중국과학원에서 open한 BLAS 라이브러리.
3level BLAS 최적화를 진행하였으며
GotoBLAS의 GEPP와 GEBP를 조금더 아키텍쳐 적으로 최적화 시킨 모델인듯 하다.
Optimized assembly나 loop unrolling reordering parallel matrix multiplication등을 구현하여 성능 개선을 하였다.
첫번째 논문은 level3 gemm 개선을 위주로 작성하였고
[Model-driven Level 3 BLAS Performance Optimization on Loongson 3A Processor, 2012]
두번째 논문은 자동적으로 optimized code를 generation하는 기법(텟플릿 기반) 위주로 작성하였다.
[AUGEM:Automatically Generate High Performance Dense Linear Algebra Kernels on x86 CPUs, 2013]
오픈소스는
https://github.com/xianyi/OpenBLAS
여기임
xianyi/OpenBLAS
OpenBLAS is an optimized BLAS library based on GotoBLAS2 1.13 BSD version. - xianyi/OpenBLAS
github.com
'Black board > BLAS' 카테고리의 다른 글
BLAS 알고리즘에 대해서 (0) | 2019.04.08 |
---|---|
GotoBLAS (0) | 2019.04.08 |
댓글