GotoBLAS는 텍사스 주립대학교에서 Kazushige Goto라는 분이 2006년에 제안했다
기존의 Block matrix multiplication에서 computer architecture의 한계를 고려하여 연산법을 제안한 것이다.
Main memory - L3 cache - L2 cache - L1 cache - register 순으로 이어지는 컴퓨터의 메모리 계층구조에 맞게
MM을 연산하도록 구현하였다.
저 5개의 nested loop을 모두 연산하면 C가 완성 된다.
'Black board > BLAS' 카테고리의 다른 글
OpenBLAS (0) | 2019.04.08 |
---|---|
BLAS 알고리즘에 대해서 (0) | 2019.04.08 |
댓글