본문 바로가기

분류 전체보기16

BLAS 알고리즘에 대해서 BLAS는 Basic Linear Algebra Subprogram의 약자로 선형대수를 연산하는 함수(코드) 묶음을 말한다. 현재 데이터 프로세싱이나 특히 머신러닝에서 아주 기초를 담당하고 있는 연산이다. BLAS는 크게 3개의 level로 이루어져 있다 level 1 : vector * vector 연산 level 2 : matrix * vector 연산 level 3 : matrix * matrix 연산 으로 이루어져 있다. level1, 2같은 경우는 연산이 단순하며 memory 성능이 전체 연산의 성능을 크게 좌우하지면 level3같은 경우는 데이터 버퍼만 뒷받침 해준다면, 모두 buffer hit이 되어 연산 성능으로 떼울 수 있게 된다. 하지만, 데이터 버퍼는 유한하므로 matrix를 쪼개어서.. 2019. 4. 8.
GotoBLAS GotoBLAS는 텍사스 주립대학교에서 Kazushige Goto라는 분이 2006년에 제안했다 기존의 Block matrix multiplication에서 computer architecture의 한계를 고려하여 연산법을 제안한 것이다. Main memory - L3 cache - L2 cache - L1 cache - register 순으로 이어지는 컴퓨터의 메모리 계층구조에 맞게 MM을 연산하도록 구현하였다. 저 5개의 nested loop을 모두 연산하면 C가 완성 된다. 2019. 4. 8.
AXI signal 설명 AXI4를 기준으로 한다. in, out은 master 입장에서.Write ChannelWrite Address Channel SignalAWID(out) : Write address ID; write address group들의 id이다. user IP라면 웬만하면 id 하나만 쓸 듯하다.AWADDR(out) : write address이고...AWLEN(out) : Burst length이다. 해당 수치만큼 데이터를 burst해서 가지고 온다.AWSIZE(out) : burst size인데. data요청의 전체 크기를 말한다. data width * arlen = arsize; 한번의 data beat가 보내는 사이즈의 byte, log2; 즉 log2(wdata_width/8)AWBURST(out).. 2019. 3. 20.
Storage-class memory: The next storage system technology 제목: Storage-class memory: The next storage system technology저자: Freitas, R F; Wilcke, W W,저널명: IBM Journal of Research and Development; Armonk(2018) Abstract: 기존의 기계식 storage인 HDD를 개선하기위해서 storage-class memory(SCM)라는 것이 제안되어져 왔고, 이 것은 빠르고, 비싸지 않으며, 전력효율이 좋다는 장점이있다. 미래에는 이 것이 disk drive를 모두 대체할 것이고, disk의 I/O성능을 엄청 좋게 만들것이다. 이 논문에서는 SCM의 대한 전반적인 내용과 트렌드, 계획 등을 보여줄것이다. Introduction: 옛날부터 largescal.. 2019. 3. 13.