HSA (문단 편집)

== HSA의 목표와 한계 ==
||<:><width=50%><rowbgcolor=#FFFFFF>[[파일:external/images.kbench.com:8080/k128925p1n3.jpg|width=100%]] ||<:><width=50%>[[파일:external/images.kbench.com:8080/k128925p1n7.jpg|width=100%]] ||
||<:>'''현재의 GPU 활용 방식'''[br]OS의 간섭이 많고 단계가 복잡하여 활용하기가 힘겹다. ||<:>'''HSA의 GPU 활용방식'''[br]애플리케이션이 GPU를 직접 활용 할수 있도록 하여 효율을 높인다. ||
HSA의 궁극적인 목적은 병렬 연산 프로그래밍의 확대이다. 이를 위해 GPGPU 프로그래밍의 난이도를 낮추고 하드웨어의 제약에 얽매이지 않게 동작할 수 있는 병렬 컴퓨팅 환경을 만드는 것이다.[* 예를 들어, AMD GPU/APU로 동작하는 병렬 컴퓨팅 프로그램을 만들었다면 이것이 'ARM + POWER VR'로도 프로그램 수정없이 돌아갈 수 있다는 것이다.] 이 목적은 AMD가 2000년 중반에 내세우던 해테로지니어스 코어라는 목표를 전 플렛폼으로 확대한 모습이기도 하다.

궁극적인 단계에서는사용자 입장에서 GPU는 CPU의 보조 연산 코어정도로 인식할 정도로 [[GPGPU]] 프로그래밍의 난이도를 낮추는것이 목표이다.

그러나 목적만큼 그 한계 역시 뚜렷하다. GPGPU 분야에서 선두주자인 [[NVIDIA]]의 [[CUDA]]를 끌어들이지 못했다는 점[* CUDA는 대표적인 폐쇄 플랫폼이다. NVIDIA GPU로만 돌아가는 녀석이니...], 그리고 CPU쪽에서도 인텔을 끌어들이지 못해서 당장 대부분의 프로그래머들이 HSA에 대해서 [[영 좋지 못한]] 시선이다. GPGPU 난이도가 아무리 낮아진다고해도 이를 이용할 하드웨어가 없다면 무용지물이다. 그런데 AMD는 [[AMD A 시리즈#s-2.4|카베리]]부터 비로소 HSA를 지원할 정도로, 늦은 속도로 HSA를 지원하는 하드웨어를 발표한다. 심지어 카베리조차 내부 버스 구조가 도떼기 시장처럼 어지러워서, GPU는 CPU 캐시를 들여다 볼 수 있지만 CPU는 GPU 캐시를 들여다 볼 수 없는 등의 문제가 있고, 정작 이런 문제가 깔끔하게 해결된 [[AMD RYZEN 2000 시리즈#Raven Ridge|레이븐 릿지]]에 와서는 담당자들이 모두 경쟁사로 옮겨가 경쟁 플랫폼을 만들고 있는 등 동력 상실로 홍보 문서에 HSA란 언급조자 다 빼버리고 관망 중이다(...)[[http://www.hwbattle.com/bbs/board.php?bo_table=cpumbram&wr_id=92716|#]] 그 중 한 사람이 NVIDIA로 가서 만든 게 NVLINK라고. NVLINK는 풀스펙 세팅 기준 1세대 100GB/s (하프 듀플렉스), 2세대 양방향 300GB/s (풀 듀플렉스)의 어마어마한 대역폭으로 APU와 유사한 효과를 누리는 플랫폼이다. 다만 CPU와의 통신에 써먹으려면 [[PowerPC]]와 조합해야만 한다. 이론상 x86 CPU와의 조합도 가능하긴 하지만 CPU쪽에서 지원을 안 한다.[* 대신 GPU간 통신에 써먹는 건 지장 없기 때문에 [[GeForce 20]]부터는 [[SLI]]를 대체하는 식으로 써먹고 있다.] [[인텔|그 CPU]] [[AMD|만드는 회사들]]이 [[인텔 제온 파이|경쟁 플랫폼]] [[Radeon Instinct|판매자]]라는 사실을 생각하면 지극히 당연한 일이지만, 반대로 [[PowerPC]]는 해당 문서의 비판적인 서술들을 보면 알겠지만 순수 CPU 성능으론 경쟁이 어려운 상황이라, 슈퍼컴퓨터에서 성능 경쟁을 위해 GPU, 보조 프로세서를 적극적으로 활용하는 등 NVLINK를 지원할만한 동기가 충분한 상황이다.

때문에 19년 현재 HSA를 가장 잘 써먹을 수 있는 플랫폼은 HSA를 처음 추진한 AMD가 아니라, 역설적이게도 기술적으로는 HSA가 아닌(...) [[PowerPC]] 플랫폼 기반의 [[CUDA]]이다. 인텔은 GPU성능이 낮고, AMD는 조용히 업계 대세에 묻어가는 분위기이고(더구나 이쪽 APU도 인텔보단 고성능일 뿐, 여전히 GPU 성능이 낮은 저가형과 모바일 제품들만 내놓고 있다), 하이엔드급 이상 GPU를 APU처럼 써먹을 수 있는 플랫폼은 [[지포스]]출신의 [[NVIDIA/워크스테이션 GPU|HPC GPU들]]을 NVLINK를 지원하는 CPU와 연결한 것이 유일하기 때문(...)

게다가 [[인텔]]과 [[IBM]]도 독자 플랫폼으로 GPGPU 시장에 진출 중이라는 점은 장기적으로 HSA 프로젝트의 발목을 잡을 것으로 보인다.

단, 인텔도 HSA 지원에 대한 투자는 꾸준히 하는데, 인텔에서 GPGPU용으로 미는 독자 플랫폼인 [[인텔 제온 파이|제온 파이]]는 슈퍼컴퓨터 같이 HPC용이지 --그나마 포기했다.[[https://quasarzone.co.kr/bbs/board.php?bo_table=qn_hardware&wr_id=179303|#]]--, 데스크탑이나 노트북에 쓸 수 없기 때문이다(애초에 --제온 파이 0세대, 흑역사-- 라라비를 출시 못한 이유의 하나가 양쪽 다 간보다가 이게 아닌가벼하고 방향전환하다가 시기를 놓쳐서...) [[브로드웰]]부터는 [[https://www.anandtech.com/show/8355/intel-broadwell-architecture-preview/3|공유 메모리와 OpenCL 2.0도 지원]]하는 등 HSA 지원이 되는 하드웨어 구조를 가지고 있다. 캐시 구조를 생각하면, 나아가 AMD보다도 앞서는 모습을 보인다.[* AMD에는 [[AMD A 시리즈#s-2.5|카리조]]까지도 CPU와 GPU가 공유하는 캐시 메모리가 없다. 그래서 해당 기능이 필요한 AMD 후원 HSA 성능 연구는 HSA와 L3 캐시를 모두 가진 가상의 APU를 시뮬레이션해서 쓰기도 한다(연구 당시에 인텔에서는 HSA를 지원하지 않았다.).]

AMD 역시 마냥 손 놓고 있는 건 아니라서, 라이젠 5천 시리즈 + 라데온 6천 시리즈부터는 CPU와 GPU 상호간의 무제한 메모리 엑세스를 통한 성능 향상이 가능하다고 한다. [[https://quasarzone.com/bbs/qn_hardware/views/605508|AMD의 RX 6000 GPU, 스마트 메모리 액세스를 통해 Ryzen 5000 CPU로 성능 향상]]
그리고 [[AMD Instinct]] 제품군으로 고성능 APU도 출시할 모양이다.[[https://quasarzone.com/bbs/qn_hardware/views/1271173|Exascale 슈퍼컴퓨터에 들어가는 AMD Instinct MI300 APU]]

[[Apple]]이 [[Apple Silicon/M 시리즈]]를 통해 PC 환경에서 hUMA를 구현하였다.

저장 버튼을 클릭하면 당신이 기여한 내용을 CC-BY-NC-SA 2.0 KR으로 배포하고,
기여한 문서에 대한 하이퍼링크나 URL을 이용하여 저작자 표시를 하는 것으로 충분하다는 데 동의하는 것입니다.
이 동의는 철회할 수 없습니다.

HSA (문단 편집)

캡챠