AMD ZEN 마이크로아키텍처/공개 전 루머 (r20190312판)

문서 조회수 확인중...

파일:mKsTjHl.jpg
ZEN APU에서는 새로운 인터커넷트 버스인 GMI(Global Memory Interconnect)가 들어간다는 말이 있다. 이 새로운 버스는 높은 대역폭과 매우 낮은 레이턴시가 특징이며, 자료에 따르면 4개의 링크로 100GB/s의 대역폭을 구현할 수 있다. 경쟁사인 인텔 프로세서의 CPU와 iGPU 사이는 링버스로 연결되어 있으며 L3 캐시와 L4 캐시[1]도 링버스에 물려있어서 CPU와 GPU가 공유하는데, ZEN의 경우 CPU와 GPU가 공유하는 캐시가 있는지 또는 저 4 GMI links의 100GB/s 대역폭이나 레이턴시가 인텔의 링버스[2]와 비교해서 어떤지 알려지지 않았기 때문에 섣부른 비교는 금물이다.
또한 이 GMI 버스가 Xbox One의 CPU-GPU간의 내부 버스, 그리고 엔비디아의 NVLink와 같다는 주장이 있다. 엔비디아의 NVLink와 Xbox one의 버스의 개발자는 동일인임이 판명되었지만 GMI와 같은지는 아직 불명.
파일:external/image.coolenjoy.net/74c055ab55c719f44babaab104be2a2c153409151071021.jpg
2015년 10월 5일까지 나온 정보를 종합해 그린 ZEN 1코어 다이어그램이다. 출처
ZEN에는 ALU와 AGU가 4:2로 나뉘어지며 부동 소수점은 128bit 2개를 엮은 FMAC가 2개가 들어간다. 파일드라이버 대비(ALU:AGU=2:2) 1코어당 ALU, FMAC의 수가 2배 증가하므로 정수, 부동소수점 연산 능력은 최대 2배로 증가한다. 똑같은 연산 유닛이 들어간다는 가정 하에 폴락의 법칙[3]을 적용할 경우 40%정도의 성능 향상을 기대할 수 있지만 최신형 설계일 수록 연산유닛 자체의 성능도 올라가므로 성능 향상 수준은 40% 보다는 좀 더 높을 것으로 예상된다.
파일:external/2.bp.blogspot.com/Zen-Architektur%2BCore%2BV0.3.2.png
출처
2016년 2월에 업데이트 된 ZEN 1코어 다이어그램으로 2015년 10월자 다이어그램에 비해 추가 및 변경된 부분이 존재한다.
  • uOp 캐시가 추가되었다.
  • FMAC로 묶인 형태로 표현된 FMUL/FADD 부분이 분리되었다. 실제로 관련 코드를 검토해 보면 4개의 FPU가 제각각의 기능을 담당하면서 특별히 대칭되는 구조가 없는 것을 확인할 수 있다.
  • L1 데이터 캐시의 레이턴시가 4 cycle로 밝혀졌다.
  • L1 데이터 캐시에 대해 동시에 128 bit 읽기동작 2회와 쓰기동작 1회가 가능하다.
이전 다이어그램과는 달리 FPU가 FMAC로 묶인 부분이 삭제되었지만 어차피 FMA명령의 AVX 256bit 명령어조차도 동시에 2명령어의 처리가 가능한 점이 바뀌지는 않았으므로 전반적인 성능 특성은 위의 평가와 동일할 것으로 예상된다. 또한 uOp캐시의 존재가 밝혀지면서 파이프라인 스톨 등에 의한 처리 레이턴시 증가를 억제하는데 좋은 효과를 볼 것으로 기대되고 있다.
루머에 의하면 서밋 리지는 적어도 처음에는 8코어 칩셋으로만 양산되며 4코어/2코어 ZEN 프로세서는 없다고 한다. 8코어 프로세서와 일부를 비활성화한 6코어 프로세서가 출시될 예정이며, 수율이 나쁠 경우 4코어 프로세서까지 출시될 가능성이 있다고 한다. 이러한 생산 전략은 많은 금전적인 이득을 줄 것이라고 하며, 4코어 이하 프로세서는 브리스톨 리지가 일단 담당하며 ZEN 기반 후속 제품인 레이븐 리지가 배턴을 넘겨받을 가능성이 크다.
파일:amd_fighting.jpg
8월 10일 AMD ZEN의 ES 제품의 AOTS 벤치마크가 유출 되었다.
i5-4670K (3.4/3.8Ghz)를 제첬으며, i7-4790 (3.6/4.0Ghz) 보다는 조금 못한 수치이다.
파일:external/www.pcper.com/ashes-r9390x.png
AOTS의 CPU별 게임프레임은 멀티코어를 잘 반영하는 편이 아닌, 메이저급 게임사를 제외한 대중적인 게임들과 비슷한 편이다. 5960X와 0.8GHz 차이나는 6700K가 3~4% 앞서는걸 고려하여 서밋 리지의 대략적인 게임 성능을 가늠할수 있다.
벤치마크에 사용된 서밋 리지 ES의 클럭은 베이스 2.8GHz, 터보 3.2GHz이다. AMD의 ES와 실제품 간의 클럭 차이는 전통적으로 0.8GHz 정도 차이났던걸 생각하면, 서밋 리지 최상위 제품은 3.6GHz로 출시가 될 거라 예상된다.
유출된 벤치마크 자료
2월 17일 라이젠의 6코어 모델인 1600X로 추정되는 CPU의 중국발 CPU-Z 벤치마크가 유출되었다.
해당 벤치에서 싱글코어 점수는 1800점대 후반을 기록했으며, 동클럭으로(3.3Ghz) 동작하는 i5-6600이 1700점대 전후로 나왔던것을 생각하면 동클럭에서의 싱글 스레드 성능도 카비레이크를 뛰어넘었다고 해석할 수 있다. 다만, 해당 자료가 중국에서 유출된 것에 유념할 것.[4]

[1] L4 캐시 자체는 별도의 EDRAM 다이로 따로 들어가 있지만 이를 컨트롤하기 위한 태그 부분이 CPU 내에서 링버스에 물려있다.이미지 출처[2] 샌디브리지 링버스는 3GHz 기준으로 코어당 약 96GB/s (듀얼코어는 190GB/s, 쿼드코어의 경우 380GB/s)라는 얘기가 있다.[3] 폴락의 법칙은 CPU설계에 투입하는 트랜지스터 숫자를 2배로 늘려도 성능향상폭은 그 이하, 즉 대체로 $$\sqrt{2}$$만큼 밖에는 증가하지 않는다는 일종의 경험법칙이다.[4] 당장에 사진에서 보여지는 윈도우 버전이 서로 상이하다. (제목 표시줄 정렬 방법과 우측의 창 아이콘이 다르다.) CPU-Z 정보는 윈도우 8.1이고 벤치마크는 윈도우 10에서 촬영되어 있다.