인텔 그레이스몬트 마이크로아키텍처

덤프버전 :


인텔 아톰 라인 마이크로아키텍처
공정
서버
데스크탑 및 모바일
임베디드
마이크로 서버
데스크탑
랩톱
태블릿 및 스마트폰
산업용
가전용
45 nm
본넬 (Bonnell) 기반

다이아몬드빌 (Diamondville)
실버쏜 (Silverthorne)
다이아몬드빌 (Diamondville)




파인뷰 (Pineview)
린크로프트 (Lincroft)
터널 크릭
(Tunnel Creek)
스텔라톤 (Stellarton)
소다빌
(Sodaville)
그로브랜드 (Groveland)
32 nm
솔트웰 (Saltwell) 기반
센터톤 (Centerton)
브라이어우드 (Briarwood)
시더뷰 (Cedarview)
펜웰 (Penwell)
클로버뷰 (Cloverview)

베리빌 (Berryville)
22 nm
실버몬트 (Silvermont) 기반
아보톤 (Avoton)
랭글리 (Rangeley)
베이 트레일-D
(Bay Trail-D)

베이 트레일-M
(Bay Trail-M)

베이 트레일-T
(Bay Trail-T)

무어필드 (Moorefield)
메리필드 (Merrifield)
SoFIA
베이 트레일-I
(Bay Trail-I)


14 nm
에어몬트 (Airmont) 기반

브라스웰 (Braswell)
체리 트레일
(Cherry Trail)

SoFIA LTE


골드몬트 (Goldmont) 기반
덴버튼 (Denverton)
아폴로 레이크 (Apollo Lake)

아폴로 레이크
(Apollo Lake)


골드몬트 플러스 (Goldmont Plus) 기반

제미니 레이크 (Gemini Lake)
제미니 레이크 리프레시 (Gemini Lake Refresh)



10 nm
트레몬트 (Tremont) 기반
스노우 릿지
(Snow Ridge)

재스퍼 레이크 (Jasper Lake)
스카이호크 레이크(?) (Skyhawk Lake)
레이크필드(Lakefield)
엘크하트 레이크
(Elkhart Lake)


Intel 7
그레이스몬트 (Gracemont) 기반

엘더 레이크-S
(Alder Lake-S)
엘더 레이크-P
(Alder Lake-P)
엘더 레이크-N
(Alder Lake-N)


Intel 4
크레스트몬트 (Crestmont) 기반






?
스카이몬트 (Skymont) 기반










1. 개요
2. 상세
2.1. 변경점
2.2. 엘더 레이크
2.3. 랩터 레이크
3. 사용 모델



1. 개요[편집]


2021년 10월 27일에 정식 발표된 후 11월 4일부터 출시된 인텔 아톰 계보의 마이크로아키텍처.


2. 상세[편집]



2.1. 변경점[편집]


파일:intel Gracemont Microarchitecture.png

파일:IAD-21_033.jpg

  • 코어 레벨 (트레몬트 대비)
    • 프론트 엔드 클러스터
      • OD-ILD (On-Demand Instruction Length Decoder) 추가
      • L1 명령어 캐시 메모리 용량이 32 KB → 64 KB로 2배 확장
      • L1 분기 대상 버퍼(Branch Target Buffer, BTB)가 128 → 1024 엔트리로, L2는 5120 → 6K 엔트리로 확장
      • 동적 부하 분산 (Dynamic Load Balancing) [1]
    • 백 엔드
      • 할당량이 4-way → 5-way로 확장
      • 재정렬 버퍼(Reorder Buffer, ROB)가 208엔트리 → 256엔트리로 확장
      • 명령어 인출(Instruction Dispatch) 포트가 총 10-way → 12-way로 확장
      • 스케줄러가 109엔트리 → 175엔트리로 확장
      • 실행 엔진
        • 실행 포트가 총 10-way → 17-way로 확장[2]
        • 정수 연산 포트가 3개 → 4개로 확장
        • 곱셈기가 1개 → 2개로 추가되었으며, 나눗셈기 2개 신설.
        • 분기 실행 장치(Branch Execution Unit)가 1개 → 2개로 추가.
        • 주소 생성 장치(Address Generation Unit, AGU)가 로드와 스토어 전용으로 분화시켰으며, 통합해서 2개였던 것이 각각 2개씩으로 추가.
        • 정수 스토어 장치와 부동소수점 스토어 장치가 각각 1개 → 2개로 추가되었다.
        • SHA 암호화 해시 연산 장치 신설.
        • 정수 벡터 연산 장치가 1개 → 2개로 추가.
    • 메모리 서브 시스템
      • 명령어 변환 색인 버퍼(Instruction Translation Lookaside Buffer, ITLB)가 48엔트리 → 64엔트리로 확장
      • L2 공유 변환 색인 버퍼가 1024엔트리 → 2048엔트리로 확장
    • 명령어 집합
      • AVX, AVX2 확장 명령어 지원
      • BMI1, BMI2, ADX, LZCNT 확장 명령어 지원
      • VNNI 확장 명령어 지원
  • 프로세서 레벨 (제스퍼 레이크 대비)
    • L2 캐시 메모리
      • 총 용량이 최대 1.5~4.5 MB → 2~4 MB (12~18-way → 16-way Set Associative)
    • 메인 메모리
      • DDR5 SDRAM 4800 MHz 듀얼 채널
        • 단, DDR5 SDRAM 장착시 Gear1 모드를 지원하지 않는다. DDR5 SDRAM 자체가 지원하지 않는게 아니라, CPU DRAM 컨트롤러가 DDR5 SDRAM의 고클럭만큼 작동할 잠재력이 부족해서 그런 것이다.
      • DDR4 SDRAM 3200 MHz 듀얼 채널
      • LPDDR5 SDRAM 5400 MHz 쿼드 채널
      • LPDDR4X SDRAM 4266 MHz 쿼드 채널

인텔이 밝힌 바에 따르면 스카이레이크와 1코어 1스레드 비교시 동일 전력에서 40% 이상 성능이 향상되었으며, 동일한 성능을 낼 때 스카이레이크 대비 40% 이하의 전력을 소모한다고 한다. 기존 트레몬트 아키텍처와 비교시 가장 큰 차이점은 그레이스몬트부터 AVX 명령어를 지원한다는 점으로, AVX2와 AVX-VNNI를 지원하며, 이를 통해 실수 벡터 연산 성능이 크게 증가하였다.


2.2. 엘더 레이크[편집]



2018년 인텔 아키텍처 데이 로드맵에 처음 언급되었으며, 세부 사항은 2021년 인텔 아키텍처 데이에서 공개되었다. E-코어 클러스터당 L2 캐시 메모리 용량은 아키텍처 데이 2021에서 공개된 최대 4 MB가 아닌 2 MB씩 탑재되었다. 일반 데스크탑 제품군인 코어 i 시리즈에서 최초로 탑재되었기 때문에 많은 사용자들이 궁금증을 자아냈다.

실행 엔진의 실행 포트 수가 대폭 확장되고, 정수 연산 ALU 1개 추가, AVX2 명령어 셋 지원 덕분에 렌더링 및 인코딩 워크로드에서 클럭당 성능이 크게 향상되어 인텔이 발표했던 대로 스카이레이크 아키텍처에 근접한 수준으로 밝혀졌다. 하지만, 게임에서는 클럭당 성능이 전체 평균 프레임 레이트 기준으로 스카이레이크에 근접했으나, CPU한테 있어서 더 중요한 하위 1% 평균 프레임 레이트 기준으로 아이비브릿지에 근접한 수준으로 측정되었다. 이는 4코어가 대역폭을 공유하는 구조에 따른 높은 레이턴시와 낮은 코어당 대역폭, 아톰 계보 마이크로아키텍처 공통 특징인 마이크로 옵 캐시의 부재로 인한 분기 예측 실패 패널티 문제 등이 작용한 것으로 추정된다. P-코어와 E-코어가 둘 다 활성화된 상태의 레이턴시가 P-코어만 활성화된 상태일 때보다 현저히 높게 측정되고, 특히 같은 클러스터상의 E-코어간 레이턴시가 클러스터 안팎에 있는 코어간 레이턴시보다 높은 특성을 보이는데 일반적으로 클러스터 내부의 통신 레이턴시가 낮은 점을 생각해 보면 상당히 기이한 부분.

알고 보면 아톰 계보 아키텍처 치고는 굉장한 발전이지만, 하필 하이브리드 구조 특성상 P-코어와 같이 있었다 보니 게이머들한테는 E-코어 클러스터 넣을 자리에 P-코어를 더 추가했으면 더 좋았을 것 같다는 식의 쓸모 없는 존재라고 혹평하는 반응도 있었다. 최신 게임이라도 8코어 이상을 사용하는 게임은 거의 없기 때문이다.[3] 반대로 데스크탑용 CPU로 렌더링 혹은 인코딩을 주로 다루는 전문가들한테는 멀티스레드 성능 효율의 혁신이라고 부를 정도로 대체로 호평이라 게이머와 상반된 반응을 보여주고 있다. 전문적으로 렌더링 및 인코딩 작업을 하는 사람들은 P-코어만 최대 56개나 되는[4] 서버용 CPU를 장착한 시스템을 사용하는 경우가 많지만 그렇지 못한 영세 사업자들도 제법많은것도 현실이기 때문. 역으로 P코어만 사용된 제품들은 단일작업(특히 게임)에서 압도적인 퍼포먼스를 보여주며 E코어로만 구성된 N라인도 압도적인 전성비를 보여주며 AV1 디코딩을 네이티브로 지원하는것도 장점이다. 중국발 N100 미니Pc들이 압도적으로 저렴한 가격으로 나오고 있는데다가 단순 사무용으론 무리없는 수인이라 서브용 Pc로는 평이 좋은 편. 단, 발열문제가 있는 편이라 미니PC 중에서 종종 발열로 사망하는 경우가 나오기 때문에 어느정도 쿨링을 갖춘것을 추천한다.

하이브리드 구조로 인한 응용프로그램 호환성 문제 역시 발견되고 있다. 게임에서 다중 클라이언트로 인식되는 문제 등이 있으며 구 버전 프로그램에서 특히 심하다. 지원이 종료된 레거시 소프트웨어들을 구동하는 데에도 문제가 있다. 물론 이는 그레이스몬트의 문제가 아닌 12세대 코어 i시리즈의 문제이며, 점차 시간이 지나면서 해결될 문제이기는 하며 2023년 기준으론 스캐쥴러 개선으로 거의 해결됐다.


2.3. 랩터 레이크[편집]


13세대 코어 i시리즈인 랩터 레이크에서는 적용이 확대되었다. 앨더 레이크에서는 코어 i7 이상과 코어 i5 중에서 최상위 모델인 12600k에만 적용되었으나[5] 13세대부터는 적용이 확대되어 i5 전체에 적용된다.[6] 모바일 CPU에도 적용이 확대되어 저전력 i5 같은 경우에는 랩터 코브 2코어에 그레이스몬트 8코어로 수 차이가 4배나 난다. 상술했듯 게임 성능 향상에 영향이 거의 없다 보니 P-코어 수 자체가 적은 저전력 모바일 CPU를 제외하면 일반 유저들의 반응은 그리 좋지 못한 편이다.


3. 사용 모델[편집]


/사용모델 참조
파일:크리에이티브 커먼즈 라이선스__CC.png 이 문서의 내용 중 전체 또는 일부는 2023-12-15 00:17:38에 나무위키 인텔 그레이스몬트 마이크로아키텍처 문서에서 가져왔습니다.

[1] 트레몬트 및 그레이스몬트 마이크로아키텍처는 디코더가 2개의 클러스터로 나누어져 있는데 기존 트레몬트 아키텍처에서는 Basic block이 긴 경우 양쪽 클러스터를 모두 활용하지 못해 성능 향상을 위해서 16-32 명령어 간격으로 무조건 분기(점프) 명령어를 추가해야 하는데 비해 그레이스몬트 아키텍처에서는 자동으로 toggle point를 추가해 별도의 최적화 없이도 양 클러스터를 모두 활용할 수 있도록 하였다.[2] 12-way인 골든 코브 마이크로아키텍처보다도 훨씬 더 넓은 폭이다.[3] 게임은 프로그래밍 특성상 멀티코어 활용에 불리하다.# [4] AMD CPU는 동 세대 기준 최대 64개이다. CPU 하나당이라 듀얼 CPU 시스템일 경우 코어 수도 두 배가 된다.[5] 그레이스몬트 코어 수는 i9에 8개, i7/i5에 4개이다.[6] 그레이스몬트 코어 수는 i9에 16개, i7/13500 이상 i5에 8개, 13490 이하 i5에 4개로 거의 12세대 대비 2배로 증가하였다.