NVIDIA 데이터 센터 GPU

덤프버전 :



[[NVIDIA/GPU|

GPU 목록
]]
GeForce · GeForce Laptop · NVIDIA RTX · 데이터 센터 GPU
[ 펼치기 · 접기 ]
NV
NV1
NV3
RIVA 128
TwiN Texel
(Fahrenheit)

RIVA TNT
RIVA TNT2
QuadPipe
(Celcius)

GeForce 256
-
Quadro
-
-
GeForce 2
-
Quadro 2
-
-
nFiniteFX I, II
(Kelvin)

GeForce 3
-
Quadro DCC
-
-
GeForce 4
-
Quadro 4
Quadro 4 NVS
-
CineFX 1.0, 2.0
(Rankine)

GeForce FX
-
Quadro FX
Quadro NVS
-
CineFX 3.0, 4.0
(Curie)

GeForce 6
-
-
GeForce 7
-
QUADRO FX
-
-
Unified (Shader)
(Tesla)

GeForce 8
-
QUADRO NVS
TESLA 800
GeForce 9
-
-
-
GeForce 200
-
QUADRO NVS
TESLA 1000
GeForce 100
-
-
-
-
GeForce 300
-
-
-
-
Fermi
GeForce 400
-
QUADRO
-
TESLA 2000
GeForce 500
-
NVS
Kepler
GeForce 600
-
QUADRO K
TESLA K
GeForce 700
GTX TITAN
GeForce 800
GTX TITAN BLACK/Z
Maxwell
GeForce 700
-
-
-
GeForce 800
-
-
-
-
GeForce 900
GTX TITAN X
QUADRO M
-
TESLA M
Pascal
GeForce 10
TITAN X/Xp
QUADRO P
-
TESLA P
Volta
-
TITAN V
QUADRO GV100
-
TESLA V
Turing
GeForce 20
TITAN RTX
QUADRO RTX
-
TESLA T
GeForce 16
-
-
-
-
Ampere
GeForce 30
-
RTX A
-
A
Hopper
-
-
-
-
H
Ada Lovelace
GeForce 40
-
RTX
-
-
















1. 개요
2. 제품군
2.1. G80(Tesla) 마이크로아키텍처
2.2. Fermi 마이크로아키텍처
2.3. Kepler 마이크로아키텍처
2.4. Maxwell 마이크로아키텍처
2.5. Pascal 마이크로아키텍처
2.6. Volta 마이크로아키텍처
2.7. Turing 마이크로아키텍처
2.8. Ampere 마이크로아키텍처
3. 관련 문서




1. 개요[편집]


2020년 5월까지 사용되던 상표는 Tesla

2007년 5월부터 내놓은 상표로, GPU가 게임용 연산에만 사용되는 것이 아닌 범용 연산(GPGPU)용으로 확대되면서 고성능 연산 작업을 목적으로 하는 곳을 공략하기 위한 제품군이다. Tesla도 알맹이는 지포스와 같지만 대체로 디스플레이 출력 단자가 없는데다 연산에 주로 사용되기 때문에 GPU 내부에 있는 텍스처 유닛과 ROP이 쓸 일은 없다. 게임 그래픽과는 거리가 먼 분야에 사용되기 때문. 물론 페르미 아키텍처 기반의 일부 제품 한정으로 DVI 단자 1개가 탑재되기도 했지만 케플러 아키텍처부터는 디스플레이 단자가 다시 빠지면서 지금까지 이어져오고 있다. 명색이 전문가를 넘어선 데이터 센터를 주로 공략하는 시장인만큼 가격도 매우 비싼 편인데 지포스와 같은 GPU라 훨씬 저렴한 지포스로 연산 작업을 하면 되지 않겠냐고 반문할 수도 있지만, 쿼드로와 마찬가지로 Tesla용 드라이버가 따로 있고 단일 GPU인 제품은 주로 하위 라인에나 해당되는 제품이지 최상위로 올라가면 GPU가 2개는 물론이고 4개를 한 기판에 탑재된 쿼드 GPU 타입 제품도 있다. GPU를 복수로 붙이면서 전력 소모량, 발열, 부피를 감안해서라도 당대 최고의 고성능 연산을 구현하는 것을 추구하는 방향이기 때문이다. 테슬라는 탑재 대상 컴퓨터들이 최소 워크스테이션에서 최대로는 슈퍼 컴퓨터와 데이터 센터급이며 소비 전력이 엄청 나기 때문에 모바일 제품군이 없다.

2020년 5월에 브랜드가 폐지되었는데. 모 자동차 회사와의 혼동 때문이라는게 공식적인 설명이다. 엔비디아 역시 자율주행 자동차 사업에 진출해 있고 여기에 사용되는 연산용 GPGPU의 명칭이 가장 큰 경쟁사의 명칭과 겹친다는게 좀 아니라고 생각했는듯. 이후 출시된 RTX A100부터는 데이터 센터 GPU라는 명칭으로 불리고 있다.(그리고2020년 10월 5일 테슬라의 뒤를 잇는 데이터센터 용 그래픽카드인 A40이 공개되었다)

특이하게 최근 나오는 데이터센터 GPU 제품군에는 쿨러가 없이 방열판과 제품 덮개만 딱 있는데, 이는 절대로 칩의 온도가 낮아서 그런게 아니다. 데이터센터 gpu는 열이 심한 vram을 덕지덕지 붙이고 나오기 때문에 일반 게이밍용 gpu보다 온도가 높으면 높았지 절대 낮지 않다. 이렇게 발열량이 높은 gpu를 수백, 수천개씩 닭장처럼 꽂아놓고, GPU 외에도 발열량이 엄청난 부품들을 수백, 수천개 단위로 쑤셔넣은 것이 데이터센터이므로, 최적화된 쿨링 솔루션을 갖추는 것이야말로 데이터센터의 가장 중요한 요소 중 하나다. 이런 상황에서 개별 GPU에 어줍잖은 공랭식 쿨러를 장착할 경우 데이터센터 자체의 쿨링 솔루션에 방해가 되어 없느니만 못할 수 있기 때문에 이를 포함하지 않는 것이다.

2. 제품군[편집]



2.1. G80(Tesla) 마이크로아키텍처[편집]


모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(TPC, SM)
클럭
(MHz)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
S870
G80
(90㎚)
(484㎟)
128:32:24
x4
(8 x4, 16 x4)
600
(코어)
1350
(셰이더)
384
x4
GDDR3
800
(1600)
1536
x4
800
11999
D870
128:32:24
x2
(8 x2, 16 x2)
384
x2
1536
x2
520
7499
C870
128:32:24
(8, 16)
384
1536
171
1499
S1075
G200B
(55㎚)
(470㎟)
240:80:32
x4
(10 x4, 30 x4)
610
(코어)
1296
(셰이더)
512
x4
4096
x4
800
?
S1070
7999
C1060
240:80:32
(10, 30)
512
4096
188
?
M1060
2048
1699
T10
4096
?
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
G200B 칩셋 한정 → (단정밀도 연산 속도) ÷ 8 = (배정밀도 연산 속도) [GFLOPS]
(GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]





2.2. Fermi 마이크로아키텍처[편집]


모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(GPC, SM)
클럭
(MHz)
L2
캐시
(KB)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
S2050
GF100
(40㎚)
(529㎟)
448:56:48
x4
(4 x4, 14 x4)
574
(코어)
1147
(셰이더)
768
x4
384
x4
GDDR5
773
(3092)
3
x4
900
11999
M2050
448:56:48
(4, 14)
575
(코어)
1150
(셰이더)
768
384
3
225
2699
M2070
574
(코어)
1150
(셰이더)
783
(3132)
6
225
3099
M2070-Q
5489
C2050
575
(코어)
1150
(셰이더)
750
(3000)
3
238
?
C2070
6
?
X2090
GF110
(40㎚)
(520㎟)
512:64:48
(4, 16)
650
(코어)
1300
(셰이더)
925
(3700)
225
?
X2070
?
M2090
250
?
C2090
?
M2075
448:56:48
(4, 14)
574
(코어)
1147
(셰이더)
783
(3132)
225
2399
C2075
575
(코어)
1150
(셰이더)
750
(3000)
247
?
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 2 = (배정밀도 연산 속도) [GFLOPS]
(GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]





2.3. Kepler 마이크로아키텍처[편집]


모델명
GPU
그래픽 메모리
최대 연산 성능
TDP
지원
API
칩셋명
CUDA 코어
클럭
버스
규격
클럭
용량
단정밀도
(FP32)
(GFLOPS)
배정밀도
(FP64)
(GFLOPS)
K10
2×GK104
2×1536
745MHz
2×256bit
GDDR5
2500MHz
(5000MT/s)
2×4GB
4577
190.7
225W
CUDA 3.0
K20
GK110
2496
706MHz
320bit
2600MHz
(5200MT/s)
5GB
3524
1175
CUDA 3.5
K20X
GK110
2688
732MHz
384bit
2600MHz
(5200MT/s)
6GB
3935
1312
235W
K40
GK110B
2880
745MHz
(기본)
875MHz
(부스트)
384bit
2500MHz
(5000MT/s)
12GB
5040
1680
K80
2×GK210
2×2496
560MHz
(기본)
875MHz
(부스트)
2×384bit
2750MHz
(5500MT/s)
2×12GB
8736
2912
300W
CUDA 3.7



2.4. Maxwell 마이크로아키텍처[편집]


모델명
GPU
그래픽 메모리
단정밀도(FP32)
최대 연산 성능
(GFLOPS)
TDP
지원
API
칩셋명
CUDA 코어
클럭
버스
규격
클럭
용량
M4
GM206
1024
872MHz
(기본)
1072MHz
(부스트)
128bit
GDDR5
2750MHz
(5500MT/s)
4GB
2195
50~75W
CUDA 5.2
M6
GM204
1536
722MHz
(기본)
1051MHz
(부스트)
256bit
2300MHz
(4600MT/s)
8GB
3229
75~100W
M10
4×GM107
4×512
1033MHz
4×128bit
2099MHz
(5188MT/s)
4×8GB
5289
225W
M40
GM200
3072
948MHz
(기본)
1114MHz
(부스트)
384bit
3000MHz
(6000MT/s)
12GB
6844
250W
M60
2×GM204
2×2048
899MHz
(기본)
1178MHz
(부스트)
2×256bit
2500MHz
(5000MT/s)
2×8GB
9650
225~300W



2.5. Pascal 마이크로아키텍처[편집]


P100은 GP100 컷칩이면서 HBM2 규격을 채택한 모델로 FP64 연산이 5.3 TFLOPS다. P40과 P4는 각각 GP102 풀칩과 GP104 풀칩을 기반으로 개발된 모델이다.
모델명
GPU
그래픽 메모리
최대 연산 성능
TDP
지원
API
칩셋명
CUDA 코어
클럭
버스
규격
클럭
용량
바이트
정수형
(INT8)
(TOPS)
반정밀도
(FP16)
(GFLOPS)
단정밀도
(FP32)
(GFLOPS)
배정밀도
(FP64)
(GFLOPS)
P4
GP104
2560
810MHz
(기본)
1063MHz
(부스트)
256bit
GDDR5
1500MHz
(6000MT/s)
8GB
22
42.5
5443
170.1
50~75W
CUDA 6.1
P40
GP102
3840
1303MHz
(기본)
1531MHz
(부스트)
384bit
1800MHz
(7200MT/s)
24GB
47
91.9
11758
367.4
250W
P100
(PCIe)

GP100
3584
1126MHz
(기본)
1303MHz
(부스트)
3072bit
HBM2
703MHz
(1406MT/s)
12GB
-
18680
9340
4670
250W
CUDA 6.0
4096bit
16GB
CUDA 6.0
P100
(NVLink)

1380MHz
(기본)
1480MHz
(부스트)
21218
10609
5340
300W
CUDA 6.0



2.6. Volta 마이크로아키텍처[편집]


일부 잘못된 내용이 있을 수 있으니 주의할 것.
모델명
GPU
그래픽 메모리
최대 연산 성능
TDP
지원
API
칩셋명
CUDA 코어
클럭
버스
규격
클럭
용량
단정밀도
(FP32)
(TFLOPS)
배정밀도
(FP64)
(TFLOPS)
V100
(PCIe)

GV100
5120
1245MHz
(기본)
1380MHz
(부스트)
4096bit
HBM2
877MHz
(1754MT/s)
16GB
14
7
250W
?
V100
(NVlink)

?MHz
(기본)
1533MHz
(부스트)
32GB
15.7
7.8
300W
?
V100S
(PCIe)

?MHz
(기본)
1600MHz
(부스트)
1107MHz
(2214MT/s)
32GB
16.4
8.2
300W
?



2.7. Turing 마이크로아키텍처[편집]


모델명
GPU
그래픽 메모리
최대 연산 성능
TDP
지원
API
칩셋명
CUDA 코어
클럭
버스
규격
클럭
용량
4비트
정수형
(INT4)
(TOPS)
바이트
정수형
(INT8)
(TOPS)
반정밀도
(FP16)
(TFLOPS)
단정밀도
(FP32)
(TFLOPS)
T4
TU104
2560
585 MHz
(기본)
1590 MHz
(부스트)
256 bit
GDDR6
1250 MHz
(10000 MT/s)
16GB
260.504
130.252
65.126
8.141
70 W
?



2.8. Ampere 마이크로아키텍처[편집]


* A10
* A16
* A40
모델명
GPU
그래픽 메모리
최대 연산 성능
TDP
지원
API
칩셋명
CUDA 코어
클럭
버스
규격
클럭
용량
4비트
정수형
(INT4)
(TOPS)
바이트
정수형
(INT8)
(TOPS)
반정밀도
(FP16)
(TFLOPS)
단정밀도
(FP32)
(TFLOPS)
A16
GA??? x4
???? x4
?
? bit
GDDR6
?
16GB x4
?
?
?
?
250W
?
A10
GA??? x4
???? x4
?
? bit
GDDR6
?
24GB
?
?
?
?
150W
?


3. 관련 문서[편집]



[각주]
파일:CC-white.svg 이 문서의 내용 중 전체 또는 일부는
문서의 r214 판{{{#!wiki style="display: inline; display: 4;"
, 4번 문단}}}에서 가져왔습니다. 이전 역사 보러 가기
파일:CC-white.svg 이 문서의 내용 중 전체 또는 일부는 다른 문서에서 가져왔습니다.
[ 펼치기 · 접기 ]
문서의 r214 판{{{#!wiki style="display: inline; display: 4;"
, 4번 문단}}} (이전 역사)
문서의 r 판{{{#!wiki style="display: inline; display: none;"
, 번 문단}}} (이전 역사)

문서의 r 판{{{#!wiki style="display: inline; display: none;"
, 번 문단}}} (이전 역사)

문서의 r 판{{{#!wiki style="display: inline; display: none;"
, 번 문단}}} (이전 역사)

문서의 r 판{{{#!wiki style="display: inline; display: none;"
, 번 문단}}} (이전 역사)

문서의 r 판{{{#!wiki style="display: inline; display: none;"
, 번 문단}}} (이전 역사)

문서의 r 판{{{#!wiki style="display: inline; display: none;"
, 번 문단}}} (이전 역사)

문서의 r 판{{{#!wiki style="display: inline; display: none;"
, 번 문단}}} (이전 역사)

문서의 r 판{{{#!wiki style="display: inline; display: none;"
, 번 문단}}} (이전 역사)

문서의 r 판{{{#!wiki style="display: inline; display: none;"
, 번 문단}}} (이전 역사)

문서의 r 판{{{#!wiki style="display: inline; display: none;"
, 번 문단}}} (이전 역사)

문서의 r 판{{{#!wiki style="display: inline; display: none;"
, 번 문단}}} (이전 역사)

문서의 r 판{{{#!wiki style="display: inline; display: none;"
, 번 문단}}} (이전 역사)

문서의 r 판{{{#!wiki style="display: inline; display: none;"
, 번 문단}}} (이전 역사)

문서의 r 판{{{#!wiki style="display: inline; display: none;"
, 번 문단}}} (이전 역사)

문서의 r 판{{{#!wiki style="display: inline; display: none;"
, 번 문단}}} (이전 역사)

문서의 r 판{{{#!wiki style="display: inline; display: none;"
, 번 문단}}} (이전 역사)

문서의 r 판{{{#!wiki style="display: inline; display: none;"
, 번 문단}}} (이전 역사)

문서의 r 판{{{#!wiki style="display: inline; display: none;"
, 번 문단}}} (이전 역사)

문서의 r 판{{{#!wiki style="display: inline; display: none;"
, 번 문단}}} (이전 역사)

문서의 r 판{{{#!wiki style="display: inline; display: none;"
, 번 문단}}} (이전 역사)

문서의 r 판{{{#!wiki style="display: inline; display: none;"
, 번 문단}}} (이전 역사)

문서의 r 판{{{#!wiki style="display: inline; display: none;"
, 번 문단}}} (이전 역사)

문서의 r 판{{{#!wiki style="display: inline; display: none;"
, 번 문단}}} (이전 역사)

문서의 r 판{{{#!wiki style="display: inline; display: none;"
, 번 문단}}} (이전 역사)

문서의 r 판{{{#!wiki style="display: inline; display: none;"
, 번 문단}}} (이전 역사)

문서의 r 판{{{#!wiki style="display: inline; display: none;"
, 번 문단}}} (이전 역사)

문서의 r 판{{{#!wiki style="display: inline; display: none;"
, 번 문단}}} (이전 역사)

문서의 r 판{{{#!wiki style="display: inline; display: none;"
, 번 문단}}} (이전 역사)

문서의 r 판{{{#!wiki style="display: inline; display: none;"
, 번 문단}}} (이전 역사)

문서의 r 판{{{#!wiki style="display: inline; display: none;"
, 번 문단}}} (이전 역사)

문서의 r 판{{{#!wiki style="display: inline; display: none;"
, 번 문단}}} (이전 역사)

문서의 r 판{{{#!wiki style="display: inline; display: none;"
, 번 문단}}} (이전 역사)

문서의 r 판{{{#!wiki style="display: inline; display: none;"
, 번 문단}}} (이전 역사)

문서의 r 판{{{#!wiki style="display: inline; display: none;"
, 번 문단}}} (이전 역사)

문서의 r 판{{{#!wiki style="display: inline; display: none;"
, 번 문단}}} (이전 역사)

문서의 r 판{{{#!wiki style="display: inline; display: none;"
, 번 문단}}} (이전 역사)

문서의 r 판{{{#!wiki style="display: inline; display: none;"
, 번 문단}}} (이전 역사)

문서의 r 판{{{#!wiki style="display: inline; display: none;"
, 번 문단}}} (이전 역사)

문서의 r 판{{{#!wiki style="display: inline; display: none;"
, 번 문단}}} (이전 역사)

문서의 r 판{{{#!wiki style="display: inline; display: none;"
, 번 문단}}} (이전 역사)

문서의 r 판{{{#!wiki style="display: inline; display: none;"
, 번 문단}}} (이전 역사)

문서의 r 판{{{#!wiki style="display: inline; display: none;"
, 번 문단}}} (이전 역사)

문서의 r 판{{{#!wiki style="display: inline; display: none;"
, 번 문단}}} (이전 역사)

문서의 r 판{{{#!wiki style="display: inline; display: none;"
, 번 문단}}} (이전 역사)

문서의 r 판{{{#!wiki style="display: inline; display: none;"
, 번 문단}}} (이전 역사)

문서의 r 판{{{#!wiki style="display: inline; display: none;"
, 번 문단}}} (이전 역사)

문서의 r 판{{{#!wiki style="display: inline; display: none;"
, 번 문단}}} (이전 역사)

문서의 r 판{{{#!wiki style="display: inline; display: none;"
, 번 문단}}} (이전 역사)

문서의 r 판{{{#!wiki style="display: inline; display: none;"
, 번 문단}}} (이전 역사)



파일:크리에이티브 커먼즈 라이선스__CC.png 이 문서의 내용 중 전체 또는 일부는 2023-10-26 19:17:25에 나무위키 NVIDIA 데이터 센터 GPU 문서에서 가져왔습니다.