NVIDIA RTX

덤프버전 :

분류

파일:다른 뜻 아이콘.svg
은(는) 여기로 연결됩니다.
배틀그라운드 프로게임단에 대한 내용은 Team Quadro 문서
Team Quadro번 문단을
Team Quadro# 부분을
, {{{#!html }}}에 대한 내용은 문서
#s-번 문단을
#s-번 문단을
# 부분을
# 부분을
, {{{#!html }}}에 대한 내용은 문서
#s-번 문단을
#s-번 문단을
# 부분을
# 부분을
, {{{#!html }}}에 대한 내용은 문서
#s-번 문단을
#s-번 문단을
# 부분을
# 부분을
, {{{#!html }}}에 대한 내용은 문서
#s-번 문단을
#s-번 문단을
# 부분을
# 부분을
, {{{#!html }}}에 대한 내용은 문서
#s-번 문단을
#s-번 문단을
# 부분을
# 부분을
, {{{#!html }}}에 대한 내용은 문서
#s-번 문단을
#s-번 문단을
# 부분을
# 부분을
, {{{#!html }}}에 대한 내용은 문서
#s-번 문단을
#s-번 문단을
# 부분을
# 부분을
, {{{#!html }}}에 대한 내용은 문서
#s-번 문단을
#s-번 문단을
# 부분을
# 부분을
, {{{#!html }}}에 대한 내용은 문서
#s-번 문단을
#s-번 문단을
# 부분을
# 부분을
참고하십시오.






파일:NVIDIA 로고 가로형.svg[[파일:NVIDIA 로고 가로형 화이트.svg
[[NVIDIA/GPU|

GPU 목록
]]
GeForce · GeForce Laptop · NVIDIA RTX · 데이터 센터 GPU
[ 펼치기 · 접기 ]
NV
NV1
NV3
RIVA 128
TwiN Texel
(Fahrenheit)

RIVA TNT
RIVA TNT2
QuadPipe
(Celcius)

GeForce 256
-
Quadro
-
-
GeForce 2
-
Quadro 2
-
-
nFiniteFX I, II
(Kelvin)

GeForce 3
-
Quadro DCC
-
-
GeForce 4
-
Quadro 4
Quadro 4 NVS
-
CineFX 1.0, 2.0
(Rankine)

GeForce FX
-
Quadro FX
Quadro NVS
-
CineFX 3.0, 4.0
(Curie)

GeForce 6
-
-
GeForce 7
-
QUADRO FX
-
-
Unified (Shader)
(Tesla)

GeForce 8
-
QUADRO NVS
TESLA 800
GeForce 9
-
-
-
GeForce 200
-
QUADRO NVS
TESLA 1000
GeForce 100
-
-
-
-
GeForce 300
-
-
-
-
Fermi
GeForce 400
-
QUADRO
-
TESLA 2000
GeForce 500
-
NVS
Kepler
GeForce 600
-
QUADRO K
TESLA K
GeForce 700
GTX TITAN
GeForce 800
GTX TITAN BLACK/Z
Maxwell
GeForce 700
-
-
-
GeForce 800
-
-
-
-
GeForce 900
GTX TITAN X
QUADRO M
-
TESLA M
Pascal
GeForce 10
TITAN X/Xp
QUADRO P
-
TESLA P
Volta
-
TITAN V
QUADRO GV100
-
TESLA V
Turing
GeForce 20
TITAN RTX
QUADRO RTX
-
TESLA T
GeForce 16
-
-
-
-
Ampere
GeForce 30
-
RTX A
-
A
Hopper
-
-
-
-
H
Ada Lovelace
GeForce 40
-
RTX
-
-















1. 개요
2. Quadro 제품군
2.1. Quadro 데스크톱용 제품군
2.1.1. NV10(Celsius) 마이크로아키텍처
2.1.1.1. Quadro
2.1.1.2. Quadro 2
2.1.1.3. Quadro 4 XGL
2.1.2. NV20(Kelvin) 마이크로아키텍처
2.1.2.1. Quadro DCC
2.1.2.2. Quadro 4 XGL
2.1.3. NV30(Rankine) 마이크로아키텍처
2.1.3.1. Quadro FX (x000)
2.1.3.2. Quadro FX (x100)
2.1.3.3. Quadro FX (x300)
2.1.4. NV40(Curie) 마이크로아키텍처
2.1.4.1. Quadro FX (x000)
2.1.4.2. Quadro FX (x400)
2.1.4.3. Quadro FX (x500)
2.1.5. G80(Tesla) 마이크로아키텍처
2.1.5.1. Quadro FX (x600)
2.1.5.2. Quadro FX (x700)
2.1.5.3. Quadro FX (x800)
2.1.5.4. Quadro CX
2.1.5.5. Quadro VX
2.1.6. Fermi 마이크로아키텍처
2.1.6.1. Quadro (x000)
2.1.7. Kepler 마이크로아키텍처
2.1.7.1. Quadro K
2.1.8. Maxwell 마이크로아키텍처
2.1.8.1. Quadro M
2.1.9. Pascal 마이크로아키텍처
2.1.9.1. Quadro P
2.1.10. Volta 마이크로아키텍처
2.1.10.1. Quadro V
2.1.11. Turing 마이크로아키텍처
2.1.11.1. Quadro RTX
2.1.12. Ampere 마이크로아키텍처
2.1.12.1. RTX A
2.1.13. Ada Lovelace 마이크로아키텍처
2.1.13.1. RTX Ada
2.2. Quadro 모바일용 제품군
2.2.1. NV10(Celsius) 마이크로아키텍처
2.2.1.1. Quadro 4 Go
2.2.2. NV20(Kelvin) 마이크로아키텍처
2.2.2.1. Quadro 4 Go
2.2.3. NV30(Rankine) 마이크로아키텍처
2.2.3.1. Quadro FX Go
2.2.4. NV40(Curie) 마이크로아키텍처
2.2.4.1. Quadro FX Go
2.2.4.2. Quadro FX (x500M)
2.2.5. G80(Tesla) 마이크로아키텍처
2.2.5.1. Quadro FX (x600M)
2.2.5.2. Quadro FX (x700M)
2.2.5.3. Quadro FX (x800M)
2.2.6. Fermi 마이크로아키텍처
2.2.6.1. Quadro (x000M)
2.2.7. Kepler 마이크로아키텍처
2.2.7.1. Quadro Kx000M
2.2.7.2. Quadro Kx100M
2.2.8. Maxwell 마이크로아키텍처
2.2.8.1. Quadro Kx200M
2.2.8.2. Quadro Mx000M
2.2.8.3. Quadro Mxx00
2.2.9. Pascal 마이크로아키텍처
2.2.9.1. Quadro Pxx00
2.2.9.2. Quadro Pxx00 Max-Q
2.2.10. Turing 마이크로아키텍처
2.2.10.1. Quadro RTX
2.2.10.2. Quadro RTX Max-Q
2.2.11. Ampere 마이크로아키텍처
2.2.11.1. RTX A
3. NVS 제품군
3.1. NVS 데스크톱용 제품군
3.1.1. NV10(Celsius) 마이크로아키텍처
3.1.2. NV30(Rankine) 마이크로아키텍처
3.1.3. NV40(Curie) 마이크로아키텍처
3.1.4. G80(Tesla) 마이크로아키텍처
3.1.5. Fermi 마이크로아키텍처
3.1.6. Kepler 마이크로아키텍처
3.1.7. Maxwell 마이크로아키텍처
3.2. NVS 모바일용 제품군
3.2.1. NV40(Curie) 마이크로아키텍처
3.2.2. G80(Tesla) 마이크로아키텍처
3.2.3. Fermi 마이크로아키텍처
4. 데이터 센터 GPU 제품군 (구 Tesla)
4.1. G80(Tesla) 마이크로아키텍처
4.2. Fermi 마이크로아키텍처
4.3. Kepler 마이크로아키텍처
4.4. Maxwell 마이크로아키텍처
4.5. Pascal 마이크로아키텍처
4.6. Volta 마이크로아키텍처
4.7. Turing 마이크로아키텍처
4.8. Ampere 마이크로아키텍처
5. GRID 제품군
5.1. Kepler 마이크로아키텍처
5.1.1. GRID K1
5.1.2. GRID K2
5.1.3. GRID K3
5.1.4. GRID K5
5.2. Maxwell 마이크로아키텍처
5.2.1. GRID M
6. Mining 제품군
6.1. Pascal 마이크로아키텍처
7. 관련 문서



1. 개요[편집]


NVIDIA워크스테이션용 GPU 목록. 용도별로 그래픽 정밀 렌더링용인 Quadro, 비즈니스 멀티 모니터 출력용인 NVS, 고성능 컴퓨팅용인 Tesla, 가상 작업 공간용인 GRID, 암호화폐 채굴용인 Mining 제품군이 있다.


2. Quadro 제품군[편집]


1999년 지포스와 비슷한 시기에 탄생했다. 지포스와 다르게 일반 사용자가 아닌 전문가를 대상으로 정밀 렌더링 작업용으로 내놓은 제품이다. 하지만, GPU 칩셋 자체는 지포스와 같다. 같은 칩셋을 쓰고 있음에도 불구하고 단일이 아닌 두 제품군으로 내놓는 것은 하드웨어 자원은 한정되어 있으므로 용도별 드라이버 소프트웨어로 자원 분배를 차등해야 하기 때문이다. 게이밍용인 지포스는 빠른 프레임률을 추구하는 방향으로, 쿼드로는 프레임률이 다소 느려도 정확한 렌더링을 추구하는 방향으로 차등해 놓았다. 전문가용 시장 공략에 대성공한데다가 근본적인 알맹이가 똑같은 게이밍용 지포스보다 전문가용이라는 이유로 훨씬 비싸게 판매해서 더 많은 이득을 보고 있다. 쿼드로와 같은 워크스테이션 GPU를 사용하는 주 목적인 레거시 OpenGL을 사용하는 프로그램들이 점차 없어지면서 3D 작업을 위해 쿼드로를 사용하는 의미가 점차 퇴색되고 있다. 최근에는 ECC/REG 같은 오류 보정 기능이 있는 서버용 메모리와 소비자용 그래픽카드에서 보이는 NVENC 제한[1]이 없고 vGPU등을 지원해 차등화하는 편이다. 지포스 시리즈는 오류 보정 기능이 없는 일반 메모리를 탑재했다. 이는 AMD의 Radeon Instinct 제품군도 마찬가지로 라데온 시리즈와의 차별화를 두고 있다.

다만, 현업자들은 아무리 쿼드로의 특장점이 과거보다 퇴색됐다 하더라도, 일반 지포스 제품과 엄연한 차이가 있다고 말한다. 또한, 여전히 더 비싼 값을 주더라도 동세대 일반 지포스보다 스펙상 성능이 떨어지는 쿼드로를 선택하고 있다. 그 가장 대표적인 이유는 쿼드로로 작업할 때는 작업 시간과 관계 없이 성능이 일정하게 유지되는데, 일반 지포스는 짧은 작업시간 내에서도 성능 널뛰기가 심하다는 것이다. 특히, 무압축 고해상도 2D 작업같은 경우엔 방대한 규모의 VRAM이 필요하기에 쿼드로 제품군을 선택할 수밖에 없다. 또한, 랩탑을 많이 활용하는 기술영업 직군에서도 쿼드로의 인기는 여전한데, 고객사에게 뭔가를 보여줄 때 버벅거리는 모습을 절대 보여줘서는 안 되기 때문이다.

"쿼드로는 지포스랑 별개의 독자적인 것"으로 생각하거나 심지어 "쿼드로는 게임성능이 구리다" 라는 선입견이 상당히 널리 퍼져있는데, 물론 같은 가격대 카드끼리 비교하면 구린게 맞다 사실 기본구조는 지포스나 쿼드로나 거의 같다. 지포스에 쓰던 칩 가져와서 몇몇 기능 해제시켜주고, VRAM 늘리고, 가격 뻥튀기한게 쿼드로다. 그래서 동일 칩을 쓰는 쿼드로와 지포스는 실제로 게임성능이 거의 동일하다. 지포스와 동급의 쿼드로를 찾는법은 간단한데 쿠다코어 갯수로 비교해보면 된다. 예를 들어 하나 찾아보자면 Quadro RTX 8000(쿠다 4608개)은 TU102 풀칩이 들어갔는데 이 칩은 TITAN RTX(쿠다 4608개)에 들어가는 TU102 풀칩과 완전 동일하기 때문에 게임에서만큼은 QUADRO RTX 8000 =< TITAN RTX 라고 볼 수 있다.[2] 따라서 설마 그런 돈지랄을 할사람이 있는지는 모르겠지만 쿼드로로 게임을 해도 게임 하는데에는 전혀 지장이 없다.

2002년부터는 지포스와 마찬가지로 쿼드로에도 랩톱 제품군이 투입되었지만, 랩톱이라는 작고 얇은 제약된 공간 특성상 데스크톱용보다 사양을 낮췄고, 그런 점에서는 랩톱용 지포스와 비슷하다. 모바일 워크스테이션에 탑재하는 쿼드로는 외장 그래픽으로 내놓은 쿼드로 제품군 대부분을 탑재하고 있다. 하지만 전문가용이라 웬만한 게이밍 랩톱보다 훨씬 비싸다. 이에 관한 자세한 내용은 모바일 워크스테이션 문서 참조.

2020년 10월 암페어 아키텍처 기반의 RTX A6000과 A40이 출시되었는데 쿼드로 브랜드가 사라진 채 발표되었다. 이미 사라진 테슬라와 균형을 맞추기 위한 것인지는 확실히 밝혀지지 않았지만, 일단 엔비디아 홈페이지에서는 신형 쿼드로로 소개하고 있다. 다만 제품 명칭에서는 확실하게 사라졌다. 테슬라야 그렇다 쳐도 쿼드로는 지포스와 같이 20년을 이어져 온 브랜드인데 왜 갑자기 사라졌는지가 의문이다.


2.1. Quadro 데스크톱용 제품군[편집]



2.1.1. NV10(Celsius) 마이크로아키텍처[편집]



2.1.1.1. Quadro[편집]

모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
PP:TMU:ROP
클럭
(MHz)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
Quadro
NV10
(220㎚)
(111㎟)
4:4:4
135
128
SDR
166
32
?
?
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]


[1] 소비자용 카드는 동시에 3개를 초과하는 영상 트랜스코딩이 불가능하다.[2] <이 아니라 =<이라고 한 이유는, 쿼드로 RTX 8000은 냉각에 불리한 블로워팬이라 일반 플라워형 팬을 장착한 TITAN RTX에 비해 온도가 높아서 클럭이 상대적으로 딸린다. 그래서 게임 프레임률이 TITAN RTX보다 소폭 낮게 나오는 것을 감안한 것이다.



2.1.1.2. Quadro 2[편집]

모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
PP:TMU:ROP
클럭
(MHz)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
Quadro 2 Pro
NV15
(180㎚)
(90㎟)
4:4:4
200
128
DDR
250
(500)
64
?
?
Quadro 2 MXR
NV11
(180㎚)
(65㎟)
2:4:4
SDR
183
32
?
?
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]





2.1.1.3. Quadro 4 XGL[편집]

모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
PP:TMU:ROP
클럭
(MHz)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
Quadro 4 550 XGL
NV17
(150㎚)
(65㎟)
2:4:4
270
128
DDR
200
(400)
64
?
?
Quadro 4 500 XGL
250
SDR
166
128
?
?
Quadro 4 580 XGL
NV18
(150㎚)
(65㎟)
300
DDR
200
(400)
64
?
?
Quadro 4 380 XGL
275
256
(512)
128
?
?
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]





2.1.2. NV20(Kelvin) 마이크로아키텍처[편집]



2.1.2.1. Quadro DCC[편집]

모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
PS:VS:TMU:ROP
클럭
(MHz)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
Quadro DCC
NV20
(150㎚)
(128㎟)
4:1:4:4
200
128
SDR
230
64
?
?
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(GPU 클럭) × (버텍스 셰이더의 개수) ÷ 4 = (버텍스 연산 속도) [MVertices/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]





2.1.2.2. Quadro 4 XGL[편집]

모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
PS:VS:TMU:ROP
클럭
(MHz)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
Quadro 4 900 XGL
NV25
(150㎚)
(142㎟)
4:2:8:8
300
128
DDR
325
(650)
128
?
?
Quadro 4 750 XGL
275
225
(450)
?
?
Quadro 4 700 XGL
64
?
?
Quadro 4 980 XGL
NV28
(150㎚)
(101㎟)
300
325
(650)
128
?
?
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(GPU 클럭) × (버텍스 셰이더의 개수) ÷ 4 = (버텍스 연산 속도) [MVertices/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]





2.1.3. NV30(Rankine) 마이크로아키텍처[편집]



2.1.3.1. Quadro FX (x000)[편집]

모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
PS:VS:TMU:ROP
클럭
(MHz)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
Quadro FX 1000
NV30
(130㎚)
(200㎟)
4:2:8:4
300
128
GDDR2
300
(600)
128
?
?
Quadro FX 2000
400
400
(800)
?
?
Quadro FX 3000
NV35
(130㎚)
(207㎟)
4:3:8:8
256
DDR
425
(850)
256
?
?
Quadro FX 700
4:1:4:4
275
128
275
(550)
128
?
?
Quadro FX 600
[3]
NV34
(150㎚)
(91㎟)
4:2:4:4
270
240
(480)
?
?
Quadro FX 500
4:1:4:4
?
?
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(GPU 클럭) × (버텍스 셰이더의 개수) ÷ 4 = (버텍스 연산 속도) [MVertices/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]


[3] PCI 슬롯형 모델.



2.1.3.2. Quadro FX (x100)[편집]

모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
PS:VS:TMU:ROP
클럭
(MHz)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
Quadro FX 1100
NV36
(130㎚)
(125㎟)
4:3:4:4
425
128
GDDR2
325
(650)
256
?
?
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(GPU 클럭) × (버텍스 셰이더의 개수) ÷ 4 = (버텍스 연산 속도) [MVertices/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]





2.1.3.3. Quadro FX (x300)[편집]

모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
PS:VS:TMU:ROP
클럭
(MHz)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
Quadro FX 1300
NV38
(130㎚)
(207㎟)
8:3:8:8
350
128
DDR
275
(550)
128
?
?
Quadro FX 330
NV35
(130㎚)
(207㎟)
4:2:4:2
250
64
GDDR2
200
(400)
64
?
?
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(GPU 클럭) × (버텍스 셰이더의 개수) ÷ 4 = (버텍스 연산 속도) [MVertices/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]





2.1.4. NV40(Curie) 마이크로아키텍처[편집]



2.1.4.1. Quadro FX (x000)[편집]

모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
PS:VS:TMU:ROP
클럭
(MHz)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
Quadro FX 4000
NV40
(130㎚)
(287㎟)
12:5:12:8
375
256
GDDR3
500
(1000)
256
?
?
Quadro FX 4000 SDI
NV41
(130㎚)
(225㎟)
12:5:12:12
425
?
?
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(GPU 클럭) × (버텍스 셰이더의 개수) ÷ 4 = (버텍스 연산 속도) [MVertices/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]





2.1.4.2. Quadro FX (x400)[편집]

모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
PS:VS:TMU:ROP
클럭
(MHz)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
Quadro FX 4400
NV40
(AGP)
(130㎚)
(287㎟)
12:5:12:12
375
256
GDDR3
525
(1050)
256
?
?
Quadro FX 3450
NV41
(PCIe)
(130㎚)
(225㎟)
425
500
(1000)
?
?
Quadro FX 3400
NV45
(PCIe)
(130㎚)
(287㎟)
350
450
(900)
?
?
Quadro FX 1400
NV41
(PCIe)
(130㎚)
(225㎟)
12:5:12:8
128
DDR
300
(600)
128
?
?
Quadro FX 540
NV43
(PCIe)
(110㎚)
(150㎟)
8:4:8:8
300
GDDR3
250
(500)
?
?
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(GPU 클럭) × (버텍스 셰이더의 개수) ÷ 4 = (버텍스 연산 속도) [MVertices/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]





2.1.4.3. Quadro FX (x500)[편집]

모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
PS:VS:TMU:ROP
클럭
(MHz)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
Quadro FX 4500
G70
NV47
(110㎚)
(333㎟)
24:8:24:16
430
256
GDDR3
525
(1050)
512
?
?
Quadro FX 5500
G71
NV49
(90㎚)
(196㎟)
650
505
(1010)
1024
?
?
Quadro FX 4500 X2
24:8:24:16
x2
375
256
x2
605
(1210)
512
x2
?
?
Quadro FX 3500
20:7:20:16
450
256
660
(1320)
256
?
?
Quadro FX 1500
325
625
(1250)
?
?
Quadro FX 560
G73
NV4B
(90㎚)
(125㎟)
12:5:12:8
350
128
600
(1200)
128
?
?
Quadro FX 550
NV43
(110㎚)
(150㎟)
8:4:8:8
360
400
(800)
?
?
Quadro FX 350
G72
NV4A
(90㎚)
(81㎟)
4:3:4:2
550
64
DDR2
405
(810)
?
?
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(GPU 클럭) × (버텍스 셰이더의 개수) ÷ 4 = (버텍스 연산 속도) [MVertices/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]





2.1.5. G80(Tesla) 마이크로아키텍처[편집]



2.1.5.1. Quadro FX (x600)[편집]

모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(TPC, SM)
클럭
(MHz)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
FX 5600
G80
(90㎚)
(484㎟)
128:32:24
(8, 16)
600
(코어)
1350
(셰이더)
384
GDDR3
800
(1600)
1536
171
2999
FX 4600
96:24:24
(6, 12)
500
(코어)
1200
(셰이더)
700
(1400)
768
134
1999
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]





2.1.5.2. Quadro FX (x700)[편집]

모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(TPC, SM)
클럭
(MHz)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
FX 3700
G92
(65㎚)
(324㎟)
112:56:16
(7, 14)
500
(코어)
1250
(셰이더)
256
GDDR3
800
(1600)
512
78
1599
FX 4700 X2
128:64:16
(8 x2, 16 x2)
x2
600
(코어)
1500
(셰이더)
256
x2
1024
x2
226
2999
FX 1700
G84
(80㎚)
(169㎟)
32:16:8
(2, 4)
460
(코어)
920
(셰이더)
256
DDR2
400
(800)
512
42
699
FX 570
16:8:8
(1, 2)
128
256
38
199
FX 370
16:8:4
(1, 2)
360
(코어)
720
(셰이더)
64
500
(1000)
35
129
FX 370 LP
G98
(65㎚)
(86㎟)
8:8:4
(1, 1)
540
(코어)
1080
(셰이더)
25
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]





2.1.5.3. Quadro FX (x800)[편집]

모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(TPC, SM)
클럭
(MHz)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
FX 5800
G200B
(55㎚)
(470㎟)
240:80:32
(10, 30)
500
(코어)
1250
(셰이더)
256
GDDR3
800
(1600)
512
78
1599
FX 4800
192:64:24
(8, 24)
602
(코어)
1204
(셰이더)
384
1536
150
1799
FX 3800
192:64:16
(8, 24)
256
1024
108
799
FX 1800
G94
(65㎚)
(240㎟)
64:32:12
(4, 8)
550
(코어)
1375
(셰이더)
192
768
59
489
FX 580
G96C
(55㎚)
(121㎟)
32:16:8
(2, 4)
450
(코어)
1125
(셰이더)
128
512
40
199
FX 380
G96
(65㎚)
(144㎟)
16:8:8
(1, 2)
450
(코어)
1100
(셰이더)
700
(1400)
256
34
129
FX 380 LP
GT218
(40㎚)
(57㎟)
16:8:4
(1, 2)
650
(코어)
1375
(셰이더)
64
800
(1600)
512
28
169
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]





2.1.5.4. Quadro CX[편집]

모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(TPC, SM)
클럭
(MHz)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
CX
G200B
(55㎚)
(470㎟)
192:64:24
(8, 24)
602
(코어)
1204
(셰이더)
384
GDDR3
800
(1600)
1536
150
1999
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]





2.1.5.5. Quadro VX[편집]

모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(TPC, SM)
클럭
(MHz)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
VX 200
G92
(65㎚)
(324㎟)
112:56:16
(7, 14)
450
(코어)
1125
(셰이더)
256
GDDR3
800
(1600)
512
75
?
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]





2.1.6. Fermi 마이크로아키텍처[편집]



2.1.6.1. Quadro (x000)[편집]

모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(GPC, SM)
클럭
(MHz)
L2
캐시
(KB)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
7000
GF110
(40㎚)
(520㎟)
512:64:48
(4, 16)
651
(코어)
1301
(셰이더)
768
384
GDDR5
924
(3696)
6
204
14499
6000
GF100
(40㎚)
(529㎟)
448:56:48
(4, 14)
574
(코어)
1147
(셰이더)
747
(2988)
4399
5000
352:44:40
(3, 11)
513
(코어)
1026
(셰이더)
640
320
750
(3000)
2.5
152
2499
4000
256:32:32
(2, 8)
475
(코어)
950
(셰이더)
512
256
702
(2808)
2
142
1199
2000
GF106
(40㎚)
(238㎟)
192:32:16
(1, 4)
625
(코어)
1250
(셰이더)
256
128
650
(2600)
1
62
599
600
GF108
(40㎚)
(116㎟)
96:16:8
(1, 2)
640
(코어)
1280
(셰이더)
DDR3
800
(1600)
40
179
400
GT216
(40㎚)
(100㎟)
48:16:8
(2, 6)
450
(코어)
1125
(셰이더)
-
64
770
(1540)
0.5
32
169
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
GF100, GF110 칩셋 한정 → (단정밀도 연산 속도) ÷ 2 = (배정밀도 연산 속도) [GFLOPS]
GF106, GF108 칩셋 한정 → (단정밀도 연산 속도) ÷ 12 = (배정밀도 연산 속도) [GFLOPS]
(GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]



이 모델까지 듀얼 DVI를 지원하기 때문에 일반적인 사무실에서 2D 작업용으로 쓰기에 괜찮다. 쿼드로 K시리즈만 가도 dp 포트가 달리기 때문이다.
쿼드로 2000은 크기도 작고 6pin 보조전원을 필요로 하지 않아 사무실 컴퓨터에서 쓰기에도 용이하다.

2.1.7. Kepler 마이크로아키텍처[편집]



2.1.7.1. Quadro K[편집]

모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(GPC, SMX/SMM)
클럭
(MHz)
L2
캐시
(KB)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
K6000
GK110
(28㎚)
(561㎟)
2880:240:48
(5, 15)
797
(기본)
902
(부스트)
1536
384
GDDR5
1502
(6008)
12
225
5265
K5200
2304:192:48
(4, 12)
667
(기본)
771
(부스트)
1024
256
8
150
?
K5000
GK104
(28㎚)
(294㎟)
1536:128:32
(4, 8)
706
(기본)
512
1350
(5400)
4
122
2499
K4200
1344:112:32
(4, 7)
771
(기본)
784
(부스트)
108
?
K4000
GK106
(28㎚)
(221㎟)
768:64:24
(2, 4)
810
(기본)
384
192
1404
(5616)
3
80
1269
K2200
GM107
(28㎚)
(148㎟)
640:40:16
(1, 5)
1046
(기본)
1124
(부스트)
2048
128
1253
(5012)
4
68
?
K2000
GK107
(28㎚)
(118㎟)
384:32:16
(1, 2)
954
(기본)
256
1000
(4000)
2
51
599
K1200
GM107
(28㎚)
(148㎟)
512:32:16
(1, 4)
1058
(기본)
1124
(부스트)
2048
1250
(5000)
4
45
?
K620
384:16:16
(1, 3)
1058
(기본)
1124
(부스트)
DDR3
900
(1800)
2
41
?
K600
GK107
(28㎚)
(118㎟)
192:16:16
(1, 1)
876
(기본)
256
891
(1792)
1
41
199
K420
?
K410
192:16:8
(1, 1)
706
(기본)
128
64
0.5
38
149
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
GK110 칩셋 한정 → (단정밀도 연산 속도) ÷ 3 = (배정밀도 연산 속도) [GFLOPS]
GK104, GK106, GK107 칩셋 한정 → (단정밀도 연산 속도) ÷ 24 = (배정밀도 연산 속도) [GFLOPS]
GM107 칩셋 한정 → (단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]





2.1.8. Maxwell 마이크로아키텍처[편집]



2.1.8.1. Quadro M[편집]

모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(GPC, SMX/SMM)
클럭
(MHz)
L2
캐시
(MB)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
M6000
GM200
(28㎚)
(601㎟)
3072:192:96
(6, 24)
988
(기본)
1114
(부스트)
3
384
GDDR5
1653
(6612)
12
24
250
4999
M5000
GM204
(28㎚)
(398㎟)
2048:128:64
(4, 16)
861
(기본)
1038
(부스트)
2
256
8
150
?
M4000
1664:104:64
(4, 13)
773
120
?
M3000 SE
1024:64:32
(2, 8)
540
1253
(5012)
4
75
?
M2000
GM206
(28㎚)
(228㎟)
768:48:32
(2, 6)
872
(기본)
1180
(부스트)
1
128
1653
(6612)
?
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]





2.1.9. Pascal 마이크로아키텍처[편집]



2.1.9.1. Quadro P[편집]

모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(GPC, SM)
클럭
(MHz)
L2
캐시
(MB)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
GP100
GP100
(16㎚)
(610㎟)
3584:224:96
(6, 56)
1380
(기본)
1441
(부스트)
4
4096
HBM2
900
(1800)
16
235
6999
P6000
GP102
(16㎚)
(471㎟)
3840:240:96
(6, 30)
1417
(기본)
1531
(부스트)
3
384
GDDR5X
1127
(9016)
24
250
4999
P5000
GP104
(16㎚)
(314㎟)
2560:160:64
(4, 20)
1607
(기본)
1733
(부스트)
2
256
16
180
2499
P4000
1792:112:64
(4, 14)
1202
(기본)
1480
(부스트)
GDDR5
1901
(7604)
8
105
815
P2000
GP106
(16㎚)
(200㎟)
1024:64:40
(2, 8)
1076
(기본)
1480
(부스트)
1.25
160
1752
(7008)
5
75
?
P1000
GP107
(16㎚)
(132㎟)
640:40:32
(1, 5)
1266
(기본)
1480
(부스트)
1
128
1253
(5012)
4
47
?
P620
384:24:16
(1, 3)
1354
(기본)
1455
(부스트)
1003
(4012)
2
40
?
P600
1329
(기본)
1557
(부스트)
0.5
64
?
P400
256:16:16
(1, 2)
1228
(기본)
1328
(부스트)
30
?
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]





2.1.10. Volta 마이크로아키텍처[편집]



2.1.10.1. Quadro V[편집]

모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
CUDA:TC:TMU:ROP
(GPC, SM)
클럭
(MHz)
L2
캐시
(MB)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
GV100
GV100
(12㎚)
(815㎟)
5120:640:320:128
(6, 80)
1132
(기본)
1628
(부스트)
8
4096
HBM2
850
(1700)
32
250
8999
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 2 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (텐서 코어의 개수) × 64 ÷ 1000 = (반정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]





2.1.11. Turing 마이크로아키텍처[편집]



2.1.11.1. Quadro RTX[편집]

모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
CUDA:TC:TMU:RT:ROP
(GPC, SM)
클럭
(MHz)
L2
캐시
(MB)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
RTX 8000
TU102
(12㎚)
(754㎟)
4608:576:288:72:96
(6, 72)
1005
(기본)
1200
(부스트)
6
384
GDDR6
1750
(14000)
48
250
9999
RTX 6000
1440
(기본)
1770
(부스트)
24
6299
RTX 5000
TU104
(12㎚)
(545㎟)
3072:384:192:48:64
(6, 48)
1620
(기본)
1815
(부스트)
4
256
16
200
2299
RTX 4000
2304:288:144:36:64
(5, 36)
1215
(기본)
1710
(부스트)
1625
(13000)
8
160
899
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 2 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (텐서 코어의 개수) × 64 ÷ 1000 = (반정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]




같은 세대의 GeForce 20이 그렇듯 USB-C 단자를 지원한다.

2.1.12. Ampere 마이크로아키텍처[편집]



2.1.12.1. RTX A[편집]

모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
CUDA:TC:TMU:RT:ROP
(GPC, SM)
클럭
(MHz)
L2
캐시
(MB)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
RTX A6000
GA102
(8㎚)
(628㎟)
10752:336:336:84:112
(7, 84)
1410
(기본)
1800
(부스트)
6
384
GDDR6
2000
(16000)
48
300
????
RTX A5500
10240:320:320:80:96
(7, 80)
1170
(기본)
1695
(부스트)
24
230
????
RTX A5000
8192:256:256:64:96
(6, 64)
1170
(기본)
1695
(부스트)
24
????
RTX A4500
GA104
(8㎚)
(393㎟)
7168:224:224:56:96
(6, 56)
1050
(기본)
1650
(부스트)
4
320
1750
(14000)
20
200
????
RTX A4000
6144:192:192:48:96
(6, 48)
745
(기본)
1560
(부스트)
256
16
140
????
RTX A2000
GA106
(8㎚)
(276㎟)
3328:104:104:26:48
(3, 26)
562
(기본)
1200
(부스트)
2.25
192
1500
(12000)
6
12
70
???
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 2 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (텐서 코어의 개수) × 64 ÷ 1000 = (반정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]





2.1.13. Ada Lovelace 마이크로아키텍처[편집]



2.1.13.1. RTX Ada[편집]

모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
CUDA:TC:TMU:RT:ROP
(GPC, SM)
클럭
(MHz)
L2
캐시
(MB)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
RTX 6000 Ada
AD102
(4㎚)
(609㎟)
18176:568:568:142:192
(12, 142)
915
(기본)
2505
(부스트)
96
384
GDDR6
2500
(20000)
48
300
6799
RTX 5000 Ada
12800:400:400:100:???
(12, ???)
1170
(기본)
2500
(부스트)
??
256
????
(18000)
32
250
3999
RTX 4500 Ada
AD104
(4㎚)
(295㎟)
7680:240:240:60:??
(5, ??)
???
(기본)
2600
(부스트)
??
192
24
210
????
RTX 4000 Ada[4]
6144:192:192:48:80
(5, 48)
???
(기본)
2200
(부스트)
48
160
20
130
????
RTX 4000 Ada SFF[5]
720
(기본)
1560
(부스트)
1750
(16000)
70
1249
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 2 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (텐서 코어의 개수) × 64 ÷ 1000 = (반정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]


[4] 싱글슬롯, non-LP[5] 더블슬롯, LP


2.2. Quadro 모바일용 제품군[편집]



2.2.1. NV10(Celsius) 마이크로아키텍처[편집]



2.2.1.1. Quadro 4 Go[편집]

모델명
GPU
그래픽 메모리
TDP
(W)
칩셋명
(공정)
(면적)
PP:TMU:ROP
클럭
(MHz)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
Quadro 4 500 Go GL
NV17
(150㎚)
(65㎟)
2:4:2
220
128
SDR
220
64
?
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]





2.2.2. NV20(Kelvin) 마이크로아키텍처[편집]



2.2.2.1. Quadro 4 Go[편집]

모델명
GPU
그래픽 메모리
TDP
(W)
칩셋명
(공정)
(면적)
PS:VS:TMU:ROP
클럭
(MHz)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
Quadro 4 700 Go GL
NV28
(150㎚)
(101㎟)
4:2:4:4
176
128
SDR
200
64
?
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(GPU 클럭) × (버텍스 셰이더의 개수) ÷ 4 = (버텍스 연산 속도) [MVertices/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]





2.2.3. NV30(Rankine) 마이크로아키텍처[편집]



2.2.3.1. Quadro FX Go[편집]

모델명
GPU
그래픽 메모리
TDP
(W)
칩셋명
(공정)
(면적)
PS:VS:TMU:ROP
클럭
(MHz)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
Quadro FX Go 1000
NV36
(130㎚)
(125㎟)
4:3:4:4
295
128
DDR
285
(570)
128
?
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(GPU 클럭) × (버텍스 셰이더의 개수) ÷ 4 = (버텍스 연산 속도) [MVertices/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]





2.2.4. NV40(Curie) 마이크로아키텍처[편집]



2.2.4.1. Quadro FX Go[편집]

모델명
GPU
그래픽 메모리
TDP
(W)
칩셋명
(공정)
(면적)
PS:VS:TMU:ROP
클럭
(MHz)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
Quadro FX Go 1400
NV41
(130㎚)
(225㎟)
8:5:8:8
275
256
DDR
295
(590)
256
?
Quadro FX Go 540
NV43
(110㎚)
(150㎟)
8:4:8:8
300
128
225
(450)
128
25
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(GPU 클럭) × (버텍스 셰이더의 개수) ÷ 4 = (버텍스 연산 속도) [MVertices/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]





2.2.4.2. Quadro FX (x500M)[편집]

모델명
GPU
그래픽 메모리
TDP
(W)
칩셋명
(공정)
(면적)
PS:VS:TMU:ROP
클럭
(MHz)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
Quadro FX 3500M
G71
NV49
(90㎚)
(196㎟)
24:8:24:16
575
256
GDDR3
600
(1200)
512
45
Quadro FX 2500M
500
Quadro FX 1500M
20:7:24:16
375
500
(1000)
Quadro FX 550M
G73
NV4B
(90㎚)
(125㎟)
12:5:12:8
480
128
35
Quadro FX 350M
G72
NV4A
(90㎚)
(81㎟)
4:3:4:2
450
450
(900)
256
15
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(GPU 클럭) × (버텍스 셰이더의 개수) ÷ 4 = (버텍스 연산 속도) [MVertices/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]





2.2.5. G80(Tesla) 마이크로아키텍처[편집]



2.2.5.1. Quadro FX (x600M)[편집]

모델명
GPU
그래픽 메모리
TDP
(W)
칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(TPC, SM)
클럭
(MHz)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
FX 3600M
G92
(65㎚)
(324㎟)
96:48:16
(6, 12)
500
(코어)
1250
(셰이더)
256
GDDR3
800
(1600)
512
70
FX 2600M
64:32:16
(4, 8)
799
(1598)
FX 1600M
G84
(80㎚)
(169㎟)
32:16:8
(2, 4)
625
(코어)
1250
(셰이더)
128
800
(1600)
50
FX 360M
G86
(80㎚)
(127㎟)
16:8:4
(1, 2)
400
(코어)
800
(셰이더)
64
DDR2
600
(1200)
256
17
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]





2.2.5.2. Quadro FX (x700M)[편집]

모델명
GPU
그래픽 메모리
TDP
(W)
칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(TPC, SM)
클럭
(MHz)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
FX 3700M
G92
(65㎚)
(324㎟)
128:64:16
(8, 16)
550
(코어)
1375
(셰이더)
256
GDDR3
800
(1600)
1024
75
FX 2700M
G94
(65㎚)
(240㎟)
48:24:16
(3, 6)
530
(코어)
1325
(셰이더)
799
(1598)
512
65
FX 1700M
G96
(65㎚)
(144㎟)
32:16:8
(2, 4)
625
(코어)
1550
(셰이더)
128
800
(1600)
50
FX 770M
500
(코어)
1250
(셰이더)
35
FX 570M
G84
(80㎚)
(169㎟)
475
(코어)
950
(셰이더)
700
(1400)
45
FX 370M
G98
(65㎚)
(86㎟)
8:4:4
(1, 1)
550
(코어)
1400
(셰이더)
64
600
(1200)
256
20
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]





2.2.5.3. Quadro FX (x800M)[편집]

모델명
GPU
그래픽 메모리
TDP
(W)
칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(TPC, SM)
클럭
(MHz)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
FX 3800M
G92
(65㎚)
(324㎟)
128:64:16
(8, 16)
675
(코어)
1650
(셰이더)
256
GDDR3
1000
(2000)
1024
100
FX 2800M
96:48:16
(6, 12)
600
(코어)
1500
(셰이더)
75
FX 1800M
GT215
(40㎚)
(144㎟)
72:24:8
(3, 9)
561
(코어)
1125
(셰이더)
128
GDDR5
550
(2200)
45
FX 880M
GT216
(40㎚)
(100㎟)
48:16:8
(2, 6)
500
(코어)
1250
(셰이더)
GDDR3
790
(1580)
35
FX 380M
GT218
(40㎚)
(57㎟)
16:8:4
(1, 2)
550
(코어)
1400
(셰이더)
64
512
25
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]





2.2.6. Fermi 마이크로아키텍처[편집]



2.2.6.1. Quadro (x000M)[편집]

모델명
GPU
그래픽 메모리
TDP
(W)
칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(GPC, SM)
클럭
(MHz)
L2
캐시
(KB)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
5010M
GF110
(40㎚)
(520㎟)
384:48:32
(3, 12)
450
(코어)
900
(셰이더)
512
256
GDDR5
650
(2600)
4
100
5000M
GF100
(40㎚)
(529㎟)
320:40:32
(3, 10)
405
(코어)
810
(셰이더)
600
(2400)
1.75
4000M
GF104
(40㎚)
(332㎟)
336:56:32
(2, 7)
475
(코어)
950
(셰이더)
625
(2500)
2
3000M
240:40:32
(2, 5)
450
(코어)
900
(셰이더)
75
2000M
GF106
(40㎚)
(238㎟)
192:32:16
(1, 4)
550
(코어)
1100
(셰이더)
256
128
DDR3
900
(1800)
55
1000M
GF108
(40㎚)
(116㎟)
96:16:4
(1, 2)
700
(코어)
1400
(셰이더)
45
500M
1
35
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
GF100, GF110 칩셋 한정 → (단정밀도 연산 속도) ÷ 2 = (배정밀도 연산 속도) [GFLOPS]
GF104, GF106, GF108 칩셋 한정 → (단정밀도 연산 속도) ÷ 12 = (배정밀도 연산 속도) [GFLOPS]
(GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]





2.2.7. Kepler 마이크로아키텍처[편집]



2.2.7.1. Quadro Kx000M[편집]

모델명
GPU
그래픽 메모리
TDP
(W)
칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(GPC, SMX)
클럭
(MHz)
L2
캐시
(KB)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
K5000M
GK104
(28㎚)
(294㎟)
1344:112:32
(4, 7)
601
(기본)
512
256
GDDR5
750
(3000)
4
100
K4000M
960:80:32
(3, 5)
700
(2800)
K3000M
576:48:32
(2, 3)
654
(기본)
2
75
K2000M
GK107
(28㎚)
(118㎟)
384:32:16
(1, 2)
745
(기본)
256
128
DDR3
900
(1800)
55
K1000M
192:16:16
(1, 1)
850
(기본)
45
K500M
192:16:8
(1, 1)
128
64
800
(1600)
1
35
K200M
K100M
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 24 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]





2.2.7.2. Quadro Kx100M[편집]

모델명
GPU
그래픽 메모리
TDP
(W)
칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(GPC, SMX)
클럭
(MHz)
L2
캐시
(KB)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
K5100M
GK104
(28㎚)
(294㎟)
1536:128:32
(4, 8)
771
(기본)
512
256
GDDR5
900
(3600)
8
100
K4100M
1152:96:32
(3, 6)
706
(기본)
800
(3200)
4
K3100M
768:64:32
(2, 4)
75
K2100M
GK106
(28㎚)
(221㎟)
576:48:16
(2, 3)
667
(기본)
256
128
752
(3016)
2
55
K1100M
GK107
(28㎚)
(118㎟)
384:32:16
(1, 2)
706
(기본)
700
(2800)
45
K610M
GK208
(28㎚)
(87㎟)
192:16:8
(1, 1)
980
(기본)
128
64
650
(2600)
1
30
K510M
846
(기본)
600
(2400)
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 24 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]





2.2.8. Maxwell 마이크로아키텍처[편집]



2.2.8.1. Quadro Kx200M[편집]

모델명
GPU
그래픽 메모리
TDP
(W)
칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(GPC, SMM)
클럭
(MHz)
L2
캐시
(MB)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
K2200M
GM107
(28㎚)
(148㎟)
640:40:16
(1, 5)
667
(기본)
2
128
GDDR5
1253
(5012)
2
65
K620M
GM108
(28㎚)
(81㎟)
384:24:8
(1, 3)
1029
(기본)
1
64
DDR3
900
(1800)
30
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]





2.2.8.2. Quadro Mx000M[편집]

모델명
GPU
그래픽 메모리
TDP
(W)
칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(GPC, SMM)
클럭
(MHz)
L2
캐시
(MB)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
M5000M
GM204
(28㎚)
(398㎟)
1536:96:64
(3, 12)
975
(기본)
2
256
GDDR5
1253
(5012)
8
100
M4000M
1280:80:64
(3, 10)
4
M3000M
1024:64:32
(2, 8)
1050
(기본)
1
128
75
M2000M
GM107
(28㎚)
(148㎟)
640:40:16
(1, 5)
1029
(기본)
1098
(부스트)
2
55
M1000M
512:32:16
(1, 4)
993
(기본)
2
40
M600M
384:24:8
(1, 3)
1029
(기본)
1124
(부스트)
30
M500M
GM108
(28㎚)
(81㎟)
1
64
DDR3
900
(1800)
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]





2.2.8.3. Quadro Mxx00[편집]

모델명
GPU
그래픽 메모리
TDP
(W)
칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(GPC, SMM)
클럭
(MHz)
L2
캐시
(MB)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
M5500
GM204
(28㎚)
(398㎟)
2048:128:64
(4, 16)
861
(기본)
1038
(부스트)
2
256
GDDR5
1753
(7012)
8
150
M2200
GM206
(28㎚)
(228㎟)
1024:64:32
(2, 8)
1025
(기본)
1
128
1375
(5500)
4
55
M1200
GM107
(28㎚)
(148㎟)
640:40:16
(1, 5)
1093
(기본)
2
128
1253
(5012)
45
M620
512:32:16
(1, 4)
756
(기본)
977
(부스트)
2
30
M520
GM108
(28㎚)
(81㎟)
384:24:8
(1, 3)
1041
(기본)
1
64
25
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]





2.2.9. Pascal 마이크로아키텍처[편집]



2.2.9.1. Quadro Pxx00[편집]

모델명
GPU
그래픽 메모리
TDP
(W)
칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(GPC, SM)
클럭
(MHz)
L2
캐시
(MB)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
P5200
GP104
(16㎚)
(314㎟)
2560:160:64
(4, 20)
1556
(기본)
1746
(부스트)
2
256
GDDR5
1800
(7200)
16
100
P5000
2048:128:64
(4, 16)
1278
(기본)
1582
(부스트)
1502
(6008)
P4200
2304:144:64
(4, 18)
1227
(기본)
1647
(부스트)
8
P4000
1792:112:64
(3, 14)
1227
(기본)
P3200
1328
(기본)
1476
(부스트)
1.5
192
1753
(7012)
6
75
P3000
1280:80:48
(2, 10)
1088
(기본)
1215
(부스트)
P2000
GP107
(16㎚)
(132㎟)
768:48:32
(1, 6)
1557
(기본)
1607
(부스트)
1
128
1502
(6008)
4
50
P1000
512:32:16
(1, 4)
1303
(기본)
1493
(부스트)
40
P600
384:24:16
(1, 3)
1430
(기본)
1557
(부스트)
1253
(5012)
25
P500
GP108
(16㎚)
(74㎟)
256:16:16
(1, 2)
1228
(기본)
1455
(부스트)
0.5
64
2
18
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]





2.2.9.2. Quadro Pxx00 Max-Q[편집]

모델명
GPU
그래픽 메모리
TDP
(W)
칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(GPC, SM)
클럭
(MHz)
L2
캐시
(MB)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
P5200 Max-Q
GP104
(16㎚)
(314㎟)
2560:160:64
(4, 20)
1316
(기본)
1569
(부스트)
2
256
GDDR5
1804
(7216)
16
100
P4000 Max-Q
1792:112:64
(4, 14)
1114
(기본)
1228
(부스트)
1502
(6008)
8
P3200 Max-Q
1139
(기본)
1404
(부스트)
1.5
192
1753
(7012)
6
75
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]





2.2.10. Turing 마이크로아키텍처[편집]



2.2.10.1. Quadro RTX[편집]

모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
CUDA:TC:TMU:RT:ROP
(GPC, SM)
클럭
(MHz)
L2
캐시
(MB)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
RTX 5000
TU104
(12㎚)
(545㎟)
3072:384:192:48:64
(6, 48)

(기본)

(부스트)
4
256
GDDR6
1750
(14000)
16
110

RTX 4000
2560:320:160:40:64
(5, 40)
1110
(기본)
1560
(부스트)
8

RTX 3000
TU106
(12㎚)
(445㎟)
2304:288:144:36:48
(5, 36)
945
(기본)
1380
(부스트)
6
60~80

RTX T2000
TU117
(12㎚)
(200㎟)
1024:0:64:0:32
(2, 0)
1575
(기본)
1785
(부스트)
1
128
GDDR5
2000
(8000)
4
60

RTX T1000
896:0:56:0:32
(2, 0)
1395
(기본)
1455
(부스트)
40~50

【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 2 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (텐서 코어의 개수) × 64 ÷ 1000 = (반정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]




2.2.10.2. Quadro RTX Max-Q[편집]

모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
CUDA:TC:TMU:RT:ROP
(GPC, SM)
클럭
(MHz)
L2
캐시
(MB)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
RTX 5000 Max-Q
TU104
(12㎚)
(545㎟)
3072:384:192:48:64
(6, 48)
600
(기본)
1350
(부스트)
4
256
GDDR6
1750
(14000)
16
80

RTX 4000 Max-Q
2560:320:160:40:64
(5, 40)
1005
(기본)
1200
(부스트)
1625
(13000)
8

RTX 3000 Max-Q
TU106
(12㎚)
(445㎟)
2304:288:144:36:48
(5, 36)
600
(기본)
1215
(부스트)
6
60

RTX T2000 Max-Q
TU117
(12㎚)
(200㎟)
1024:0:64:0:32
(2, 0)

(기본)

(부스트)
1
128
GDDR5
2000
(8000)
4
40

【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 2 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (텐서 코어의 개수) × 64 ÷ 1000 = (반정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]





2.2.11. Ampere 마이크로아키텍처[편집]



2.2.11.1. RTX A[편집]

모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
CUDA:TC:TMU:RT:ROP
(GPC, SM)
클럭
(MHz)
L2
캐시
(MB)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
RTX A5500
GA103
(8㎚)
(496㎟)
7424:232:232:58:96
(6, 58)
????
(기본)
????
(부스트)
4
256
GDDR6
2000
(16000)
16
80~165
????
RTX A4500
GA104
(8㎚)
(393㎟)
5888:184:184:46:96
(6, 46)
????
(기본)
????
(부스트)
16
80~140
????
RTX A3000
4096:128:128:32:80
(5, 32)
???
(기본)
????
(부스트)
192
1750
(14000)
12
60~130
????
RTX A2000
GA107
(8㎚)
(???㎟)
2560:80:80:20:32
(2, 20)
???
(기본)
????
(부스트)
1.5
8
35~95
???
RTX A1000
2048:64:64:16:32
(2, 16)
???
(기본)
????
(부스트)
128
4
35~95
???
RTX A500
2048:64:64:16:32
(2, 16)
???
(기본)
????
(부스트)
64
4
20~60
???
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 2 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (텐서 코어의 개수) × 64 ÷ 1000 = (반정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]




3. NVS 제품군[편집]


2003년부터 등장한 비즈니스 멀티 모니터 출력용 제품군으로, 본래 쿼드로에서 파생된 녀석이라 2009년까지는 제품명이 NVS 앞에 쿼드로가 붙여 있었다가 2010년 이후에 출시된 제품부터 쿼드로를 뺀 것이 현재의 모습이다. 멀티 모니터용으로써는 과거엔 매트록스가 꽉 잡고 있었기 때문에 지포스에서는 좀처럼 볼 수 없는 하위 GPU를 2개 붙인 형태의 제품을 통해 멀티 모니터 지원을 꾀하기도 했지만 현재까지도 인지도는 낮은 편. 2015년 11월에 발매한 맥스웰 아키텍처 기반의 NVS 810이 최신 NVS 제품으로 이 제품이 나와서야 멀티 모니터 출력용 그래픽 카드에 걸맞는 스펙을 갖추었다. 최대 8개의 디스플레이 출력을 지원하는데 80만원을 호가할 만큼 만만한 제품이 아니다. 이보다 하위 제품은 최대 4개로 4개의 출력은 지포스 제품군에서도 흔하게 볼 수 있어서 4개 이하의 모니터 출력만큼은 효용성이 많이 줄어든 상태. 가격 대비 더 많은 모니터 출력 지원이라면 NVIDIA보단 차라리 AMD 라데온을 알아보는게 더 나을 정도.

쿼드로와 마찬가지로 NVS도 랩톱용 제품군이 존재한다. 그런데 저렴한 중고 워크스테이션 랩톱을 구한답시고 알아본 그래픽의 스펙이 NVS가 붙은 경우가 제법 많이 보이는데 광고 카탈로그에도 NVS 계열 모델에 대한 제원이 자세하지 않은 경우가 많아서 뭔가 좋아보이는 네이밍으로 착각해 낭패볼 수 있으니 주의할 것. NVS는 지금까지 NVS 510M(G71 칩셋 즉 지포스 Go 7900 GTX)을 제외하면 메인스트림 이상의 체급인 칩셋이 사용된 적이 별로 없고 로우엔드 칩셋이 주로 사용되는 명색이 멀티 모니터 출력용인 모델이다. 그래픽 정밀 렌더링용 중고 워크스테이션 랩톱을 알아보고 있는데 뭐가 뭔지 잘 모르겠다면 너무 저렴해 보이는 워크스테이션 랩톱은 일단 거르는 것이 좋은데 쿼드로가 아닌 NVS가 탑재된 제품일 확률이 높다.

NVS에 대한 정보는 해당 공식 홈페이지에서도 확인할 수 있다.[6][7]


3.1. NVS 데스크톱용 제품군[편집]



3.1.1. NV10(Celsius) 마이크로아키텍처[편집]


모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
PP:TMU:ROP
클럭
(MHz)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
Quadro 4 100 NVS
NV17
(150㎚)
(65㎟)
2:4:2
250
128
DDR
166
(332)
64
?
?
Quadro 4 200 NVS
250
(500)
?
?
Quadro 4 400 NVS PCI
220
166
(332)
?
?
Quadro NVS 280 PCI
NV18
(150㎚)
(65㎟)
275
250
(500)
?
?
Quadro NVS 280 SD
250
64
200
(400)
?
?
Quadro NVS 55 PCI
?
?
Quadro NVS 50 PCI
?
?
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]


[6] 직접 4200M을 사용해본 결과, 게임은 마인크래프트 하옵이 일부 경우 40을 넘지 못하지만, 경우에 따라 1440P 유튜브 영상은 네트워크가 좋다는 전제 하에 재생 가능. avi 같은 파일로 1440P 영상은 당연하게 재생이 가능하다. 전체적 시스템은 i5-2520M+8GB 랩톱용 DDR3 메모리 싱글채널+HM65 칩셋+Windows 7+SanDisk 256G SSD이며 유튜브는 버전 54 베타 채널이다.[7] 모바일용으로는 페르미 기반(GF108, GF117) 칩셋 모델까지만 나왔다.



3.1.2. NV30(Rankine) 마이크로아키텍처[편집]


모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
PS:VS:TMU:ROP
클럭
(MHz)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
Quadro NVS 280 AGP
NV34
(150㎚)
(91㎟)
4:1:4:4
275
128
DDR
250
(500)
64
?
?
Quadro NVS 280 PCIe
NV37
(150㎚)
(91㎟)
13
?
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(GPU 클럭) × (버텍스 셰이더의 개수) ÷ 4 = (버텍스 연산 속도) [MVertices/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]





3.1.3. NV40(Curie) 마이크로아키텍처[편집]


모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
PS:VS:TMU:ROP
클럭
(MHz)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
Quadro NVS 440
NV43
(110㎚)
(150㎟)
8:4:8:8
x2
275
128
x2
DDR
250
(500)
128
x2
31
?
Quadro NVS 285
NV44
(150㎚)
(91㎟)
4:3:4:2
128
128
18
?
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(GPU 클럭) × (버텍스 셰이더의 개수) ÷ 4 = (버텍스 연산 속도) [MVertices/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]





3.1.4. G80(Tesla) 마이크로아키텍처[편집]


모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(TPC, SM)
클럭
(MHz)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
Quadro NVS 290
G86
(80㎚)
(127㎟)
16:8:4
(1, 2)
459
(코어)
918
(셰이더)
64
DDR2
400
(800)
256
21
149
Quadro NVS 295
G98
(65㎚)
(86㎟)
8:8:4
(1, 1)
540
(코어)
1300
(셰이더)
GDDR3
695
(1390)
23
?
Quadro NVS 420
8:8:4
x2
(1 x2, 1 x2)
550
(코어)
1400
(셰이더)
64
x2
700
(1400)
256
x2
40
?
Quadro NVS 450
480
(코어)
1200
(셰이더)
35
?
NVS 300
GT218
(40㎚)
(57㎟)
16:8:4
(1, 2)
520
(코어)
1230
(셰이더)
64
790
(1380)
512
18
109
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]





3.1.5. Fermi 마이크로아키텍처[편집]


모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(GPC, SM)
클럭
(MHz)
L2
캐시
(KB)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
NVS 310
GF119
(40㎚)
(79㎟)
48:8:4
(1, 1)
523
(코어)
1046
(셰이더)
128
64
DDR3
875
(1750)
0.5
20
159
NVS 315
1
19
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 12 = (배정밀도 연산 속도) [GFLOPS]
(GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]





3.1.6. Kepler 마이크로아키텍처[편집]


모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(GPC, SMX)
클럭
(MHz)
L2
캐시
(KB)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
NVS 510
GK107
(28㎚)
(118㎟)
192:16:16
(1, 1)
797
(기본)
256
128
DDR3
891
(1782)
2
35
449
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 24 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]





3.1.7. Maxwell 마이크로아키텍처[편집]


모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(GPC, SM)
클럭
(MHz)
L2
캐시
(MB)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
NVS 810
GM107
(28㎚)
(148㎟)
512:32:16
x2
(1 x2, 4 x2)
902
(기본)
1033
(부스트)
0.5
x2
64
x2
DDR3
900
(1800)
2
x2
68
?
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]





3.2. NVS 모바일용 제품군[편집]



3.2.1. NV40(Curie) 마이크로아키텍처[편집]


모델명
GPU
그래픽 메모리
TDP
(W)
칩셋명
(공정)
(면적)
PS:VS:TMU:ROP
클럭
(MHz)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
Quadro NVS 510M
G71
NV49
(90㎚)
(196㎟)
24:8:24:16
450
128
GDDR3
600
(1200)
256
35
Quadro NVS 300M
G73
NV4B
(90㎚)
(125㎟)
4:3:4:2
500
700
(1400)
16
Quadro NVS 120M
G72
NV4A
(90㎚)
(81㎟)
450
64
DDR2
512
10
Quadro NVS 110M
300
DDR
300
(600)
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (ROP의 개수) = (픽셀 필레이트) [MPixels/s]
(GPU 클럭) × (TMU의 개수) = (텍스처 필레이트) [MTexel/s]
(GPU 클럭) × (버텍스 셰이더의 개수) ÷ 4 = (버텍스 연산 속도) [MVertices/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]





3.2.2. G80(Tesla) 마이크로아키텍처[편집]


모델명
GPU
그래픽 메모리
TDP
(W)
칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(TPC, SM)
클럭
(MHz)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
Quadro NVS 320M
G84
(80㎚)
(169㎟)
32:16:8
(1, 2)
575
(코어)
1150
(셰이더)
128
GDDR3
700
(1400)
512
20
Quadro NVS 160M
G98
(65㎚)
(86㎟)
8:8:4
(1, 1)
580
(코어)
1450
(셰이더)
64
256
12
Quadro NVS 150M
530
(코어)
1300
(셰이더)
10
Quadro NVS 140M
G86
(80㎚)
(127㎟)
16:8:4
(1, 2)
400
(코어)
800
(셰이더)
64
DDR2
600
(1200)
512
12
Quadro NVS 135M
594
(1188)
256
10
Quadro NVS 130M
8:4:4
(1, 1)
DDR
700
(1400)
NVS 5100M
GT216
(40㎚)
(100㎟)
48:16:8
(2, 6)
550
(코어)
1210
(셰이더)
128
GDDR3
800
(1600)
1024
35
NVS 3100M
GT218
(40㎚)
(57㎟)
16:8:4
(1, 2)
606
(코어)
1468
(셰이더)
64
790
(1580)
512
14
NVS 2100M
535
(코어)
1230
(셰이더)
11
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]





3.2.3. Fermi 마이크로아키텍처[편집]


모델명
GPU
그래픽 메모리
TDP
(W)
칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(GPC, SM)
클럭
(MHz)
L2
캐시
(KB)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
NVS 5400M
GF108
(40㎚)
(116㎟)
96:16:4
(1, 2)
660
(코어)
1320
(셰이더)
256
128
DDR3
900
(1800)
2 [8]
35
NVS 5200M
672
(코어)
1344
(셰이더)
128
64
GDDR5
785
(3140)
1
25
GF117
(28㎚)
(116㎟)
DDR3
900
(1800)
NVS 4200M
GF119
(40㎚)
(79㎟)
48:8:4
(1, 1)
810
(코어)
1620
(셰이더)
800
(1600)
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 12 = (배정밀도 연산 속도) [GFLOPS]
(GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]


[8] 다만 제조사에 따라 1기가만 장착하는 경우도 있다.



4. 데이터 센터 GPU 제품군 (구 Tesla)[편집]


파일:다른 뜻 아이콘.svg
은(는) 여기로 연결됩니다.
Tesla 마이크로아키텍처에 대한 내용은 NVIDIA/GPU 문서
3.8번 문단을
NVIDIA/GPU# 부분을
, {{{#!html }}}에 대한 내용은 문서
#s-번 문단을
#s-번 문단을
# 부분을
# 부분을
, {{{#!html }}}에 대한 내용은 문서
#s-번 문단을
#s-번 문단을
# 부분을
# 부분을
, {{{#!html }}}에 대한 내용은 문서
#s-번 문단을
#s-번 문단을
# 부분을
# 부분을
, {{{#!html }}}에 대한 내용은 문서
#s-번 문단을
#s-번 문단을
# 부분을
# 부분을
, {{{#!html }}}에 대한 내용은 문서
#s-번 문단을
#s-번 문단을
# 부분을
# 부분을
, {{{#!html }}}에 대한 내용은 문서
#s-번 문단을
#s-번 문단을
# 부분을
# 부분을
, {{{#!html }}}에 대한 내용은 문서
#s-번 문단을
#s-번 문단을
# 부분을
# 부분을
, {{{#!html }}}에 대한 내용은 문서
#s-번 문단을
#s-번 문단을
# 부분을
# 부분을
, {{{#!html }}}에 대한 내용은 문서
#s-번 문단을
#s-번 문단을
# 부분을
# 부분을
참고하십시오.




2020년 5월까지 사용되던 상표는 Tesla

2007년 5월부터 내놓은 상표로, GPU가 게임용 연산에만 사용되는 것이 아닌 범용 연산(GPGPU)용으로 확대되면서 고성능 연산 작업을 목적으로 하는 곳을 공략하기 위한 제품군이다. Tesla도 알맹이는 지포스와 같지만 대체로 디스플레이 출력 단자가 없는데다 연산에 주로 사용되기 때문에 GPU 내부에 있는 텍스처 유닛과 ROP이 쓸 일은 없다. 게임 그래픽과는 거리가 먼 분야에 사용되기 때문. 물론 페르미 아키텍처 기반의 일부 제품 한정으로 DVI 단자 1개가 탑재되기도 했지만 케플러 아키텍처부터는 디스플레이 단자가 다시 빠지면서 지금까지 이어져오고 있다. 명색이 전문가를 넘어선 데이터 센터를 주로 공략하는 시장인만큼 가격도 매우 비싼 편인데 지포스와 같은 GPU라 훨씬 저렴한 지포스로 연산 작업을 하면 되지 않겠냐고 반문할 수도 있지만, 쿼드로와 마찬가지로 Tesla용 드라이버가 따로 있고 단일 GPU인 제품은 주로 하위 라인에나 해당되는 제품이지 최상위로 올라가면 GPU가 2개는 물론이고 4개를 한 기판에 탑재된 쿼드 GPU 타입 제품도 있다. GPU를 복수로 붙이면서 전력 소모량, 발열, 부피를 감안해서라도 당대 최고의 고성능 연산을 구현하는 것을 추구하는 방향이기 때문이다. 테슬라는 탑재 대상 컴퓨터들이 최소 워크스테이션에서 최대로는 슈퍼 컴퓨터와 데이터 센터급이며 소비 전력이 엄청 나기 때문에 모바일 제품군이 없다.

2020년 5월에 브랜드가 폐지되었는데. 모 자동차 회사와의 혼동 때문이라는게 공식적인 설명이다. 엔비디아 역시 자율주행 자동차 사업에 진출해 있고 여기에 사용되는 연산용 GPGPU의 명칭이 가장 큰 경쟁사의 명칭과 겹친다는게 좀 아니라고 생각했는듯. 이후 출시된 RTX A100부터는 데이터 센터 GPU라는 명칭으로 불리고 있다.(그리고2020년 10월 5일 테슬라의 뒤를 잇는 데이터센터 용 그래픽카드인 A40이 공개되었다)

특이하게 최근 나오는 데이터센터 GPU 제품군에는 쿨러가 없이 방열판과 제품 덮개만 딱 있는데, 이는 절대로 칩의 온도가 낮아서 그런게 아니다. 데이터센터 gpu는 열이 심한 vram을 덕지덕지 붙이고 나오기 때문에 일반 게이밍용 gpu보다 온도가 높으면 높았지 절대 낮지 않다. 얘네들이 쿨러가 없는 이유는 바로 패시브 쿨링 이라는 방법을 쓰기 때문이다. 우리가 일반적으로 보는 팬이 기본 장착되어 있는 그래픽카드는 "액티브 쿨링"이라고 하는데 데이터센터 GPU 제품군은 서버 컴퓨터를 사용하는 고객들이 자기네들만의 독자적인 쿨링 시스템을 자유롭게 구성할수 있도록 일부러 팬을 달지 않고 방열판만 달고 나오는 것이다.

4.1. G80(Tesla) 마이크로아키텍처[편집]


모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(TPC, SM)
클럭
(MHz)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(MB)
S870
G80
(90㎚)
(484㎟)
128:32:24
x4
(8 x4, 16 x4)
600
(코어)
1350
(셰이더)
384
x4
GDDR3
800
(1600)
1536
x4
800
11999
D870
128:32:24
x2
(8 x2, 16 x2)
384
x2
1536
x2
520
7499
C870
128:32:24
(8, 16)
384
1536
171
1499
S1075
G200B
(55㎚)
(470㎟)
240:80:32
x4
(10 x4, 30 x4)
610
(코어)
1296
(셰이더)
512
x4
4096
x4
800
?
S1070
7999
C1060
240:80:32
(10, 30)
512
4096
188
?
M1060
2048
1699
T10
4096
?
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
G200B 칩셋 한정 → (단정밀도 연산 속도) ÷ 8 = (배정밀도 연산 속도) [GFLOPS]
(GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]





4.2. Fermi 마이크로아키텍처[편집]


모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(GPC, SM)
클럭
(MHz)
L2
캐시
(KB)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
S2050
GF100
(40㎚)
(529㎟)
448:56:48
x4
(4 x4, 14 x4)
574
(코어)
1147
(셰이더)
768
x4
384
x4
GDDR5
773
(3092)
3
x4
900
11999
M2050
448:56:48
(4, 14)
575
(코어)
1150
(셰이더)
768
384
3
225
2699
M2070
574
(코어)
1150
(셰이더)
783
(3132)
6
225
3099
M2070-Q
5489
C2050
575
(코어)
1150
(셰이더)
750
(3000)
3
238
?
C2070
6
?
X2090
GF110
(40㎚)
(520㎟)
512:64:48
(4, 16)
650
(코어)
1300
(셰이더)
925
(3700)
225
?
X2070
?
M2090
250
?
C2090
?
M2075
448:56:48
(4, 14)
574
(코어)
1147
(셰이더)
783
(3132)
225
2399
C2075
575
(코어)
1150
(셰이더)
750
(3000)
247
?
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 셰이더 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 2 = (배정밀도 연산 속도) [GFLOPS]
(GPU 코어 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 코어 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]





4.3. Kepler 마이크로아키텍처[편집]


모델명
GPU
그래픽 메모리
최대 연산 성능
TDP
지원
API
칩셋명
CUDA 코어
클럭
버스
규격
클럭
용량
단정밀도
(FP32)
(GFLOPS)
배정밀도
(FP64)
(GFLOPS)
K10
2×GK104
2×1536
745MHz
2×256bit
GDDR5
2500MHz
(5000MT/s)
2×4GB
4577
190.7
225W
CUDA 3.0
K20
GK110
2496
706MHz
320bit
2600MHz
(5200MT/s)
5GB
3524
1175
CUDA 3.5
K20X
GK110
2688
732MHz
384bit
2600MHz
(5200MT/s)
6GB
3935
1312
235W
K40
GK110B
2880
745MHz
(기본)
875MHz
(부스트)
384bit
2500MHz
(5000MT/s)
12GB
5040
1680
K80
2×GK210
2×2496
560MHz
(기본)
875MHz
(부스트)
2×384bit
2750MHz
(5500MT/s)
2×12GB
8736
2912
300W
CUDA 3.7



4.4. Maxwell 마이크로아키텍처[편집]


모델명
GPU
그래픽 메모리
단정밀도(FP32)
최대 연산 성능
(GFLOPS)
TDP
지원
API
칩셋명
CUDA 코어
클럭
버스
규격
클럭
용량
M4
GM206
1024
872MHz
(기본)
1072MHz
(부스트)
128bit
GDDR5
2750MHz
(5500MT/s)
4GB
2195
50~75W
CUDA 5.2
M6
GM204
1536
722MHz
(기본)
1051MHz
(부스트)
256bit
2300MHz
(4600MT/s)
8GB
3229
75~100W
M10
4×GM107
4×512
1033MHz
4×128bit
2099MHz
(5188MT/s)
4×8GB
5289
225W
M40
GM200
3072
948MHz
(기본)
1114MHz
(부스트)
384bit
3000MHz
(6000MT/s)
12GB
6844
250W
M60
2×GM204
2×2048
899MHz
(기본)
1178MHz
(부스트)
2×256bit
2500MHz
(5000MT/s)
2×8GB
9650
225~300W



4.5. Pascal 마이크로아키텍처[편집]


P100은 GP100 컷칩이면서 HBM2 규격을 채택한 모델로 FP64 연산이 5.3 TFLOPS다. P40과 P4는 각각 GP102 풀칩과 GP104 풀칩을 기반으로 개발된 모델이다.
모델명
GPU
그래픽 메모리
최대 연산 성능
TDP
지원
API
칩셋명
CUDA 코어
클럭
버스
규격
클럭
용량
바이트
정수형
(INT8)
(TOPS)
반정밀도
(FP16)
(GFLOPS)
단정밀도
(FP32)
(GFLOPS)
배정밀도
(FP64)
(GFLOPS)
P4
GP104
2560
810MHz
(기본)
1063MHz
(부스트)
256bit
GDDR5
1500MHz
(6000MT/s)
8GB
22
42.5
5443
170.1
50~75W
CUDA 6.1
P40
GP102
3840
1303MHz
(기본)
1531MHz
(부스트)
384bit
1800MHz
(7200MT/s)
24GB
47
91.9
11758
367.4
250W
P100
(PCIe)

GP100
3584
1126MHz
(기본)
1303MHz
(부스트)
3072bit
HBM2
703MHz
(1406MT/s)
12GB
-
18680
9340
4670
250W
CUDA 6.0
4096bit
16GB
CUDA 6.0
P100
(NVLink)

1380MHz
(기본)
1480MHz
(부스트)
21218
10609
5340
300W
CUDA 6.0



4.6. Volta 마이크로아키텍처[편집]


일부 잘못된 내용이 있을 수 있으니 주의할 것.
모델명
GPU
그래픽 메모리
최대 연산 성능
TDP
지원
API
칩셋명
CUDA 코어
클럭
버스
규격
클럭
용량
단정밀도
(FP32)
(TFLOPS)
배정밀도
(FP64)
(TFLOPS)
V100
(PCIe)

GV100
5120
1245MHz
(기본)
1380MHz
(부스트)
4096bit
HBM2
877MHz
(1754MT/s)
16GB
14
7
250W
?
V100
(NVlink)

?MHz
(기본)
1533MHz
(부스트)
32GB
15.7
7.8
300W
?
V100S
(PCIe)

?MHz
(기본)
1600MHz
(부스트)
1107MHz
(2214MT/s)
32GB
16.4
8.2
300W
?



4.7. Turing 마이크로아키텍처[편집]


모델명
GPU
그래픽 메모리
최대 연산 성능
TDP
지원
API
칩셋명
CUDA 코어
클럭
버스
규격
클럭
용량
4비트
정수형
(INT4)
(TOPS)
바이트
정수형
(INT8)
(TOPS)
반정밀도
(FP16)
(TFLOPS)
단정밀도
(FP32)
(TFLOPS)
T4
TU104
2560
585 MHz
(기본)
1590 MHz
(부스트)
256 bit
GDDR6
1250 MHz
(10000 MT/s)
16GB
260.504
130.252
65.126
8.141
70 W
?



4.8. Ampere 마이크로아키텍처[편집]


* A10
* A16
* A40

모델명
GPU
그래픽 메모리
최대 연산 성능
TDP
지원
API
칩셋명
CUDA 코어
클럭
버스
규격
클럭
용량
4비트
정수형
(INT4)
(TOPS)
바이트
정수형
(INT8)
(TOPS)
반정밀도
(FP16)
(TFLOPS)
단정밀도
(FP32)
(TFLOPS)
A16
GA??? x4
???? x4
?
? bit
GDDR6
?
16GB x4
?
?
?
?
250W
?
A10
GA??? x4
???? x4
?
? bit
GDDR6
?
24GB
?
?
?
?
150W
?


5. GRID 제품군[편집]



5.1. Kepler 마이크로아키텍처[편집]



5.1.1. GRID K1[편집]


모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(GPC, SMX)
클럭
(MHz)
L2
캐시
(KB)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
K1
GK107
(28㎚)
(118㎟)
192:16:16
x4
(1 x4, 1 x4)
850
(기본)
256
x4
128
x4
DDR3
891
(1782)
4
x4
130
4140
K180Q
192:16:16
(1, 1)
256
128
1
125
K160Q
K140Q
K120Q
0.5
K100
0.25
63
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 24 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]





5.1.2. GRID K2[편집]


모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(GPC, SMX)
클럭
(MHz)
L2
캐시
(KB)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
K2
GK104
(28㎚)
(294㎟)
1536:128:32
x2
(4 x2, 8 x2)
745
(기본)
512
x2
256
x2
GDDR5
1250
(5000)
4
x2
225
5199
K280Q
1536:128:32
(4, 8)
512
256
4
1875
K260Q
2
937
K240Q
1
469
K220Q
0.5
K200
0.25
235
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 24 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]





5.1.3. GRID K3[편집]


모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(GPC, SMX)
클럭
(MHz)
L2
캐시
(KB)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
K340
GK107
(28㎚)
(118㎟)
384:32:8
x4
(1 x4, 2 x4)
950
(기본)
128
x4
64
x4
GDDR5
900
(3600)
1
x4
225
3299
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 24 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]





5.1.4. GRID K5[편집]


모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(GPC, SMX)
클럭
(MHz)
L2
캐시
(KB)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
K560Q
GK104
(28㎚)
(294㎟)
1536:128:32
x2
(4 x2, 8 x2)
745
(기본)
512
x2
256
x2
GDDR5
1250
(5000)
4
x2
225
3599
K540Q
K520Q
K520
K500
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 24 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]





5.2. Maxwell 마이크로아키텍처[편집]



5.2.1. GRID M[편집]


모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(GPC, SMM)
클럭
(MHz)
L2
캐시
(MB)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
M60-8Q
GM204
(28㎚)
(398㎟)
2048:128:64
(4, 16)
930
(기본)
1180
(부스트)
2
256
GDDR5
1253
(5012)
8
225
3599
M60-4A
4
?
M60-2Q
2
?
M60-1Q
1
?
M6-8Q
1536:96:64
(3, 12)
722
(기본)
8
100
?
M10-8Q
GM107
(28㎚)
(148㎟)
640:40:16
(1, 5)
1033
(기본)
1306
(부스트)
128
1300
(5200)
225
?
M3-3020
2
?
?
M40
384:32:16
(1, 3)
930
(기본)
1000
(부스트)
1350
(5400)
4
50
?
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]





6. Mining 제품군[편집]


이름에서 보듯 채굴기이다. 그래서 모니터 연결용 단자가 없다. Linus Tech Tips는 중국에서 이걸 사와서 이걸로 게임을 돌리는 데 성공했다..


6.1. Pascal 마이크로아키텍처[편집]


모델명
GPU
그래픽 메모리
TDP
(W)
출고
가격
($)
칩셋명
(공정)
(면적)
CUDA:TMU:ROP
(GPC, SM)
클럭
(MHz)
L2
캐시
(MB)
버스
(bit)
규격
클럭
(전송률)
(MHz)
(Mbps)
용량
(GB)
P102-101
GP102
(16㎚)
(471㎟)
3200:200:80
(5, 25)
1557
(기본)
1670
(부스트)
2.5
320
GDDR5
2002
(8008)
10
250
?
P102-100
1481
(기본)
1582
(부스트)
GDDR5X
1251
(10008)
5
?
P104-101
GP104
(16㎚)
(314㎟)
2560:160:64
(4, 20)
1607
(기본)
1733
(부스트)
2
256
8
?
?
P104-100
1920:120:64
(3, 15)
4
?
?
P106-100
GP106
(16㎚)
(200㎟)
1280:80:48
(2, 10)
1506
(기본)
1709
(부스트)
1.5
192
GDDR5
2002
(8008)
6
120
?
P106-090
768:48:48
(2, 6)
1354
(기본)
1531
(부스트)
3
75
?
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (CUDA의 개수) × 2 ÷ 1000 = (단정밀도 연산 속도) [GFLOPS]
(단정밀도 연산 속도) ÷ 32 = (배정밀도 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TMU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]





7. 관련 문서[편집]



파일:크리에이티브 커먼즈 라이선스__CC.png 이 문서의 내용 중 전체 또는 일부는 2023-10-26 19:17:14에 나무위키 NVIDIA RTX 문서에서 가져왔습니다.