PTX(ISA)
덤프버전 : r (♥ 0)
분류
1. 개요[편집]
PTX는 NVIDIA 병렬 스레드 실행 가상머신의 명령어 집합 아키텍처이다.
2. 역사[편집]
2.1. PTX 8.0 (Hopper)[편집]
-
wgmma
명령어 추가
2.2. PTX 6.0 (Volta)[편집]
-
wmma
명령어 추가 -
barrier
} 명령어 추가 -
neg
명령어의.f16
및.f16x2
자료형 지원 -
fns
명령어 추가 -
bar.warp.sync
} 명령어 추가 -
match.sync
} 명령어 추가 -
brx.idx
} 명령어 추가
2.3. PTX 5.0 (Pascal)[편집]
-
dp4a
,dp2a
명령어 추가 (4-way/2-way dot product with accumulation) - 특수 레지스터
%clock_hi
지원
2.4. PTX 3.0 (Kepler)[편집]
-
mad.cc
,madc
명령어 추가 - 성능 모니터 카운터 특수 레지스터
%pm4..%pm7
추가
2.5. PTX 2.0 (Fermi)[편집]
- 단정밀도 명령어가 subnormal number를 지원
- 1.x와의 호환성을 위해
.ftz
수식어를 지원- 단정밀도
add
,sub
,mul
이.rm
및.rp
rounding 수식어를 지원 - 단정밀도 fused multiply-add (FMA) 명령어
fma.f32
추가
- 기존
mad.f32
명령어는 호환성을 위해 유지- 단정밀도 및 배정밀도
div
,rcp
,sqrt
명령어에 IEEE 754 대응 rounding 추가 -
testp
및copysign
명령어 추가