문서의 임의 삭제는 제재 대상으로, 문서를 삭제하려면 삭제 토론을 진행해야 합니다. 문서 보기문서 삭제토론 슈퍼컴퓨터 (문단 편집) === 역대 1위 슈퍼 컴퓨터 연혁 === [[http://top500.org/|TOP500]] 사이트에 올라온 정보를 바탕으로 작성. * [[ENIAC]]: 1946년. 500 플롭스 탄도 계산이나 일기 예보를 위해 사용되었다. 현재 물가로 65억 원 정도. 1955년 퇴역. * IBM 7030: 1961년. 600 킬로플롭스 * [[CDC 6600]]: 1964년. 1 메가플롭스 생산된 100여 대 대부분이 핵실험에 쓰였다. 크레이가 CDC에서 일하던 시절 만들었다. 1MFLOPS 는 10MHz CPU 가 달린 [[IBM PC XT]]의 성능과 비슷하다. * CDC 7600: 1969년. 10 메가플롭스 점점 밀집화되는 내부 구조로 인해 본격적으로 쿨링 시스템이 장착되기 시작한 최초의 컴퓨터이기도 하다. PC 기준으로는 75MHz [[펜티엄]] 정도의 성능이다. * Cray-1. 1975년. 800 메가플롭스 CDC 7600 이후로, CDC는 또 다시 10배 성능을 올린 슈퍼컴퓨터를 기획했으나 발전 방향이 다르다고 생각한 크레이는 퇴직하고 후에 슈퍼컴퓨터의 대명사가 된 크레이社를 세운다. Cray-1은 시장에서 대 히트를 칠 수 있었다. 최초로 나온 제품의 성능은 펜티엄3 600MHz 정도였으며, 이때까지만 해도 모든 컴퓨터는 단일 CPU 코어를 사용했지만 1983년에 나온 MP로 최초로 병렬컴퓨팅이 이루어진다. 마지막에 나온 4코어 MP 모델의 성능은 800 MFLOPS로 [[인텔 펜티엄4 시리즈|펜티엄 4]] [[프레스캇]] 3GHz 급에 달했다. * Cray-2: 1985년, 1.9 기가플롭스[* [[퀄컴 스냅드래곤/S 시리즈#s-2.1.1|퀄컴 스냅드래곤 S1 QSD8250]]에 들어간 [[퀄컴 Adreno GPU#s-3.2|Adreno 200]]은 2.1기가플롭스의 성능을 갖고 있다. [[갤럭시 S]]에 사용된 [[삼성 엑시노스|엑시노스]] 3110 SoC는 ARM Cortex-A8을 사용하고 있으며 3.5기가플롭스 정도의 성능을 갖는다.] 수랭을 도입했다가 고장으로 인해 제대로 팔지도 못했다. * ETA-10: 1987년. 10 기가플롭스[* 2009년 출시된 저성능 [[그래픽카드]] GeForce G210의 연산 성능은 최소 36.4기가플롭스에 달한다.] * CM-5: 1993년. 59.7 기가플롭스 미국 [[로스 앨러모스]] 연구소에서 1024개의 프로세서를 연결하여 59.7 기가플롭스의 성능을 뽑아냈다. * 数値風洞 (Numerical wind tunnel) 1993년 일본 국립항공우주연구소에서 140개의 벡터 프로세서를 채용하여 124.2 기가플롭스의 성능을 내는 컴퓨터를 제작하였다. 1994년 잠시 1위를 내줬다가 벡터프로세서를 167개로 업그레이드하며 170 기가플롭스로 다시 1위로 올라섰다. * Intel XP/S 140 Paragon 1994년 미국 [[미합중국 에너지부#s-3|샌디아 국립 연구소]]에서 3680개의 프로세서를 연결하여 143.40 기가플롭스를 달성하였다. 하지만, 업그레이드된 Numerical wind tunnel에게 다시 1위를 내주었다. * 히타치 SR2201 1996년 일본 [[도쿄대학]]에서 1024개의 프로세서로 232.4 기가플롭스를 달성하였다.[* [[삼성 엑시노스/라인업(2017년 이전)#s-2.5.1|삼성 엑시노스 8890]]에 탑재된 [[ARM Mali GPU#s-3.5.4|Mali-T880]] MP12의 성능은 265.2기가플롭스 정도다.] * CP-PACS 1996년 일본 [[쓰쿠바대학]]에서는 2048개의 프로세서로 368.20 기가플롭스를 기록하였다.[* 2016년 출시된 저가형 [[그래픽카드]] (당시 3~5만원)인 GeForce GT 710은 366기가플롭스, 인텔 Iris 내장그래픽은 401 기가플롭스, [[퀄컴 스냅드래곤/8XX 라인업#s-3.7|퀄컴 스냅드래곤 835]]에 탑재된 [[퀄컴 Adreno GPU#s-3.5|Adreno 540]]의 성능은 567기가플롭스다.] * ASCI RED 1997년 미국 [[미합중국 에너지부#s-3|샌디아 국립 연구소]]에서 7264개의 프로세서로 1.068 테라플롭스[* 2014년 출시된 GeForce GTX 750과 GeForce GTX 660의 연산성능이 각각 1.2테라플롭스와 1.8816테라플롭스 정도다.]를 기록하며, 최초로 '''1 테라플롭스'''의 벽을 넘어섰다. 그리고 2000년까지 1위를 유지하였다. * ASCI WHITE 2000년 미국 로렌스 리버모어 연구소에서 8192개의 프로세서로 4.9 테라플롭스를 달성하였다. 또한 업그레이드 후 7.2 테라플롭스까지 성능을 향상시켜 2001년까지 왕좌의 자리를 지켰다.[* 2013년 5월 출시된 GTX 780이 4.1 테라플롭스. 2015년 100만원 가량에 출시된 [[그래픽카드]]인 GeForce GTX TITAN X의 연산능력은 6.6 테라플롭스이다. 메인스트림으로는 GTX 1650이 2.8 테라플롭스다. [[GPGPU]]에 긍정적인 반응을 보이는 [[AMD/GPU|라데온]] PRO DUO (2017.1 출시)는 '''16테라플롭스를 돌파했다.'''] * 地球シミュレータ(The Earth Simulator, 어스[지구] 시뮬레이터) 2002년 일본 [[NEC]]에서 만든 슈퍼컴퓨터로 당시 2위 컴퓨터의 7배의 성능인 '''35 테라플롭스'''를 기록하며, 2004년 IBM 블루진에게 1위를 내줄 때까지 3년간 왕좌의 자리를 지킨 일본의 자존심이었다. 또한, 마지막 벡터형 슈퍼컴퓨터이기도 하였다. 참고로, 이 이후에 등장하는 모든 슈퍼컴퓨터는 병렬형이다. [[http://top500.org/system/167148|TOP500정보]][* 2018년 현재 AI 스타트업에서는 600~1,000만원대의 [[워크스테이션]]을 쓰는 경우가 많은데 그 정도 예산이면 [[TITAN X/Xp|TITAN Xp]] 4장으로 최소 40TFLOPS까지 확보가 가능하다.] * 블루진(Blue Gene) 블루진은 IBM의 슈퍼컴퓨터 솔루션 이름이자, 슈퍼컴퓨터의 이름이다. 미국 에너지부에서 사용 중인 블루진/L이 70 테라플롭스로 2004년 1위의 자리에 오른 뒤 업그레이드 하여 2007년까지 계속 1위 자리를 지켰다.[* 2017년 기준 파스칼 다음 세대인 볼타 세대의 GV100([[TITAN V]])은 무려 '''120 테라플롭스'''에 달한다.] * 로드런너(Roadrunner) 2008년 6월 공식적으로 최초의 '''1 페타플롭스''' 성능을 인증받은 슈퍼컴퓨터이다. 미국 에너지부에서 1페타플롭스 성능의 슈퍼컴퓨터를 업체들에게 요구하였는데, IBM 이 입찰하여 납품한 제품이 바로 로드런너이다. 당시 CPU로는 원하는 성능을 내기 힘들었기에, [[플레이스테이션3]]에 사용되는 [[CELL-Broadband Engine|Cell 프로세서]]와 AMD 옵테론 프로세서를 조합하여 요구조건을 만족하였다. 허나 연산속도 대비 전력 사용량이 다른 슈퍼컴의 2배 정도인 안습한 성능비로 결국 [[http://arstechnica.com/information-technology/2013/03/worlds-fastest-supercomputer-from-09-is-now-obsolete-will-be-dismantled/|2013년 해체되었다.]] * 재규어(Jaguar) 사실 2008년 6월에 1페타플롭스 성능을 기록한 슈퍼컴퓨터는 또 한 대 있었는데, 역시 미국 Cray에서 만든 재규어이다. 하지만 약간 낮은 성능으로 2위를 기록하였고, 로드런너의 언플에 묻히며 주목받지 못하였다. 하지만, 2009년 11월 대대적인 업그레이드를 단행하며 1.7 페타플롭스로 1위로 올라섰다. * 天河-1A(톈허-1A, Tianhe-1A) 2010년 11월 중국은 '톈허(天河)'[* 하늘의 강, 즉 은하수를 의미한다. ~~코어가 은하의 별만큼 박혀있다는 건가.~~]라는 이름의 슈퍼컴퓨터를 선보이고 랭킹 1위에 올리며, 미국의 자존심을 짓밟는다. 186,368개의 코어가 사용되었고, 2.5 페타플롭스의 성능을 기록하였다. * 京(케이-컴퓨터) 2011년 6월, 일본은 [[후지쯔]]와 국립기초과학연구소인 [[이화학연구소]](RIKEN)의 주도로 개발되어 548,352 코어라는 어마어마한 물량 공세를 펼치며 8 페타플롭스라는 성능을 뽑아내는 케이 컴퓨터를 발표한다. 이름은 숫자 [[경#s15|京]]의 일본어 발음인 '케이'에서 따온 것이며 경 단위의 연산을 한다는 뜻이다. 이는 중국 톈허의 거의 3배 성능을 내는 엄청난 성능이었다. 케이 컴퓨터가 설치된 이화학연구소 계산과학연구기관에서 가까운 역의 이름도 아예 [[케이컴퓨터마에역]]으로 갈아버렸다. 추후 과거 어스 시뮬레이터의 영광을 이어가겠다는 강한 의지를 표명하며, 코어수를 705,024개로 업그레이드 시켰고, 최초로 '''10 페타플롭스''' 성능을 돌파해 버린다. 탄생 직후부터 응용 프로그램에 대한 실제 계산 성능을 측정해 가장 우수한 컴퓨터에 수여하는 Gordon Bell Award를 수상했고, 미국 에너지부 주최로 슈퍼컴퓨터의 성능 대비 효율성과 에너지 소비율을 겨루는 HPC Challenge에서 2011년부터 14년까지 4번 연속 수상한데다 순수하게 연산 속도만 따지는 Top 500 순위에서 상당히 밀려난 이후에도 전성비를 따지는 Green 500 순위와 빅데이터 제작 및 해석 능력을 따지는 Graph 500 부문에서 2018년 11월까지도 1위 자리를 지켰다. 2019년 8월에 해체되고 일본 최초의 엑사 스케일 슈퍼 컴퓨터 ' [[후가쿠(컴퓨터)|후가쿠]]'(富岳)로 대체되었다. 이 문서 아래쪽에 사진이 있다. * 세쿼이어(Sequoia) 2012년 6월 중국과 일본에 연이어 자존심을 구긴 미국은 ~~[[쇼미더머니]]를 쳐갈기며~~ 무려 1,572,864 코어짜리 슈퍼컴퓨터를 뽑아내었다. 16.324 페타플롭스. * 타이탄(Titan): 2012.11 미국은 17.59 페타플롭스 성능의 슈퍼컴퓨터를 하나 더 장만한다. 이것은 코어의 성능을 높이는 전략을 사용하여 세쿼이어의 1/3 밖에 안되는 56만 코어로 해당 성능을 기록한다. [[NVIDIA]] TESLA[* NVIDIA Geforce 8 시리즈 그래픽카드에 쓰인 것과 같은 계열의 칩셋이다.]를 병렬 조합하여 주 전산기를 구성하고 256코어의 IBM [[POWER(마이크로프로세서)|POWER]] 프로세서로 주 전산기를 관리하는 방식을 사용한다. 크레이 사가 만들었다. * 天河-2(톈허-2, Tianhe-2): 2013.6 중국도 [[쇼미더머니]] 신공에 동참하며, 3,120,000 코어짜리를 뽑아내면서 '''33.862 페타플롭스'''의 성능을 기록한다. 대략 수치상으로 세쿼이어 2대를 합쳐놓은 성능으로 보인다. 2016년 6월까지 3년간 1위 자리를 지켰다. 참고로 2018년 4,981,760코어로 업그레이드 하고 이름도 '''텐허-2A'''로 변경하였다. 성능은 거의 2배에 가까운 '''61페타플롭스'''를 기록했다. (이론치는 100페타플롭스) 이는 2018년 6월 기준 4위에 해당하는 성능이다. * 神威太湖之光(Sunway TaihuLight): 2016.6 자체 개발 프로세서인 SW26010[* 64bit RISC 아키텍처, 260코어, 클럭 1.45GHz, 3TFLOPS, 32GB 메모리]을 40,960개를 합쳐 총 10,649,600 코어이며, 이론상 125 PFLOPS, 실성능 '''93 PFLOPS'''로 '''톈허-2의 2.8배'''의 연산 성능을 기록했다. 현존하는 설계 방식이 아닌 전혀 다른 새로운 설계 방식이다. [[http://www.top500.org/news/china-tops-supercomputer-rankings-with-new-93-petaflop-machine/|top500.org의 추정]]으로는 완전 자체 개발이 아니라 DEC 알파 아키텍처에 기반한 프로세서라고 한다. 미국에서 실수요자가 없어서 떨이해버린 알파 아키텍처를 사다가 개조한 것으로 보인다. [[http://www.newsis.com/ar_detail/view.html?ar_id=NISX20160620_0014163964&cID=10101&pID=10100|관련 기사]] 이례적인 방식이라 범용성이 좀 떨어지는 단점이 지적되긴 하지만, 그 성능까지 거짓은 아니다. 대략적인 설명은 [[http://drmola.com/etc_column/51004|이곳]]을 참고. 게다가 소비 전력은 15,371 KW로 톈허-2보다 2,437 KW가 낮아 효율 면에서 3위를 차지하기까지 했다. * 서밋(summit) 2018.6 [[IBM]]에서 개발한 이 컴퓨터의 하드웨어는 22코어 파워9 CPU와 엔비디아 테슬라 V100 GPU, 멜라녹스 EDR 인피니밴드 등으로 구성되했다. 서밋은 수년전부터 개발돼 왔으며 2개의 22코어 IBM파워9 칩과 6대의 엔비디아 테슬라 V100칩을 사용하는 IBM 서버 4608대로 구성됐다. IBM에 따르면 이 시스템에 사용되는 GPU는 총 2만7648개에 이르며, 스토리지 용량은 250페타(25경)바이트에 이른다. 엔비디아 GPU가 들어간다는 점을 감안할 때 이 슈퍼컴은 머신러닝과 딥러닝은 물론 [[미합중국 에너지부#s-3|오크리지 연구소]]에서 수행될 에너지 및 첨단 소재 연구용으로 사용될 것으로 예상된다. 서밋의 성능 이론치는 187페타플롭스이며, 린팩 실측 성능은 '''122페타플롭스'''를 기록했다. 2018년말에 업그레이드하여 린팩 실측 성능을 '''143페타플롭스'''까지 향상시켰다. 2020년 6월 기준으로는 더 업그레이드되어 이론치 '''200페타플롭스'''. 실성능 '''148페타플롭스'''까지 향상시켰다. 참고로, 서밋은 IBM이 에너지부에 공급하기 위해 제작 중인 2종의 차세대 슈퍼컴 가운데 하나다. 또 다른 슈퍼컴은 시에라(Sierra)로서 로렌스 리버모어 국립연구소에 설치되었다. 시에라는 서밋보다 다소 낮은 119페타플롭스이며, 린팩 실측 성능은 '''71페타플롭스'''를 기록해, 서밋, Sunway TaihuLight 에 이어 3위에 순위를 올렸다. 그리고, 2018년 말 업그레이드를 해서, 린팩 실측 성능 '''94페타플롭스'''를 기록하며 2위로 순위를 끌어 올렸다. * [[후가쿠(컴퓨터)|후가쿠]](Fugaku,富岳) 2020.6 일본 국립 이화학연구소 [[RIKEN]]과 전자기업 [[후지쯔]]가 공동개발한 슈퍼컴퓨터로, 일본이 2011년 케이(Kei,京)로 1위를 한지 9년만에 다시 1등을 차지하게 되었다. 후가쿠의 성능 이론치는 513페타플롭스, 실성능은 '''416페타플롭스'''에 달해, 기존 1등이었던 서밋을 이론치로는 2.5배, 실성능으로는 '''2.8배'''로 뛰어넘었다. [[https://www.yna.co.kr/view/AKR20200623084000073|관련기사]] 이번 평가에서 후가쿠는 계산 속도 뿐만 아니라, 산업 이용 등의 처리 능력을 평가하는 '''HPCG''' 부문[* 13.4페타플롭스로, 서밋의 '''4.5배'''] 과 빅데이터 능력을 평가하는 '''Graph 500''', AI 성능을 측정하는 '''HPL-AI''' 4부문 모두에서 1위를 차지하였고, 이는 사상 처음이다. 후가쿠 개발에는 국비만 약 1,100억 엔(1조 2,443억 원)이 투입되었다. 후가쿠는 2020년 11월 업그레이드를 하며 이론치 537페타플롭스, 실성능 '''442페타플롭스'''를 달성했다. Arm A64FX 용량을 7,299,072 코어에서 7,630,848 코어로 늘려 1 위를 유지했다. 이 기록은 2020년 11월 기준 2위인 [[IBM]]의 서밋(summit)의 3배 정도이다. 일본 고베의 RIKEN 컴퓨터 과학 센터 (R-CCS)에 설치되었다. * 프론티어(Frontier) 2022.6 미국 [[오크리지 국립연구소]] 소속 컴퓨터로 '''세계 최초의 엑사플롭스급 슈퍼컴퓨터'''이며, 린팩 실성능 기준 '''1.102 엑사플롭스'''를 자랑한다. 대부분의 미국제 슈퍼컴퓨터가 그렇듯 개발 주체는 크레이이며, [[AMD]]의 3세대 [[EPYC]] 64코어 CPU와 MI250X 가속기를 사용했다. 총 코어 수는 CPU와 가속기를 합쳐 8,730,112개.[* CPU 1개당 가속기 4개를 장착한, CPU 코어 64개 + 가속기 1개당 컴퓨팅 유닛 220개 × 가속기 4개 = 944코어짜리 단위 시스템이 9,248기 있는 것으로 추정된다.] 효율성 면에서도 개선이 있었는데, 후가쿠보다 적은 전력으로 두 배 이상의 성능을 달성하여 후가쿠의 3.5배의 전성비를 자랑한다.[* 후가쿠 연산성능 442.01 PFLOPS 및 전력 사용량 29.899 MW로 14.78 GFLOPS/W, 프론티어 연산성능 1,102.00 PFLOPS 및 전력 사용량 21.100 MW로 52.23 GFLOPS/W.] 슈퍼컴퓨터 전성비 순위에서는 2등이긴 하나 1등이 프론티어의 축소판인 프론티어 TDS[* Test & Development System.][* 코어 수 120,832개로 언급되는 것으로 보아 앞서 언급한 944코어짜리 단위 시스템을 128기만 연결한 것으로 추정된다.]이어서 사실상 '''전성비 세계 1위'''가 되었다. 23년 6월 기준 72개 랙 8,699,904 코어로 줄이고 성능[* 1.194 엑사플롭스, 36,864개 NIC]을 높이며 전성비를 올렸다. * 오로라(Aurora) 2024. 미국 아르곤 국립연구소 소속 컴퓨터로 2 엑사플롭스 돌파 슈퍼컴퓨터. 크레이가 개발 주체로 인텔 제온 맥스[* HBM 사용 모델]CPU와 Data Center GPU Max 가속기를 사용한다. CPU 1개당 가속기를 3개 장착하여 한 노드당 두개 CPU + 6개 가속기로 구성되어 있고 총 노드 수는 10624개이다.[* 랙 수는 166개, 87404개 NIC]저장 버튼을 클릭하면 당신이 기여한 내용을 CC-BY-NC-SA 2.0 KR으로 배포하고,기여한 문서에 대한 하이퍼링크나 URL을 이용하여 저작자 표시를 하는 것으로 충분하다는 데 동의하는 것입니다.이 동의는 철회할 수 없습니다.캡챠저장미리보기