챗GPT 거대한 전환

덤프버전 :


챗GPT 거대한 전환
파일:챗GPT거대한전환.jpg}}}
저자
김수민, 백선환
ISBN
9788925576756
쪽수
408쪽
출판사
알에이치코리아
국내 출간일
2023.03.30.
장르
경제경영 서적
구매링크
YES24

1. 개요
2. 내용
2.1. 1부 - 챗GPT, 생성형 AI의 시대를 열다
2.1.1. 1장 - 대세가 된 챗GPT
2.1.2. 2장 - 차근차근 이해하는 챗GPT 배경 기술
2.2. 2부 - AI 전쟁의 승자는 누가 될 것인가
2.2.1. 3장 - 2023년은 AI 전쟁의 원년
2.2.2. 4장 - 챗GPT로 누가 돈을 벌 것인가?
2.2.3. 5장 - 한국 AI 사장과 주요 기업
2.3. 3부 - 생성형 AI가 바꾸는 미래
2.3.1. 6장 - 생성형 AI 글로벌 서비스
2.3.2. 7장 - 산업과 시장의 지각변동
2.3.3. 8장 - 생성형 AI로 더 강력해지려는 기업들
2.4. 4부 - 챗GPT의 한계와 도전
2.4.1. 9장 - 챗GPT의 한계
2.4.2. 10장: 챗GPT와 생성형 AI가 나아갈 길
3. 여담




1. 개요[편집]


2020년대 들어 유행하는 AI 기술인 ChatGPT를 다룬 서적. 저자는 김수민, 백선환. 본 책은 ChatGPT가 가져오는 세상의 변화와, 이를 포착하려는 기업의 생성형 AI 서비스를 다룬 책이다.


2. 내용[편집]


스마트폰이 없는 삶을 한번 상상해보라. 길 찾기부터 은행 업무, 그리고 친구와의 연락이나 음식 주문까지, 스마트폰은 우리 삶의 모든 방식을 크게 바꾸어 놓았다. 챗GPT로 대표되고 있는 생성형 AI는 또 한 번 세상을 완전히 바꿀 것이다. 이를 두고 모든 것이 처음부터 시작한다는 '리셋 모먼트'라 표현하는 사람들도 있다.


2.1. 1부 - 챗GPT, 생성형 AI의 시대를 열다[편집]



2.1.1. 1장 - 대세가 된 챗GPT[편집]



파일:챗GPT100만돌파.jpg

100만 이용자 돌파 소요 기간
  • 2022년 12월 1일, 오픈AI는 대화형 인공지능 서비스, 챗GPT를 출시하였다. 오픈AI는 2015년 샘 올트먼일론 머스크를 포함한 7명의 창업자가 모든 인류에게 AI가 유익함을 제공하도록 한다는 미션 아래 설립한 AI 회사이다. 챗GPT는 출시 단 5일 만에 사용자 100만명을 돌파하면서 대박을 쳤다. 오픈AI의 기업 가치는 23년 1월 기준 290억 달러로 평가되는데, 이는 챗GPT 발표 이전과 비교했을 때 약 45% 상승한 수치이다.

  • 챗GPT는 오픈AI의 거대 언어 모델인 GPT-3.5GPT-4를 기반으로 동작하는 AI 챗봇 서비스이다. 챗GPT는 마치 사람과 대화하는 것 같은 착각을 불러일으키는데, 특히 대화가 일회성으로 끝나지 않고 지속적인 상호작용[1]을 만들어낸다. 챗GPT는 단순히 질문에 대답할 뿐만 아니라, 텍스트 요약/번역/문학/광고카피 등 다양한 작업을 할 수 있다. 실제로 학교 과제를 대신 풀어주고, 시험에도 무난히 통과할 수 있을 정도. 챗GPT는 주목받다가 사라진 여타 AI 서비스와는 달리, 사람들은 지금도 이들을 써가면서 상상 이상의 창의적 활용법을 만들어내고 있다.

  • 챗GPT는 또한 사용자가 잘못된 전제를 갖고 질문하면 이의를 제기하고 부적절한 요청은 거절한다. 만약, "자동차 문을 철사로 따려고 하면 어떻게 해야 할까?"와 같이 물으면 "죄송하지만 저는 범죄를 저지르는 방법에 대한 설명을 제공하도록 프로그래밍 되어 있지 않습니다"와 같은 답변을 듣는다. 이렇게 답변할 수 있는 이유는 인간의 피드백을 통해서 실수를 바로잡도록 알고리즘을 강화하기 때문.

  • 챗GPT 창립자에 일론 머스크가 있는 걸 보고, 그가 챗GPT를 만들었다고 생각하기 쉬운데, 사실은 그렇지 않다. 챗GPT가 발표되기 전에 일론 머스크는 오픈AI와 결별했으며, 테슬라의 자체 AI 기술과 상충된다고 판단했기 때문. [2] 그러나 그 이후로도 꾸준히 챗GPT에 대한 관심을 보이는 등, 여러모로 애증의 모습을 보이고 있다.

  • 챗GPT의 주인으로는, 오픈AI의 창립자 중 한 명이자 현재 CEO인 샘 올트먼을 꼽을 수 있다. 그에 대한 자세한 정보는 샘 알트만 항목 참고.

  • 우리는 다음과 같은 이유로 챗GPT를 알아야 한다. 첫째, 챗GPT는 확장성과 효율성이 높아 다양한 산업에 즉각적인 파급효과를 가져오고 있다. 둘째, 오픈AI 알고리즘을 활용하면 일반인들도 자신만의 서비스를 만들어낼 수 있다. 셋째, 챗GPT는 직업에도 상당한 지각변동을 불러일으킬 것이다. 넷째, 챗GPT에 전세계가 열광하는 가장 큰 이유로, 챗GPT는 다른 서비스에 비해서 압도적인 성능을 갖고 있다.


2.1.2. 2장 - 차근차근 이해하는 챗GPT 배경 기술[편집]


  • 우선, 저자는 2장은 챗GPT의 기술을 다루기 때문에, 읽는 사람의 판단에 따라 건너뛰어도 괜찮다고 말하고 있다.

  • GPT는 Generative Pre-trained Transformer의 약자로, '사전 훈련을 받은 생성형 트랜스포머 챗봇' 정도로 해석할 수 있다. 각각의 의미는 다음과 같다.

  • Generative: 생성형 AI와 언어 모델
    • 기계로 인간의 활동을 구현하기 위해서는 '자연어 처리'를 통해 인간의 언어를 기계로 번역하는 과정이 필요하다. 예전에는 자연어 처리 기술을 통계적인 방법에 의존했지만, 최근에는 여기에도 딥러닝 기술이 도입되고 있다. 대표적인 딥러닝 기반 언어 모델로는 구글의 버트와 오픈AI의 GPT가 있는데, 버트는 빈칸의 앞뒤 문맥을 모두 고려하는 반면에 GPT는 다음에 나올 단어의 확률을 계산한다.[* 대표적인 예시: {{{#!wiki style="margin: -5px -10px;"
파일:버트GPT 비교.png}}}]
  • 결국 GPT는 언어 모델의 일종인데, 이 모델은 또한 생성형 AI라고도 불린다. 여기서 생성형 AI란 기존 데이터를 기반으로 새로운 콘텐츠를 만드는 AI를 뜻한다. 챗GPT는 초거대 생성형 AI 모델로, 방대한 양의 데이터를 미리 학습하고 새로운 텍스트를 생성하는 방식으로 작동한다.

  • Transformer: 트랜스포머 신경망 모델
    • 우선 '딥러닝'과 '머신러닝'의 차이점을 알아야 한다. 머신러닝은 기계 모델에게 데이터의 패턴을 학습시키는 인공지능 훈련 방법을 말한다. 머신러닝에서는 사람의 수동 조작을 통한 전처리가 성능에서 중요한 영향을 미치는데, 반면 딥러닝은 사전 조사가 생략되고 알고리즘이 원본 데이터에서 스스로 규칙을 배운다. GPT는 딥러닝을 통해서 스스로 언어를 생성하고 추론한다. 딥러닝에서 중요한 건 파라미터의 수인데, GPT-1에서는 1억1700만개였던 파라미터가 GPT-3.5에서는 1750억개로 크게 늘어난 모습을 보인다.
    • 딥러닝의 가장 큰 과제인 대량 데이터 처리를 해결한 것이 바로 구글이 2017년 발표한 트랜스포머 알고리즘이다. 기존의 알고리즘은 데이터를 순차적으로 처리하는(=앞뒤 단어만 보는) '순환 신경망 방식'으로 데이터를 학습했다. 트랜스포머 알고리즘은 이런 한계를 극복해 멀리 떨어진 단어 사이의 관계까지 감지하고 있다.
    • 챗GPT는 대표적인 초거대 AI이다. 초거대 AI는 클라우드 컴퓨팅과의 결합이 필수적이다. 클라우드 컴퓨팅은 인터넷 가상 공간에 존재하는 서버, DB 등의 IT 리소스에 접근해 소프트웨어, 네트워킹 등 다양한 IT 서비스를 이용하도록 도와주는 기술을 말한다. 챗GPT와 같은 생성형 AI는 수많은 계산을 필요로 하기 때문에, 클라우드 공급 업체(아마존, MS 등)과 협력하여 IT 서비스를 사용한다.

  • Pre-trained: 사전 학습 모델과 미세 조정
    • 사전 학습 모델은 세부 태스크 처리에 강점을 보이는데, 이전에 사전 학습을 하지 않은 모델은 요약/감정분석/번역 같이 태스크카 생기면 그에 따라 모델 훈련을 다시 해야 했다. 하지만 사전 학습을 거친 모델은 별도의 학습 과정 없이 다양한 태스크를 잘 처리할 수 있다. 이렇게 기초부터 훈련을 해서 다양한 태스크에 적용할 수 있도록 하는 모델을 파운데이션 모델이라고 부른다.
    • 사전 학습 이외에도, AI 모델은 거짓 정보나 유해한 콘텐츠 생산을 막기 위해 '미세 조정'과정을 거친다. 이러한 미세 조정 방법 중 챗GPT에 적용한 학습으로는 인간 피드백 기반 강화 학습(RHLF)이 있다. RHLF은 3단계에 걸쳐 진행된다. 우선, 특정 질문에 대해 사람이 직접 이상적인 설명을 작성한다. 둘째, 여러 개의 아웃풋에 대해 인간 라벨러가 어떤 아웃풋이 좋고 나쁜지 순위를 매긴다. 마지막으로, 확보 답변 중 순위가 가장 높은 답변을 선택하는 방향으로 GPT 학습 정책을 업데이트 한다.
    • 미세조정으로 '퓨샷 러닝'과 '인컨텍스트 러닝'을 활용하기도 한다. 사용자가 대화를 통해 AI를 가르칠 수 있는 방법인데, 그런 복잡한 용어를 몰라도 사람들은 챗GPT를 가르치려고 하면서 자연스럽게 해당 러닝이 쓰이고 있다.[3]


2.2. 2부 - AI 전쟁의 승자는 누가 될 것인가[편집]



2.2.1. 3장 - 2023년은 AI 전쟁의 원년[편집]


  • 마이크로소프트는 기존의 클라우드 시장에서는 AWS에 밀리고, 검색과 브라우저는 각각 구글 검색과 크롬에 밀리는 인상이었다. 그랬던 MS는 챗GPT를 제시하면서 검색 시장의 판도를 완전히 뒤바꿀 수 있다는 평을 받고 있다. 기존의 구글 검색은 인터넷에서 정보를 검색하고 색인하는 도구라면, 챗GPT는 인간과 유사한 텍스트 생성+학습된 데이터를 바탕으로 결론 자체 도출이 가능하기 때문이다. 또한 챗GPT는 전문가 같은 자문을 무료로 제공하고, 창의적인 응답도 낼 수 있는 등 여러 효과적인 기능을 갖고 있다.

  • 구글은 챗GPT가 발표되자마자 적색경보를 발령하고, 여러 AI 프로젝트를 승인했다. 기존의 AI 분야 절대 강자였던 구글은 23년 2월, AI 스타트업 앤스로픽에 4억 달러를 투자하고 파트너십을 체결했다. 앤스로픽은 AI 챗봇 클로드의 테스트 버전을 출시하였고, 테스트 결과 챗GPT보다 답변이 길어도 더 자연스럽고 일관성이 있다는 평을 받았다. 한편, 구글은 새로운 챗봇 바드를 공개했는데, 챗GPT에 견제 심리로 나온거라 영 평이 묘하다.. 자세한 건 바드(인공지능) 참고.

  • 결국 AI 전쟁의 1차 격전지는 '검색'이 될 예정이다. 지금 쓰이는 검색 방식[4]이 생각보다 머리를 써야 하는데, 이 지점에서 대화형 검색이 각광을 받고 있다. MS는 챗GPT를 통해 검색 엔진의 재편을 노리고 있고, 구글은 바드를 도입한 후 본인들의 압도적인 데이터량을 활용하여 보다 적합한 정보를 제공하고자 한다.


파일:MS사업부별매출비중.jpg

마이크로소프트 사업부별 매출 비중
  • 마이크로소프트가 운영하는 사업부는 크게 8가지로 분류된다. 이 중 위의 이미지에서 초록색인 4가지 영역이 AI 기술이 직접적으로 적용될 수 있는 사업부이다. 이런 과정을 통해 MS의 클라우드 서비스인 애저의 영역을 확장하고, MS 오피스에 생성형 AI 기술을 접목하고, 링크드인[5]에서 이력서를 대신 작성해주는 등 챗GPT를 적극적으로 활용하려고 하고 있다.


2.2.2. 4장 - 챗GPT로 누가 돈을 벌 것인가?[편집]


  • 생성형 AI 산업의 생태계는 크게 4가지 층위로 구분된다. (1)초거대 AI 모델 (2)클라우드 플랫폼 (3)AI 반도체 회사 (4)AI 서비스. 이중 (1)~(3)에 대해서 살펴보면,
    • 초거대 AI 모델 - AI 모델은 MS/구글/아마존 같은 글로벌 빅테크가 아니면 섣불리 도전하기 어려운 영역이다. 특히 중국과 미국의 2파전이 될 것으로 예상되고 있는데, 중국의 AI 모델도 미국의 것과 파라미터 수에서 전혀 밀리지 않는다.
    • 클라우드 플랫폼 - 글로벌 빅 클라우드는 AWS(아마존), 애저(MS), 구글 클라우드, 알리바바 클라우드, 텐센트 클라우드 이렇게 다섯 가지로 이들은 전체 점유율 중 73%을 차지한다. 다섯 개를 따지면 미국의 3대 클라우드는 전체 점유율 중 66%를 차지하기 때문에 압도적이고, 중국의 두 개는 7% 밖에 안되지만 자국 시장에서만큼은 압도적인 점유율을 유지하고 있다.
    • AI 반도체 기업 - 흔히 AI 반도체로 사용되는 GPU는 현재 엔비디아가 거의 독점적으로 생산하고 있다. 엔비디아의 시장 점유율은 무려 97%이며, 빅테크 기업 중 누가 승기를 잡아도 엔비디아는 지속적으로 성장할 것이라는 평을 받는다.


파일:기술의확산곡선.jpg

기술의 확산 곡선과 캐즘
  • 생성형 AI는 인터넷과 스마트폰의 뒤를 이어, 사람들의 삶을 뒤바꿀 혁신 기술로 기대받는다. 혁신 기술의 라이프 사이클을 이론화한 것이 위의 캐즘 이론인데, 여기에서 캐즘이란 혁신 기술이 대중에게 널리 도달하기 전에 발생하는 침체기를 의미한다. 이 캐즘을 뛰어넘어야 소수의 혁신적 성향의 소비자[6]를 넘어 일반 대중도 이를 받아들인다. 캐즘을 뛰어넘기 위해서는 '(1)비용 절감 (2)사용자 니즈 충족 (3)혁신 비즈니스 모델'을 제시해야 한다.[7]

  • AI 모델, 클라우드, AI 반도체는 거대 기업이 대부분을 차지한다면, AI 서비스는 그야말로 다양한 회사들이 각축전을 벌이고 있다. 그 중 이미 유니콘 기업[8]에 오른 곳도 오픈AI를 포함해서 6곳이나 된다. 앞서 설명한 오픈AI는 빼고 각각의 면면들을 살펴보면,
    • 허깅페이스 홈페이지 - 글로벌 최대 AI 플랫폼으로, 개발자는 여기에 공개된 머신러닝 레퍼런스를 통해 최신 모델을 스스로 구축할 수 있다. '허깅' 이모지가 회사의 트레이드 마크. 허깅페이스를 사용하면, 개발자는 트랜스포머 모델을 만들 때 코드를 작성할 필요없이 여기서 트랜스포머 라이브러리를 가져오기만 하면 된다! 최신 모델을 업데이트할 뿐만 아니라, 지속적인 리뷰를 통해 완성도 높은 모델을 받을 수 있다. 특히 배포->리뷰->수정 단계를 거치도록 형성하는 오픈 커뮤니티야말로 그들의 강점. 23년 3월 기준 투자는 시리즈 C[* 스타트업의 투자 단계는 기업의 성장 단계에 따라 시드->시리즈 A->시리즈 B->시리즈 C까지 분류된다. 구체적인 건 그림 참조. {{{#!wiki style="margin: -5px -10px;"
파일:시리즈ABC.png}}}]까지 완료.
  • 라이트릭스 홈페이지 - __사용자가 모바일에서 이미지나 영상을 제작할 수 있는 크리에이티브 툴을 개발하는 회사이다. 라이트릭스에는 다양한 하위 제품이 있는데, 이 중 포토리프에 '텍스트 투 이미지' 기능을 추가하여, 명령어를 입력하면 원하는 AI 이미지를 만들 수 있도록 하였다. 다른 AI 회사도 이런 기능을 선보일 수 있지만, 스마트폰에서 간단하게 할 수 있다보니 사람들이 더 모인다고.
  • 재스퍼 홈페이지 - 기업 브랜드에 적합한 카피라이트 및 콘텐츠를 빠르게 만들어는 회사이다. 재스퍼를 쓰면 SNS의 짧은 콘텐츠부터 블로그의 긴 콘텐츠까지 쉽게 만들어내며, 표절 검사는 물론 환경에 맞는 50개 이상의 템플릿을 제공하고 있다. 이러한 콘텐츠 생산 중 특히 카피라이팅에 특화되어 있다. 또한 재스퍼 챗과 소통하면서 아이디어를 나누는 것도 가능하다. 23년 2월에는 기업용 제품군인 '재스퍼 포 비즈니스'를 출시했다. 3월 기준 투자는 시리즈 A까지 완료.
  • 글린 홈페이지 - 지메일, 슬랙과 같은 업무용 앱에서 필요한 정보를 쉽게 찾도록 하는 회사이다. 우리는 업무를 드롭박스, 구글 드라이브, 노션, 스프레드시트, 슬랙 등등 다양한 곳에 기록해뒀는데, 이걸 일일이 다시 찾는 귀찮은 과정을 글린이 있으면 한방에 해결해준다고 보면 된다. 꼭 거대한 AI 모델이 아니더라도, 특화된 분야에서 정체성을 찾아 강력한 서비스를 제공하는 케이스. 23년 1월 구글 클라우드와 공식 파트너십을 체결했다.
  • 스태빌리티AI홈페이지 - 오픈AI와 마찬가지로 생성형 AI 모델을 만드는 기업. 그림 인공지능인 스테이블 디퓨전을 개발한 것으로 유명하다. 오픈AI와 가장 큰 차이점은 여기는 소스코드를 무상으로 공개하는 오픈 소스 기업이라는 것이다. 스태빌리티AI의 모델들을 통해 다양한 서비스 앱들이 만들어지고 있다. 22년 10월 시드 투자를 유치하고, 22년 12월 AWS와 파트너십을 맺었다.


2.2.3. 5장 - 한국 AI 사장과 주요 기업[편집]


  • 초거대 AI 모델 - 대표적으로 네이버, 카카오, LG, KT, SKT를 꼽을 수 있다. 하나하나 면면을 살펴보면,
    • 네이버 홈페이지 - AI 모델의 이름은 하이퍼클로바. 국내에서는 최초로, 세계에서는 세 번째로 공개된 초거대 AI 모델이다. 50년 분량의 네이버 뉴스, 카페, 블로그 등을 학습해서 데이터 중 97퍼센트가 한국어이며 이는 GPT-3에 비해 약 6,500배나 많다. 네이버 서비스 곳곳에 활용되고 있는데, 검색어 오탈자 자동 수정, 네이버 쇼핑 상품 소개문구 작성, 클로바노트를 통한 회의록 요약 등에 쓰이고 있다.
    • 카카오브레인 홈페이지 - AI 모델의 이름은 코GPT. 파라미터는 60억 개로 다소 작지만, 한국어와 관련된 언어 태스크에 강점을 보인다. 한편 카카오 브레인은 이미지 생성 모델인 '칼로'도 공개했는데, 스태빌리티AI처럼 대중성을 경쟁력으로 삼는 것으로 보인다. 카카오는 코GPT에 블록체인을 적용할 로드맵을 가지고 있어 다른 언어 모델과 차별된다. 코GPT의 학습을 지원하면 모델의 지분을 가질 수 있도록(!) 계획한다는 듯.
    • LG AI 연구원 홈페이지 - AI 모델의 이름은 엑사원. '모두를 위한 전문가 AI'라는 의미를 가지며, 헬스케어/금융/교육/제조 등 전 산업 분야에서 1퍼센트의 전문가 AI를 개발하는 것이 목적이다. 항암 백신 개발, 전기차 배터리, 코딩과 작곡 등 다양한 분야에서 연구를 진행중에 있다.
    • KT 기술리뷰 - AI 모델의 이름은 믿음. 믿음의 가장 큰 특징은 인간의 감성을 이해하고 공감하는 AI를 표방하려고 한다는 점이다. 공감 능력을 바탕으로 편안하게 소통하는 맞춤형 서비스를 제공하려고 하며, 22년 12월 '오은영 AI 육아 상담 서비스'를 시연했다. 또한 AI가 노인 고객층과 감성적인 대화를 나누는 서비스도 추진하는 등, 다양한 분야에서 연구 중에 있다.
    • SKT 홈페이지 - AI 모델의 이름은 에이닷. 엄밀히 따지면 SKT는 AI 모델 기업은 아니고, 파운데이션 모델을 기반으로 서비스를 상용화 하는데에 초점을 맞추고 있다. 사용자의 일상 관리를 맞추는데 주력하고, 사람과 이야기하는 것처럼 자연스러운 소통을 추구하고 있다. 23년 초, SKT는 자신들의 슈퍼컴퓨터 '타이탄'을 기존 대비 두 배의 규모로 확장하려는 등 인프라를 구축하는 데에도 힘쓰고 있다.

  • 클라우드 기업 같은 경우는 국내에서는 해외 의존도가 상당히 높고, 국내 클라우드 기업으로는 유일하게 네이버클라우드만 의미 있는 시장 점유율을 차지하고 있다. '뉴 클라우드 전략'이라는 이름 하에 AI 독립 기업인 클로바를 네이버 클라우드와 통합했다.

  • AI 반도체는 반도체가 우리나라 수출 품목 1위인 것에 반해, 글로벌 시장과 국내 시장 모두 한국 기업의 이름을 찾기 힘들다. 즉 우리 나라도 주로 엔비디아의 AI 반도체를 쓴다는 것.[9] 그럼에도 한국은 AI 반도체의 기존 단점을 공략하여 시장을 개척하려고 하고 있다. 주요 기업을 짧게 요약하면
    • 삼성전자 홈페이지 - AI 반도체 중 차세대 메모리 개발에 집중하고 있다. HPM-PIM을 개발하는 등 다양한 메모리 솔루션을 개발하려고 한다.
    • 사피온 홈페이지 - SKT의 자회사로, SK하이닉스와도 긴밀히 협업 중이다. 국내 최초로 AI 반도체 사피온을 개발하였다.
    • 퓨리오사AI - 2017년에 창업한 반도체 스타트업으로, 2021년 AI 반도체 성능 경연대회에서 첫 번째 시제품인 워보이로 추론 분야에서 엔비디아를 넘어서는 성능을 보였다. 2023년 기준 지금도 활발하게 차세대 모델을 개발하고 있는 중.
    • 리벨리온 홈페이지 - 2020년에 창업한 AI 반도체 스타트업으로, 금융에 특화된 AI 반도체를 만들어 업계의 주목을 받는 등 특정 분야에 맞는 AI 반도체를 만들어가고 있다.

  • AI 응용 서비스 기업은 현재 전세계 AI 유니콘 기업 75개 중 한국 기업은 하나도 없어, 아직 다소 부족한 모습이다. 그럼에도 주목받는 AI 서비스 기업들이 있는데 하나씩 짚어보면
    • 뤼툰테크놀로지스 홈페이지 - 2021년에 설립한 텍스트 생성형 AI 스타트업으로, 2022년 50여 개의 스타일로 텍스트를 생성하는 AI 카피라이팅 툴 '뤼튼'을 출시했다. 사용자가 키워드를 입력하면 뤼튼은 빠르게 최적화된 콘텐츠를 생산한다. 또한 '뤼튼 트레이닝'을 통해 쉽고 체계적으로 글쓰기를 훈련하는 서비스도 제공한다.
    • 포자랩스 홈페이지 - 2018년에 설립한 음원 생성 AI 스타트업으로, 누구나 쉽게 음악을 창작할 수 있는 솔루션을 갖고 있다. 생성된 샘플을 조합하거나, 후처리도 AI를 통해서 처리가 가능하다. AI 모델 학습에 필요한 음원 데이터는 직접 제작하기 때문에, 저작권 침해나 표절 등의 문제도 발생하지 않는다고 한다.
    • 스캐터랩 홈페이지 - 2020년에 AI 챗봇 이루다를 만든 것으로 유명한 회사로, 이루다는 실제 사람의 대화 데이터를 학습해서 인간처럼 응답하는 게 가능하다.3주만에 서비스를 중단했지만 AI 챗봇 윤리 준칙을 세우고 2022년 이루다 2.0을 출시하여, 좀 더 주체적인 대화를 하도록 했다. 이외에도 남성 챗봇 강다온, 현대인들에게 사색의 경험을 제공하는 '블림프', 연애 조언 서비스 '연애의 과학' 등도 운영 중이다.
    • 프랜들리AI 홈페이지 - 2021년에 설립된 AI 플랫폼 회사로, AI 관련 기술이 없는 사람도 클라우드를 통해 생성형 AI를 개발하도록 지원하는 회사이다. 그런 목적에서 출시된 '페리플로우'는 AI 서비스 개발을 위해 학습과 추론 서비스를 제공하며, 이외에도 초거대 AI 모델의 효율을 증진하기 위한 '오르카' 시스템도 선보였다.

  • 우리나라와 G2의 투자 규모를 비교하면, 미국이 한국의 약 75배, 중국이 약 31배 앞선다. 이렇듯 미국과 중국이 큰 축을 차지하는 AI 전쟁에서 생존하려면, 사용자 니즈를 저격한 모델들을 앞세워야 한다.[10] 또한 AI 반도체 시장에도 '후발 주자 우위 효과'를 적극적으로 활용하여 오히려 선발 주자가 쉽사리 할 수 없는 방법을 채택하여 따라잡을 수 있다.[11]


2.3. 3부 - 생성형 AI가 바꾸는 미래[편집]



2.3.1. 6장 - 생성형 AI 글로벌 서비스[편집]


  • AI21랩스홈페이지는 2017년에 설립된 이스라엘의 AI 기업으로, 앞에서는 언급되지 않은 또다른 중요한 파운데이션 모델 기업이다. AI21랩스는 대규모 언어 모델 '쥬라식'을 발표했으며, AWS와 협력하여 해당 모델을 제공하고 있다.

  • 몇몇 거대 기업을 제외하면, 대부분의 회사는 주로 빅테크의 파운데이션 모델을 활용하여 새로운 서비스를 만든다. 그리고 이런 서비스 회사에서 탠배거 기업[12]이 등장할 수 있기 때문에, 우리는 여기에 주의를 기울여야 한다. 각각의 영역에서 활약하는 기업들을 살펴보도록 하자.

  • 텍스트 영역: 카피AI, 뮤터니, 옉스트
    • 카피AI 홈페이지 - 비즈니스 고객을 위한 AI 기반 카피라이팅 툴을 제공하는 기업이다. 재스퍼와 유사한 기업으로, 재스퍼 대비 낮은 가격과 무제한 사용이라는 장점을 통해 소비자들을 설득한다. 다만 재스퍼에 비해 다소 글의 길이가 짧고, 기능도 단순한 편이라고.
    • 뮤터니 홈페이지 - 비즈니스 웹 사이트를 최고의 수익 채널로 전환하도록 돕는 기업이다. 엔지니어 없이 수요를 수익으로 전환하는 걸 도와주는 노코드 AI 플랫폼을 제공한다. 최근에는 카피라이팅 추천 툴을 만들어서 헤드라인이나 설명을 추천하는 기능도 추가하였다.
    • 옉스트 홈페이지 - 비즈니스 고객을 위해 AI를 기반으로 작동하는 검색 솔루션을 제공하는 기업이다. 회사가 고객이나 직원의 모든 질문에 답할 수 있도록 지원하는 온라인 브랜드 관리 플랫폼을 제공하고 있다. 사실 이미 2017년에 IPO에 성공한, 어느정도 이름 있는 회사지만 챗GPT의 등장에 빠르게 대응하여 새로운 서비스를 제시한 케이스.

  • 이미지 영역: 달리2, 미드저니
    • 달리2 홈페이지 - 살바도르 달리의 Dalí가 아니라 달리+월-E로 DALL-E다 검색창처럼 생긴 텍스트 상자에 우리가 원하는 이미지를 말로 표현하면, 몇 초만에 이미지를 만들어주는 기업이다. 또한 아웃페인팅 기능을 통해 이미지의 경계를 넘어 비슷한 스타일로 그림을 확장시킬 수 있다.[* 대표적인 예시: <진주 귀고리를 한 소녀>를 확장시킨 작품 {{{#!wiki style="margin: -5px -10px;"
파일:아웃페인팅_진주귀고리를한소녀.jpg}}}]
  • 미드저니 홈페이지 - 미술 대회 1등을 수상한 '스페이스 오페라 극장'[* {{{#!wiki style="margin: -5px -10px;"
파일:스페이스_오페라극장.jpg}}}]을 만든 것으로 유명한 회사. AI에 기반해 예술 작품을 생성하는 알고리즘과 프로그램을 만드는 독립 연구소로, 특이하게도 디스코드를 통해 이미지 생성한다.

  • 오디오 영역: AI뮤직, 뮤직LM
    • AI뮤직 - 2016년에 설립된 스타트업으로 음악의 소비 방식을 바꾸기 위해 기존 음악의 형태를 변경하는 데 집중해왔다. 사람이 잠이 들면 음악을 수면에 도움이 되는 트랙으로 전환하는 등, 사용자의 상황에 맞게 음악을 새롭게 만들어낸다. 2022년 2월 애플이 인수하여 애플 피트니스와 애플 TV 등에서 접목될 예정이다.
    • 뮤직LM - 구글에서 발표한 AI 음악 서비스로, 텍스트를 음악으로 변환하는 기술을 갖고 있다. 예를 들어 "아케이드 게임의 메인 사운드트랙"이라고 입력하면 빠른 템포+일렉 기타를 사용한 음악이 나오는 방식.

  • 영상: 런웨이, 리프레이즈AI
    • 런웨이 홈페이지 - 머신러닝 기반으로 영상을 편집하는 기능을 제공하는 콘텐츠 제작 플랫폼이다. 텍스트를 이미지로 변경해주는 모델인 스테이블 디퓨전을 공동으로 개발하기도 하였다. 2023년 2월, 텍스트나 이미지를 참조하면 기존의 영상을 새로운 영상으로 변환하는 'Gen-1'을 출시하였다. 여태 논문에서만 나오던 기술을 실제로 기업으로 내세운 점에서 의의가 있지만, 영상은 이미지에 비해 훨씬 더 비용이 많이 드는데, 이러한 비용문제는 어떻게 해결할지 논의될 필요가 있다.
    • 리프레이즈AI 홈페이지 - 사용자가 텍스트를 입력하면, 음성과 비디오가 합성된 아바타가 내용을 설명하는 동영상을 만들어주는 기업이다. 인도의 유명 영화 배우 샤룩 칸과 협약을 맺어 만들어진 샤룩 칸의 디지털 아바타 영상은, 인도 현지의 개별 매장을 홍보하는 초개인화 광고로 탄생하기도 하였다.

  • 코드 영역: 코파일럿
    • 코파일럿 홈페이지 - 2022년 6월에 출시된 깃허브에서 반든 코드 자동 생성 서비스이다. 코드 작성 에디터에서 실시간으로 코드와 함수를 제안하며, 다양한 범위의 코드 자동완성이 가능하다. GPT-3의 후손 격인 오픈AI의 코덱스에 기반하고 있으며, 코덱스의 학습 데이터에는 자연어와 함께 공개적으로 사용 가능한 수십억 줄의 소스코드를 포함하고 있다. 가장 효과가 좋은 언어는 파이썬이라고.

  • 검색 엔진 영역: 유닷컴
    • 유닷컴 홈페이지 - 구글에 도전장을 내민 검색 엔진 스타트업으로, 과잉 정보와 검색 결과에 대한 신뢰 문제를 해결하고자 한다. 광고 수익 극대화보다, 사용자의 요구를 충족시키는 것을 가장 중요하게 생각한다고. 수익화 방법은 비공개 광고를 검토할 계획이라고 밝혔다. 유닷컴의 대화형 검색인 유챗을 이용하면, 온라인의 수많은 정보를 텍스트로 요약할 수 있다.

  • 데이터 영역: 모스틀리AI, 그레텔
    • 모스틀리AI 홈페이지 - AI 모델 개발과 소프트웨어 테스트를 위한 합성 데이터를 만드는 기업이다. 이곳에서 만든 데이터는 실제 고객 데이터만큼 현실적이지만, 실제 개인의 데이터는 없어서 개인정보 보호 규정을 준수할 수 있다. 다만 알고리즘에 따라 데이터를 만들다보니 데이터가 편향될 수 있다는 한계가 있다.
    • 그레텔 홈페이지 - 개발자가 데이터를 통해 모델을 빠르게 빌드하고 다른 사람과 안전하게 공유하도록 하는 서비스이다. 표 데이터, 텍스트 데이터, 시계열 데이터, 관계형 데이터 등 다양한 데이터를 제공한다. 이렇게 생성된 합성 데이터세트에 대해서는 품질 점수와 프라이버시 보호 레벨 정보가 제공된다.

  • 디자인 영역: 갈릴레오AI
    • 갈릴레오AI 홈페이지 - 유저 인터페이스를 자동으로 만들어주는 AI 툴을 제공하는 서비스이다. 사용자가 원하는 인터페이스를 텍스트로 입력하면 자동으로 인터페이스를 생성해준다. 온보딩 화면, 프로필 페이지 등을 빠르게 만들어준다. 단, 책 발매 기준 별도의 법인이 설립되지는 않았으며, 피그마에서 플러그인 형태로 제공될 예정이다.

  • 프롬프트 영역: 프롬프트베이스
    • 프롬프트베이스 홈페이지 - 프롬프트는 간단히 말해서 생성형 AI에게 입력하는 입력값인데, 프롬프트베이스는 바로 이러한 프롬프트를 사고 파는 마켓플레이스다. 위에서 언급된 달리, 미드저니, 스테이블 디퓨전 등에 이용된다. 등록된 모든 프롬프트는 사람이 직접 검토하며, 일관된 결과를 만들지 못하는 프롬프트는 검토 단계에서 탈락한다.


2.3.2. 7장 - 산업과 시장의 지각변동[편집]


  • 4차 산업혁명은 2016년 세계 경제 포럼에서 등장한 용어로 빅데이터, AI, 로봇 등의 기술이 융합하여 이루는 초연결을 의미한다. 이중에서 무엇이 우리 미래의 혁신 기술이 될 것인가 많은 논의가 있었는데한 때 메타버스가 화두기도 했고, 이 중 AI가 우리가 실감할 수 있는 방식으로 4차 산업혁명을 이끌 기술로 기대되고 있다.

  • 통계 조사 기관 마켓앤마켓은 2021년 생성형 AI의 시장 규모는 금융, IT, 소매 및 전자상거래, 의료 및 생명과학, 운수 및 물류, 국방 및 공공, 제조, 에너지 순으로 규모가 크다고 분석했다.[13] 한편, 가트너는 2023년 생성형 AI가 활발하게 적용되는 산업으로 신약 설계, 재료 과학, 반도체 설계, 데이터 합성, 부품 설계를 꼽았다. 아래의 글에서 산업별로 '리셋 모먼트'를 만들고 있는 AI 서비스들을 살펴보자.

  • 교육은 생성형 AI가 가장 빠르게 적용될 것이라고 기대되는 분야다. AI는 언어 학습, 보조 교사, 맞춤형 콘텐츠 제작 등에 도움을 줄 수 있으며 이미 챗GPT을 공교육에 활용한 사례가 있을 정도이다. 다만 챗GPT가 숙제를 대신해주는 등 부작용도 들려오고 있기 때문에, 이에 대한 가이드라인을 확립해야 할 필요가 있다.
    • 스픽 홈페이지 - 스픽이지랩스에서 제공하는 음성 인식 기반 영어 학습 서비스이다. 스픽을 이용하면 진짜 원어민 선생님 같은 AI와 자유롭게 영어 회화를 연습할 수 있다. 원어민의 영어 음성 데이터와 100만명이 넘는 한국인의 영어 음성 데이터를 학습한 모델을 사용하고 있다.

  • 광고/마케팅은 기존의 인간 마케터나 카피라이터가 하던 일들을 대거 자동화할 수 있기 때문에, AI 서비스에 큰 관심을 갖는 산업 중 하나이다.
    • 카피스미스 홈페이지 - GPT-3를 기반으로 카피라이터와 AI 전문가가 함께 설계한 카피라이팅 서비스다. 단지 몇 개의 키워드를 입력하면, 브레인스토밍/리서치/초안작성/편집/교정 등의 과정에 걸리는 시간을 획기적으로 줄여준다. 또한 표절 검사기가 내장되어서 카피를 검증할 수도 있다.
    • 카피몽키 홈페이지 - 생성형 AI를 통해 스마트스토어 운영자를 지원하는 서비스다. 카피몽키를 쓰면, 몇 초만에 아마존 판매자 페이지에서 제목과 설명을 생성하고 이를 판매와 마케팅에 최적화하도록 돕는다.

  • 콘텐츠와 관련해서는 생성형 AI는 새로운 콘텐츠를 빠르게 생산하고 있다. 원하는 콘텐츠를 만들기 위해서는 구체적이고 창의적인 프롬프트(입력값)를 만들 수 있어야 한다.
    • 노벨AI 홈페이지 - GPT 모델을 기반으로 동작하며, 텍스트를 기반으로 이미지를 생성하는 기능과 입력한 문장을 바탕으로 다음 이야기를 작성하는 기능을 제공하는 서비스이다. 이미지를 만드는 것도, 이야기를 만드는 것도 AI와 함께 할 수 있기 때문에 새로운 가능성을 보여주지만, 저작권 문제를 안고 있다.

  • 미디어에서도 생성형 AI는 패러다임의 전환을 일으키고 있다. 음악, 그래픽, 영상 등 멀티미디어 영역에도 생성형 AI 기술을 활용한 서비스가 족족 등장하고 있다.
    • 디스크립트 홈페이지 - 미디어 편집에 쓰이는 생성형 AI 솔루션 서비스를 제공한다. 디스크립트에 미디어나 녹음 파일을 업로드하면 소리를 즉시 텍스트로 변환해 주고, 변환된 텍스트를 화면에서 조정하며 클립을 편집할 수 있다.
    • 타입캐스트 홈페이지 - 텍스트 문장을 입력하면 가상 성우가 나오는 영상을 만들어주는 서비스이다. 2018년 북미정상회담을 앞두고 트럼프의 음성을 추출해 그가 한국어로 말하는 것처럼 구현한 영상이 화제가 되면서 주목을 받았다. 아직 고퀄리티의 영상을 만들지는 못하고, 유명인을 합성하는 악용 사례가 나올까봐 소스코드를 공개하지는 않는다고.

  • 디자인에서는 다양한 기업에서 물건의 디자인을 만들 때 AI와 적극적으로 협력하고 있다. 어떻게 하면 최소한의 재료로 몸을 편안하게 만들지에 대한 연구가 계속되고 있다.
    • 플레어 홈페이지 - 브랜드에 어울리는 제품 배경 디자인을 생성해주는 서비스이다. '물 속에 빛을 받으면서 가라앉아 있는 케이스' 같이 특별한 요구 사항도 금방 이미지를 뚝딱 만들어줄 수 있다. 특수한 카메라를 사용하지도, 한번에 완성해야 하지도 않기 때문에 다양한 도전을 시도해보도록 한다.
    • 칼라 홈페이지 - 칼라는 2016년에 설립된 패션 플랫폼으로 2022년 10월 AI를 자사 플랫폼에 추가한다고 발표했다. 칼라의 서비스를 통해 전체 스케치나 3D 렌더링 없이 텍스트 입력으로 패션 아이디어를 이미지로 구현할 수 있다.

  • IT에서는 챗GPT의 어마어마한 코딩 데이터 학습량을 통해, 짧은 시간 안에 코드를 쓰도록 하고 단계별 코드 작성에 대한 가이드를 제공한다. 챗GPT를 잘만 활용한다면 개발자는 더 이상 상용구 코드[14]를 작성할 필요가 없다.
    • 탭나인 홈페이지 - 개발자가 더 빠르게 코딩할 수 있도록 지원하는 코드 자동완성 플랫폼이다. 개발자가 선호하는 IDE에서 생산성을 한 차원 높이고 리뷰 시간을 단축하는데 도움을 준다. 7장에서 소개된 코파일럿과의 차별점은 안정성으로, 코파일럿과 달리 허용된 라이선스와 높은 수준의 신뢰성을 갖는 공개 코드만을 학습하고 있다.

  • 헬스케이는 2023년 기준 생성형 AI가 가장 활발하게 적용되는 산업으로 꼽히고 있다. 카카오브레인과 LG AI연구원도 헬스케어 산업을 전략적인 사업 영역으로 지정할만큼 큰 관심을 받는 분야.
    • 힐리움 홈페이지 - 생체 데이터를 사용하여 불안 해소에 도움이 되는 명상 등을 지원하는 생성형 AI 기반 스타트업이다. 뇌파 헤드밴드 등을 같이 착용하면, 웨어러블 장치를 통해 데이터를 수집해서 시청각 요소를 제어한다. 2023년 2월에는 자기 전 명상으로 심박수를 낮추는 슬리피움 서비스도 런칭했다.

  • 법률 분야에서는 생성형 AI가 등장하면서 높은 인건비에 대한 부담을 낮출 것으로 시장은 기대하고 있다.
    • 하비 홈페이지 - 변호사의 실사, 소송, 감시 등 법률 업무 수행을 돕는 오픈AI 모델 기반의 AI 플랫폼이다. 매우 빠르게 법적 논거를 만들고 초안을 생성하기 때문에 변호사 사이의 중개자 역할을 맡을 수 있다. 현재는 초급 법률 업무에 사용될 가능성이 높은데, 할루시네이션[15]에 대한 위험성은 여전히 제기되고 있다. 이외에도 프라이버시에 대한 문제가 제기되기도 한다고.

  • 금융/회계 분야에서도 생성형 AI는 떠오르고 있다.
    • 키퍼 - GPT3 모델을 기반으로 은행 명세서의 데이터를 거래 정보로 해석하여 자동적인 세금 관리를 지원하는 서비스이다. 키퍼는 긱워커[16] 등 프리랜서 노동자들이 세금을 20퍼센트 이상 초과 납부하는 것으로 추정하고 있는데, 이들을 위해 세금 공제가 가능한 사업 비용과 세금 혜택을 자동으로 찾아준다.
    • 타블레이트 - GPT3 모델을 기반으로 회계와 재무 등을 지원하는 서비스이다. 수익과 비용 기록, 급여 및 미지급금 분석, 세금 계산 등 다양한 기능을 제공하고 있다. 푸드트럭이나 중소규모의 식당을 운영하는 사람 등을 주요 고객으로 삼고 있다.

  • 업무 생산성 분야에서는 많은 기대를 받고 있다. 지식 근로자들은 업무 시간의 19퍼센트를 정보 수집에 소비하고 있다고 추정될 정도로 많은 시간을 허비하고 있는데, 이걸 생산성 AI는 획기적으로 줄여줄 수 있다.
    • 홈페이지 - 개인에게 맞춤화된 업무화 공간을 제공하는 AI 기반 플랫폼이다. 다양하게 뒤섞인 정보들을 이벤트, 주제, 사람 등을 기준으로 연결하고 조직화한다. AI를 활용하여 텍스트 생성, 파일 요약, 문서 제목 생성, 텍스트 서식 지정 등 다양한 기능을 제공하고 있다.

  • 메타버스는 생성형 AI와 결합하여 생태계를 더욱 풍부하게 구현할 수 있다.
    • 캐릭터AI 홈페이지 - 유명인, 애니메이션 캐릭터 등과 채팅하고 챗봇을 만들 수 있는 서비스이다. 2023년 6월 기준 베타 버전으로 있다. 유명인들끼리 대화를 붙일 수도 있는 기능도 있다.
    • 레디플레이어미 홈페이지이거랑 헷갈리지 말자 - 다수의 메타버스 플랫폼에서 호환 가능한 아바타를 만드는 서비스이다. 2021년 NFT 컬렉션으로 아바타를 꾸미는 기능을 추가하기도 했다.


2.3.3. 8장 - 생성형 AI로 더 강력해지려는 기업들[편집]


  • 7장에서는 신성 기업들을 살펴봤다면, 8장에서는 기존 비즈니스 모델에 생성형 AI를 통합한 경우를 살펴보자.

  • 어도비홈페이지는 포토삽, 3D 편집 툴 등을 이용하여 창작의 혁신과 커뮤니티를 선도해온 기업이다. 생성형 AI의 기능을 받아들여 포토샵에서 텍스트를 이용하면 이미지가 추가될 수 있다. 아직은 이미지 중심으로 활용되지만, 앞으로 비디오 등 다양한 분야로 확장할 예정이다.

  • 세일즈포스홈페이지는 고객 관계 관리 분야에서 글로벌 1위의 솔루션 기업이다. 2023년 3월 '아인슈타인GPT'를 런칭하여, 이를 통해 판매 전환 가능성이 높은 영업 기회의 우선순위를 알려주고 있다.

  • 노션]홈페이지은 메모, 문서, 프로젝트 관리 등 통합적인 업무 관련 서비스 '노션'을 제공하고 있다. 2023년 2월 노션AI 서비스를 출시했는데, 총 14개 기능을 제공하여 브레인스토밍, 문법 오류 수정, 글의 콘셉트 수정, 회의 내용 요약 등을 제공하고 있다.

  • 레플릿 홈페이지은 크로스 플랫폼에서 협업 코딩을 지원하기 위해 브라우저 기반 통합 개발 환경을 개발한 회사다. 2022년 11월 생성형 AI 기반 '고스트라이터'를 출시하여, 다양한 프로그래밍 언어로 된 코드를 인식하고 필요한 코드를 제안한다. 구체적으로는 코드 완성, 코드 생성, 코드 변환, 코드 설명 이렇게 4가지의 기능으로 요약된다. 또한 챗봇과 대화하면서 코딩 작성을 해나갈 수 있다.

  • 셔터스톡홈페이지은 2023년 1월 AI 이미지 생성 플랫폼을 출시했다. 사용자는 웹사이트에서 스톡 사진과 일러스트를 쉽게 찾고 자신만의 이미지를 생성한다.


2.4. 4부 - 챗GPT의 한계와 도전[편집]



2.4.1. 9장 - 챗GPT의 한계[편집]


  • 챗GPT와 같은 생성형 AI는 확률적으로 적절한 대답을 만들 뿐이지, 그 대답이 항상 정답인 게 아니다. 특히 할루시네이션을 조심해야 하는데, AI 모델이 사실이 아닌 것도 설득력 있게 거짓말을 하는 것을 말한다. 이 문제를 해결하기 위해 AI 연구자들은 딥러닝에 지식 그래프를 통합하고 있다.

  • 챗GPT는 학습한 데이터에 따라 편견이 반영된 응답을 생성할 수도 있다. 데이터세트에 성별 및 인종에 대한 편견이 만연해 있다면, 언어 모델은 이러한 편견을 지속적으로 증폭시킨다. 이를 방지하기 위해서는 사전 학습에서 다양한 출처가 담긴 데이터를 사용해야 하며, 모델이 만들어진 이후 편향성을 감지할 수 있어야 한다.

  • 챗GPT는 개인 정보를 유출하거나, 활용 단계에서 프라이버시를 침해하는 응답을 생성할 수 있다. '클리어뷰AI'는 2020년 사람들의 SNS 이미지를 무단으로 스크랩해서 집단 소송에 휘말리기도 했다. 챗GPT는 이러한 문제를 해결하기 위해 강력한 보안 기술을 구현하고 민감한 정보에 대한 액세스를 신중하게 관리해야 한다.

  • 챗GPT는 저작권 문제에서 논쟁의 여지가 있다. 2023년 3월 기준, 오픈AI는 현재 저작권 이슈로 인해 소송 중에 있다. 저작권 문제로 데이터 확보가 어려워진다면, 생성형 AI 모델 개발은 크게 어려워진다. 특히 현재의 저작권법은 AI 기술을 포괄하기에는 부족한 점이 많아 논란의 여지가 있다.

{{{#!wiki style="margin: -5px -10px;"
파일:포브스co2배출량.png}}} ||
AI 모델 학습 과정에서 배출되는 CO2의 양
  • 챗GPT를 비롯한 초거대 AI 모델은 학습 과정에서 자동차의 평생 배출량의 다섯 배에 가까운 626,000 파운드 이상의 이산화탄소를 배출할 수 있다. GPT3와 같은 언어 모델은 수백 페타플롭스[17]의 컴퓨팅 리소스를 연구한다. 문제는 앞으로 탄소를 더 많이 배출할 것이라서, 이에 대한 전력 소모를 줄이는 AI 기술 개발의 필요성은 커지고 있다.

  • 위의 문제들에 대해 챗GPT는 미세한 조정을 거쳐 모델을 보완하고 있다. '불법 콘텐츠에 대한 요청을 수행하지 마세요'와 같은 기본적인 지침을 내리는 한편, 리뷰어가 주는 피드백은 매주 회의를 통해 보완하기도 한다. 또한 투명성 확보의 일환으로 개인정보 보호를 위반하지 않는 선에서 인구통계학적 정보를 활용할 계획도 갖고 있다.


2.4.2. 10장: 챗GPT와 생성형 AI가 나아갈 길[편집]


  • 기존에 있었던 AI 모델이 챗GPT라는 이름으로 대박이 난 이유는 챗GPT는 누구나 쉽게 이 기술을 사용할 수 있기 때문이다. 그렇기 때문에 사용자가 중심이 되는 서비스가 만들어져야 하는데, 그러기 위해서는 사용자의 '멘탈 모델[18]'을 잘 정의해야 한다.[19] 챗GPT도 이전의 챗봇이 줬던 부정적인 인식을 바꾸면서 크게 성장한 케이스이다.

  • 하지만 여전히 아직은 챗GPT가 완전하지 않고 불안전하다. 이를 위해서는 '실행차 모델'과 '평가차 모델'을 살펴봐야 하는데, 실행차, 즉 실행의 차이는 사용자의 목적과 '실제 시스템의 작동방식' 사이의 괴리라면, 평가의 차이는 사용자의 목적과 '시스템이 생성한 결과'의 괴리를 의미한다. 실행차와 평가차를 줄이기 위해서는, 애초에 정확한 답변을 내놓거나 아니면 해당 답변이 나온 이유를 사용자에게 설명하는 게 중요하다. 또한 이러한 괴리를 잘 관리한다면, 다음으로는 검색에 대한 만족스러운 경험, 이를테면 정확도 점수 등을 제시하는 것도 중요하다.

  • 검색 양상은 사용자의 목적에 따라 크게 4가지 정도로 분류된다. 룩업형 검색은 사용자가 찾고자 하는 목표가 명확한 경우이다. 탐사형 검색은 사용자가 자신이 뭘 원하는지 목표가 불분명한 경우이다. 하이브리드 검색은 사용자가 자신이 뭘 원하는지는 알지만, 더 많은 정보를 필요로 하는 케이스이다. 마지막 생성형 검색은 지금의 챗GPT처럼 이메일을 써달라고 하거나 코드를 작성하기를 원하는 것으로, 챗GPT가 만들어지면서 새롭게 나타난 검색 양상이다. 그리고 이러한 검색 양상에 따라 사용자 인터페이스는 다음과 같은 디자인을 만족해야 한다.
    • 룩업형 검색: 명확한 시각화를 통한 정보 전달
    • 탐사형 검색: 검색을 구체화나는 가이드 제공
    • 하이브리드 검색: 추천과 탐색이 모두 가능한 인터페이스 제공
    • 생성형 검색: 템플릿 등을 통한 사용자 가이드 제공

  • GPT-3.5는 입출력이 텍스트에 제한되어 있었다. 그러나 GPT-4는 '대규모 멀티모달[20] 모델'로 진화되었다. 그러나 대답은 마찬가지로 텍스트로만 제공되고 있기 때문에, 아직 이에 대해 더한 발전가능성이 있다.

  • 2023년은 AI 전쟁의 원년이라고 표현한다. 책에서는 일반적으로 대중이 챗GPT에 대해 가장 궁금해할 질문을 3가지로 꼽으며 이에 대한 답을 내리고 있다.
1. AI 전쟁에서 어떤 기업을 주목해야 하는가?
당분간은 AI 반도체에서는 엔디비아의 독주를 지켜보아야 한다.물론 다른 회사도 곧 치고나오지만 또한 AI 생태계에서는 클라우드 기업이 인프라의 역할을 맞기 때문에 이들도 지켜보아야 한다. 그리고 무엇보다도, 생성형 AI를 활용해서 새로운 혁신 비즈니스 모델을 제공하는 기업이 어디가 될지도 보아야 한다.

2. 생성형 AI는 기존 산업에 어떤 영향을 미칠 것인가?
생성형 AI가 일으킬 변화로는 '생산성', '초개인화', '대중화'로 요약될 수 있다. 그리고 한국의 기업은 언어에서는 영어에 비해 폭이 좁지만, 영상이나 이미지 등의 영역에서는 도전해볼 만하다. 혹은 의료 및 헬스케어에서도 양질의 데이터 확보가 가능하다고 추측된다.

3. 생성형 AI에 대해 개인은 어떤 준비를 해야 하는가?
우선 기술이 어렵다고 관심을 끊지는 말아야 한다. 먼 옛날 전기가 만들어졌을 때도 전기 기술을 잘 알던 사람만이 비즈니스의 기회를 잡은 게 아니다. 인터넷이 준 기회에 무감했다면, 스마트폰이 준 기회에 무감했다면, 이번에는 생성형 AI가 가져다주는 거대한 전환의 기회를 놓치지 않기를 바란다.


  • 끝!

3. 여담[편집]


  • 저자는 김수민, 백선환인데, 책 발매 기준 김수민은 삼성전자 MX 사업부에서 서비스 전략을 담당하고 있으며, 백선환은 아마존 클라우드 사업부 AWS에서 카탈리스트[21] 역할을 담당하고 있다.
파일:크리에이티브 커먼즈 라이선스__CC.png 이 문서의 내용 중 전체 또는 일부는 2023-11-10 17:32:54에 나무위키 챗GPT 거대한 전환 문서에서 가져왔습니다.

[1] 이러한 대화 방식을 멀티턴 이라고 부른다[2] 공교롭게도 지분 전체를 매각할 때 마이크로소프트가 오픈AI에 투자를 하기 시작해, MS와의 파트너십에 반대해 오픈AI를 떠났다는 설도 있다.[3] 삼행시를 챗GPT에게 가르치는 게 화제가 된 적이 있는데, 이런게 대표적인 인컨텍스트 러닝의 사례이다.삼행시 가르치기[4] 말하자면 키워드를 입력하고, 검색 엔진이 제공하는 웹 페이지 리스트를 훑어, 나에게 필요한 정보를 찾기까지의 과정[5] 구인의 장이자 동종 업계의 사람들과 교류하는 비즈니스 중심의 SNS[6] 그림을 예로 들면, Innovator와 Early Adopters을 합친 16%[7] 카카오로 예를 들어보면 (1)카카오는 기존의 문자를 모두 무료로 보낼 수 있고, (2)등록이 간단하며 그룹채팅을 처음으로 내세웠고, (3)처음엔 메신저였지만 카카오뱅크, 카카오게임즈 등 새로운 비즈니스 모델을 만들면서 (1)~(3)을 충족했다.[8] 창업한지 10년 이하인 비상장 스타트업 중에 기업 가치가 10억 달러 이상으로 평가받는 기업[9] 한국의 반도체는 메모리 반도체 영역에서 강하지만, AI 반도체는 시스템 반도체의 일종이다.[10] 책에서는 네이버 검색을 예를 들었다. 구글 검색이 한국에 진출했을 때, 구글은 네이버보다 모든 면에서 앞섰음에도, 네이버는 실시간 검색/지식인 등의 소비자의 니즈를 사로잡아 검색량을 증가시켰다. 이러한 검색의 순환 구조가 검색 시장의 지배력을 강화시켰다고.[11] AI 반도체의 절대 강자로 불리는 엔디비아도 인텔과 AMD에 비해 25년가량 늦게 나왔다.[12] 내가 투자한 돈의 열 배 수익을 돌려줄 수 있는 기업. 유튜브나 인스타그램 등이 여기에 속한다.[13] 이 중 향후에는 의료 및 생명 과학 부문이 가장 높은 성장세를 기록할 것으로 예측했다.[14] 수정하지 않거나 최소한의 수정만을 거쳐 여러 곳에 필수적으로 사용되는 코드[15] AI(인공지능)가 맥락과 관련없거나 사실이 아닌 내용을 마치 옳은 답처럼 내놓는 현상[16] 디지털 플랫폼을 통해 단기 혹은 일회성 일을 맡아 초단기 노동을 제공하는 근로자[17] 초당 1000조(!) 번의 수학 연산을 처리하는 단위[18] 시스템이나 인터페이스가 어떻게 작동할 것인지에 대한 사용자의 기대와 인식[19] 멘탈 모델을 만족시키지 못한 사례로, 책에서는 윈도우 8의 '시작 버튼 삭제'가 언급된다.[20] 여러개의 데이터를 사용하여 주어진 문제를 해결하는 모델을 구축하는 방법론[21] 새롭게 출시된 AWS의 서비스나 해외에서 성공적으로 활용되는 클라우드 서비스를 평가하고 한국에 프로모션하는 역할