Gemini(인공지능 모델)

덤프버전 :


파일:다른 뜻 아이콘.svg
은(는) 여기로 연결됩니다.
구글에서 개발한 인공지능 검색 엔진 서비스에 대한 내용은 Gemini(앱) 문서
Gemini(앱)번 문단을
Gemini(앱)# 부분을
, {{{#!html }}}에 대한 내용은 문서
#s-번 문단을
#s-번 문단을
# 부분을
# 부분을
, {{{#!html }}}에 대한 내용은 문서
#s-번 문단을
#s-번 문단을
# 부분을
# 부분을
, {{{#!html }}}에 대한 내용은 문서
#s-번 문단을
#s-번 문단을
# 부분을
# 부분을
, {{{#!html }}}에 대한 내용은 문서
#s-번 문단을
#s-번 문단을
# 부분을
# 부분을
, {{{#!html }}}에 대한 내용은 문서
#s-번 문단을
#s-번 문단을
# 부분을
# 부분을
, {{{#!html }}}에 대한 내용은 문서
#s-번 문단을
#s-번 문단을
# 부분을
# 부분을
, {{{#!html }}}에 대한 내용은 문서
#s-번 문단을
#s-번 문단을
# 부분을
# 부분을
, {{{#!html }}}에 대한 내용은 문서
#s-번 문단을
#s-번 문단을
# 부분을
# 부분을
, {{{#!html }}}에 대한 내용은 문서
#s-번 문단을
#s-번 문단을
# 부분을
# 부분을
참고하십시오.




생성형 인공지능

[ 펼치기 · 접기 ]
텍스트
[[소설|

소설
]] NovelAI
대화형
[[챗봇|

챗봇
]] ChatGPT · Microsoft Copilot · LLaMA · 바드(인공지능) · CLOVA X · Cue: · Inflection AI
[[거대 자연어 모델|

거대 자연어 모델
]] GPT-1 · GPT-2 · GPT-3 · GPT-4 · GPT-5 · Gemini
그림/영상
[[그림|

그림
]] Midjourney · DALL·E · Artbreeder · NovelAI/이미지 제네레이터 · Stable Diffusion · Gaugan2
[[영상|

영상
]] Stable Video · AI 스튜디오 페르소
오디오/소리
[[음성|

음성
]] A.I.VOICE DeepVocal




Gemini
Generalized Multimodal Intelligence Network
파일:geminiLogo.png파일:geminiLogoDark.png
개발사
구글 딥마인드
출시일
2023년 12월 6일
기능
생성형 인공지능 모델 [1]
하드웨어
TPU v4, v5e
지원 언어
영어, 한국어 등 40개 언어
사용처
Gemini[2][3], Google Pixel 8 Pro[N],
갤럭시 S24[N]
라이선스
Proprietary SW
링크
파일:홈페이지 아이콘.svg

1. 개요
2. 역사
3. 특징
4. 공개 후 평가
4.1. 긍정적 평가
4.2. 부정적 평가
5. 논란
5.1. 시연 영상 조작 논란
6. 탑재 기기
7. 관련 문서




1. 개요[편집]


파일:GeminiIntro.png
[1] GPT와 같은 텍스트 기반의 언어 모델과는 달리 처음부터 멀티모달로 개발되었다.[2] Bard가 Gemini로 리브랜딩 되었다.[3] 앞으로 더 다양한 구글 플랫폼이 적용될 예정이다.[N] A B 나노 모델

Gemini(Generalized Multimodal Intelligence Network, 이하 제미나이)는 구글딥마인드가 개발한 멀티모달 생성형 인공지능 모델이다. 텍스트뿐만 아니라 오디오, 이미지, 비디오와 같은 다양한 입출력을 지원할 것으로 보인다. 이를 구글에서는 MMLU(Massive Multitask Language Understanding, 대규모 멀티태스킹 언어 이해) 분야 벤치마크를 기반해서 멀티모달 성능을 평가하며 소개하고 있다.


2. 역사[편집]


2023년 5월 10일, Google I/O 2023에서 처음 공개되었다.

2023년 9월경, 일부 기업을 상대로 테스트가 시작되었다.

파일:gemini3combo.png

2023년 12월 6일 울트라, 프로, 나노로 구성된 세 가지 제미나이 모델을 전격 공개했다. 울트라는 유료 모델로 예상되는 바드 어드밴스드로 2024년 적용될 예정이며 프로의 경우 바드에 바로 적용되었다. 사이즈가 작은 나노의 경우 픽셀 등에 탑재되는 온디바이스 전용 모델이다.

2023년 12월 13일부터 Google AI Studio나 Google Cloud Vertex AI를 통해 다른 애플리케이션에서 모델 구동이 가능해진다.

2024년 1월 18일 공개된 갤럭시 S24 시리즈에 일부 기능이 탑재되었다. 나노형 모델이 온디바이스로 내장되었다.

3. 특징[편집]


  • Gemini Ultra의 경우 모델에 사용된 매개변수는 GPT-4(5,000억~1조개)를 뛰어넘는 것으로 알려졌지만, 아직까지 자세한 수치는 밝혀지지 않았다.

파일:geminiGraph.png

  • 구글에 따르면 최상위 모델인 Gemini Ultra가 대규모 다중작업 언어 이해(MMLU)에서 90%의 정답률을 기록했다. 이는 OpenAIGPT-4 86.4%는 물론 인간 전문가 점수인 89.8%를 넘는 수준이다.최초로 인간을 뛰어넘은 AI가 나왔다고 이야기.# [4]

파일:gemini_exs1.png
[4] 다만 일각에서는 이 측정 결과가 과장되었을 가능성이 있다고 주장하고 있다. 하정우 네이버클라우드 AI이노베이션 센터장은 "구글이 공개한 제미나이 MMLU 성능에서 GPT-4는 5-샷(문제 해결 예시 5개를 모델에 제시하고 문제를 푸는 방식)을 기준으로 한 반면 제미나이는 연쇄적 사고(CoT)로 (문제 풀이를 32번 반복하는) 'CoT@32'를 진행했기 때문에 공정한 비교가 아니다"라면서 제미나이 프로 버젼은 GPT-3.5나 GPT-4 사이 수준으로 보인다고 말했다.

  • 여러가지 입출력 형식의 인공지능 모델들을 각각 따로 만들어 합치는 다른 멀티모달 생성형 AI들과 달리 바닥부터 멀티모달로 만들어졌다. 따라서 멀티모달 쪽에서 특히 우수한 성능을 보인다.

  • Google은 Gemini의 학습에 유튜브의 데이터를 이용한다는 이야기가 있다. 이처럼 Google은 자사의 플랫폼 덕분에 모델 학습을 위한 수많은 데이터에 손쉽게 접근할 수 있다.[5]


4. 공개 후 평가[편집]



4.1. 긍정적 평가[편집]



4.2. 부정적 평가[편집]


  • Gemini Pro가 탑재된 AI 챗봇 바드는 질문에 정확한 답을 하지 못하거나 논란이 되는 주제에 대해 답을 회피한다는 지적이 나왔다. 비즈니스 인사이더에 따르면 Gemini Pro가 탑재된 바드는 올해 오스카 시상식에서 누가 남우주연상을 받았는지 묻자 버벅거리고, 논란이 되는 주제에 대해선 답변을 피했다. 이스라엘과 팔레스타인 무장정파 하마스의 전쟁을 업데이트 해달라고 하자 "최신 정보를 얻으려면 구글 검색을 사용해 보라"며 답을 피했다. #

  • 뉴스 요약에도 약점이 있었다. 이스라엘 전쟁에 대한 업데이트 요약을 요청하자, 제미니 프로는 잠재적으로 논란이 될 수 있는 뉴스 주제에 대한 의견을 피하고 대신 사용자들에게 직접 구글에서 찾아보라고 말하기도 했다. 우크라이나 전쟁의 경우 요약된 정보를 제공하는 경우도 있었지만, 한달 이상 오래된 정보를 제공했다. #

  • 또한 영어 이외의 언어에 대한 이해도도 낮다는 의견이 나오고 있는 상황이다. SF 작가인 찰리 스트로스는 프랑스어로 여섯글자 단어를 표현해 달라고 요청하자, 다섯글자로 된 ‘amour’를 출력했다. 이어 같은 요청을 반복해도 일곱글자 단어를 내놓았다. #

  • 구글은 특히 Gemini의 향상된 코딩 능력을 강조했다. 그러나 실제로는 파이썬의 기본적인 코딩 기능에도 어려움을 겪는 것으로 나타났다. 두 다각형의 교차 부분을 계산하는 파이썬 함수를 작성하지 못했다. 이 함수는 상대적으로 간단하지만, 파이썬에는 아직 라이브러리로 제공되지 않고 스택 오버플로우 게시물에도 없는 희귀한 함수 중 하나다. 반면 챗GPT는 첫 시도에서 버그 없는 코드를 작성했다. #

  • '탈옥'[6] 시도에 쉽게 영향을 받는다. 모델 감사 도구를 서비스하는 스타트업 로버스트 인텔리전스는 가드레일이 무너질 때까지 프롬프트의 컨텍스트를 알고리즘적으로 변경하는 방법을 사용, Gemini Pro에게 자선 단체에서 돈을 훔치는 방법과 고위 인사를 암살하는 방법을 제안하도록 유도했다. 결국 거부하지 못하고 구체적인 답변을 제시했다. #


5. 논란[편집]



5.1. 시연 영상 조작 논란[편집]



[5] Google Search, Google Books, Google Scholar 등.[6] AI에 걸려있는 규제를 풀고 할 수 없는 말들을 하게 하는 것

  • 6분짜리 데모 영상에서 매우 빠른 실시간 응답이 보여진 반면, 실제로는 빨리감기, 스틸샷 등을 통해 성능이 과장되었던 것으로 드러났다.# 구글은 CNBC에게 자사는 시연 영상을 편집한 것을 인정했으며 단지 Gemini의 상호작용에 대한 이해를 쉽게 만들기 위한 것이라고 해명했다.

6. 탑재 기기[편집]




7. 관련 문서[편집]


파일:크리에이티브 커먼즈 라이선스__CC.png 이 문서의 내용 중 전체 또는 일부는 2024-02-12 02:55:49에 나무위키 Gemini(인공지능 모델) 문서에서 가져왔습니다.