2023년 12월 07일·1분 읽기

Gemini 소개: Google의 정교한 다중 모드 AI 모델

구글이 첨단 AI 모델 '제미니(Gemini)'를 출시했다. 이 모델은 텍스트, 코드, 오디오, 이미지, 비디오를 포함한 다양한 형식의 데이터를 이해할 수 있습니다.

Google 인공지능(AI) 분야의 도약을 위해 최신 AI 모델 '제미니(Gemini)'를 선보였다. 이 혁신적인 모델은 기존 모델과 달리 텍스트, 코드, 오디오, 이미지, 비디오 등 이기종 데이터 형식을 처음부터 바로 해석할 수 있습니다.

일반적으로 다중 모드 모델은 다양한 정보 형식에 대해 서로 다른 구성 요소를 별도로 학습한 다음 통합하여 개발됩니다. 그럼에도 불구하고 Gemini는 이러한 표준 관행에서 벗어나 다른 접근 방식을 활용합니다. 이 모델은 처음부터 다양한 데이터 형식으로 학습되었으며 추가 다중 모드 데이터로 미세 조정되었습니다. 이 방법론은 Gemini가 여러 데이터 유형을 이해하고 추론할 수 있도록 하여 현재 다중 모드 모델보다 뛰어난 성능을 발휘합니다. Google 및 Alphabet의 CEO인 Sundar Pichai 와 Google DeepMind의 CEO이자 공동 창업자인 Demis Hassabis Gemini의 강점을 강조하면서 이 모델의 능력이 거의 모든 영역에서 최고와 동등하다고 공유했습니다.

놀랍게도 Gemini는 강력한 추론 능력을 갖추고 있어 복잡한 서면 및 시각적 정보를 인식할 수 있습니다. 덕분에 방대한 데이터 풀에서 찾기 어려운 지식을 추출하는 데 능숙합니다. 이것의 유일한 예는 수십만 개의 문서를 조사하여 많은 분야에서 획기적인 발전을 이루는 귀중한 통찰력을 얻는 능력입니다. 더욱이 Gemini의 다중 모드 측면은 수학과 물리학과 같은 과목의 복잡한 질문을 해독하는 데 특히 효과적입니다.

초기 Gemini 1.0은 Ultra, Pro, Nano의 세 가지 변형으로 제공되며 각각 서로 다른 크기 요구 사항을 충족합니다. Google 에 따르면 Gemini Ultra는 예비 벤치마킹 동안 모델 개발 및 연구에서 일반적으로 사용되는 학술 벤치마크 32개 중 30개를 능가했습니다. 특히 Gemini Ultra는 인간 전문가를 능가한 최초의 모델이기도 합니다. 이는 수학, 물리학부터 역사, 법률, 의학, 윤리에 이르기까지 57개 학문을 포괄하는 MMLU(Massive Multitask Language Understanding)를 사용하여 측정되었습니다.

Gemini Pro는 이제 Bard와 통합되어 출시 이후 가장 실질적인 Bard 업데이트를 나타냅니다. Pixel 8 Pro는 녹음기 앱의 요약 및 Google 키보드의 스마트 답장과 같은 기능을 강화하기 위해 Gemini Nano의 기능을 활용하도록 최적화되었다는 점도 주목할 가치가 있습니다.

앞으로 몇 달에 걸쳐 Gemini는 검색, 광고, Chrome, Duet AI 등 더 많은 Google 제품에 통합될 예정입니다. 12월 13일부터 개발자에게는 Google AI Studio 또는 Google Cloud Vortex AI의 Gemini API를 통해 Gemini Pro에 대한 액세스 권한이 부여됩니다.

이 외에도 Gemini는 Python, Java, C++ 및 Go를 포함하여 널리 사용되는 여러 프로그래밍 언어를 이해할 수 있습니다. Pichai와 Hassabis에 따르면 Gemini의 탄탄한 언어 능력과 복잡한 정보에 대한 추론 능력은 전 세계적으로 코딩을 위한 최고의 기반 모델이 되었습니다.

Google 또한 Gemini를 고용하여 AlphaCode 2로 알려진 고급 코드 생성 시스템을 설계했습니다. 2년 전에 출시된 첫 번째 버전의 업그레이드인 이 시스템은 복잡한 수학과 이론적 컴퓨터 과학과 관련된 경쟁적인 프로그래밍 문제를 해결할 수 있습니다.

일련의 발표에 덧붙여, 최첨단 AI 모델 훈련을 위해 설계된 Cloud TPU v5p라는 새로운 TPU 시스템을 공개함으로써 Gemini 출시를 더욱 보완하게 되었습니다. 이 차세대 TPU는 Gemini의 개발을 가속화하고 개발자와 기업 고객이 대규모 생성 AI 모델을 더 빠르게 훈련하는 데 도움을 줄 것입니다. 이를 통해 더 짧은 시간 내에 새로운 서비스와 기능이 고객에게 제공될 수 있습니다.

Google Gemini를 개발하는 동안 책임 있는 AI 원칙을 준수할 것을 강조했습니다. 사이버 범죄, 설득, 자율성과 같은 잠재적 위험 영역에 대한 연구를 수행했습니다. 폭력이나 부정적인 고정관념이 포함된 콘텐츠를 식별하고, 라벨을 지정하고, 분리하기 위해 안전 분류 기준도 만들어졌습니다.

Gemini의 출시는 AI 진화의 중요한 이정표를 의미하며 Google 의 새로운 시대를 시작합니다. 현재 Gemini의 기능을 향후 버전으로 확장하기 위한 노력, 계획 및 메모리 향상 개선, 더 많은 정보를 처리할 수 있는 컨텍스트 창 증가 등을 통해 향후 더 나은 대응을 약속드립니다.

no-code 및 low-code 영역의 지평이 확장됨에 따라 AppMaster 와 같은 플랫폼을 통해 개발자와 비즈니스 전문가는 확장 가능하고 강력한 애플리케이션을 구축하여 Gemini와 같은 AI 발전을 보완할 수 있습니다. 인상적인 기능 목록을 자랑하는 AppMaster 빠르게 진화하는 앱 개발 환경에서 다재다능하고 비용 효율적인 솔루션으로 돋보입니다.

관련 뉴스