최근 거대 기술 기업인 Google 새로 출시된 다중 모드 AI 모델인 Gemini와 관련된 일련의 혁신적인 업데이트를 발표했습니다. 이는 이제 개발자의 창의적인 작업을 강화할 것을 약속하는 이 최첨단 기술을 공개한 지 불과 일주일 만에 나온 것입니다.
공개 당시 Google은 Ultra, Pro 및 Nano의 세 가지 버전으로 Gemini를 사용할 수 있음을 강조했습니다. 이는 다양한 크기와 복잡성 요구 사항에 따라 맞춤화됩니다. 참고로 Gemini Nano는 이미 Pixel 8 Pro를 통해 Android에 통합되었습니다. 또한 Google Bard는 이제 Gemini Pro의 개조된 버전의 이점을 누리고 있습니다.
새로운 지평을 연 Google 이제 개발자가 Gemini API를 통해 Gemini Pro가 제공하는 다양한 기능에 액세스할 수 있다고 발표했습니다. 개발자는 기능적 호출, 임베딩, 의미 검색, 사용자 정의 지식 기반 및 채팅 기능을 사용할 수 있습니다.
또한 개발자는 Gemini Pro로 작업하는 두 가지 주요 방법인 Google AI Studio와 Google Cloud의 Vertex AI를 소개합니다. 쉬운 시작점으로 간주되는 Google AI Studio는 웹 기반 개발 도구, 분당 60개 요청에 대한 무료 할당량, 개발자가 모델에 쉽게 참여할 수 있도록 빠른 시작 템플릿을 제공합니다.
보다 정교한 옵션으로 알려진 Google Cloud의 Google Vertex AI는 Gemini의 전체 맞춤설정을 허용하는 머신러닝 플랫폼입니다. 완전한 데이터 제어 및 다른 Google Cloud 모듈과의 통합과 같은 기타 실용적인 기능이 탑재되어 있어 개발자는 보안, 안전, 개인정보 보호, 거버넌스 요구사항을 준수할 수 있습니다.
현재 Vertex AI 내에서 Gemini를 사용하는 것은 Google AI Studio의 무료 할당량과 동일한 요금으로 무료입니다. 그럼에도 불구하고 이 조항은 다음 해에 일반에 공개될 때까지만 연장됩니다. 그 이후에는 1,000자당 $0.00025, 이미지당 $0.0025의 요금이 부과됩니다.
Google은 회사 데이터로 Gemini를 향상시키고 AppMaster 와 같은 강력한 플랫폼이 제공하는 것과 유사한 low-code 환경에서 검색 및 대화 에이전트를 개발하는 기능을 포함하여 Vertex AI 환경의 정교한 기능에 대해 자세히 설명합니다.
현재 Gemini Pro는 텍스트를 수신하고 출력합니다. 그러나 이미지 실험을 열망하는 개발자를 위해 전용 Gemini Pro Vision endpoint 텍스트와 함께 이미지를 받아들이고 텍스트를 출력합니다.
Google은 내년 초 Gemini Ultra를 출시할 것이라는 예측으로 기대감을 더욱 증폭시킵니다. 이는 더 복잡한 작업을 목표로 하는 더 큰 모델입니다. Google은 또한 Gemini를 Chrome 및 Firebase 개발자 플랫폼과 통합하는 것을 고려하고 있습니다.
오늘은 거대 기술 기업의 이미지 생성 모델인 Imagen 2의 업그레이드 버전도 공개되는 날입니다. 이제 Google의 허용 목록에 포함된 모든 Vertex AI 사용자에게 이 버전이 공개됩니다.
Imagen의 이러한 고급 반복을 통해 자연어 프롬프트에 따라 조정되는 심미적으로 매력적이고 고품질이며 실제와 같은 이미지를 생성할 수 있습니다. 이 매력적인 새로운 기능은 이미지에 텍스트 오버레이를 생성하는 텍스트 렌더링, 로고 생성, 캡션 생성을 위한 시각적 질문 및 답변으로 구성됩니다.