El modelo evolucionado de IA multimodal Gemini Pro de Google se desplegó con fines de desarrollo
Los últimos desarrollos de Google con su modelo de IA multimodal, Gemini Pro, ofrecen a los desarrolladores más herramientas.

Recientemente, el gigante tecnológico Google reveló una serie de actualizaciones innovadoras relacionadas con su modelo de IA multimodal recientemente lanzado, Gemini. Esto se produjo sólo una semana después de presentar esta tecnología de vanguardia que ahora promete impulsar el trabajo creativo de los desarrolladores.
En el momento de su presentación, Google destacó la disponibilidad de Gemini en tres versiones distintas: Ultra, Pro y Nano. Estos se adaptan a diferentes requisitos de tamaño y complejidad. Es de destacar que Gemini Nano ya se incorporó a Android con el Pixel 8 Pro. Además, Google Bard ahora se beneficia de una versión adaptada de Gemini Pro.
Abriendo nuevos caminos, Google ha anunciado que los desarrolladores pueden acceder a la amplia gama de funciones que ofrece Gemini Pro a través de la API de Gemini. Los desarrolladores pueden utilizar llamadas funcionales, incrustaciones, recuperación semántica, base de conocimientos personalizada y funcionalidad de chat.
Los desarrolladores también conocen dos formas principales de trabajar con Gemini Pro: Google AI Studio y Vertex AI en Google Cloud. Considerado como un punto de partida fácil, Google AI Studio ofrece una herramienta de desarrollo basada en web, una cuota gratuita para 60 solicitudes por minuto y plantillas de inicio rápido para facilitar el acceso de los desarrolladores al modelo.
Considerada como una opción más sofisticada, Vertex AI de Google en Google Cloud es una plataforma de aprendizaje automático que permite la personalización completa de Gemini. Equipado con otras funciones prácticas, como control total de datos e integración con otros módulos de Google Cloud, los desarrolladores pueden cumplir con las necesidades de seguridad, privacidad y gobernanza.
Actualmente, el uso de Gemini dentro de Vertex AI es gratuito con la misma tarifa que la cuota gratuita de Google AI Studio. Sin embargo, esta provisión se extiende sólo hasta que alcance la disponibilidad general, proyectada para el año siguiente. Después de lo cual, los cargos serán de $0,00025 por 1000 caracteres y $0,0025 por imagen.
Google profundiza en las capacidades sofisticadas del entorno Vertex AI, incluida la capacidad de mejorar Gemini con datos de la empresa y desarrollar agentes de búsqueda y conversación en un entorno low-code similar a lo que ofrecen plataformas poderosas como AppMaster .
Actualmente, Gemini Pro recibe y genera texto. Pero para los desarrolladores deseosos de experimentar con imágenes, un endpoint dedicado Gemini Pro Vision acepta imágenes junto con texto y genera texto.
Google alimenta aún más la anticipación con un pronóstico de lanzar Gemini Ultra a principios del próximo año. Este es un modelo más grande que apunta a tareas más complejas. Google también está considerando integrar Gemini con las plataformas de desarrollo Chrome y Firebase.
Hoy también se presenta la versión mejorada del modelo de generación de imágenes del gigante tecnológico, Imagen 2. Ahora está abierta para todos los usuarios de Vertex AI incluidos en la lista de permitidos de Google.
Esta versión avanzada de Imagen permite la producción de imágenes estéticamente atractivas, de alta calidad y realistas dirigidas por indicaciones de lenguaje natural. Sus nuevas y fascinantes funciones consisten en representación de texto para crear superposiciones de texto en imágenes, generación de logotipos y preguntas y respuestas visuales para la generación de subtítulos.


