Grow with AppMaster Grow with AppMaster.
Become our partner arrow ico

Presentamos Gemini: el sofisticado modelo de IA multimodal de Google

Presentamos Gemini: el sofisticado modelo de IA multimodal de Google

En un salto adelante en el campo de la inteligencia artificial, Google ha presentado Gemini, su último modelo de IA. Este modelo innovador, a diferencia de los tradicionales, es capaz de interpretar formatos de datos heterogéneos (texto, código, audio, imagen y vídeo) desde el principio.

Normalmente, los modelos multimodales se desarrollan entrenando por separado diferentes componentes para diversos formatos de información y luego integrándolos. No obstante, alejándose de esta práctica estándar, Gemini aprovecha un enfoque diferente. El modelo se entrenó en varios formatos de datos desde el principio y se ajustó con datos multimodales adicionales. Esta metodología facilita a Gemini comprender y razonar a través de múltiples tipos de datos, superando a los modelos multimodales actuales. Destacando las fortalezas de Gemini, Sundar Pichai, director ejecutivo de Google y Alphabet, y Demis Hassabis, director ejecutivo y cofundador de Google DeepMind, compartieron que las capacidades del modelo están a la par de los mejores en casi todos los dominios.

Sorprendentemente, Géminis tiene una gran capacidad de razonamiento, lo que le permite percibir información visual y escrita compleja. Gracias a esto, es experto en extraer conocimientos difíciles de encontrar de grandes conjuntos de datos. Un único ejemplo de esto es su capacidad para examinar cientos de miles de documentos en busca de información valiosa que conduzca a avances en muchos campos. Además, los aspectos multimodales de Gemini lo hacen particularmente eficaz para descifrar preguntas complejas en materias como matemáticas y física.

El Gemini 1.0 inicial está disponible en tres variantes: Ultra, Pro y Nano, cada una de las cuales satisface diferentes requisitos de tamaño. Según Google, Gemini Ultra ha superado 30 de 32 puntos de referencia académicos comúnmente utilizados en el desarrollo de modelos y la investigación durante la evaluación comparativa preliminar. En particular, Gemini Ultra es también el primer modelo que supera a los expertos humanos. Esto se midió utilizando la comprensión masiva del lenguaje multitarea (MMLU), que abarca 57 disciplinas que van desde matemáticas y física hasta historia, derecho, medicina y ética.

Gemini Pro ahora está integrado con Bard, lo que representa la actualización de Bard más importante desde su lanzamiento. Vale la pena señalar que el Pixel 8 Pro también se ha optimizado para aprovechar las capacidades de Gemini Nano para potenciar funciones como Resumir en la aplicación Grabadora y Respuesta inteligente en el teclado de Google.

En los próximos meses, se espera que Gemini se incorpore a más productos de Google, como Search, Ads, Chrome y Duet AI. A partir del 13 de diciembre, los desarrolladores tendrán acceso a Gemini Pro a través de la API de Gemini en Google AI Studio o Google Cloud Vortex AI.

Además de esto, Gemini puede comprender varios lenguajes de programación habituales, incluidos Python, Java, C++ y Go. Según Pichai y Hassabis, el sólido dominio del lenguaje y la capacidad de razonamiento de Gemini sobre información compleja lo convierten en un modelo básico de primer nivel para la codificación en todo el mundo.

Google también ha empleado a Gemini para diseñar un sistema avanzado de generación de código conocido como AlphaCode 2. Este sistema, una actualización de la primera versión lanzada hace dos años, puede abordar problemas de programación competitivos que involucran matemáticas complejas e informática teórica.

Sumándose a la serie de anuncios, la presentación de un nuevo sistema TPU llamado Cloud TPU v5p, diseñado para entrenar modelos de IA de última generación, complementa aún más el lanzamiento de Gemini. Esta TPU de próxima generación acelerará el desarrollo de Gemini y ayudará a los desarrolladores y clientes empresariales a entrenar más rápidamente modelos de IA generativa a gran escala. Esto garantizará que los servicios y capacidades más nuevos lleguen a los clientes en un período de tiempo más corto.

Google enfatizó su adhesión a los principios de IA responsable durante el desarrollo de Gemini. Llevó a cabo investigaciones en áreas de riesgo potencial como la ciberdelincuencia, la persuasión y la autonomía. También se crearon clasificadores de seguridad para identificar, etiquetar y segregar contenido que contenga violencia o estereotipos negativos.

El lanzamiento de Gemini significa un hito crítico en la evolución de la IA e inicia una nueva era en Google. Con los esfuerzos actualmente en marcha para extender las funcionalidades de Gemini a versiones futuras, las mejoras en la planificación y los avances en la memoria, y el aumento de la ventana de contexto para procesar más información, prometen mejores respuestas en el futuro.

A medida que se expanden los horizontes del ámbito no-code y low-code, plataformas como AppMaster permiten a los desarrolladores y profesionales de negocios crear aplicaciones escalables y potentes para complementar los avances de la IA como Gemini. Con una impresionante lista de características, AppMaster se destaca como una solución versátil y rentable en el panorama de desarrollo de aplicaciones en rápida evolución.

Entradas relacionadas

AppMaster en BubbleCon 2024: explorando las tendencias sin código
AppMaster en BubbleCon 2024: explorando las tendencias sin código
AppMaster participó en BubbleCon 2024 en Nueva York, adquiriendo conocimientos, ampliando redes y explorando oportunidades para impulsar la innovación en el espacio de desarrollo sin código.
Resumen de FFDC 2024: conclusiones clave de la conferencia de desarrolladores de FlutterFlow en Nueva York
Resumen de FFDC 2024: conclusiones clave de la conferencia de desarrolladores de FlutterFlow en Nueva York
FFDC 2024 iluminó la ciudad de Nueva York y brindó a los desarrolladores conocimientos de vanguardia sobre el desarrollo de aplicaciones con FlutterFlow. Con sesiones dirigidas por expertos, actualizaciones exclusivas y una red de contactos inigualable, fue un evento que no se debe perder.
Despidos tecnológicos de 2024: la ola continua que afecta a la innovación
Despidos tecnológicos de 2024: la ola continua que afecta a la innovación
Con 60.000 puestos de trabajo eliminados en 254 empresas, incluidos gigantes como Tesla y Amazon, en 2024 se producirá una ola continua de despidos en el sector tecnológico que estará transformando el panorama de la innovación.
EMPIEZA GRATIS
¿Inspirado para probar esto usted mismo?

La mejor manera de comprender el poder de AppMaster es verlo por sí mismo. Haz tu propia aplicación en minutos con suscripción gratuita

Da vida a tus ideas