Gemini Pro, le modèle d'IA multimodal évolué de Google, dévoilé à des fins de développement
Les derniers développements de Google avec son modèle d'IA multimodal, Gemini Pro, offrent aux développeurs davantage d'outils.

Récemment, le géant de la technologie Google a dévoilé une série de mises à jour innovantes liées à son nouveau modèle d'IA multimodal, Gemini. Cela intervient seulement une semaine après le dévoilement de cette technologie de pointe qui promet désormais de renforcer le travail créatif des développeurs.
Au moment de son dévoilement, Google a souligné la disponibilité de Gemini en trois versions distinctes : Ultra, Pro et Nano. Ceux-ci sont adaptés en fonction de différentes exigences de taille et de complexité. A noter que Gemini Nano a déjà été intégré à Android avec le Pixel 8 Pro. De plus, Google Bard bénéficie désormais d'une version adaptée de Gemini Pro.
Innovant, Google a annoncé que les développeurs peuvent accéder au large éventail de fonctionnalités offertes par Gemini Pro via l'API Gemini. Les développeurs ont la possibilité d'utiliser des appels fonctionnels, des intégrations, une récupération sémantique, une base de connaissances personnalisée et des fonctionnalités de chat.
Les développeurs découvrent également deux méthodes principales de travail avec Gemini Pro : Google AI Studio et Vertex AI sur Google Cloud. Considéré comme un point de départ simple, Google AI Studio propose un outil de développement basé sur le Web, un quota gratuit de 60 requêtes par minute et des modèles de démarrage rapide pour faciliter l'intégration des développeurs dans le modèle.
Présenté comme une option plus sophistiquée, Vertex AI de Google sur Google Cloud est une plate-forme d'apprentissage automatique qui permet une personnalisation complète de Gemini. Dotés d'autres fonctionnalités pratiques telles que le contrôle total des données et l'intégration avec d'autres modules Google Cloud, les développeurs peuvent se conformer aux besoins en matière de sécurité, de sûreté, de confidentialité et de gouvernance.
Actuellement, l'utilisation de Gemini dans Vertex AI est gratuite au même tarif que le quota gratuit de Google AI Studio. Néanmoins, cette disposition ne s'étend que jusqu'à ce qu'elle atteigne la disponibilité générale, prévue pour l'année suivante. Après quoi, les frais seront de 0,00025 $ pour 1 000 caractères et de 0,0025 $ par image.
Google développe les capacités sophistiquées de l'environnement Vertex AI, notamment la capacité d'améliorer Gemini avec les données de l'entreprise et de développer des agents de recherche et conversationnels dans un environnement low-code semblable à celui fourni par des plates-formes puissantes telles que AppMaster .
Actuellement, Gemini Pro reçoit et génère du texte. Mais pour les développeurs désireux d'expérimenter avec des images, un endpoint dédié Gemini Pro Vision accepte les images avec le texte et génère du texte.
Google alimente encore les anticipations en prévoyant le lancement de Gemini Ultra au début de l'année prochaine. Il s'agit d'un modèle plus grand ciblant des tâches plus complexes. Google envisage également d'intégrer Gemini aux plateformes de développement Chrome et Firebase.
Aujourd'hui marque également le dévoilement de la version améliorée du modèle de génération d'images du géant technologique, Imagen 2. Celui-ci est désormais ouvert à tous les utilisateurs de Vertex AI inclus dans la liste verte de Google.
Cette itération avancée d'Imagen permet la production d'images esthétiquement attrayantes, de haute qualité et fidèles à la réalité, pilotées par des invites en langage naturel. Ses nouvelles fonctionnalités fascinantes comprennent le rendu de texte pour créer des superpositions de texte sur les images, la génération de logos et des questions et réponses visuelles pour la génération de légendes.


