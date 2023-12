In een sprong voorwaarts op het gebied van kunstmatige intelligentie heeft Google Gemini geïntroduceerd, het nieuwste AI-model. Dit innovatieve model is, in tegenstelling tot traditionele modellen, in staat heterogene dataformaten – tekst, code, audio, beeld en video – vanaf het begin te interpreteren.

Meestal worden multimodale modellen ontwikkeld door verschillende componenten afzonderlijk te trainen voor diverse informatieformaten en deze vervolgens te integreren. Niettemin hanteert Gemini, in afwijking van deze standaardpraktijk, een andere aanpak. Het model trainde vanaf het begin op verschillende dataformaten en werd verfijnd met aanvullende multimodale data. Deze methodologie stelt Gemini in staat om meerdere datatypen te begrijpen en te redeneren, en presteert beter dan de huidige multimodale modellen. Sundar Pichai, CEO van Google en Alphabet, en Demis Hassabis, CEO en mede-oprichter van Google DeepMind, benadrukten de sterke punten van Gemini en deelden dat de capaciteiten van het model op bijna elk gebied vergelijkbaar zijn met de beste.

Opmerkelijk genoeg beschikt Gemini over een robuust redeneervermogen, waardoor hij complexe schriftelijke en visuele informatie kan waarnemen. Hierdoor is het bedreven in het extraheren van moeilijk te vinden kennis uit enorme hoeveelheden gegevens. Een eenzaam voorbeeld hiervan is het vermogen om honderdduizenden documenten te doorzoeken op zoek naar waardevolle inzichten die tot doorbraken op veel terreinen kunnen leiden. Bovendien maken de multimodale aspecten van Gemini het bijzonder effectief bij het ontcijferen van complexe vragen in onderwerpen als wiskunde en natuurkunde.

De initiële Gemini 1.0 is verkrijgbaar in drie varianten: Ultra, Pro en Nano, die elk aan verschillende maatvereisten voldoen. Volgens Google heeft Gemini Ultra tijdens voorlopige benchmarks beter gepresteerd dan 30 van de 32 veelgebruikte academische benchmarks op het gebied van modelontwikkeling en onderzoek. Opvallend is dat Gemini Ultra ook het allereerste model is dat menselijke experts overtreft. Dit werd gemeten met behulp van massaal multitask taalbegrip (MMLU), dat 57 disciplines omvat, variërend van wiskunde en natuurkunde tot geschiedenis, rechten, geneeskunde en ethiek.

Gemini Pro is nu geïntegreerd met Bard, wat de meest substantiële Bard-update sinds de release vertegenwoordigt. Het is vermeldenswaard dat de Pixel 8 Pro ook is geoptimaliseerd om de mogelijkheden van Gemini Nano te benutten voor functies zoals Samenvatten in de Recorder-app en Smart Reply op het toetsenbord van Google.

De komende maanden zal Gemini naar verwachting worden opgenomen in meer Google-producten, zoals Zoeken, Advertenties, Chrome en Duet AI. Vanaf 13 december krijgen ontwikkelaars toegang tot Gemini Pro via de Gemini API in Google AI Studio of Google Cloud Vortex AI.

Daarnaast kan Gemini verschillende gangbare programmeertalen begrijpen, waaronder Python, Java, C++ en Go. Volgens Pichai en Hassabis maken Gemini's goede taalvaardigheid en redeneervermogen over ingewikkelde informatie het tot een topmodel voor coderen wereldwijd.

Google heeft Gemini ook ingeschakeld om een ​​geavanceerd codegeneratiesysteem te ontwerpen dat bekend staat als AlphaCode 2. Dit systeem, een upgrade van de eerste versie die twee jaar geleden werd uitgebracht, kan concurrerende programmeerproblemen aanpakken die gepaard gaan met complexe wiskundige en theoretische informatica.

Als aanvulling op de reeks aankondigingen vormt de onthulling van een nieuw TPU-systeem genaamd Cloud TPU v5p, ontworpen voor het trainen van ultramoderne AI-modellen, een verdere aanvulling op de lancering van Gemini. Deze volgende generatie TPU zal de ontwikkeling van Gemini versnellen en ontwikkelaars en zakelijke klanten helpen bij het sneller trainen van grootschalige generatieve AI-modellen. Dit zal ervoor zorgen dat nieuwere diensten en mogelijkheden klanten in een korter tijdsbestek bereiken.

Google benadrukte tijdens de ontwikkeling van Gemini dat het zich houdt aan de principes van verantwoorde AI. Het voerde onderzoek uit op potentiële risicogebieden zoals cybercriminaliteit, overtuigingskracht en autonomie. Er zijn ook veiligheidsclassificatoren ontwikkeld om inhoud die geweld of negatieve stereotypen bevat, te identificeren, labelen en scheiden.

De lancering van Gemini betekent een cruciale mijlpaal in de evolutie van AI en luidt een nieuw tijdperk in bij Google. Met de inspanningen die momenteel worden geleverd om de functionaliteit van Gemini uit te breiden naar toekomstige versies, beloven verbeteringen in planning en geheugenverbeteringen, en het vergroten van het contextvenster voor het verwerken van meer informatie, betere reacties in de toekomst.

