Memperkenalkan Gemini: Model AI Multimodal Canggih Google
Google meluncurkan model AI canggihnya, Gemini. Model ini dapat memahami beragam format data, termasuk teks, kode, audio, gambar, dan video.

Sebagai lompatan maju dalam bidang kecerdasan buatan, Google telah memperkenalkan Gemini, model AI terbarunya. Model inovatif ini, tidak seperti model tradisional, mampu menafsirkan format data yang heterogen—teks, kode, audio, gambar, dan video, sejak awal.
Biasanya, model multimodal dikembangkan dengan melatih komponen berbeda secara terpisah untuk beragam format informasi dan kemudian mengintegrasikannya. Meskipun demikian, berbeda dengan praktik standar ini, Gemini memanfaatkan pendekatan yang berbeda. Model ini dilatih pada berbagai format data sejak awal dan disempurnakan dengan data multimodal tambahan. Metodologi ini memfasilitasi Gemini untuk memahami dan mempertimbangkan berbagai tipe data, mengungguli model multimodal saat ini. Menyoroti kekuatan Gemini, Sundar Pichai, CEO Google dan Alphabet, dan Demis Hassabis, CEO dan salah satu pendiri Google DeepMind, berbagi bahwa kemampuan model ini setara dengan yang terbaik di hampir semua domain.
Hebatnya, Gemini memiliki kecakapan berpikir yang kuat, memungkinkannya memahami informasi tertulis dan visual yang kompleks. Berkat ini, ia mahir dalam mengekstraksi pengetahuan yang sulit ditemukan dari kumpulan data yang luas. Salah satu contohnya adalah kemampuannya menyaring ratusan ribu dokumen untuk mendapatkan wawasan berharga yang menghasilkan terobosan di banyak bidang. Selain itu, aspek multimodal Gemini membuatnya sangat efektif dalam memecahkan pertanyaan kompleks dalam mata pelajaran seperti matematika dan fisika.
Gemini 1.0 awal tersedia dalam tiga varian—Ultra, Pro, dan Nano, masing-masing memenuhi kebutuhan ukuran berbeda. Menurut Google, Gemini Ultra telah mengungguli 30 dari 32 tolok ukur akademis yang umum digunakan dalam pengembangan model dan penelitian selama pembandingan awal. Khususnya, Gemini Ultra juga merupakan model pertama yang mengungguli pakar manusia. Hal ini diukur dengan menggunakan pemahaman bahasa multitugas masif (MMLU), yang mencakup 57 disiplin ilmu mulai dari matematika dan fisika hingga sejarah, hukum, kedokteran, dan etika.
Gemini Pro kini terintegrasi dengan Bard, mewakili pembaruan Bard paling substansial sejak dirilis. Perlu dicatat bahwa Pixel 8 Pro juga telah dioptimalkan untuk memanfaatkan kemampuan Gemini Nano untuk mendukung fitur-fitur seperti Summarize di aplikasi Recorder dan Smart Reply di keyboard Google.
Dalam beberapa bulan mendatang, Gemini diperkirakan akan disertakan dengan lebih banyak produk Google, seperti Penelusuran, Iklan, Chrome, dan Duet AI. Mulai 13 Desember, pengembang akan diberikan akses ke Gemini Pro melalui Gemini API di Google AI Studio atau Google Cloud Vortex AI.
Selain itu, Gemini dapat memahami beberapa bahasa pemrograman umum, termasuk Python, Java, C++, dan Go. Menurut Pichai dan Hassabis, kemahiran bahasa Gemini dan kapasitas penalaran tentang informasi rumit menjadikannya model dasar tingkat atas untuk pengkodean di seluruh dunia.
Google juga mempekerjakan Gemini untuk merancang sistem pembuatan kode tingkat lanjut yang dikenal sebagai AlphaCode 2. Sistem ini, yang merupakan peningkatan dari versi pertama yang dirilis dua tahun lalu, dapat mengatasi masalah pemrograman kompetitif yang melibatkan matematika kompleks dan ilmu komputer teoretis.
Menambah serangkaian pengumuman, peluncuran sistem TPU baru bernama Cloud TPU v5p, yang dirancang untuk melatih model AI canggih, semakin melengkapi peluncuran Gemini. TPU generasi berikutnya ini akan mempercepat pengembangan Gemini dan membantu pengembang dan klien perusahaan dalam melatih model AI generatif skala besar dengan lebih cepat. Hal ini akan memastikan bahwa layanan dan kemampuan baru menjangkau pelanggan dalam jangka waktu yang lebih singkat.
Google menekankan kepatuhannya terhadap Prinsip AI yang Bertanggung Jawab selama pengembangan Gemini. Mereka melakukan penelitian di bidang-bidang yang berpotensi berisiko seperti pelanggaran dunia maya, persuasi, dan otonomi. Pengklasifikasi keamanan juga dibuat untuk mengidentifikasi, memberi label, dan memisahkan konten yang mengandung kekerasan atau stereotip negatif.
Peluncuran Gemini menandakan tonggak penting dalam evolusi AI dan mengawali era baru di Google. Dengan upaya yang sedang dilakukan untuk memperluas fungsionalitas Gemini ke versi masa depan, peningkatan dalam perencanaan dan kemajuan memori, serta meningkatkan jendela konteks untuk memproses lebih banyak informasi, menjanjikan respons yang lebih baik di masa depan.
Seiring dengan berkembangnya cakrawala dunia no-code dan low-code, platform seperti AppMaster memungkinkan pengembang dan profesional bisnis untuk membangun aplikasi yang skalabel dan kuat untuk melengkapi kemajuan AI seperti Gemini. Menggembar-gemborkan daftar fitur yang mengesankan, AppMaster menonjol sebagai solusi serbaguna dan hemat biaya dalam lanskap pengembangan aplikasi yang berkembang pesat.


