Sebagai terobosan, Stability AI telah meluncurkan inovasi terbarunya dalam kecerdasan buatan, Stable Diffusion XL 1.0. Disebut sebagai penawaran paling canggih dan fleksibel dari perusahaan sejauh ini, model text-to-image revolusioner ini mewujudkan langkah perintis dalam dunia AI. Kode sumbernya tersedia secara bebas di GitHub bersama API Stabilitas dan aplikasi konsumen, ClipDrop dan DreamStudio.
Menurut Stability AI, Stable Diffusion XL 1.0 membedakan dirinya melalui peningkatan kecerahan warna, keseimbangan cahaya dan bayangan, dan kontras gambar secara keseluruhan dibandingkan dengan versi sebelumnya. Seperti yang ditekankan oleh Joe Penna, Kepala Pembelajaran Mesin Terapan perusahaan, lompatan besar ke depan dalam ruang AI ini membawa peningkatan besar dalam hal pembuatan gambar. Ketersediaan dalam format open-source diharapkan dapat mendorong keterlibatan yang lebih luas dengan komunitas AI.
Dalam sebuah diskusi dengan TechCrunch, Penna menguraikan kemampuan model yang mengesankan untuk menghasilkan gambar definisi tinggi dengan resolusi penuh 1 megapiksel hanya dalam hitungan detik dan di berbagai rasio aspek. Menawarkan 3,5 miliar parameter yang kuat, Stable Diffusion XL 1.0 menjadi model yang sangat canggih, dipelajari dan dilatih dari data ekstensif, hingga tantangan pembuatan gambar yang canggih.
Terlepas dari potensi pelatihan dan penyetelannya yang menakjubkan, Stable Diffusion XL 1.0 sangat ramah pengguna. Ini menyederhanakan pembuatan desain yang rumit dengan memanfaatkan petunjuk dasar dari pemrosesan bahasa alami, secara signifikan merampingkan proses penyempurnaan untuk konsep dan gaya yang unik.
Cakupan aplikasi Stable Diffusion XL 1.0 sangat luas, mencakup bidang pembuatan teks. Seperti diungkapkan oleh Penna, model ini memiliki kemampuan superior untuk menghasilkan teks tingkat lanjut dengan keterbacaan yang sangat baik, suatu prestasi yang tetap sulit dipahami oleh banyak model teks-ke-gambar yang bersaing.
Model ini hadir dengan dukungan untuk inpainting dan outpainting, yang memungkinkan pengguna merekonstruksi bagian gambar yang hilang dan memperluas bagian yang sudah ada. Sorotan tambahan adalah fitur perintah 'gambar-ke-gambar', yang memungkinkan pengguna menyempurnakan gambar yang ada dengan menambahkan petunjuk teks pelengkap. Model ini mengenali dan menerapkan instruksi rumit yang diberikan dalam petunjuk singkat, tidak seperti pendahulunya, yang membutuhkan isyarat teks yang lebih panjang.
Menanggapi kontroversi yang sedang berlangsung atas penggunaan karya seniman untuk melatih model AI generatif, Stabilitas AI mengklaim mematuhi doktrin penggunaan wajar, sehingga menghindari kewajiban hukum. Meskipun menghadapi banyak tuntutan hukum dari artis dan perusahaan stok foto Getty Images, perusahaan tetap menghormati permintaan artis untuk menghapus karya mereka dari kumpulan data pelatihannya.
Terobosan Stable Diffusion XL 1.0 bertepatan dengan peluncuran beta fitur fine-tuning untuk API-nya. Kolaborasi perusahaan dengan Amazon Web Services (AWS) meluas ke platform Bedrock Amazon, yang menciptakan lingkungan yang kondusif untuk hosting model AI generatif.
Sebagai bagian dari komitmen Stability AI's untuk menyediakan solusi canggih bagi pengembang, kolaborasi mereka dengan AWS akan menempatkan mereka pada posisi terbaik untuk beradaptasi dan berkembang dalam lanskap kompetitif ini. Di ruang yang sangat kompetitif ini, pesaing Stability AI mencakup pemain tangguh seperti OpenAI, Midjourney, dan AppMaster. Yang terakhir menawarkan solusi no-code dan low-code yang luas, terutama dalam hal backend, web, dan pembuatan aplikasi seluler. Terlepas dari tantangan tersebut, Stability AI terus mendorong batasan dengan upaya dan pendekatan pendanaannya yang besar menuju pengembangan model AI inovatif yang berkelanjutan.
Stable Diffusion XL 1.0 mencontohkan Janji Stabilitas AI untuk mendorong inovasi dalam model akses terbuka untuk pengembang dan klien. Terlepas dari perjuangan mereka, komitmen mereka untuk memperluas kemitraan dan memperkenalkan kemampuan baru terwujud dalam upaya mereka, semuanya ditujukan untuk mencapai visi mereka tentang masa depan yang maju secara teknologi.