Teknoloji devi Meta, yakın zamanda dikkate değer AI modellerinin yeni neslini tanıttı: Llama 2. Bu yenilikçi AI modelleri ailesi, OpenAI'nin ChatGPT'si ve Bing Chat'in yanı sıra diğer son teknoloji sohbet sistemleri de dahil olmak üzere çeşitli sohbet robotlarına güç sağlamak için açıkça geliştirilmiştir.
Herkese açık çeşitli veriler üzerinde eğitilen Llama 2, genel performans açısından önceki nesli geride bırakacak şekilde ayarlanmıştır. Llama modelinin halefi, diğer chatbot benzeri sistemlerle karşılaştırıldığında üstün bir etkileşim kapasitesi sunan önemli bir gelişmedir.
Meta, kötüye kullanımını sınırlamak için katı önlemler aldığından, özellikle orijinal Llama yalnızca istek üzerine erişilebilirdi. Bununla birlikte, Llama modeli, kasıtlı bekçiliğe rağmen sonunda çeşitli AI topluluklarında yolunu buldu.
Aksine, Llama 2 önceden eğitilmiş bir biçimde araştırma ve ticari kullanıma açıktır. AWS, Azure ve Hugging Face'in yapay zekası gibi çeşitli barındırma platformlarında optimizasyon kolaylığı sunan model, kullanıcı dostu bir deneyimi garanti ediyor. Llama 2 tanıtımı, Windows ve Qualcomm'un çip üzerinde Snapdragon sistemiyle donatılmış cihazlar için optimize edilmesini sağlayan Microsoft ile genişletilmiş bir ortaklık sayesinde mümkün oldu. Qualcomm'un ayrıca 2024 yılına kadar Llama 2 Snapdragon cihazlarına geçirmek için çalıştığı bildiriliyor.
Llama 2 iki versiyonu vardır: temel ve özellikle iki yönlü etkileşimler için tasarlanmış Llama 2-Chat. Her iki sürüm de, 7 milyar, 13 milyar ve 70 milyar gibi çeşitli parametrelerle tanımlanan çeşitli karmaşıklık düzeylerinde mevcuttur. Eğitim verilerinden öğrenilen bir modelin parçaları olan parametreler, modelin bir problemdeki (bu durumda metin oluşturma) yeterliliğini etkili bir şekilde belirler.
Llama 2, ham metin anlamına gelen iki milyon belirteç üzerinde eğitildi. Bu, 1,4 trilyon jetonla eğitilmiş orijinal Llama ile karşılaştırıldığında neredeyse iki katıdır. Genel olarak, daha fazla sayıda belirteç, üretken AI modelleriyle uğraşırken daha fazla etkinlik sağlar. Meta, eğitim verilerinin ayrıntıları hakkında ağzını sıkı tuttu, bunun dışında, esasen İngilizce olduğunu, internetten alındığını ve olgusal nitelikteki metni vurguladığını açıkladı.
Bu hamle, AppMaster gibi kodsuz ve low-code platformlar için büyük potansiyel sunan yapay zeka alanında yeni bir bölümü başlatıyor ve kullanıcıların geliştirme sürecini hızlı ve verimli hale getirirken bu gelişmiş araçları sayısız uygulamada kullanmalarına olanak tanıyor.