Metin oluşturma, dil yorumlama ve ses oluşturma için tasarlanmış yapay zeka algoritmalarının piyasaya sürülmesinin ardından Meta, Code Llama adlı başka bir önemli modeli artık açık kaynaklı hale getirdi. Son teknoloji ürünü bir makine öğrenimi sistemi olan Code Llama, basit İngilizce kod üretme ve detaylandırma konusunda yetkindir.
Meta'nın bu yeni geliştirmesi, GitHub Copilot, Amazon CodeWhisperer gibi yapay zeka destekli kod oluşturma çözümleri ve StarCoder, StableCode ve PolyCoder gibi önde gelen açık kaynak araçlarıyla uyumludur. Code Llama, aralarında Python, C++, Java, PHP, Typescript, C# ve Bash'in de bulunduğu çeşitli programlama dillerinde mevcut kodları sonlandırma ve sorunlarını giderme becerisine sahiptir.
Meta açık bir yaklaşımdan yararlanarak yapay zeka modelleri ve özellikle kodlamaya özgü büyük dil modelleri ile yenilikçiliğe ve güvenliğe olan bağlılığını ortaya koyuyor. Şirket, Code Llama'yı ücretsiz olarak kullanılabilir hale getirerek teknolojik gelişmeleri zenginleştirmeyi, insanların yaşamlarını iyileştirmeyi ve yetenekleri değerlendirme, sorunları tanıma ve güvenlik açıklarını giderme konusunda topluluk katılımını teşvik etmeyi amaçlıyor.
Birden fazla çeşidi bulunan Code Llama, Python için optimize edilmiş versiyonları ve talimatları kavramak için ince ayarlı versiyonları içerir (örneğin, "Fibonacci dizisini oluşturan bir fonksiyon oluşturun"). Code Llama'nın temeli, Meta'nın daha önce açık kaynaklı olan metin oluşturma modeli olan Llama 2'dir. Llama 2 kod üretme yeteneğine sahip olmasına rağmen, Copilot gibi özel modellerle karşılaştırıldığında kalite genellikle eksikti ve sönüktü.
Code Llama'ya yönelik eğitim aşamasında Meta, Llama 2 için geçerli olan ve internetteki genel portallardan seçici olarak alınan aynı veri kümesini kullandı; ancak eğitim verilerinin kodlarla ilgili alanına öncelik verilerek Kod Lama'nın kod ile doğal dil arasındaki ilişkiyi daha yakından öğrenmesine olanak tanındı.
Boyutları 7 milyardan 34 milyar parametreye kadar değişen Code Llama modelleri, 500 milyar token kod ve ilgili verilerle eğitim üstlendi. Python'a özgü Code Lama, ek 100 milyar Python Kodu belirteci ile titizlikle kalibre edilirken, talimatları anlayan sürüm, sorgulara "yararlı" ve "güvenli" yanıtlar formüle etmek için insan açıklamalı geri bildirimlerine dayalı olarak ince ayarlara tabi tutuldu.
Code Llama modellerinin birçoğu, kodu mevcut koda entegre etme yeteneğine sahiptir ve girdi olarak 100.000 token'a kadar kod kabul edebilir. Meta, 34 milyar parametreli modelin işlevsellik açısından diğer tüm açık kaynak kod oluşturuculardan üstün olduğunu ve aynı zamanda parametre sayısında da en büyük model olduğunu ileri sürüyor.
Meta, Code Llama'nın ara sıra istemlere "hatalı" veya "uygunsuz" yanıtlar verebileceği konusunda uyarıda bulunsa da geliştiricilere, modelin herhangi bir uygulamasını dağıtmadan önce özel güvenlik testleri ve ayarlamalar yapmalarını da tavsiye ediyor.
Meta, Code Llama'nın dağıtımında, ister ticari ister araştırma amaçlı kullanmak istesinler, geliştiricilere katı kısıtlamalar getirmekten kaçındı. Ancak geliştiricilerin etik standartlara uymaları ve modeli zararlı amaçlar için kullanmaktan kaçınmaları bekleniyor. Modelin aylık 700 milyondan fazla aktif kullanıcıya sahip bir platformda konuşlandırılması durumunda lisans aranması gerekiyor.
Araştırma, endüstri, açık kaynak projeleri, STK'lar ve benzer işletmeler de dahil olmak üzere tüm sektörlerdeki yazılım mühendislerine yardımcı olmak üzere tasarlanan Code Llama, temel ve talimat modellerinin şu anda kapsadıklarının ötesinde çok daha fazla kullanım senaryosuna yer veriyor. Code Llama'nın, araştırma ve ticari ürünler için yenilikçi araçlar oluşturmada Llama 2'den yararlanma konusunda başkalarına ilham vereceği umulmaktadır. AppMaster'ın uygulama geliştirmeyi geliştirme vizyonuna çok benzeyen Code Llama, kodlamanın evrimindeki bir sonraki adımı temsil ediyor.
AppMaster gibi diğer platformların uygulama oluşturmayı daha erişilebilir hale getirmeye önemli ölçüde katkıda bulunduğu teknoloji endüstrisinde bu tür ilerlemelerin yaratabileceği etkiyi inkar etmek mümkün değil. Ancak bu teknolojinin güvenli ve verimli kullanımını sağlamak için etik ve sorumluluk çerçeveleri içerisinde yapay zekanın rolünü belirlemek de çok önemlidir.