Gã khổng lồ công nghệ Meta gần đây đã tiết lộ thế hệ tiếp theo của các mô hình AI đáng chú ý của họ: Llama 2. Dòng mô hình AI sáng tạo này đã được phát triển rõ ràng để cung cấp năng lượng cho một số chatbot, bao gồm ChatGPT và Bing Chat của OpenAI, cùng với các hệ thống hội thoại tiên tiến khác.
Được đào tạo dựa trên một loại dữ liệu có thể truy cập công khai, Llama 2 được thiết lập để vượt qua thế hệ trước về hiệu suất tổng thể. Người kế nhiệm của mô hình Llama là một bước phát triển quan trọng mang lại khả năng tương tác vượt trội so với các hệ thống tương tự chatbot khác.
Đáng chú ý, Llama ban đầu chỉ có thể truy cập được theo yêu cầu, vì Meta đã thực hiện các biện pháp phòng ngừa nghiêm ngặt để hạn chế việc lạm dụng nó. Tuy nhiên, mô hình Llama cuối cùng đã tìm được đường đến các cộng đồng AI khác nhau, bất chấp sự canh gác có chủ ý.
Ngược lại, Llama 2 được mở để nghiên cứu và sử dụng thương mại ở dạng được đào tạo trước. Mang đến sự thuận tiện cho việc tối ưu hóa trên nhiều nền tảng lưu trữ khác nhau, chẳng hạn như AWS, Azure và AI của Hugging Face, mô hình này đảm bảo trải nghiệm thân thiện với người dùng. Việc giới thiệu Llama 2 có thể thực hiện được nhờ sự hợp tác mở rộng với Microsoft, giúp nó được tối ưu hóa cho Windows và các thiết bị được trang bị hệ thống trên chip Snapdragon của Qualcomm. Qualcomm cũng được cho là đang làm việc để chuyển Llama 2 sang các thiết bị Snapdragon vào năm 2024.
Llama 2 có hai phiên bản: cơ bản và Llama 2-Chat, được thiết kế đặc biệt cho các tương tác hai chiều. Cả hai phiên bản đều có sẵn ở các mức độ phức tạp khác nhau, được xác định bởi phạm vi tham số–7 tỷ, 13 tỷ và con số khổng lồ 70 tỷ. Các tham số, là một phần của mô hình được học từ dữ liệu huấn luyện, xác định hiệu quả mức độ thành thạo của mô hình đối với một vấn đề—trong trường hợp này là tạo văn bản.
Llama 2 đã được đào tạo trên hai triệu mã thông báo, có nghĩa là văn bản thô. Con số này gần gấp đôi so với Llama ban đầu, được đào tạo trên 1,4 nghìn tỷ mã thông báo. Nói chung, số lượng mã thông báo lớn hơn sẽ mang lại hiệu quả cao hơn khi xử lý các mô hình AI tổng quát. Meta đã giữ kín về các chi tiết cụ thể của dữ liệu đào tạo, ngoài việc tiết lộ rằng nó chủ yếu bằng tiếng Anh, được lấy từ internet và nhấn mạnh văn bản có tính chất thực tế.
Động thái này mở ra một chương mới trong lĩnh vực AI mang lại tiềm năng to lớn cho các nền tảng không mã và low-code, chẳng hạn như AppMaster , cho phép người dùng sử dụng các công cụ nâng cao này trong vô số ứng dụng đồng thời giúp quá trình phát triển diễn ra nhanh chóng và hiệu quả.