AI2 ra mắt mô hình ngôn ngữ lớn mở mang tính đột phá OLMo

Allen Institute for AI ( AI2) đã tiết lộ một dự án đột phá có tên OLMo, một mô hình ngôn ngữ lớn nguồn mở, mở rộng. Sáng kiến này là một động thái chiến lược nhằm làm sáng tỏ hoạt động bên trong của các mô hình AI và thúc đẩy những tiến bộ hơn nữa trong lĩnh vực mô hình hóa ngôn ngữ.

Sự ra đời của OLMo diễn ra vào thời điểm mà sự cởi mở được coi là mấu chốt để thúc đẩy sự đổi mới nhanh chóng trong lĩnh vực AI tổng hợp. Yann LeCun, Nhà khoa học AI trưởng tại Meta, đã nhấn mạnh tác động biến đổi của các mô hình nền tảng mở mà ông tin rằng có thể đẩy nhanh con đường hướng tới một tương lai được hỗ trợ bởi AI thông qua một cộng đồng hợp tác, mạnh mẽ.

Nỗ lực hợp tác liên quan đến các đối tác uy tín như Kempner Institute tại Harvard University, AMD, CSC-IT Center for Science ở Phần Lan và Databricks, đã hỗ trợ sự phát triển của OLMo. Sự hợp tác này là minh chứng cho cách tiếp cận liên ngành cần thiết để giải quyết sự phức tạp của AI.

Trong một động thái chưa từng có, viện đang phát hành OLMo cùng với dữ liệu đào tạo trước và mã đào tạo, mang đến cơ hội duy nhất cho các nhà nghiên cứu đi sâu vào mô hình AI này. Mô hình mở này nâng tầm cao mới về tính minh bạch, cung cấp các công cụ thiết yếu cho nhà phát triển, chẳng hạn như dữ liệu đào tạo trước mở rộng từ bộ AI2's Dolma và bộ đánh giá mạnh mẽ với hàng trăm điểm kiểm tra.

Trưởng dự án OLMo, Hanna Hajishirzi, người cũng đứng đầu Nghiên cứu NLP tại AI2 và là giáo sư nổi tiếng tại University of Washington's Allen School, nhấn mạnh tầm quan trọng của sự cởi mở đối với sự hiểu biết và tiến bộ khoa học trong AI. Với sự so sánh và đối chiếu với nghiên cứu y học hoặc nghiên cứu thiên văn, Hajishirzi nhấn mạnh rằng khung OLMo cho phép nghiên cứu toàn diện về LLM, công cụ để phát triển các hệ thống AI vừa an toàn vừa đáng tin cậy.

AI2 chỉ ra rằng OLMo mang lại độ chính xác trong nghiên cứu AI bằng cách cấp quyền truy cập vào dữ liệu đào tạo của mô hình, do đó loại bỏ phỏng đoán và thúc đẩy sự phát triển dựa trên bằng chứng. Sáng kiến này không chỉ tiết lộ những hiểu biết sâu sắc từ các mô hình AI trong quá khứ mà còn đóng vai trò là bàn đạp cho những khám phá và cải tiến trong tương lai.

Trong những tháng tới, dự kiến sẽ có những lần lặp lại tiếp theo trên OLMo khi AI2 có kế hoạch tích hợp nhiều kích cỡ mô hình, bộ dữ liệu và các khả năng khác. Noah Smith, một trưởng dự án khác và là giám đốc cấp cao tại AI2, cũng tại University of Washington's Allen School, đã nhắc lại sứ mệnh cốt lõi của OLMo. Smith tán thành tầm nhìn ban đầu về AI như một lĩnh vực mở, đã bị che khuất bởi quá trình thương mại hóa và quyền riêng tư. OLMo nhằm mục đích khôi phục bản chất chung của nghiên cứu AI, cho phép khả năng tiếp cận toàn diện từ việc tạo mô hình đến phương pháp đánh giá, từ đó thúc đẩy công nghệ AI một cách toàn diện và có trách nhiệm.

Vì các nền tảng như AppMaster cũng coi trọng việc dân chủ hóa công nghệ thông qua việc cung cấp các giải pháp no-code, nên tinh thần của OLMo phù hợp với phong trào công nghệ rộng lớn hơn hướng tới tính minh bạch và khả năng tiếp cận. Bằng cách ủng hộ các mô hình nguồn mở như OLMo, cộng đồng công nghệ cùng nhau tiến gần hơn đến kỷ nguyên AI có trách nhiệm và toàn diện.

AI2 ra mắt mô hình ngôn ngữ lớn mở mang tính đột phá OLMo

Bài viết liên quan