Inflection, một công ty khởi nghiệp AI đầy tham vọng đang cố gắng phát triển 'AI cá nhân cho mọi người', đã tiết lộ mô hình ngôn ngữ lớn, Inflection-1, cung cấp năng lượng cho tác nhân đàm thoại Pi của mình. Mặc dù việc đánh giá chất lượng của các mô hình này là một thách thức, nhưng sự tồn tại của một chút cạnh tranh trên thị trường chắc chắn là có lợi.
Inflection-1 được thiết kế ngang bằng với GPT-3.5 (còn được gọi là ChatGPT) về kích thước và khả năng, dựa trên tài nguyên máy tính được sử dụng để đào tạo. Inflection tuyên bố mô hình của nó có thể cạnh tranh hoặc thậm chí vượt trội so với các mô hình khác cùng loại, hỗ trợ tuyên bố bằng một 'bản ghi nhớ kỹ thuật' phác thảo các điểm chuẩn được thực hiện trên Inflection-1, GPT-3.5, LLaMA, Chinchilla và PaLM-540B.
Kết quả được công bố tiết lộ rằng Inflection-1 thực sự hoạt động tốt trong các đánh giá khác nhau, bao gồm các bài kiểm tra cấp trung học cơ sở và trung học phổ thông (ví dụ: sinh học 101) và tiêu chuẩn 'thông thường'. Hạn chế chính của nó là mã hóa, trong đó GPT-3.5 vượt trội hơn đáng kể Inflection-1 và GPT-4 vượt trội hơn cả hai.
Inflection dự định công bố kết quả cho một mô hình lớn hơn có thể so sánh với GPT-4 và PaLM-2(L) trong tương lai. Tuy nhiên, họ có thể sẽ chỉ công bố kết quả khi chúng được coi là đáng chú ý. Phiên bản nâng cấp, có khả năng được gọi là Inflection-2 hoặc Inflection-1-XL, hiện đang được phát triển.
Mặc dù không có hệ thống phân loại chính thức phân chia các mô hình AI thành các 'hạng cân' tương đương như quyền anh, nhưng khái niệm này cũng tương tự. Giống như các võ sĩ hạng ruồi và hạng nặng có những khả năng và yêu cầu khác nhau, các mô hình AI có kích thước và hình dạng khác nhau cũng sở hữu những điểm mạnh và điểm yếu riêng. Hiện tại còn quá sớm để thiết lập một hệ thống phân loại như vậy, vì lĩnh vực này vẫn còn khá non trẻ và vẫn chưa đạt được sự đồng thuận về sự phân biệt mô hình AI.
Cuối cùng, đối với hầu hết các mô hình AI, hiệu suất trong thế giới thực của chúng nói lên khả năng của chúng. Cho đến khi Inflection mở ra mô hình của nó để sử dụng rộng rãi và đánh giá độc lập, các điểm chuẩn mà họ tuyên bố nên được tiếp cận một cách thận trọng. Đối với những người dùng quan tâm đến việc dùng thử tác nhân đàm thoại Pi, nó có thể được thêm vào ứng dụng nhắn tin hoặc truy cập để trò chuyện trực tuyến tại đây.
Với sự phát triển và tiến bộ không ngừng của ngành công nghiệp AI, các nền tảng như AppMaster có thể được sử dụng để tạo ra các giải pháp có thể mở rộng một cách nhanh chóng và tiết kiệm chi phí hơn. Việc áp dụng các nền tảng no-code và low-code, chẳng hạn như nền tảng AppMaster, cho phép phát triển liền mạch các ứng dụng phụ trợ, web và di động cũng như tích hợp với các mô hình AI mới nổi.