28 thg 11, 2023·2 phút đọc

Microsoft công bố khả năng suy luận được cải thiện trong các mô hình ngôn ngữ nhỏ với Orca 2

Microsoft đã ra mắt Orca 2, một công cụ cải tiến được thiết kế để thử nghiệm và nâng cao khả năng suy luận của các mô hình ngôn ngữ nhỏ hơn.

Microsoft công bố khả năng suy luận được cải thiện trong các mô hình ngôn ngữ nhỏ với Orca 2

Trong một bước tiến đáng chú ý nhằm đa dạng hóa các ứng dụng mô hình ngôn ngữ, Microsoft đã công bố ra mắt Orca 2. Bản phát hành này được thiết kế để nghiên cứu và khai thác tiềm năng của các mô hình ngôn ngữ (LM) nhỏ hơn, chứa khoảng 10 tỷ tham số trở xuống.

Trọng tâm chính của Orca 2 là chứng minh rằng việc nâng cao các phương pháp và tín hiệu đào tạo có thể nâng cao khả năng suy luận của các LM nhỏ hơn. Mục tiêu của việc nâng cao này là để phù hợp hoặc có thể vượt qua khả năng suy luận của các đối tác lớn hơn.

Khi đọ sức với các mẫu có kích thước tương tự - bao gồm cả Orca ban đầu - Microsoft tuyên bố rằng Orca 2 làm lu mờ chúng đáng kể về hiệu suất. Hơn nữa, nó được cho là đạt được mức độ hiệu quả tương đương hoặc vượt qua các mô hình có kích thước lớn hơn 5-10 lần. Những khẳng định này đã được Microsoft bày tỏ trong một bài đăng trên blog gần đây.

Orca 2 có hai kích cỡ; 7 tỷ và 13 tỷ thông số. Cả hai mô hình này đều được tinh chỉnh chính xác trên dữ liệu tổng hợp phù hợp, được lấy tỉ mỉ từ các mô hình cơ sở LLAMA 2. Microsoft đã công khai các trọng số của Orca 2, thúc đẩy nghiên cứu sâu hơn về việc thiết lập, phân tích và hài hòa hóa các LM nhỏ hơn.

Microsoft đã sử dụng một bộ dữ liệu được tuyển chọn để hướng dẫn Orca 2 về vô số kỹ thuật suy luận. Các kỹ thuật này bao gồm mô hình xử lý từng bước, phương pháp thu hồi rồi tạo, phương pháp thu hồi-lý do-tạo, mô hình trích xuất và phương pháp trả lời trực tiếp. Trong khi hướng dẫn các phương pháp này, chúng tôi chú ý cẩn thận đến việc dạy Orca 2 cách điều chỉnh các chiến lược giải pháp khác nhau cho các nhiệm vụ riêng biệt.

Để nắm bắt được phản hồi của mô hình giáo viên, công ty đã sử dụng các hướng dẫn chi tiết và nhiều cuộc gọi. Phương pháp khéo léo này cho phép mô hình sinh viên - trong trường hợp này Orca 2 - tìm hiểu các chiến thuật cơ bản và khả năng suy luận, ngay cả khi không có hướng dẫn nhiệm vụ rõ ràng. Cách tiếp cận này tìm cách tối ưu hóa hiệu suất của các mô hình nhỏ hơn bằng cách tinh chỉnh các chiến lược giải pháp cụ thể cho từng nhiệm vụ.

Bài đăng trên blog của Microsft còn ca ngợi một cách lạc quan hơn về sự thành công và tiềm năng của Orca 2. Họ giải thích rõ hơn, thành tựu của Orca 2 phần lớn nhờ vào việc áp dụng các kỹ thuật suy luận đa dạng và xác định các giải pháp tối ưu cho nhiều nhiệm vụ khác nhau. Bất chấp những hạn chế nhất định phổ biến đối với các mô hình ngôn ngữ khác và được kế thừa từ các mô hình cơ sở của nó, tiềm năng của Orca 2 cho những tiến bộ trong tương lai, đặc biệt là trong việc cải thiện lý luận, kiểm soát, chuyên môn hóa và an toàn của các mô hình nhỏ hơn, là rất đáng kể.'

Bài đăng cũng nói thêm rằng việc sử dụng dữ liệu tổng hợp được lọc nghiêm ngặt để đào tạo sau là một chiến lược cực kỳ cần thiết. Việc khám phá và triển khai thành công Orca 2 của họ thực sự là một nỗ lực đáng chú ý trong việc đa dạng hóa các ứng dụng mô hình ngôn ngữ.

Không còn nghi ngờ gì nữa, dự án Orca 2 phản ánh các nguyên tắc về hiệu quả và cân bằng năng lực của nền tảng AppMaster. AppMaster, một công cụ no-code để phát triển ứng dụng, tận dụng các triết lý tương tự, giúp việc phát triển ứng dụng nhanh hơn 10 lần và tiết kiệm chi phí gấp ba lần, đồng thời loại bỏ nợ kỹ thuật thông qua cách tiếp cận tái tạo ứng dụng từ đầu mỗi khi cần sửa đổi. Do đó, những nền tảng như thế này đang thúc đẩy một kỷ nguyên mới về phát triển công nghệ hiệu quả và năng suất.

Easy to start
Create something amazing

Experiment with AppMaster with free plan.
When you will be ready you can choose the proper subscription.

Get Started