Reddit giới thiệu các bậc giá cho quyền truy cập API trong bối cảnh lo ngại về đào tạo AI
Reddit có kế hoạch tính phí các công ty truy cập vào API của mình do lo ngại về việc sử dụng nó để đào tạo chatbot AI. Công ty sẽ cung cấp các mức giá được thiết kế để phù hợp với các doanh nghiệp khác nhau, đưa ra các giới hạn và quyền sử dụng khác nhau tùy theo từng mức.

Reddit, một nền tảng phổ biến để tổng hợp tin tức xã hội và trò chuyện, đã công bố kế hoạch tính phí các công ty truy cập vào API của nó. Quyết định này bắt nguồn từ những lo ngại về việc các doanh nghiệp sử dụng API để đào tạo các mô hình ngôn ngữ lớn (LLM), đặc biệt là các chatbot AI.
Công ty có kế hoạch cung cấp các mức giá khác nhau để phù hợp với các doanh nghiệp có quy mô khác nhau. Mỗi bậc sẽ cấp các giới hạn sử dụng khác nhau và quyền sử dụng rộng hơn. Mặc dù Reddit vẫn chưa công bố chi tiết về giá cụ thể, nhưng bộ sưu tập dữ liệu toàn diện của công ty từ lâu đã được công nhận là nguồn tài nguyên quý giá để đào tạo AI.
Steve Huffman, Người sáng lập và Giám đốc điều hành của Reddit, cho biết trong một cuộc phỏng vấn với The New York Times : “Khối dữ liệu Reddit thực sự có giá trị, nhưng chúng tôi không cần phải trao tất cả giá trị đó cho một số công ty lớn nhất trên thế giới miễn phí."
Nhu cầu về AI, từng là một công nghệ thích hợp, đã tăng vọt trong những năm gần đây, dẫn đến suy đoán rằng Reddit có thể sớm ra mắt công chúng. Bằng cách tận dụng nguồn doanh thu mới này thông qua API của mình, Reddit có thể tự định vị cho đợt phát hành lần đầu ra công chúng (IPO) thành công.
Reddit không phải là tổ chức duy nhất cung cấp dữ liệu cho đào tạo LLM; các trình thu thập dữ liệu như Thu thập thông tin chung thu thập hàng tỷ trang web hàng tháng, cung cấp dữ liệu thô cho các doanh nghiệp AI. Dữ liệu thô, bao gồm các nhóm thông tin trực tuyến lớn, khác với nội dung của Reddit, chủ yếu là các cuộc thảo luận do con người tạo ra. Để các mô hình AI ngày càng trở nên chính xác trên thực tế và mô phỏng tốt hơn hành vi của con người, chúng yêu cầu quyền truy cập vào cả hai loại dữ liệu.
Trong một nghiên cứu của Andy Baio và Simon Willison khi phân tích 12 triệu trong số 2,3 tỷ hình ảnh được sử dụng để huấn luyện mô hình Chuyển văn bản thành hình ảnh Khuếch tán ổn định, họ phát hiện ra rằng mô hình này sử dụng hình ảnh từ Thu thập thông tin chung. Nhiều hình ảnh được Thu thập thông tin chung thu thập bắt nguồn từ các trang web có nội dung do người dùng tạo. Getty Images, một dịch vụ hình ảnh chứng khoán, đã kiện người sáng tạo Ổn định Khuếch tán Ổn định AI vì cáo buộc vi phạm bản quyền vào đầu năm nay.
API của Reddit có các ứng dụng đa dạng ngoài đào tạo chatbot AI. Chẳng hạn, nó được sử dụng để phát triển và duy trì các công cụ kiểm duyệt nội dung. Để giải quyết vấn đề này, Reddit có kế hoạch tạo các công cụ kiểm duyệt chuyên dụng dưới dạng ứng dụng iOS và Android. Các ứng dụng này nhằm thay thế nhu cầu truy cập API của người kiểm duyệt nội dung và các tính năng như nhật ký mod, công cụ quản lý quy tắc và thông tin hàng đợi mod sẽ được đưa vào.
Khi các nền tảng no-code và low-code như AppMaster ngày càng trở nên phổ biến, quyền truy cập vào dữ liệu từ các nền tảng như Reddit có thể chứng tỏ giá trị vô giá trong quá trình phát triển không ngừng của các mô hình máy học và trí tuệ nhân tạo. Bằng cách sử dụng nền tảng AppMaster , người dùng có thể tạo các ứng dụng web, di động và phụ trợ, giúp quá trình phát triển nhanh hơn và tiết kiệm chi phí hơn cho cả doanh nghiệp nhỏ và doanh nghiệp.
Với quyết định tính phí truy cập API của Reddit, các công ty trong lĩnh vực AI và máy học sẽ cần đánh giá lại các chiến lược tìm nguồn dữ liệu của họ khi đào tạo LLM của họ.


