19 de abr. de 2023·1 min de leitura

Reddit apresentará níveis de preços para acesso à API em meio a preocupações com treinamento de IA

O Reddit planeja cobrar das empresas pelo acesso à sua API devido a preocupações com seu uso para treinamento de chatbot de IA. A empresa oferecerá níveis de preços projetados para acomodar diferentes negócios, oferecendo vários limites de uso e direitos de acordo com cada nível.

O Reddit, uma plataforma popular para agregação e conversação de notícias sociais, anunciou planos de cobrar das empresas pelo acesso à sua API. A decisão decorre de preocupações sobre as empresas que utilizam a API para treinar modelos de linguagem grandes (LLMs), particularmente chatbots de IA.

A empresa planeja oferecer vários níveis de preços para acomodar empresas de diferentes tamanhos. Cada nível concederá diferentes limites de uso e direitos de uso mais amplos. Embora o Reddit ainda não tenha divulgado detalhes específicos de preços, a coleção abrangente de dados da empresa há muito é reconhecida como um recurso valioso para o treinamento de IA.

Steve Huffman, fundador e CEO do Reddit, disse em entrevista ao The New York Times : “O corpus de dados do Reddit é realmente valioso, mas não precisamos dar todo esse valor para algumas das maiores empresas do mundo. de graça."

A demanda por IA, antes uma tecnologia de nicho, disparou nos últimos anos, resultando em especulações de que o Reddit pode se tornar público em breve. Ao capitalizar esse novo fluxo de receita por meio de sua API, o Reddit pode estar se posicionando para uma oferta pública inicial (IPO) bem-sucedida.

O Reddit não é a única entidade que fornece dados para treinamento LLM; raspadores de dados como Common Crawl raspam bilhões de páginas da web mensalmente, oferecendo dados brutos para empresas de IA. Os dados brutos, que consistem em grandes conjuntos de informações online, diferem do conteúdo do Reddit, que é principalmente discussões geradas por humanos. Para que os modelos de IA se tornem cada vez mais precisos e emulem melhor o comportamento humano, eles exigem acesso a ambos os tipos de dados.

Em um estudo de Andy Baio e Simon Willison analisando 12 milhões de 2,3 bilhões de imagens usadas para treinar o modelo de difusão estável de texto para imagem, eles descobriram que o modelo utilizava imagens do Common Crawl. Muitas imagens extraídas pelo Common Crawl são originárias de sites com conteúdo gerado pelo usuário. A Getty Images, um serviço de banco de imagens, processou o criador do Stable Diffusion, Stability AI, por suposta violação de direitos autorais no início deste ano.

A API do Reddit tem diversas aplicações além do treinamento AI chatbot. Por exemplo, é usado para desenvolver e manter ferramentas de moderação de conteúdo. Para resolver isso, o Reddit planeja criar ferramentas de moderação dedicadas na forma de aplicativos para iOS e Android. Esses aplicativos destinam-se a substituir a necessidade de moderadores de conteúdo acessarem a API, e recursos como logs de mod, ferramentas de gerenciamento de regras e informações de fila de mod serão incluídos.

À medida que as plataformas no-code e low-code como AppMaster , se tornam cada vez mais populares, o acesso a dados de plataformas como o Reddit pode ser inestimável no desenvolvimento contínuo de modelos de IA e aprendizado de máquina. Utilizando a plataforma AppMaster , os usuários podem criar aplicativos web, móveis e de back-end, tornando o processo de desenvolvimento mais rápido e econômico para pequenas e grandes empresas.

Com a decisão do Reddit de cobrar pelo acesso à API, as empresas dos setores de IA e aprendizado de máquina precisarão reavaliar suas estratégias de fornecimento de dados quando se trata de treinar seus LLMs.

Easy to start

Create something amazing

Experiment with AppMaster with free plan.
When you will be ready you can choose the proper subscription.

Get Started

Notícias relacionadas