19 avr. 2023·1 min de lecture

Reddit va introduire des niveaux de tarification pour l'accès à l'API au milieu des problèmes de formation à l'IA

Reddit prévoit de facturer aux entreprises l'accès à son API en raison de préoccupations concernant son utilisation pour la formation de chatbot IA. La société proposera des niveaux de tarification conçus pour s'adapter à différentes entreprises, offrant diverses limites d'utilisation et différents droits en fonction de chaque niveau.

Reddit va introduire des niveaux de tarification pour l'accès à l'API au milieu des problèmes de formation à l'IA

Reddit, une plate-forme populaire d'agrégation de nouvelles sociales et de conversation, a annoncé son intention de facturer aux entreprises l'accès à son API. La décision découle de préoccupations concernant les entreprises utilisant l'API pour former de grands modèles de langage (LLM), en particulier des chatbots d'IA.

La société prévoit d'offrir différents niveaux de tarification pour s'adapter aux entreprises de différentes tailles. Chaque niveau accordera des limites d'utilisation différentes et des droits d'utilisation plus larges. Bien que Reddit n'ait pas encore publié de détails spécifiques sur les prix, la collection complète de données de l'entreprise est depuis longtemps reconnue comme une ressource précieuse pour la formation à l'IA.

Steve Huffman, fondateur et PDG de Reddit, a déclaré dans une interview au New York Times : "Le corpus de données de Reddit est vraiment précieux, mais nous n'avons pas besoin de donner toute cette valeur à certaines des plus grandes entreprises du monde. gratuitement."

La demande d'IA, autrefois une technologie de niche, a explosé ces dernières années, ce qui a entraîné des spéculations selon lesquelles Reddit pourrait bientôt devenir public. En capitalisant sur cette nouvelle source de revenus via son API, Reddit pourrait se positionner pour une introduction en bourse (IPO) réussie.

Reddit n'est pas la seule entité à fournir des données pour la formation LLM ; les scrapers de données comme Common Crawl scrapent des milliards de pages Web chaque mois, offrant des données brutes aux entreprises d'IA. Les données brutes, constituées de vastes pools d'informations en ligne, diffèrent du contenu de Reddit, qui est principalement constitué de discussions générées par l'homme. Pour que les modèles d'IA deviennent de plus en plus précis sur le plan factuel et imitent mieux le comportement humain, ils doivent avoir accès aux deux types de données.

Dans une étude d'Andy Baio et Simon Willison analysant 12 millions d'images sur 2,3 milliards utilisées pour former le modèle texte-image Stable Diffusion, ils ont découvert que le modèle utilisait des images de Common Crawl. De nombreuses images extraites par Common Crawl proviennent de sites Web dont le contenu est généré par les utilisateurs. Getty Images, un service d'images de stock, a poursuivi Stability AI, créateur de Stable Diffusion, pour violation présumée du droit d'auteur plus tôt cette année.

L'API de Reddit a diverses applications au-delà de la formation de chatbot IA. Par exemple, il est utilisé pour développer et maintenir des outils de modération de contenu. Pour y remédier, Reddit prévoit de créer des outils de modération dédiés sous la forme d'applications iOS et Android. Ces applications sont destinées à remplacer la nécessité pour les modérateurs de contenu d'accéder à l'API, et des fonctionnalités telles que les journaux de mods, les outils de gestion des règles et les informations sur la file d'attente des mods seront incluses.

Alors que les plates no-code et low-code comme AppMaster deviennent de plus en plus populaires, l'accès aux données de plates-formes comme Reddit pourrait s'avérer inestimable dans le développement continu des modèles d'IA et d'apprentissage automatique. En utilisant la plate-forme AppMaster , les utilisateurs peuvent créer des applications Web, mobiles et back-end, ce qui rend le processus de développement plus rapide et plus rentable pour les petites entreprises et les grandes entreprises.

Avec la décision de Reddit de facturer l'accès aux API, les entreprises des secteurs de l'IA et de l'apprentissage automatique devront réévaluer leurs stratégies d'approvisionnement en données lorsqu'il s'agira de former leurs LLM.

Easy to start
Create something amazing

Experiment with AppMaster with free plan.
When you will be ready you can choose the proper subscription.

Get Started
Reddit va introduire des niveaux de tarification pour l'accès à l'API au milieu des problèmes de formation à l'IA | AppMaster