Reddit presentará niveles de precios para el acceso a API en medio de preocupaciones de capacitación de IA
Reddit planea cobrar a las empresas por el acceso a su API debido a las preocupaciones sobre su uso para la capacitación de chatbots de IA. La empresa ofrecerá niveles de precios diseñados para acomodar diferentes negocios, ofreciendo varios límites de uso y derechos según cada nivel.

Reddit, una plataforma popular para la agregación y conversación de noticias sociales, ha anunciado planes para cobrar a las empresas por el acceso a su API. La decisión surge de las preocupaciones sobre las empresas que utilizan la API para entrenar modelos de lenguaje grandes (LLM), en particular los chatbots de IA.
La compañía planea ofrecer varios niveles de precios para adaptarse a empresas de diferentes tamaños. Cada nivel otorgará diferentes límites de uso y derechos de uso más amplios. Aunque Reddit aún tiene que publicar detalles de precios específicos, la recopilación integral de datos de la compañía ha sido reconocida durante mucho tiempo como un recurso valioso para la capacitación en IA.
Steve Huffman, fundador y director ejecutivo de Reddit, dijo en una entrevista con The New York Times : “El corpus de datos de Reddit es realmente valioso, pero no necesitamos dar todo ese valor a algunas de las empresas más grandes del mundo. gratis."
La demanda de IA, que alguna vez fue una tecnología de nicho, se disparó en los últimos años, lo que generó especulaciones de que Reddit podría salir a bolsa pronto. Al capitalizar esta nueva fuente de ingresos a través de su API, Reddit podría estar posicionándose para una oferta pública inicial (OPI) exitosa.
Reddit no es la única entidad que proporciona datos para la formación de LLM; raspadores de datos como Common Crawl extraen miles de millones de páginas web mensualmente, ofreciendo datos sin procesar a las empresas de IA. Los datos sin procesar, que consisten en grandes conjuntos de información en línea, difieren del contenido de Reddit, que son principalmente discusiones generadas por humanos. Para que los modelos de IA sean cada vez más precisos en cuanto a los hechos y emulen mejor el comportamiento humano, requieren acceso a ambos tipos de datos.
En un estudio realizado por Andy Baio y Simon Willison que analizó 12 millones de 2300 millones de imágenes utilizadas para entrenar el modelo de texto a imagen Stable Diffusion, descubrieron que el modelo utilizaba imágenes de Common Crawl. Muchas imágenes extraídas por Common Crawl se originan en sitios web con contenido generado por el usuario. Getty Images, un servicio de imágenes de stock, demandó al creador de Stable Diffusion, Stability AI, por presunta infracción de derechos de autor a principios de este año.
La API de Reddit tiene diversas aplicaciones más allá del entrenamiento de chatbots de IA. Por ejemplo, se utiliza para desarrollar y mantener herramientas de moderación de contenido. Para abordar esto, Reddit planea crear herramientas de moderación dedicadas en forma de aplicaciones para iOS y Android. Estas aplicaciones están destinadas a reemplazar la necesidad de que los moderadores de contenido accedan a la API, y se incluirán funciones como registros de mods, herramientas de administración de reglas e información de la cola de mods.
A medida que las plataformas no-code y low-code como AppMaster se vuelven cada vez más populares, el acceso a los datos de plataformas como Reddit podría resultar invaluable en el desarrollo continuo de modelos de aprendizaje automático e inteligencia artificial. Al utilizar la plataforma AppMaster , los usuarios pueden crear aplicaciones web, móviles y back-end, lo que hace que el proceso de desarrollo sea más rápido y rentable tanto para las pequeñas empresas como para las empresas.
Con la decisión de Reddit de cobrar por el acceso a la API, las empresas en los sectores de inteligencia artificial y aprendizaje automático deberán reevaluar sus estrategias de abastecimiento de datos cuando se trata de capacitar a sus LLM.


