Reddit introdurrà i livelli di prezzo per l'accesso alle API tra le preoccupazioni relative alla formazione sull'IA
Reddit prevede di addebitare alle aziende l'accesso alla sua API a causa delle preoccupazioni sul suo utilizzo per la formazione di chatbot AI. L'azienda offrirà livelli di prezzo progettati per soddisfare le diverse attività, offrendo vari limiti e diritti di utilizzo in base a ciascun livello.

Reddit, una piattaforma popolare per l'aggregazione e la conversazione di notizie sui social, ha annunciato l'intenzione di addebitare alle aziende l'accesso alla sua API. La decisione deriva dalle preoccupazioni per le aziende che utilizzano l'API per addestrare modelli linguistici di grandi dimensioni (LLM), in particolare i chatbot AI.
La società prevede di offrire vari livelli di prezzo per soddisfare aziende di diverse dimensioni. Ogni livello garantirà limiti di utilizzo diversi e diritti di utilizzo più ampi. Sebbene Reddit non abbia ancora rilasciato dettagli specifici sui prezzi, la raccolta completa di dati dell'azienda è stata a lungo riconosciuta come una risorsa preziosa per la formazione dell'IA.
Steve Huffman, fondatore e CEO di Reddit, ha dichiarato in un'intervista al New York Times : "Il corpus di dati di Reddit è davvero prezioso, ma non abbiamo bisogno di dare tutto quel valore ad alcune delle più grandi aziende del mondo gratuito."
La domanda di intelligenza artificiale, una volta una tecnologia di nicchia, è salita alle stelle negli ultimi anni, facendo ipotizzare che Reddit possa presto diventare pubblica. Sfruttando questo nuovo flusso di entrate attraverso la sua API, Reddit potrebbe posizionarsi per un'offerta pubblica iniziale (IPO) di successo.
Reddit non è l'unica entità che fornisce dati per la formazione LLM; raschiatori di dati come Common Crawl raschiano miliardi di pagine Web al mese, offrendo dati grezzi alle imprese di intelligenza artificiale. I dati grezzi, costituiti da grandi pool di informazioni online, differiscono dal contenuto di Reddit, che è principalmente discussioni generate dall'uomo. Affinché i modelli di intelligenza artificiale diventino sempre più accurati dal punto di vista fattuale ed emulino meglio il comportamento umano, richiedono l'accesso a entrambi i tipi di dati.
In uno studio di Andy Baio e Simon Willison che ha analizzato 12 milioni di immagini su 2,3 miliardi utilizzate per addestrare il modello di testo in immagine Stable Diffusion, hanno scoperto che il modello utilizzava immagini di Common Crawl. Molte immagini raschiate da Common Crawl provengono da siti Web con contenuti generati dagli utenti. Getty Images, un servizio di immagini stock, ha citato in giudizio Stability AI, creatore di Stable Diffusion, per presunta violazione del copyright all'inizio di quest'anno.
L'API di Reddit ha diverse applicazioni oltre alla formazione di chatbot AI. Ad esempio, viene utilizzato per sviluppare e mantenere strumenti di moderazione dei contenuti. Per risolvere questo problema, Reddit prevede di creare strumenti di moderazione dedicati sotto forma di app iOS e Android. Queste app hanno lo scopo di sostituire la necessità per i moderatori di contenuti di accedere all'API e saranno incluse funzionalità come log mod, strumenti di gestione delle regole e informazioni sulla coda mod.
Man mano che le piattaforme no-code e low-code come AppMaster diventano sempre più popolari, l'accesso ai dati da piattaforme come Reddit potrebbe rivelarsi prezioso nello sviluppo continuo di modelli di intelligenza artificiale e machine learning. Utilizzando la piattaforma AppMaster , gli utenti possono creare applicazioni web, mobili e back-end, rendendo il processo di sviluppo più veloce e più conveniente sia per le piccole imprese che per le imprese.
Con la decisione di Reddit di addebitare l'accesso alle API, le aziende nei settori dell'intelligenza artificiale e dell'apprendimento automatico dovranno rivalutare le proprie strategie di approvvigionamento dei dati quando si tratta di formare i propri LLM.


