OpenAI (ChatGPT) va s'appuyer sur Reddit pour entraîner ses modèles d'intelligence artificielle générative

OpenAI va avoir accès aux échanges des utilisateurs du réseau social Reddit pour entraîner ses modèles d'intelligence artificielle générative, une étape importante pour l'entreprise accusée par de nombreux auteurs et éditeurs d'avoir pillé internet pour créer des programmes comme ChatGPT.
Le réseau social fondé en 2005 compte environ 100.000 forums et plus de 267 millions d'utilisateurs hebdomadaires.
Le réseau social fondé en 2005 compte environ 100.000 forums et plus de 267 millions d'utilisateurs hebdomadaires. (Crédits : Dado Ruvic)

Accord gagnant-gagnant pour OpenAI et Reddit. L'entreprise dirigée par Sam Altman va avoir accès aux échanges des utilisateurs du réseau social pour entraîner ses modèles d'intelligence artificielle générative. En échange, Reddit va ajouter des outils d'IA à sa plateforme de discussions pour les utilisateurs et les modérateurs, des fonctionnalités qui reposeront sur les modèles d'OpenAI.

Les deux entreprises ont annoncé l'accord jeudi, sans divulguer de montant. OpenAI a aussi précisé dans son communiqué que son cofondateur Sam Altman, est également actionnaire de Reddit.

« Reddit est devenue l'une des plus grandes archives ouvertes de conversations humaines authentiques, pertinentes et toujours à jour sur tout et n'importe quoi », a déclaré le patron de Reddit, Steve Huffman, cité dans le communiqué. « L'inclure dans ChatGPT (...) va aider les gens à trouver plus facilement ce qu'ils cherchent sur internet, et aider de nouveaux publics à trouver leur communauté sur Reddit. »

OpenAI deviendra en outre un partenaire publicitaire de Reddit. La plateforme a déjà passé un accord similaire avec Google en février.

Reddit est constitué de sous-groupes ou communautés - les subbreddits - modérés par leurs créateurs, dont certains deviennent de vraies vedettes de la toile. Certaines communautés attirent des dizaines de millions d'utilisateurs. Mais, malgré son succès auprès du public, il n'a jamais réussi à dégager de profits, et ses dirigeants cherchent à tirer parti des besoins des géants technologiques en matières premières - les contenus créés par des humains - pour entraîner leurs modèles d'IA générative. La société a tout de même perdu 90,8 millions de dollars en 2023 et 158,6 millions l'année précédente. Lors de son entrée à la Bourse de New York, en mars dernier, le réseau avait toutefois été valorisé à hauteur de 6.4 milliards d'euros.

Reddit et Open Ai font face à des tollés et des plaintes

En juin 2023, Reddit avait relevé les tarifs demandés aux éditeurs tiers pour utiliser les données et conversations postées sur ses forums, afin d'empêcher les géants du secteur (OpenAI, Google, Microsoft...) d'exploiter gratuitement ces contenus. La décision avait suscité un tollé, car de nombreux petits développeurs ont conçu des applications liées à la plateforme sur la base de prix modérés, voire de l'accès gratuit à son interface de programmation (API).

Lire aussiReddit, porté par la vague de l'intelligence artificielle, mise sur une valorisation optimiste

De son côté, OpenAI fait de son côté face à une plainte du New York Times, qui l'accuse d'avoir violé ses droits d'auteur pour alimenter son modèle. L'entreprise a contre-attaqué en justice fin février, accusant le quotidien américain d'avoir « piraté » son interface star d'intelligence artificielle (IA) générative, ChatGPT, pour produire des « résultats hautement anormaux ».

« Contrairement aux allégations (...), ChatGPT n'est en aucun cas un substitut à l'abonnement au New York Times. (...) Dans le cours normal des choses, on ne peut pas utiliser ChatGPT pour servir des articles du Times à volonté », argumentait la start-up californienne.

D'autres organisations et personnes ont lancé des poursuites similaires contre des entreprises d'IA générative, dont l'auteur de « Game of Thrones », George R.R. Martin, contre OpenAI.

(Avec AFP)

Sujets les + lus

|

Sujets les + commentés

Commentaires 2
à écrit le 17/05/2024 à 13:43
Signaler
Comme cela on est certain que l'IA qui domine le marché pensera et interagira avec la "culture" américaine : merci qui ? Merci la CNIL

à écrit le 17/05/2024 à 10:36
Signaler
"d'avoir pillé internet" Mais quand vont ils comprendre que internet est un réseau "peer to peer" ? Qu'au final ce sont bel et bien les droits à la propriété qui y sont l'anomalie, cela a été crée et ne peut que fonctionner comme cela.

Votre email ne sera pas affiché publiquement.
Tous les champs sont obligatoires.

-

Merci pour votre commentaire. Il sera visible prochainement sous réserve de validation.