« Le 18-25 et l'IA » : différence entre les versions

précision
(petit paragraphe sur l'arrivée de ChatGPT en 2022.)
(précision)
 
Ligne 18 : Ligne 18 :


== Le forum en tant que jeu de données ==
== Le forum en tant que jeu de données ==
Tout au long de la vie du forum, des initiatives visant à archiver les messages postés (rendus particulièrement éphémères suite à l'[[Nadia Daam|affaire Nadia Daam]] en [[Histoire du Blabla 18-25 ans en 2017|2017]]) sont apparues. Parmi celles-ci, [[JvArchive|JVArchive]] a la particularité de fournir une archive publique de la majorité des messages postés depuis fin [[Histoire du Blabla 18-25 ans en 2020|2020]]. Mis à jour mensuellement, ce ''dump'' contient plus de 120 000 000 de messages, répartis en 7 500 000 [[topics]] sur lesquels ont participé plus de 800 000 [[pseudos]]. Ces données ont été exploitées dans l'entraînement de plusieurs modèles de langage :  
Tout au long de la vie du forum, des initiatives visant à archiver les messages postés (rendus particulièrement éphémères suite à l'[[Nadia Daam|affaire Nadia Daam]] en [[Histoire du Blabla 18-25 ans en 2017|2017]]) sont apparues. Parmi celles-ci, [[JvArchive|JVArchive]] a la particularité de fournir une archive publique de la majorité des messages postés depuis fin [[Histoire du Blabla 18-25 ans en 2020|2020]]. Mis à jour mensuellement, ce ''dump'' contient plus de 120 000 000 de messages, répartis en 7 500 000 [[topics]] sur lesquels ont participé plus de 800 000 [[pseudos]]. Ces données ont été exploitées dans l'entraînement de plusieurs outils et modèles :  


=== JVCGPT ===
=== JVCGPT ===
3 085

modifications