« Le 18-25 et l'IA » : différence entre les versions
(hyperlien dans source) |
(précision) |
||
| (Une version intermédiaire par le même utilisateur non affichée) | |||
| Ligne 6 : | Ligne 6 : | ||
* Topics à l'aide d'IA | * Topics à l'aide d'IA | ||
== Découverte de l'IA == | |||
En novembre [[Histoire du Blabla 18-25 ans en 2022|2022]], les forumeurs découvrent en même temps que le reste du public mondial les LLMs publiquement accessibles comme ChatGPT<ref>https://www.jeuxvideo.com/forums/42-51-71312778-1-0-1-0-openai-je-suis-devenu-accro-a-chatgpt-et-minvente-des-histoires-de-cul.htm</ref><ref>https://www.jeuxvideo.com/forums/42-51-71280834-1-0-1-0-openai-pire-que-le-porn-ma-boucle-dure-depuis-des-jours.htm</ref>. | |||
== Topics à l'aide de l'IA == | == Topics à l'aide de l'IA == | ||
| Ligne 16 : | Ligne 18 : | ||
== Le forum en tant que jeu de données == | == Le forum en tant que jeu de données == | ||
Tout au long de la vie du forum, des initiatives visant à archiver les messages postés (rendus particulièrement éphémères suite à l'[[Nadia Daam|affaire Nadia Daam]] en [[Histoire du Blabla 18-25 ans en 2017|2017]]) sont apparues. Parmi celles-ci, [[JvArchive|JVArchive]] a la particularité de fournir une archive publique de la majorité des messages postés depuis fin [[Histoire du Blabla 18-25 ans en 2020|2020]]. Mis à jour mensuellement, ce ''dump'' contient plus de 120 000 000 de messages, répartis en 7 500 000 [[topics]] sur lesquels ont participé plus de 800 000 [[pseudos]]. Ces données ont été exploitées dans l'entraînement de plusieurs modèles | Tout au long de la vie du forum, des initiatives visant à archiver les messages postés (rendus particulièrement éphémères suite à l'[[Nadia Daam|affaire Nadia Daam]] en [[Histoire du Blabla 18-25 ans en 2017|2017]]) sont apparues. Parmi celles-ci, [[JvArchive|JVArchive]] a la particularité de fournir une archive publique de la majorité des messages postés depuis fin [[Histoire du Blabla 18-25 ans en 2020|2020]]. Mis à jour mensuellement, ce ''dump'' contient plus de 120 000 000 de messages, répartis en 7 500 000 [[topics]] sur lesquels ont participé plus de 800 000 [[pseudos]]. Ces données ont été exploitées dans l'entraînement de plusieurs outils et modèles : | ||
=== JVCGPT === | === JVCGPT === | ||
Dernière version du 20 janvier 2026 à 23:18
Page sur les usages et la perception de l'IA générative par le 18-25
- Découverte de ChatGPT à sa sortie en 2022.
- Topics à l'aide d'IA
Découverte de l'IA[modifier | modifier le wikicode]
En novembre 2022, les forumeurs découvrent en même temps que le reste du public mondial les LLMs publiquement accessibles comme ChatGPT[1][2].
Topics à l'aide de l'IA[modifier | modifier le wikicode]
Le 4 novembre 2025, MOYAONAAAA publie un topic [JvArchive] où il parodie par un streamable les vidéos d'influenceurs souvent maghrébins, vantant les mérites de fast-food aux innovations douteuses.
Le 2 décembre 2025, celestin0
publie un topic [JvArchive] où il fait analyser à ChatGPT le forum, ses membres et certaines attitudes des kheys entre autres. Le topic suscite rapidement l'hilarité tant l'analyse de l'IA s'avère mordante, mais particulièrement efficace, allant jusqu'à fouillant les contenus des différents topics. Plusieurs khey publient "toast" afin que l'IA analyse leur comportement sur le forum, à leurs risques et périls.)
Le 2 janvier 2026, plusieurs vidéos visant à se moquer des quoicoubeh insouciants face au départ de feu lors de l'incendie mortel à Crans-Montana sont générées[3][4][5].
Le forum en tant que jeu de données[modifier | modifier le wikicode]
Tout au long de la vie du forum, des initiatives visant à archiver les messages postés (rendus particulièrement éphémères suite à l'affaire Nadia Daam en 2017) sont apparues. Parmi celles-ci, JVArchive a la particularité de fournir une archive publique de la majorité des messages postés depuis fin 2020. Mis à jour mensuellement, ce dump contient plus de 120 000 000 de messages, répartis en 7 500 000 topics sur lesquels ont participé plus de 800 000 pseudos. Ces données ont été exploitées dans l'entraînement de plusieurs outils et modèles :
JVCGPT[modifier | modifier le wikicode]
Début 2025, le forumeur Undi présente au forum JVCGPT, un modèle de langage entraîné sur les dumps de JVArchive. Co-développé avec Greums, celui-ci a pour but d'imiter le phrasé, les reférences et le format d'expression d'un ou plusieurs forumeurs du 18-25. Une version intitulée JVCGPT mini 3B sort en janvier.
ToxiFrench[modifier | modifier le wikicode]
Mi-2025, le chercheur Axel Delaval publie un papier scientifique intitulé ToxiFrench: Benchmarking and Enhancing Language Models via CoT Fine-Tuning for French Toxicity Detection portant sur la construction d'une collection de phrases de benchmark utilisées pour mesurer la détection par LLM de phrases toxiques dans des messages en français. Un dump public de jeuxvideo.com y est cité comme source de contenu non-filtré portant sur des sujets variés[6].
Références[modifier le wikicode]
- ↑ https://www.jeuxvideo.com/forums/42-51-71312778-1-0-1-0-openai-je-suis-devenu-accro-a-chatgpt-et-minvente-des-histoires-de-cul.htm [JvArchive]
- ↑ https://www.jeuxvideo.com/forums/42-51-71280834-1-0-1-0-openai-pire-que-le-porn-ma-boucle-dure-depuis-des-jours.htm [JvArchive]
- ↑ https://streamable.com/xeicfz
- ↑ https://streamable.com/g22r2v
- ↑ https://streamable.com/6sv6jv
- ↑ Axel Delaval et al., “ToxiFrench: Benchmarking and Enhancing Language Models via CoT Fine-Tuning for French Toxicity Detection,” arXiv.org, August 15, 2025, https://arxiv.org/abs/2508.11281.