« JvArchive » : différence entre les versions

De JVFlux
user: 63065c4 (?)
Aucun résumé des modifications
Balises : Révoqué (en savoir plus) Via portable Via portable
user: 5ca841c (?)
 
(90 versions intermédiaires par 42 utilisateurs non affichées)
Ligne 5 : Ligne 5 :
| '''Ouverture''' || align="center" | Mars 2021
| '''Ouverture''' || align="center" | Mars 2021
|-
|-
| '''URL''' || align="center" | https://jvarchive.com/
| '''URL''' || align="center" | https://jvarchive.st/
|-
|-
|}
|}


[https://jvarchive.com '''JvArchive'''] est un site archivant les [[topics]] du [[Blabla 18-25 ans|forum 18-25]] afin que ceux-ci restent accessibles en cas de [[suppression]] (par la modération de [[jeuxvideo.com]] ou par l'[[auteur]] du topic).
'''[https://jvarchive.st JvArchive]''', est un site archivant les [[topics]] du [[Blabla 18-25 ans|forum 18-25]] afin que ceux-ci restent accessibles en cas de [[suppression]] (par la modération de [[jeuxvideo.com]] ou par l'[[auteur]] du topic).


Le site apparaît pour la première fois sur un topic le 4 mars 2021. Celui-ci est très rapidement supprimé, et il n'est plus possible de poster l'URL de JvArchive, celle-ci ayant été ajoutée au bot ''blacklist'' (erreur [[Erreur 500|500]]).
Le site apparaît pour la première fois sur un topic le 4 mars 2021. Celui-ci est très rapidement supprimé, et il n'est plus possible de poster l'URL de JvArchive, celle-ci ayant été ajoutée au bot ''blacklist'' (erreur [[Erreur 500|500]]).


Il s'agit aujourd'hui du [[Sites et outils liés à jeuxvideo.com|site]] le plus visité de la communauté du 18-25<ref>https://www.similarweb.com/fr/website/jvarchive.com/</ref> et fait figure d'outil indispensable pour la plupart des forumeurs actifs<ref>https://jvarchive.com/forums/message/1193719293</ref>.
Il s'agit aujourd'hui du [[Sites et outils liés à jeuxvideo.com|site]] le plus visité de la communauté du 18-25<ref>https://www.similarweb.com/fr/website/jvarchive.com/</ref> et fait figure d'outil indispensable pour la plupart des forumeurs actifs<ref>https://jvarchive.com/forums/message/1193719293</ref>.
L'auteur explique dans la FAQ du site, que son objectif est de sauvegarder au maximum le forum 18-25<ref>https://jvarchive.com/faq</ref>. L'auteur justifie ce projet par la politique de modération violente et diverses actions de [[jeuxvideo.com]] empêchant une bonne préservation des contenus des forums blabla.


Similaire aux projets d'archivage des forumeurs ''RedSky'' et ''Glosoli'', ainsi que de [[Bruiter]], JvArchive est l'archive qui actuellement est restée en ligne le plus longtemps d'entre eux.
Similaire aux projets d'archivage des forumeurs ''RedSky'' et ''Glosoli'', ainsi que de [[Bruiter]], JvArchive est l'archive qui actuellement est restée en ligne le plus longtemps d'entre eux.
e me prives d'actualité et scoops automobiles, Je me prives d'actualités sur spyro 4, Probleme Y:quand on vit en foyer de vie, est il possible d'envoyer sur YouTube et Dè poster sur jeuxvideo.com ? ?? Jerry çâ fait Cômme du liv Ciara feat ludacris Pieds de gwladys pieds de Vera Plus bonbons origiphné Daphne Dè scoobydoo sait que El Mordjene est une marque hard discount
Miaou
Miaou
== Objectif ==
Expliqué par son auteur dans une FAQ présente sur le site<ref>https://jvarchive.com/faq</ref>, l'objectif du site est de sauvegarder un maximum le forum 18-25. L'auteur justifie ce projet par la politique de modération violente et diverses actions de [[jeuxvideo.com]] empêchant une bonne préservation des contenus des forums blabla.


== Fonctionnement ==
== Fonctionnement ==
Un crawler parcours le forum sans interruption et archive les topics qui apparaissent dans les premières pages de la liste des sujets. Pour cette raison les anciens topics précédents la mise en place du site ne sont pas archivés pour la plupart. Certains forumeurs peuvent d'ailleurs [[Up|upper]] volontairement un ancien topic afin que JVArchive le remarque et l'archive.
Un crawler parcourt le forum sans interruption et archive les ''topics'' qui apparaissent dans les premières pages de la liste des sujets. Pour cette raison les anciens topics précédents la mise en place du site ne sont pas archivés pour la plupart. Certains forumeurs peuvent d'ailleurs [[Up|upper]] volontairement un ancien topic afin que JVArchive le remarque et l'archive.


Dans certains cas il arrive que le ''crawler'' n'ait pas pu archiver le contenu d'un topic ou d'un message si sa [[suppression]] fut trop rapide. Les [[Sondage|sondages]] ne sont pas non plus archivés.
Dans certains cas il arrive que le ''crawler'' n'ait pas pu archiver le contenu d'un topic ou d'un message si sa [[suppression]] fut trop rapide. Les [[Sondage|sondages]] ne sont pas non plus archivés.
Ligne 36 : Ligne 29 :


=== Hébergement et détails ===
=== Hébergement et détails ===
[[Fichier:Capture d’écran 2022-09-13 à 12.37.56.png|vignette|L'erreur 500 sur le site. Comme souvent un sticker est là pour illustrer.]]D'après le [https://who.is/whois/jvarchive.com WHOIS] du site, le [https://www.wikiwand.com/fr/Registrar registraire] est [https://www.wikiwand.com/fr/Tucows Tucows]
[[Fichier:Capture d’écran 2022-09-13 à 12.37.56.png|vignette|L'erreur 500 sur le site. Comme souvent un sticker est là pour illustrer.]]D'après le [https://who.is/whois/jvarchive.com WHOIS] du site, le [https://www.wikiwand.com/fr/Registrar registraire] est [https://www.wikiwand.com/fr/Tucows Tucows]. Pour des raisons légales évidentes, le site n'est pas hébergé dans l'Union européenne. Selon certains il est hébergé aux États Unis ou en Finlande<ref>https://www.jeuxvideo.com/forums/message/1232139067</ref>. D'autres évoquent une île des caraïbes comme hébergeur en offshore combiné à un fournisseur canadien<ref>https://www.jeuxvideo.com/forums/message/1143134376</ref>. <blockquote>''Il faut savoir que les archives JVC type JVA, ça utilise des IP rotatives. En fait, quand le script qui gère l'archivage fait une requête vers JVC, il change immédiatement d'IP. Donc le ban IP est impossible, et la localisation de la source aussi. Les IP sont majoritairement des proxys random trouvés sur Internet, souvent créés accidentellement.''</blockquote>
 
Pour des raisons légales évidentes, le site n'est pas hébergé dans l'Union européenne. Selon certains il est hébergé aux États Unis ou en Finlande<ref>https://www.jeuxvideo.com/forums/message/1232139067</ref>. <blockquote>''Il faut savoir que les archives JVC type JVA, ça utilise des IP rotatives. En fait, quand le script qui gère l'archivage fait une requête vers JVC, il change immédiatement d'IP. Donc le ban IP est impossible, et la localisation de la source aussi. Les IP sont majoritairement des proxys random trouvés sur Internet, souvent créés accidentellement.''</blockquote>


=== Modération et Admin ===
=== Modération et Admin ===
Ligne 45 : Ligne 36 :
L'admin de JvArchive a gardé un anonymat parfait et ne peut être joint qu'à travers l'adresse mail laissée sur le site : ''jvarchive @ protonmail.com.''
L'admin de JvArchive a gardé un anonymat parfait et ne peut être joint qu'à travers l'adresse mail laissée sur le site : ''jvarchive @ protonmail.com.''


=== API et Données publiques ===
=== API ===
JvArchive met à disposition du public une API utilisable gratuitement<ref>https://jvarchive.com/swagger-ui</ref>. En dehors du site, elle est notamment utilisée par les userscripts [[Deboucled|Déboucled]] et l'extension officielle "''JvArchive Compagnon''".
JvArchive met à disposition du public une API utilisable gratuitement<ref>https://jvarchive.com/swagger-ui</ref>. En dehors du site, elle est notamment utilisée par les userscripts [[Deboucled|Déboucled]] et l'extension officielle "''JvArchive Compagnon''".


Le site propose également des [https://jvarchive.com/backup bases de données publiques] sous format CSV, accessibles sur la Wayback Machine.
=== Archives publiques ===
JvArchive propose des archives complètes du 18-25 comprenant l'intégralité des messages depuis le début de Respawn (donc aux alentours de 2014). On y obtient également les topics, des flags qui indiquent si les topics ont été supprimés ou non par l'auteur ou la modération, et on a également une liste de pseudos avec leur ID associé.
Il est possible d'importer les archives en question dans une base PostgreSQL afin de pouvoir les traiter comme désiré.
Les archives étant au format CSV, elles peuvent être importées dans des tables avec la fonction COPY de PostgreSQL.
 
Voici un schéma facilement compatible avec les dumps JvArchive : https://pastebin.com/EzNgjqKG
 
Notez que les dumps étants lourds (environ 50 Go de messages à traiter), il est recommandé d'utiliser au maximum des index et le tout sur une machine haute performance côté disque (de préférence un RAID de disques SAS, ou du NVMe).
 
A noter qu'il est inutile d'importer chaque dump pour obtenir l'intégralité des messages du 18-25. Le dernier dump publié sur le site, comprend l'intégralité des messages du 18-25.
 
== Critiques ==
Un certain nombre de forumeurs indiquent ne pas se sentir tranquille à l'idée que JvArchive enregistre tous leurs posts et qu'on puisse retrouver facilement tout ce qu'ils ont écrit sur le forum grâce au site, malgré les suppressions<ref>https://jvarchive.com/forums/message/1193719077</ref><ref>https://jvarchive.com/forums/42-51-69786451-1-0-1-0-pas-moyen-de-supprimer-ses-topics-sur-jvarchive</ref><ref>https://jvarchive.com/forums/42-51-69740705-2-0-1-0-on-en-talk-de-jvarchive-qui-sauvegarde-tout</ref>. De plus, JvArchive conserve et diffuse publiquement les topics supprimés par leurs [[Auteur|auteurs]] et non par la modération<ref>https://www.jeuxvideo.com/forums/message/1140111938</ref>.
 
De plus, l'automatisation du site fait que JvArchive est amené à héberger tous les contenus supprimés, sans distinction, même si ils l'ont été légitimement comme par exemple les images et liens pédophiles, les contenus terroristes, les appels aux meurtres, les harcèlements en tout genre et les données personnelles (dox). Ces messages, liens et images problématiques ne sont pas toujours supprimés de JvArchive. Toutefois le créateur du site explique supprimer du mieux qu'il peut ce type de contenu notamment le contenu pédophile<ref>Page entière, le webmaster de JVArchive écrit sous le pseudo  ''OgpzuFezFd :''
 
https://www.jeuxvideo.com/forums/42-1000021-67105829-3-0-1-0-vous-comptez-faire-quelque-chose-contre-jvarchive.htm</ref>.
 
Certains affirment que bien que les signalements soient possibles via mail, il arrive souvent qu'aucune suite ne soit donnée{{Commentaire|Source requise=oui}}.
 
== Théories concernant l'administrateur ==
<p>L'identité de l'administrateur du site est une énigme. Néanmoins, des kheys enquêteurs{{Commentaire|Autre=Qui ?}} ont remarqué qu'un forumeur du [[Blabla 18-25 ans|18-25]] ''MacroidVirale'' avait utilisé l'expression "''tout simpletèrent''" le 8 avril 2021 dans un message<ref>https://www.jeuxvideo.com/forums/message/1110202529</ref>, tout comme l'administrateur de JvArchive sur un topic d'Avenoel<ref>https://avenoel.org/message/12605994</ref>.</p>
 
<p>Cette expression très singulière pourrait être une simple coïncidence dûe à un correcteur automatique ne reconnaissant pas l'expression "''tout simplement''" et proposant "''simpletèrent''" à la place, qui est une conjugaison au passé simple du verbe ''simpleter''<ref>https://fr.bab.la/conjugaison/francais/simpleter</ref>. Toutefois la présence des mêmes fautes d'orthographe et des mêmes stickers entre les deux comptes{{Commentaire|Autre=Expliciter les fautes et stickers communs svp}} fit penser à certains kheys qu'il pourrait être le compte derrière JvArchive<ref>[[Discussion:JvArchive#Théories concernant l'administrateur]]</ref>.</p>
 
Ils ont aussi relevé l'historique de ses messages<ref>https://justpaste.it/3gvsf</ref>.


==Histoire==
==Histoire==
Ligne 58 : Ligne 74 :
===2021===
===2021===


* Le 26 février le nom de domaine est enregistré.
* '''Le 26 février,''' le nom de domaine est enregistré.
* Le 4 mars 2021, le premier topic diffusant l'URL est créé.
* '''Le 4 mars,''' le premier topic diffusant l'URL est créé.


===2022===
===2022===


==== Webedia contre-attaque ====
==== Webedia contre-attaque ====
* Le 13 juillet 2022, un message d'alerte est affiché sur la page d'accueil de JvArchive. Ce message indique que le crawler utilisé pour extraire les données en provenance du forum 18-25 de Jeuxvideo.com a été bloqué par [[Webedia]], rendant l'archivage des topics impossible.
* '''Le 13 juillet''', un message d'alerte est affiché sur la page d'accueil de JvArchive. Ce message indique que le crawler utilisé pour extraire les données en provenance du forum 18-25 de Jeuxvideo.com a été bloqué par [[Webedia]], rendant l'archivage des topics impossible.
* Le 17 juillet 2022, l'accès au site est rétabli (soit une interruption de 5 jours), mais le crawler de JvArchive se voit de nouveau très rapidement bloqué par Webedia.
* '''Le 17 juillet''', l'accès au site est rétabli (soit une interruption de 5 jours), mais le crawler de JvArchive se voit de nouveau très rapidement bloqué par Webedia.
* Le 21 juillet 2022, un message d'alerte est de nouveau affiché sur la page d'accueil de JvArchive, pour le même motif que le 13 juillet (blocage par Webedia). Les blocages menés par Webedia sont basés sur la protection applicative du service Cloudflare : lorsqu'une requête ou une IP source est suspecte, la requête HTTP est interceptée et réclame un captcha ou est tout simplement bloquée ([[Erreur 1020]]), bloquant en conséquence le crawler de JvArchive. A partir de cette période, le crawler de JvArchive commence à rencontrer de sérieuses difficultés pour atteindre le 18-25 : on peut constater des archivages totalement aléatoires, à n'importe quelle heure de la journée, de très courte durée.
* '''Le 21 juillet''', un message d'alerte est de nouveau affiché sur la page d'accueil de JvArchive, pour le même motif que le 13 juillet (blocage par Webedia). Les blocages menés par Webedia sont basés sur la protection applicative du service Cloudflare : lorsqu'une requête ou une IP source est suspecte, la requête HTTP est interceptée et réclame un captcha ou est tout simplement bloquée ([[Erreur 1020]]), bloquant en conséquence le crawler de JvArchive. A partir de cette période, le crawler de JvArchive commence à rencontrer de sérieuses difficultés pour atteindre le 18-25 : on peut constater des archivages totalement aléatoires, à n'importe quelle heure de la journée, de très courte durée.
* Le 23 juillet 2022, JvArchive est de nouveau fonctionnel aux alentours de minuit, mettant à bas les efforts de Webedia malgré leurs diverses tentatives de blocage, ainsi que l'aide d'[[AntoineForum]] - [https://jvarchive.com/forums/42-51-70246678-1-0-1-0-cloudflare-nouvelles-recommandations-a-webedia <nowiki>[CLOUDFLARE] Nouvelles recommandations à Webedia</nowiki>]
* '''Le 23 juillet''', JvArchive est de nouveau fonctionnel aux alentours de minuit, mettant à bas les efforts de Webedia malgré leurs diverses tentatives de blocage, ainsi que l'aide d'[[AntoineForum]] - [https://jvarchive.com/forums/42-51-70246678-1-0-1-0-cloudflare-nouvelles-recommandations-a-webedia <nowiki>[CLOUDFLARE] Nouvelles recommandations à Webedia</nowiki>]
* Le 24 juillet 2022, JvArchive sort officiellement de "maintenance" et indique ouvertement que Webedia tente tant bien que mal à contrer le crawler associé au site. Une requête de soutien du site en crypto est mise en avant pour l'occasion.
* '''Le 24 juillet,''' JvArchive sort officiellement de "maintenance" et indique ouvertement que Webedia tente tant bien que mal à contrer le crawler associé au site. Une requête de soutien du site en crypto est mise en avant pour l'occasion.
* Le 25 juillet 2022, étant pour anecdote un jour ouvrable (un lundi, signant le retour de l'équipe technique de Webedia), le crawler de JvArchive se voit à nouveau bloqué aux alentours de 9h40. Il est de retour dans la soirée vers 21h00, mettant de nouveau à mal les efforts de Webedia.
* '''Le 25 juillet,''' étant pour anecdote un jour ouvrable (un lundi, signant le retour de l'équipe technique de Webedia), le crawler de JvArchive se voit à nouveau bloqué aux alentours de 9h40. Il est de retour dans la soirée vers 21h00, mettant de nouveau à mal les efforts de Webedia.
* Le 26 juillet 2022 vers 13h00, le site est de nouveau bloqué, provoquant un suspens intense.
* '''Le 26 juillet''' vers 13h00, le site est de nouveau bloqué, provoquant un suspens intense.
* Depuis le 30 juillet, l'archivage semble refonctionner, les perturbations étant rares et de courte durée.
* '''Depuis le 30 juillet,''' l'archivage semble refonctionner, les perturbations étant rares et de courte durée.


* Depuis le 6 août à 3h du matin, le service rencontre une nouvelle perturbation sérieuse, empêchant l'archivage des topics. L'archivage repris à 13h.
* '''Depuis le 6 août''' à 3h du matin, le service rencontre une nouvelle perturbation sérieuse, empêchant l'archivage des topics. L'archivage repris à 13h.


==== Fonctionnalité "voyage dans la [[boucle]]" ====
==== Fonctionnalité "voyage dans la [[boucle]]" ====
Ligne 82 : Ligne 98 :


==== Désaveu de Webedia ====
==== Désaveu de Webedia ====
'''Le 24 août 2022''' le [https://www.jeuxvideo.com/forums/42-1000021-66741506-1-0-1-0-jvc-tolere-jvarchive.htm <nowiki>topic</nowiki>] parlant de JVArchive, sur le [[Communauté (forum)|forum communauté]], est [[lock]] par la modération. Plusieurs messages critiquant l'échec cuisant de Webedia se voient supprimés. Cet action est perçue comme un aveu de faiblesse de la part de Webedia signifiant indirectement que tous leurs efforts ont été vains et réduits à néant.
'''Le 24 août''' le [https://www.jeuxvideo.com/forums/42-1000021-66741506-1-0-1-0-jvc-tolere-jvarchive.htm <nowiki>topic</nowiki>] parlant de JVArchive, sur le [[Communauté (forum)|forum communauté]], est [[lock]] par la modération. Plusieurs messages critiquant l'échec cuisant de Webedia se voient supprimés. Cet action est perçue comme un aveu de faiblesse de la part de Webedia signifiant indirectement que tous leurs efforts ont été vains et réduits à néant.


=== 2023 ===
=== 2023 ===


* Le '''20 Mars 2023''', un compteur de connectés est ajouté au site.
* '''Le 20 mars''', un compteur de connectés est ajouté au site.
* Le '''24 septembre 2023''', un mode [[fic]] est ajouté au site. Il permet d'afficher uniquement les posts de l'[[auteur]] afin de pouvoir suivre les topics plus facilement
* '''Le 24 septembre''', un mode [[fic]] est ajouté au site. Il permet d'afficher uniquement les posts de l'[[auteur]] afin de pouvoir suivre les topics plus facilement
 
=== 2024 ===
 
* '''Le 29 novembre''', JvArchive est down. Mais est restauré quelques heures plus tard.
* '''Le 14 décembre''', le [https://fr.wikipedia.org/wiki/Web_scraping scraping] est arrêté à la suite de la mise en place de fonctionnalités anti-bot avec Cloudflare, qui provoque une navigation compliquée pour certains utilisateurs. Il est rétabli le lendemain.
* '''Du 19 décembre au 22 décembre''', suite à un nouveau changement de JVC, beaucoup de topics apparaissent avec le statut "supprimé" dans JVA malgré leurs disponibilité sur JVC. JVC renvoyant des erreurs "410 gone" sur certains navigateurs. Ça semble patché sur JVA après le 22 mais le soucis persiste sur JVC.
 
=== 2025 ===


== Critiques ==
* '''Depuis le 30 décembre 2024''', le domaine de JvArchive est désactivé<ref name=":0" /> et n'est donc plus accessible en clair. Celui-ci expirant normalement en février 2025<ref name=":1" />, cette perturbation pourrait être le fruit d'une enquête de [[PHAROS]] ou d'une action de la DGSI suite à une plainte déposée par [[Webedia]]. Cependant, le serveur est toujours actif. Le site est accessible soit via TOR soit via une manipulation décrite plus bas.
Un certain nombre de forumeurs indiquent ne pas se sentir tranquille à l'idée que JvArchive enregistre tous leurs posts et qu'on puisse retrouver facilement tout ce qu'ils ont écris sur le forum grâce au site, malgré les suppressions<ref>https://jvarchive.com/forums/message/1193719077</ref><ref>https://jvarchive.com/forums/42-51-69786451-1-0-1-0-pas-moyen-de-supprimer-ses-topics-sur-jvarchive</ref><ref>https://jvarchive.com/forums/42-51-69740705-2-0-1-0-on-en-talk-de-jvarchive-qui-sauvegarde-tout</ref>.
* '''Depuis le 7 janvier''', le domaine de JvArchive est est de retour.
* '''Le 10 janvier''', après été avoir une nouvelle fois désactivé, JvArchive revient sous un autre domaine : https://jvarchive.st/.
* '''Le 25 janvier''' vers 9h15, l'archivage des topics est interrompu bien que le domaine reste opérationnel, le scraping reprend le '''26 janvier''' vers 18h.
* '''Le 05 février''' vers 9h54, l'archivage des topics est de nouveau interrompu, il reprend le '''06 février''' vers 21h.
* '''Le 17 février,''' le domaine jvarchive.com réapparaît et redirige vers jvarchive.st


== Perturbations en juillet 2022 ==
== Perturbations en juillet 2022 ==
Ligne 103 : Ligne 131 :


Il se pourrait qu'à l'avenir, [[Webedia]] en vienne à prendre d'autres mesures visant à casser le script d'archivage (HTML, paramètres de protection contre les bots etc.) tout en maintenant les autres mesures de protection, provoquant un épuisement des développeurs, une stratégie déjà utilisée par Webedia pour [[JV Parallele|JV Parallèle.]] et qui serait probablement applicable à JvArchive.
Il se pourrait qu'à l'avenir, [[Webedia]] en vienne à prendre d'autres mesures visant à casser le script d'archivage (HTML, paramètres de protection contre les bots etc.) tout en maintenant les autres mesures de protection, provoquant un épuisement des développeurs, une stratégie déjà utilisée par Webedia pour [[JV Parallele|JV Parallèle.]] et qui serait probablement applicable à JvArchive.
==Accès détourné==
===Accès via Tor===
http://jvarch5snkl25gv6vd4ab3qv4prhpcvnvpiyenf5mh4j43t7n43zrqid.onion/
==Miroirs==


== Archives publiques ==
JvArchive rend ses données publiques. De fait, il est possible de créer des miroirs de JvArchive. A ce jour, le seul miroir connu de JvArchive était [[Geevey.com]], fermé début 2025.
 
JvArchive propose des archives complètes du 18-25 comprenant l'intégralité des messages depuis le début de Respawn (donc aux alentours de 2014). On y obtient également les topics, des flags qui indiquent si les topics ont été supprimés ou non par l'auteur ou la modération, et on a également une liste de pseudos avec leur ID associé.
Il est possible d'importer les archives en question dans une base PostgreSQL afin de pouvoir les traiter comme désiré.
Les archives étant au format CSV, elles peuvent être importées dans des tables avec la fonction COPY de PostgreSQL.
 
Voici un schéma facilement compatible avec les dumps JvArchive : https://pastebin.com/EzNgjqKG
 
Notez que les dumps étants lourds (environ 50 Go de messages à traiter), il est recommandé d'utiliser au maximum des index et le tout sur une machine haute performance côté disque (de préférence un RAID de disques SAS, ou du NVMe).
 
À ce jour, les dumps ne sont plus mis à jour. JvArchive semble être abandonné, les derniers dumps datent de juin 2024, et les anciens dumps ont été DMCA par Webedia.
 
A noter qu'il est inutile d'importer chaque dump pour obtenir l'intégralité des messages du 18-25. Le dernier dump publié sur le site, comprend l'intégralité des messages du 18-25.
 
== Liens externes ==
* [http://www.jvarchive.com '''JvArchive.com''']


{{SectionRéférences}}
{{SectionRéférences}}

Dernière version du 6 mars 2025 à 23:31

logo.6c9b3f8.jpg
JvArchive
Ouverture Mars 2021
URL https://jvarchive.st/

JvArchive, est un site archivant les topics du forum 18-25 afin que ceux-ci restent accessibles en cas de suppression (par la modération de jeuxvideo.com ou par l'auteur du topic).

Le site apparaît pour la première fois sur un topic le 4 mars 2021. Celui-ci est très rapidement supprimé, et il n'est plus possible de poster l'URL de JvArchive, celle-ci ayant été ajoutée au bot blacklist (erreur 500).

Il s'agit aujourd'hui du site le plus visité de la communauté du 18-25[1] et fait figure d'outil indispensable pour la plupart des forumeurs actifs[2].

L'auteur explique dans la FAQ du site, que son objectif est de sauvegarder au maximum le forum 18-25[3]. L'auteur justifie ce projet par la politique de modération violente et diverses actions de jeuxvideo.com empêchant une bonne préservation des contenus des forums blabla.

Similaire aux projets d'archivage des forumeurs RedSky et Glosoli, ainsi que de Bruiter, JvArchive est l'archive qui actuellement est restée en ligne le plus longtemps d'entre eux.

Fonctionnement[modifier | modifier le wikicode]

Un crawler parcourt le forum sans interruption et archive les topics qui apparaissent dans les premières pages de la liste des sujets. Pour cette raison les anciens topics précédents la mise en place du site ne sont pas archivés pour la plupart. Certains forumeurs peuvent d'ailleurs upper volontairement un ancien topic afin que JVArchive le remarque et l'archive.

Dans certains cas il arrive que le crawler n'ait pas pu archiver le contenu d'un topic ou d'un message si sa suppression fut trop rapide. Les sondages ne sont pas non plus archivés.

Pour obtenir la version archivée d'un topic du 18-25, il suffit de remplacer dans l'url du topic "jeuxvideo.com" par "jvarchive.com". La démarche est la même pour obtenir le lien permanent d'un message du 18-25, ou bien le profil d'un utilisateur ayant posté au moins une fois sur le forum.

Il est possible d'effectuer une recherche de topic dans toute la base de donnée, mais aussi de trouver tous les topics créés par un forumeur particulier en cherchant son pseudo. Pour l'instant les résultats ne sont classables que par un seul paramètre : si ils ont été supprimés sur jeuxvideo.com ou non. Il n'est pas encore possible d'effectuer une recherche par message, ou par date.

Hébergement et détails[modifier | modifier le wikicode]

L'erreur 500 sur le site. Comme souvent un sticker est là pour illustrer.

D'après le WHOIS du site, le registraire est Tucows. Pour des raisons légales évidentes, le site n'est pas hébergé dans l'Union européenne. Selon certains il est hébergé aux États Unis ou en Finlande[4]. D'autres évoquent une île des caraïbes comme hébergeur en offshore combiné à un fournisseur canadien[5].

Il faut savoir que les archives JVC type JVA, ça utilise des IP rotatives. En fait, quand le script qui gère l'archivage fait une requête vers JVC, il change immédiatement d'IP. Donc le ban IP est impossible, et la localisation de la source aussi. Les IP sont majoritairement des proxys random trouvés sur Internet, souvent créés accidentellement.

Modération et Admin[modifier | modifier le wikicode]

Le site indique procéder à une modération légère: Fraude, pédopornographie et terrorisme uniquement. À noter qu'en cas de suppression, c'est uniquement les posts concernés qui sautent et non les topics entiers.

L'admin de JvArchive a gardé un anonymat parfait et ne peut être joint qu'à travers l'adresse mail laissée sur le site : jvarchive @ protonmail.com.

API[modifier | modifier le wikicode]

JvArchive met à disposition du public une API utilisable gratuitement[6]. En dehors du site, elle est notamment utilisée par les userscripts Déboucled et l'extension officielle "JvArchive Compagnon".

Archives publiques[modifier | modifier le wikicode]

JvArchive propose des archives complètes du 18-25 comprenant l'intégralité des messages depuis le début de Respawn (donc aux alentours de 2014). On y obtient également les topics, des flags qui indiquent si les topics ont été supprimés ou non par l'auteur ou la modération, et on a également une liste de pseudos avec leur ID associé. Il est possible d'importer les archives en question dans une base PostgreSQL afin de pouvoir les traiter comme désiré. Les archives étant au format CSV, elles peuvent être importées dans des tables avec la fonction COPY de PostgreSQL.

Voici un schéma facilement compatible avec les dumps JvArchive : https://pastebin.com/EzNgjqKG

Notez que les dumps étants lourds (environ 50 Go de messages à traiter), il est recommandé d'utiliser au maximum des index et le tout sur une machine haute performance côté disque (de préférence un RAID de disques SAS, ou du NVMe).

A noter qu'il est inutile d'importer chaque dump pour obtenir l'intégralité des messages du 18-25. Le dernier dump publié sur le site, comprend l'intégralité des messages du 18-25.

Critiques[modifier | modifier le wikicode]

Un certain nombre de forumeurs indiquent ne pas se sentir tranquille à l'idée que JvArchive enregistre tous leurs posts et qu'on puisse retrouver facilement tout ce qu'ils ont écrit sur le forum grâce au site, malgré les suppressions[7][8][9]. De plus, JvArchive conserve et diffuse publiquement les topics supprimés par leurs auteurs et non par la modération[10].

De plus, l'automatisation du site fait que JvArchive est amené à héberger tous les contenus supprimés, sans distinction, même si ils l'ont été légitimement comme par exemple les images et liens pédophiles, les contenus terroristes, les appels aux meurtres, les harcèlements en tout genre et les données personnelles (dox). Ces messages, liens et images problématiques ne sont pas toujours supprimés de JvArchive. Toutefois le créateur du site explique supprimer du mieux qu'il peut ce type de contenu notamment le contenu pédophile[11].

Certains affirment que bien que les signalements soient possibles via mail, il arrive souvent qu'aucune suite ne soit donnéesommaire puces.pngsource nécessaire.

Théories concernant l'administrateur[modifier | modifier le wikicode]

L'identité de l'administrateur du site est une énigme. Néanmoins, des kheys enquêteurssommaire puces.pngQui ? ont remarqué qu'un forumeur du 18-25 MacroidVirale avait utilisé l'expression "tout simpletèrent" le 8 avril 2021 dans un message[12], tout comme l'administrateur de JvArchive sur un topic d'Avenoel[13].

Cette expression très singulière pourrait être une simple coïncidence dûe à un correcteur automatique ne reconnaissant pas l'expression "tout simplement" et proposant "simpletèrent" à la place, qui est une conjugaison au passé simple du verbe simpleter[14]. Toutefois la présence des mêmes fautes d'orthographe et des mêmes stickers entre les deux comptessommaire puces.pngExpliciter les fautes et stickers communs svp fit penser à certains kheys qu'il pourrait être le compte derrière JvArchive[15].

Ils ont aussi relevé l'historique de ses messages[16].

Histoire[modifier | modifier le wikicode]

2020[modifier | modifier le wikicode]

  • Le site semble avoir commencé à archiver le forum en décembre 2020.

2021[modifier | modifier le wikicode]

  • Le 26 février, le nom de domaine est enregistré.
  • Le 4 mars, le premier topic diffusant l'URL est créé.

2022[modifier | modifier le wikicode]

Webedia contre-attaque[modifier | modifier le wikicode]

  • Le 13 juillet, un message d'alerte est affiché sur la page d'accueil de JvArchive. Ce message indique que le crawler utilisé pour extraire les données en provenance du forum 18-25 de Jeuxvideo.com a été bloqué par Webedia, rendant l'archivage des topics impossible.
  • Le 17 juillet, l'accès au site est rétabli (soit une interruption de 5 jours), mais le crawler de JvArchive se voit de nouveau très rapidement bloqué par Webedia.
  • Le 21 juillet, un message d'alerte est de nouveau affiché sur la page d'accueil de JvArchive, pour le même motif que le 13 juillet (blocage par Webedia). Les blocages menés par Webedia sont basés sur la protection applicative du service Cloudflare : lorsqu'une requête ou une IP source est suspecte, la requête HTTP est interceptée et réclame un captcha ou est tout simplement bloquée (Erreur 1020), bloquant en conséquence le crawler de JvArchive. A partir de cette période, le crawler de JvArchive commence à rencontrer de sérieuses difficultés pour atteindre le 18-25 : on peut constater des archivages totalement aléatoires, à n'importe quelle heure de la journée, de très courte durée.
  • Le 23 juillet, JvArchive est de nouveau fonctionnel aux alentours de minuit, mettant à bas les efforts de Webedia malgré leurs diverses tentatives de blocage, ainsi que l'aide d'AntoineForum - [CLOUDFLARE] Nouvelles recommandations à Webedia
  • Le 24 juillet, JvArchive sort officiellement de "maintenance" et indique ouvertement que Webedia tente tant bien que mal à contrer le crawler associé au site. Une requête de soutien du site en crypto est mise en avant pour l'occasion.
  • Le 25 juillet, étant pour anecdote un jour ouvrable (un lundi, signant le retour de l'équipe technique de Webedia), le crawler de JvArchive se voit à nouveau bloqué aux alentours de 9h40. Il est de retour dans la soirée vers 21h00, mettant de nouveau à mal les efforts de Webedia.
  • Le 26 juillet vers 13h00, le site est de nouveau bloqué, provoquant un suspens intense.
  • Depuis le 30 juillet, l'archivage semble refonctionner, les perturbations étant rares et de courte durée.
  • Depuis le 6 août à 3h du matin, le service rencontre une nouvelle perturbation sérieuse, empêchant l'archivage des topics. L'archivage repris à 13h.

Fonctionnalité "voyage dans la boucle"[modifier | modifier le wikicode]

L'encart annonçant la nouvelle fonctionnalité. Derrière le texte un gif évoquant le délire Zinzin.

Le 16 août le site propose une nouvelle fonctionnalité qui permet de revoir les plus gros topics d'une journée précise, mais aussi d'une semaine ou d'un mois précis dans le passé. Cela permet de retrouver le top topic de journées importantes comme lors du décès de Risitas ou l'élection présidentielle de 2022, mais aussi d'observer l'évolution des topics au fil du temps.

La fonctionnalité affiche également les topics antérieurs à la création de JVArchive lorsque ceux-ci ont été archivés en étant uppés après la création du site.

Désaveu de Webedia[modifier | modifier le wikicode]

Le 24 août le topic parlant de JVArchive, sur le forum communauté, est lock par la modération. Plusieurs messages critiquant l'échec cuisant de Webedia se voient supprimés. Cet action est perçue comme un aveu de faiblesse de la part de Webedia signifiant indirectement que tous leurs efforts ont été vains et réduits à néant.

2023[modifier | modifier le wikicode]

  • Le 20 mars, un compteur de connectés est ajouté au site.
  • Le 24 septembre, un mode fic est ajouté au site. Il permet d'afficher uniquement les posts de l'auteur afin de pouvoir suivre les topics plus facilement

2024[modifier | modifier le wikicode]

  • Le 29 novembre, JvArchive est down. Mais est restauré quelques heures plus tard.
  • Le 14 décembre, le scraping est arrêté à la suite de la mise en place de fonctionnalités anti-bot avec Cloudflare, qui provoque une navigation compliquée pour certains utilisateurs. Il est rétabli le lendemain.
  • Du 19 décembre au 22 décembre, suite à un nouveau changement de JVC, beaucoup de topics apparaissent avec le statut "supprimé" dans JVA malgré leurs disponibilité sur JVC. JVC renvoyant des erreurs "410 gone" sur certains navigateurs. Ça semble patché sur JVA après le 22 mais le soucis persiste sur JVC.

2025[modifier | modifier le wikicode]

  • Depuis le 30 décembre 2024, le domaine de JvArchive est désactivé[17] et n'est donc plus accessible en clair. Celui-ci expirant normalement en février 2025[18], cette perturbation pourrait être le fruit d'une enquête de PHAROS ou d'une action de la DGSI suite à une plainte déposée par Webedia. Cependant, le serveur est toujours actif. Le site est accessible soit via TOR soit via une manipulation décrite plus bas.
  • Depuis le 7 janvier, le domaine de JvArchive est est de retour.
  • Le 10 janvier, après été avoir une nouvelle fois désactivé, JvArchive revient sous un autre domaine : https://jvarchive.st/.
  • Le 25 janvier vers 9h15, l'archivage des topics est interrompu bien que le domaine reste opérationnel, le scraping reprend le 26 janvier vers 18h.
  • Le 05 février vers 9h54, l'archivage des topics est de nouveau interrompu, il reprend le 06 février vers 21h.
  • Le 17 février, le domaine jvarchive.com réapparaît et redirige vers jvarchive.st

Perturbations en juillet 2022[modifier | modifier le wikicode]

Très vite après l'apparition de perturbations notables, une bannière demandant de l'aide a été publiée, incitant les développeurs à contacter les administrateurs du site afin de les aider à trouver une solution.

En effet, face aux nouvelles mesures de protection de Webedia contre le scraping , l'administration de JvArchive tente de lutter contre ce problème depuis un mois, avec un succès partiel.

Les mesures de contournement entraînant un coût financier "de plus en plus onéreux", et un travail supplémentaire, l'équipe de JvArchive a décidé de lancer un appel aux dons "pour que JvArchive continue d'exister"

Beaucoup de forumeurs pensent y voir la fin proche du site, quand pour d'autres, il ne s'agirait que d'un problème transitoire.

Il se pourrait qu'à l'avenir, Webedia en vienne à prendre d'autres mesures visant à casser le script d'archivage (HTML, paramètres de protection contre les bots etc.) tout en maintenant les autres mesures de protection, provoquant un épuisement des développeurs, une stratégie déjà utilisée par Webedia pour JV Parallèle. et qui serait probablement applicable à JvArchive.

Accès détourné[modifier | modifier le wikicode]

Accès via Tor[modifier | modifier le wikicode]

http://jvarch5snkl25gv6vd4ab3qv4prhpcvnvpiyenf5mh4j43t7n43zrqid.onion/

Miroirs[modifier | modifier le wikicode]

JvArchive rend ses données publiques. De fait, il est possible de créer des miroirs de JvArchive. A ce jour, le seul miroir connu de JvArchive était Geevey.com, fermé début 2025.

Références[modifier le wikicode]