Kheys, Administrateurs
2 823
modifications
(Déplacé histoire 2025 en sous-catégorie vu la durée des turbulences et ajout de précisions et d'une solution) |
(réorganisation de la page, section accès mise en évidence) |
||
| Ligne 16 : | Ligne 16 : | ||
Il s'agit aujourd'hui du [[Sites et outils liés à jeuxvideo.com|site]] le plus visité de la communauté du 18-25<ref>https://www.similarweb.com/fr/website/jvarchive.com/</ref> et fait figure d'outil indispensable pour la plupart des forumeurs actifs<ref>https://jvarchive.com/forums/message/1193719293</ref>. | Il s'agit aujourd'hui du [[Sites et outils liés à jeuxvideo.com|site]] le plus visité de la communauté du 18-25<ref>https://www.similarweb.com/fr/website/jvarchive.com/</ref> et fait figure d'outil indispensable pour la plupart des forumeurs actifs<ref>https://jvarchive.com/forums/message/1193719293</ref>. | ||
L'auteur explique dans la FAQ du site, que son objectif est de sauvegarder au maximum le forum 18-25<ref>https://jvarchive.com/faq</ref>. L'auteur justifie ce projet par la politique de modération violente et diverses actions de [[jeuxvideo.com]] empêchant une bonne préservation des contenus des forums blabla. | |||
Similaire aux projets d'archivage des forumeurs ''RedSky'' et ''Glosoli'', ainsi que de [[Bruiter]], JvArchive est l'archive qui actuellement est restée en ligne le plus longtemps d'entre eux. | Similaire aux projets d'archivage des forumeurs ''RedSky'' et ''Glosoli'', ainsi que de [[Bruiter]], JvArchive est l'archive qui actuellement est restée en ligne le plus longtemps d'entre eux. | ||
== | == Accès== | ||
Depuis le 30 décembre 2024, le domaine de JvArchive est désactivé<ref>Le 2 janvier 2025, aucune IP associée au domaine et ce sur tout les serveurs DNS dont le cache est à jour | |||
https://www.nslookup.io/domains/jvarchive.com/dns-records/</ref>. Celui-ci expirant normalement en février 2025<ref>https://www.whatsmydns.net/domain-expiration?q=jvarchive.com</ref>, cette perturbation peut être le fruit d'une enquête de [[PHAROS]] à la suite d'un [[Signal gouv]] ou d'une action de la DGSI suite à une plainte déposée par [[Webedia]]. Cependant, le serveur est toujours actif. Le site est accessible soit via TOR soit via une manipulation décrite ci-dessous : | |||
===Solution sans passer par Tor=== | |||
Il est possible de consulter le site en réassociant au domaine son addresse IP. | |||
Pour ce faire, [https://www.google.com/search?q=comment+modifier+mon+fichier+hosts modifiez votre fichier hosts] en y ajoutant la ligne suivante<ref>Dernière IP vers laquelle le domaine pointait, appartient au réseau Cloudflare | |||
https://whoisfreaks.com/tools/dns/history/lookup/jvarchive.com?type=a</ref>: | |||
<code>188.114.97.0 jvarchive.com</code> | |||
''L'adresse donnée ci-dessus est susceptible de changer, merci de la mettre à jour le cas échéant.'' | |||
'''N'oubliez pas de supprimer cette ligne de votre fichier hosts une fois le domaine de retour.''' | |||
== Fonctionnement == | == Fonctionnement == | ||
Un crawler parcours le forum sans interruption et archive les topics qui apparaissent dans les premières pages de la liste des sujets. Pour cette raison les anciens topics précédents la mise en place du site ne sont pas archivés pour la plupart. Certains forumeurs peuvent d'ailleurs [[Up|upper]] volontairement un ancien topic afin que JVArchive le remarque et l'archive. | Un crawler parcours le forum sans interruption et archive les ''topics'' qui apparaissent dans les premières pages de la liste des sujets. Pour cette raison les anciens topics précédents la mise en place du site ne sont pas archivés pour la plupart. Certains forumeurs peuvent d'ailleurs [[Up|upper]] volontairement un ancien topic afin que JVArchive le remarque et l'archive. | ||
Dans certains cas il arrive que le ''crawler'' n'ait pas pu archiver le contenu d'un topic ou d'un message si sa [[suppression]] fut trop rapide. Les [[Sondage|sondages]] ne sont pas non plus archivés. | Dans certains cas il arrive que le ''crawler'' n'ait pas pu archiver le contenu d'un topic ou d'un message si sa [[suppression]] fut trop rapide. Les [[Sondage|sondages]] ne sont pas non plus archivés. | ||
| Ligne 42 : | Ligne 59 : | ||
L'admin de JvArchive a gardé un anonymat parfait et ne peut être joint qu'à travers l'adresse mail laissée sur le site : ''jvarchive @ protonmail.com.'' | L'admin de JvArchive a gardé un anonymat parfait et ne peut être joint qu'à travers l'adresse mail laissée sur le site : ''jvarchive @ protonmail.com.'' | ||
=== API | === API === | ||
JvArchive met à disposition du public une API utilisable gratuitement<ref>https://jvarchive.com/swagger-ui</ref>. En dehors du site, elle est notamment utilisée par les userscripts [[Deboucled|Déboucled]] et l'extension officielle "''JvArchive Compagnon''". | JvArchive met à disposition du public une API utilisable gratuitement<ref>https://jvarchive.com/swagger-ui</ref>. En dehors du site, elle est notamment utilisée par les userscripts [[Deboucled|Déboucled]] et l'extension officielle "''JvArchive Compagnon''". | ||
Le site | === Archives publiques === | ||
JvArchive propose des archives complètes du 18-25 comprenant l'intégralité des messages depuis le début de Respawn (donc aux alentours de 2014). On y obtient également les topics, des flags qui indiquent si les topics ont été supprimés ou non par l'auteur ou la modération, et on a également une liste de pseudos avec leur ID associé. | |||
Il est possible d'importer les archives en question dans une base PostgreSQL afin de pouvoir les traiter comme désiré. | |||
Les archives étant au format CSV, elles peuvent être importées dans des tables avec la fonction COPY de PostgreSQL. | |||
Voici un schéma facilement compatible avec les dumps JvArchive : https://pastebin.com/EzNgjqKG | |||
Notez que les dumps étants lourds (environ 50 Go de messages à traiter), il est recommandé d'utiliser au maximum des index et le tout sur une machine haute performance côté disque (de préférence un RAID de disques SAS, ou du NVMe). | |||
A noter qu'il est inutile d'importer chaque dump pour obtenir l'intégralité des messages du 18-25. Le dernier dump publié sur le site, comprend l'intégralité des messages du 18-25. | |||
== Critiques == | |||
Un certain nombre de forumeurs indiquent ne pas se sentir tranquille à l'idée que JvArchive enregistre tous leurs posts et qu'on puisse retrouver facilement tout ce qu'ils ont écris sur le forum grâce au site, malgré les suppressions<ref>https://jvarchive.com/forums/message/1193719077</ref><ref>https://jvarchive.com/forums/42-51-69786451-1-0-1-0-pas-moyen-de-supprimer-ses-topics-sur-jvarchive</ref><ref>https://jvarchive.com/forums/42-51-69740705-2-0-1-0-on-en-talk-de-jvarchive-qui-sauvegarde-tout</ref>. | |||
==Histoire== | ==Histoire== | ||
| Ligne 90 : | Ligne 119 : | ||
* Le '''29 novembre''', JvArchive est down. Mais est restauré quelques heures plus tard. | * Le '''29 novembre''', JvArchive est down. Mais est restauré quelques heures plus tard. | ||
* Le '''14 décembre''', le [https://fr.wikipedia.org/wiki/Web_scraping scraping] est arrêté à la suite de la mise en place de fonctionnalités anti-bot avec Cloudflare, qui provoque une navigation compliquée pour certains utilisateurs. Il est rétabli le lendemain. | * Le '''14 décembre''', le [https://fr.wikipedia.org/wiki/Web_scraping scraping] est arrêté à la suite de la mise en place de fonctionnalités anti-bot avec Cloudflare, qui provoque une navigation compliquée pour certains utilisateurs. Il est rétabli le lendemain. | ||
* Du '''19 décembre''' au '''22 décembre''', suite à un nouveau changement de JVC, beaucoup de topics apparaissent avec le statut "supprimé" dans JVA | * Du '''19 décembre''' au '''22 décembre''', suite à un nouveau changement de JVC, beaucoup de topics apparaissent avec le statut "supprimé" dans JVA malgré leurs disponibilité sur JVC. JVC renvoyant des erreurs "410 gone" sur certains navigateurs. Ça semble patché sur JVA après le 22 mais le soucis persiste sur JVC. | ||
== Perturbations en juillet 2022 == | == Perturbations en juillet 2022 == | ||
| Ligne 106 : | Ligne 132 : | ||
Il se pourrait qu'à l'avenir, [[Webedia]] en vienne à prendre d'autres mesures visant à casser le script d'archivage (HTML, paramètres de protection contre les bots etc.) tout en maintenant les autres mesures de protection, provoquant un épuisement des développeurs, une stratégie déjà utilisée par Webedia pour [[JV Parallele|JV Parallèle.]] et qui serait probablement applicable à JvArchive. | Il se pourrait qu'à l'avenir, [[Webedia]] en vienne à prendre d'autres mesures visant à casser le script d'archivage (HTML, paramètres de protection contre les bots etc.) tout en maintenant les autres mesures de protection, provoquant un épuisement des développeurs, une stratégie déjà utilisée par Webedia pour [[JV Parallele|JV Parallèle.]] et qui serait probablement applicable à JvArchive. | ||
==Miroirs== | ==Miroirs== | ||
JvArchive rend ses données publiques. De fait, il est possible de créer des miroirs de JvArchive. A ce jour, le seul miroir connu de JvArchive est [[Geevey.com]]. | JvArchive rend ses données publiques. De fait, il est possible de créer des miroirs de JvArchive. A ce jour, le seul miroir connu de JvArchive est [[Geevey.com]]. | ||
{{SectionRéférences}} | {{SectionRéférences}} | ||