« JvArchive » : différence entre les versions

687 octets ajoutés ,  8 avril
détails et mise en forme
m (→‎Bases de données publiques : Retrait lien down)
(détails et mise en forme)
Ligne 2 : Ligne 2 :
|-
|-
! colspan="2" align="center" valign="middle" height="40" style="font-weight: bold; font-size: 1em; background:#5e72e4; color: white" | [[File:logo.6c9b3f8.jpg|70px]]<br/><font size="3">''JvArchive''<br/></font size>
! colspan="2" align="center" valign="middle" height="40" style="font-weight: bold; font-size: 1em; background:#5e72e4; color: white" | [[File:logo.6c9b3f8.jpg|70px]]<br/><font size="3">''JvArchive''<br/></font size>
|-
| colspan="2" align="center" |
----
|-
|-
| '''Ouverture''' || align="center" | Mars 2021
| '''Ouverture''' || align="center" | Mars 2021
|-
|-
|-
| '''URL''' || align="center" | https://jvarchive.com/
| '''URL''' || align="center" | https://jvarchive.com/
Ligne 15 : Ligne 11 :
[https://jvarchive.com '''JvArchive'''] est un site archivant les [[topics]] du [[Blabla 18-25 ans|forum 18-25]] afin que ceux-ci restent accessibles en cas de [[suppression]] (par la modération de [[jeuxvideo.com]] ou par l'[[auteur]] du topic).
[https://jvarchive.com '''JvArchive'''] est un site archivant les [[topics]] du [[Blabla 18-25 ans|forum 18-25]] afin que ceux-ci restent accessibles en cas de [[suppression]] (par la modération de [[jeuxvideo.com]] ou par l'[[auteur]] du topic).


Le site apparaît pour la première fois sur un topic le 4 mars 2021. Celui-ci est très rapidement supprimé, et il n'est plus possible de poster l'URL de JvArchive, celle-ci ayant été ajoutée au bot blacklist ([[500]]).
Le site apparaît pour la première fois sur un topic le 4 mars 2021. Celui-ci est très rapidement supprimé, et il n'est plus possible de poster l'URL de JvArchive, celle-ci ayant été ajoutée au bot blacklist (erreur [[Erreur 500|500]]).


Il s'agit aujourd'hui du [[Sites et outils liés à jeuxvideo.com|site]] le plus visité de la communauté du 18-25 <ref>https://www.similarweb.com/fr/website/jvarchive.com/</ref> et fait figure d'outil indispensable pour la plupart des forumeurs actifs<ref>https://jvarchive.com/forums/message/1193719293</ref>.
Il s'agit aujourd'hui du [[Sites et outils liés à jeuxvideo.com|site]] le plus visité de la communauté du 18-25 <ref>https://www.similarweb.com/fr/website/jvarchive.com/</ref> et fait figure d'outil indispensable pour la plupart des forumeurs actifs<ref>https://jvarchive.com/forums/message/1193719293</ref>.


Similaire aux projets d'archivage des forumeurs RedSky et Glosoli, ainsi que de [[Bruiter]], JvArchive est l'archive qui actuellement est restée en ligne le plus longtemps d'entre eux.
Similaire aux projets d'archivage des forumeurs ''RedSky'' et ''Glosoli'', ainsi que de [[Bruiter]], JvArchive est l'archive qui actuellement est restée en ligne le plus longtemps d'entre eux.


== Objectif ==
== Objectif ==
Ligne 26 : Ligne 22 :


== Fonctionnement ==
== Fonctionnement ==
Une crawler parcours le forum sans interruption et enregistre les topics. Dans certains cas il arrive que le crawler n'ait pas pu archiver le contenu d'un topic si sa suppression fut trop rapide.
Un crawler parcours le forum sans interruption et archive les topics qui apparaissent dans les premières pages de la liste des sujets. Pour cette raison les anciens topics précédents la mise en place du site ne sont pas archivés pour la plupart. Certains forumeurs peuvent d'ailleurs upper volontairement un ancien topic afin que JVArchive le remarque et l'archive.


=== Modération ===
Dans certains cas il arrive que le crawler n'ait pas pu archiver le contenu d'un topic ou d'un message si sa [[suppression]] fut trop rapide.
Le site indique procéder à une modération légère: Fraude, pédopornographie et terrorisme uniquement. À noter qu'en cas de suppression, c'est uniquement les posts concernés qui sautent et non les topics entiers.  


=== Hébergement ===
Pour obtenir la version archivée d'un topic du 18-25, il suffit de remplacer dans l'url du topic "jeuxvideo.com" par "jvarchive.com". La démarche est la même pour obtenir le [[lien permanent]] d'un message du 18-25, ou bien le profil d'un utilisateur ayant posté au moins une fois sur le forum.
[[Fichier:Capture d’écran 2022-09-13 à 12.37.56.png|vignette|L'erreur 500 sur le site. Comme souvent un sticker est pour illustrer.]]
Pour des raisons légales évidentes, le site n'est pas hébergé dans l'Union européenne.  


=== Admin ===
=== Hébergement et détails ===
L'admin de JvArchive a gardé un anonymat parfait et ne peut être joint qu'à travers l'adresse mail laissée sur le site : ''jvarchive @ protonmail.com.''
[[Fichier:Capture d’écran 2022-09-13 à 12.37.56.png|vignette|L'erreur 500 sur le site. Comme souvent un sticker est là pour illustrer.]]D'après le [https://who.is/whois/jvarchive.com WHOIS] du site, le [https://www.wikiwand.com/fr/Registrar registraire] est [https://www.wikiwand.com/fr/Tucows Tucows]


=== Utilisation ===
Pour des raisons légales évidentes, le site n'est pas hébergé dans l'Union européenne. Selon certains il est hébergé aux États Unis ou en Finlande<ref>https://www.jeuxvideo.com/forums/message/1232139067</ref>. <blockquote>''Il faut savoir que les archives JVC type JVA, ça utilise des IP rotatives. En fait, quand le script qui gère l'archivage fait une requête vers JVC, il change immédiatement d'IP. Donc le ban IP est impossible, et la localisation de la source aussi. Les IP sont majoritairement des proxys random trouvés sur Internet, souvent créés accidentellement.''</blockquote>


Pour obtenir la version archivée d'un topic du 18-25, il suffit de remplacer dans l'url du topic "jeuxvideo.com" par "jvarchive.com". Notons que l'astuce fonctionne aussi pour un pseudo ou un message particulier.  
=== Modération et Admin ===
Le site indique procéder à une modération légère: Fraude, pédopornographie et terrorisme uniquement. À noter qu'en cas de suppression, c'est uniquement les posts concernés qui sautent et non les topics entiers.


'''Exemple:'''
L'admin de JvArchive a gardé un anonymat parfait et ne peut être joint qu'à travers l'adresse mail laissée sur le site : ''jvarchive @ protonmail.com.''
''https://www.jeuxvideo.com/forums/42-51-65395814-1-0-1-0-officiel-tournoi-des-6-nations-2021.htm''
 
devient
 
''https://www.jvarchive.com/forums/42-51-65395814-1-0-1-0-officiel-tournoi-des-6-nations-2021.htm''


Sinon, il est possible d'utiliser la barre de recherche et rechercher par mots-clés le titre du topic.
=== API et Données publiques ===
JvArchive met à disposition du public une API utilisable gratuitement. <ref>https://jvarchive.com/swagger-ui</ref> En dehors du site, elle est notamment utilisée par les userscripts [[Deboucled|Déboucled]] et l'extension officielle "''JvArchive Compagnon''".


=== API ===
Le site propose également des [https://jvarchive.com/backup bases de données publiques] sous format CSV, accessibles sur la Wayback Machine.
JvArchive met à disposition du public une API utilisable gratuitement. <ref>https://jvarchive.com/swagger-ui</ref>
En dehors du site, elle est notamment utilisée par les userscripts [[Deboucled|Déboucled]] et l'extension officielle "[[Jvarchive Compagnon|JvArchive Compagnon]]".


==Histoire==
==Histoire==
Ligne 63 : Ligne 51 :
===2021===
===2021===


* Le 26 février le nom de domaine est enregistré.
* Le 4 mars 2021, le premier topic diffusant l'URL est créé.
* Le 4 mars 2021, le premier topic diffusant l'URL est créé.


Ligne 68 : Ligne 57 :


==== Webedia contre-attaque ====
==== Webedia contre-attaque ====
* Le 13 juillet 2022, un message d'alerte est affiché sur la page d'accueil de JvArchive. Ce message indique que le crawler utilisé pour extraire les données en provenance du forum 18-25 de Jeuxvideo.com a été bloqué par Webedia, rendant l'archivage des topics impossible.
* Le 13 juillet 2022, un message d'alerte est affiché sur la page d'accueil de JvArchive. Ce message indique que le crawler utilisé pour extraire les données en provenance du forum 18-25 de Jeuxvideo.com a été bloqué par [[Webedia]], rendant l'archivage des topics impossible.
* Le 17 juillet 2022, l'accès au site est rétabli (soit une interruption de 5 jours), mais le crawler de JvArchive se voit de nouveau très rapidement bloqué par Webedia.
* Le 17 juillet 2022, l'accès au site est rétabli (soit une interruption de 5 jours), mais le crawler de JvArchive se voit de nouveau très rapidement bloqué par Webedia.
* Le 21 juillet 2022, un message d'alerte est de nouveau affiché sur la page d'accueil de JvArchive, pour le même motif que le 13 juillet (blocage par Webedia). Les blocages menés par Webedia sont basés sur la protection applicative du service Cloudflare : lorsqu'une requête ou une IP source est suspecte, la requête HTTP est interceptée et réclame un captcha ou est tout simplement bloquée ([[Erreur 1020]]), bloquant en conséquence le crawler de JvArchive. A partir de cette période, le crawler de JvArchive commence à rencontrer de sérieuses difficultés pour atteindre le 18-25 : on peut constater des archivages totalement aléatoires, à n'importe quelle heure de la journée, de très courte durée.
* Le 21 juillet 2022, un message d'alerte est de nouveau affiché sur la page d'accueil de JvArchive, pour le même motif que le 13 juillet (blocage par Webedia). Les blocages menés par Webedia sont basés sur la protection applicative du service Cloudflare : lorsqu'une requête ou une IP source est suspecte, la requête HTTP est interceptée et réclame un captcha ou est tout simplement bloquée ([[Erreur 1020]]), bloquant en conséquence le crawler de JvArchive. A partir de cette période, le crawler de JvArchive commence à rencontrer de sérieuses difficultés pour atteindre le 18-25 : on peut constater des archivages totalement aléatoires, à n'importe quelle heure de la journée, de très courte durée.
Ligne 106 : Ligne 95 :
Beaucoup de forumeurs pensent y voir la fin proche du site, quand pour d'autres, il ne s'agirait que d'un problème transitoire.
Beaucoup de forumeurs pensent y voir la fin proche du site, quand pour d'autres, il ne s'agirait que d'un problème transitoire.


Il se pourrait qu'à l'avenir, Webedia en vienne à prendre d'autres mesures visant à casser le script d'archivage (HTML, paramètres de protection contre les bots etc.) tout en maintenant les autres mesures de protection, provoquant un épuisement des développeurs, une stratégie déjà utilisée par Webedia pour [[JV Parallele|JV Parallèle.]] et qui serait probablement applicable à JvArchive.
Il se pourrait qu'à l'avenir, [[Webedia]] en vienne à prendre d'autres mesures visant à casser le script d'archivage (HTML, paramètres de protection contre les bots etc.) tout en maintenant les autres mesures de protection, provoquant un épuisement des développeurs, une stratégie déjà utilisée par Webedia pour [[JV Parallele|JV Parallèle.]] et qui serait probablement applicable à JvArchive.
 
== Bases de données publiques ==
 
JvArchive propose des bases de données publiques sous format CSV, accessibles sur la Wayback Machine. Pour en savoir plus, le lien suivant liste les fichiers CSV : https://jvarchive.com/backup.


== Liens externes ==
== Liens externes ==
12 621

modifications