JVFlux:Guide de l'archiviste

De JVFlux
Révision datée du 4 septembre 2025 à 23:04 par Chanclarchiviste (discussion | contributions) (section 4chan)
(diff) ← Version précédente | Voir la version actuelle (diff) | Version suivante → (diff)

Cet article est en cours de rédaction ou de réécriture. La version que vous lisez n'est pas définitive et peut manquer d'informations importantes ou de sources.

Cette page vise à compiler les méthodes d'archivage préférées pour les ressources utilisées sur JVFlux, qu'elles soient mises en ligne sur le site ou utilisées comme sources. Elle est en travaux et offre principalement des suggestions et outils aux forumeurs souhaitant aider à archiver le patrimoine numérique du forum. Son respect n'est pas impératif mais est conseillé, particulièrement dans le cas d'archivage massif de ressources.

Principes généraux[modifier | modifier le wikicode]

Méthodes d'archivage pour l'audio[modifier | modifier le wikicode]

Vocaroo[modifier | modifier le wikicode]

Vocaroo permet aux utilisateurs de télécharger directement les fichiers hébergés.

Information
Pour archiver un vocaroo, on le met en ligne directement sur JVFlux. Il est conseillé de conserver le nom original du fichier car celui-ci contient un identifiant unique qui facilite sa recherche.


Méthodes d'archivage pour les images[modifier | modifier le wikicode]

Jeuxvideo.com+Noelshack[modifier | modifier le wikicode]

à gauche l'original en PNG, à droite la version WebP.

Jeuxvideo.com et Noelshack utilisent Google Cloud, qui fournit par défaut les images au format WebP (y compris lorsque le fichier est présenté au format .JPG ou .PNG). C'est un problème d'un point de vue archivistique car ce format est destructeur et se substitue à la "vraie" image qui a été mise en ligne soit par un forumeur, soit par un rédacteur du site

Information
Pour obtenir les images dans leur qualité originelle, il est nécessaire de simuler le non-support du format WebP par le navigateur, afin que le site fournisse les vraies images à leur place.


sommaire puces.pngPlugin pour Firefox

Information
Alternativement, on peut obtenir l'image via Risibank


Méthodes d'archivage pour le texte[modifier | modifier le wikicode]

4chan[modifier | modifier le wikicode]

Dans de rares cas il peut être nécessaire d'archiver du contenu qui a été posté sur 4chan. Etant donné la nature ephémère des posts sur le site (de quelques jours à quelques semaines selon les boards) il est nécessaire de passer par un site d'archivage.

Il en existe plusieurs, aucun n'archivant tous les boards. Le site 4search propose un index (long mais incomplet) permettant de retrouver les sites d'archive correspondant au board dont on souhaite archiver le message. Il n'est pas nécessaire de mettre un lien vers chaque archive, cependant on précise toujours le nom de domaine complet du site.

Ci-dessous une liste des sites d'archive de 4chan au 4 septembre 2025 :

Site Boards Images scraper archive.org scraper archive.is
arch.b4k.dev g / mlp / qb / v / vg / vm / vmg / vp / vrpg / vst Oui ? ?
archive.4plebs.org adv / f / hr / o / pol / s4s / sp / tg / trv / tv /x Oui ? ?
archive.alice.al vg Non ? ?
archived.moe 3 / a / aco / adv / an / asp / b / bant / biz / c / can / cgl / ck / cm / co / cock / con / d / diy / e / f / fa / fap / fit / fitlit / g / gd / gif / h / hc / his / hm / hr / i / ic / int / jp / k / lgbt / lit / m / mlp / mlpol / mo / mtv / mu / n / news / o / out / outsoc / p / po / pol / pw / q / qa / qb / qst / r / r9k / s / s4s / sci / soc / sp / spa / t / tg / toy / trash / trv / tv / u / v / vg / vint / vip / vm / vmg / vp / vrpg / vst / vt / w / wg / wsg / wsr / x / xs / y Partiel ? ?
archiveofsins.com h / hc / hm / i / lgbt / r / s / soc / t / u Oui ? ?
archive.palanq.win bant / c / con / e / i / n / news / out / p / pw / qst / toy / vip / vp / vt / w / wg / wsr Oui ? ?
desuarchive.org a / aco / an / c / cgl / co / d / fit / g / his / int / k / m / mlp / mu / q / qa / r9k / tg / trash / vr / wsg Oui ? ?
thebarchive.com b / bant Partiel ? ?
warosu.org 3 / biz / cgl / ck / diy / fa / ic / jp / lit / sci / vr / vt Oui ? ?

Articles de presse[modifier | modifier le wikicode]

TODO flowchart

Les articles de presse peuvent être des sources indispensables pour certaines informations, cependant ils peuvent facilement disparaître avec le temps. archive.org et archive.ph peuvent aisément en fournir une copie archivée consultable même en cas de fermeture ou de remaniement du site qui les héberge.

Posts sur le 18-25[modifier | modifier le wikicode]

Les posts sur le forum 18-25 ans sont automatiquement archivés par JVArchive. Cependant l'archivage peut ne pas se faire dans certains cas (topic antérieur à 2021, ou posté pendant une panne du scraper.)

Information
Dans ce cas, il faut upper le topic sur le forum (quand c'est possible) pour que l'archiveur puisse le repérer et le sauvegarder.


Cas d'un topic du 18-25 antérieur à Respawn[modifier | modifier le wikicode]

Dans le cas d'un topic antérieur à Respawn (décembre 2014) L'URL contiendra 1-51 au lieu de 42-51, ce qui empêche la génération automatique du lien vers JVArchive.

Chaque URL en 1-51 possède son équivalent en 42-51 utilisant la valeur de la variable forum_topic_id présente dans le code source de la page.

Exemple :

Information
Dans ce cas, il faut upper le topic sur le forum (quand c'est possible) et convertir l'URL en suivant le protocole ci-dessus


Tweets (X)[modifier | modifier le wikicode]

Archiver un tweet directement via x.com n'est pas possible en raison de la protection contre le scraping.

Il est cependant possible d'archiver un tweet en sauvegardant la page d'une instance Nitter pour ce même tweet.

Voici une liste des instances fonctionnelles à ce jour  :

sommaire puces.pngConsulter le statut des instances nitter en temps réel

Instances Nitter fonctionnant avec le scraper d'archive.org au 30 août 2025
Instance Archivage possible Contenu NSFW
lightbrd.com Oui Oui
nitter.kuuro.net Non (go-away) Oui
nitter.privacyredirect.com Oui Non
nitter.net Intermittent Non
nitter.space Non (Cloudflare) Oui
nuku.trabun.org Non (Cloudflare) Non
twitt.re Non (go-away) Non
xcancel.com Non (Erreur 403) Non

Information
On ajoute manuellement " · [Nitter]" derrière l'URL du tweet archivé, quelle que soit l'instance utilisée.


Méthodes d'archivage pour les vidéos[modifier | modifier le wikicode]

YouTube[modifier | modifier le wikicode]