« JVFlux:Guide de l'archiviste » : différence entre les versions

De JVFlux
(hyperlien)
(section 4chan)
 
(4 versions intermédiaires par le même utilisateur non affichées)
Ligne 1 : Ligne 1 :
{{Bannière Travaux}}
{{Bannière Travaux}}


Cette page vise à compiler les méthodes d'archivage des ressources préférées sur [[JVFlux]]. Elle est en travaux et offre principalement des suggestions et outils aux forumeurs souhaitant aider à archiver le patrimoine numérique du forum. Son respect n'est pas impératif mais est conseillé, particulièrement dans le cas d'archivage massif de ressources.
Cette page vise à compiler les méthodes d'archivage préférées pour les ressources utilisées sur [[JVFlux|JVFlux,]] qu'elles soient mises en ligne sur le site ou utilisées comme sources. Elle est en travaux et offre principalement des suggestions et outils aux forumeurs souhaitant aider à archiver le patrimoine numérique du forum. Son respect n'est pas impératif mais est conseillé, particulièrement dans le cas d'archivage massif de ressources.


==Principes généraux==
==Principes généraux==
Ligne 17 : Ligne 17 :
Jeuxvideo.com et Noelshack utilisent Google Cloud, qui fournit par défaut les images au format [https://fr.wikipedia.org/wiki/WebP WebP] (y compris lorsque le fichier est présenté au format .JPG ou .PNG). C'est un problème d'un point de vue archivistique car ce format est destructeur et se substitue à la "vraie" image qui a été mise en ligne soit par un forumeur, soit par un rédacteur du site{{Bannière Info|Contenu=Pour obtenir les images dans leur qualité originelle, il est nécessaire de simuler le non-support du format WebP par le navigateur, afin que le site fournisse les vraies images à leur place.}}
Jeuxvideo.com et Noelshack utilisent Google Cloud, qui fournit par défaut les images au format [https://fr.wikipedia.org/wiki/WebP WebP] (y compris lorsque le fichier est présenté au format .JPG ou .PNG). C'est un problème d'un point de vue archivistique car ce format est destructeur et se substitue à la "vraie" image qui a été mise en ligne soit par un forumeur, soit par un rédacteur du site{{Bannière Info|Contenu=Pour obtenir les images dans leur qualité originelle, il est nécessaire de simuler le non-support du format WebP par le navigateur, afin que le site fournisse les vraies images à leur place.}}


{{PuceJVC}}[https://addons.mozilla.org/fr/firefox/addon/dont-accept-webp/ Plugin pour Firefox]
{{PuceJVC}}[https://addons.mozilla.org/fr/firefox/addon/dont-accept-webp/ Plugin pour Firefox]{{Bannière Info|Contenu=Alternativement, on peut obtenir l'image via Risibank}}


== Méthodes d'archivage pour le texte ==
== Méthodes d'archivage pour le texte ==
=== 4chan ===
Dans de rares cas il peut être nécessaire d'archiver du contenu qui a été posté sur [[4Chan|4chan]]. Etant donné la nature ephémère des posts sur le site (de quelques jours à quelques semaines selon les ''boards'') il est nécessaire de passer par un site d'archivage.
Il en existe plusieurs, aucun n'archivant tous les ''boards''. Le site [https://4search.neocities.org/ 4search] propose un index (long mais incomplet) permettant de retrouver les sites d'archive correspondant au board dont on souhaite archiver le message. Il n'est pas nécessaire de mettre un lien vers chaque archive, cependant on précise toujours le nom de domaine complet du site.{{Bannière Info|Contenu=Exemple : https://boards.4chan.org/b/thread/939326172 · [https://thebarchive.com/b/thread/939326172/ <nowiki>[thebarchive.com]</nowiki>]}}Ci-dessous une liste des sites d'archive de 4chan au 4 septembre 2025 :
{| class="wikitable sortable mw-collapsible mw-collapsed"
|+
!Site
!Boards
!Images
!scraper archive.org
!scraper archive.is
|-
|[https://arch.b4k.dev/g/ arch.b4k.dev]
|g / mlp / qb / v / vg / vm / vmg / vp / vrpg / vst
|Oui
|?
|?
|-
|[https://archive.4plebs.org/ archive.4plebs.org]
|adv / f / hr / o / pol / s4s / sp / tg / trv / tv /x
|Oui
|?
|?
|-
|[https://archive.alice.al archive.alice.al]
|vg
|Non
|?
|?
|-
|[https://archived.moe/ archived.moe]
|3 / a / aco / adv / an / asp / b / bant / biz / c / can / cgl / ck / cm / co / cock / con / d / diy / e / f / fa / fap / fit / fitlit / g / gd / gif / h / hc / his / hm / hr / i / ic / int / jp / k / lgbt / lit / m / mlp / mlpol / mo / mtv / mu / n / news / o / out / outsoc / p / po / pol / pw / q / qa / qb / qst / r / r9k / s / s4s / sci / soc / sp / spa / t / tg / toy / trash / trv / tv / u / v / vg / vint / vip / vm / vmg / vp / vrpg / vst / vt / w / wg / wsg / wsr / x / xs / y
|Partiel
|?
|?
|-
|[https://archiveofsins.com/ archiveofsins.com]
|h / hc / hm / i / lgbt / r / s / soc / t / u
|Oui
|?
|?
|-
|[https://archive.palanq.win/ archive.palanq.win]
|bant / c / con / e / i / n / news / out / p / pw / qst / toy / vip / vp / vt / w / wg / wsr
|Oui
|?
|?
|-
|[https://desuarchive.org desuarchive.org]
|a / aco / an / c / cgl / co / d / fit / g / his / int / k / m / mlp / mu / q / qa / r9k / tg / trash / vr / wsg
|Oui
|?
|?
|-
|[https://thebarchive.com/ thebarchive.com]
|b / bant
|Partiel
|?
|?
|-
|[https://warosu.org/ warosu.org]
|3 / biz / cgl / ck / diy / fa / ic / jp / lit / sci / vr / vt
|Oui
|?
|?
|}


=== Articles de presse ===
=== Articles de presse ===
Ligne 43 : Ligne 110 :


=== Tweets (X) ===
=== Tweets (X) ===
Archiver un tweet directement via x.com n'est pas possible en raison de la protection contre le ''scraping''.
Il est cependant possible d'archiver un tweet en sauvegardant la page d'une instance [https://github.com/zedeus/nitter Nitter] pour ce même tweet.
Voici une liste des instances fonctionnelles à ce jour  :
{{PuceJVC}}[https://status.d420.de/ Consulter le statut des instances nitter en temps réel]
{| class="wikitable"
|+Instances Nitter fonctionnant avec le ''scraper'' d'archive.org au 30 août 2025
!Instance
!Archivage possible
!Contenu NSFW
|-
|[https://lightbrd.com lightbrd.com]
|Oui
|Oui
|-
|[https://nitter.kuuro.net nitter.kuuro.net]
|Non (go-away)
|Oui
|-
|[https://nitter.privacyredirect.com nitter.privacyredirect.com]
|Oui
|Non
|-
|[https://nitter.net nitter.net]
|Intermittent
|Non
|-
|[https://nitter.space nitter.space]
|Non (Cloudflare)
|Oui
|-
|[https://nuku.trabun.org nuku.trabun.org]
|Non (Cloudflare)
|Non
|-
|[https://twitt.re twitt.re]
|Non (go-away)
|Non
|-
|[https://xcancel.com xcancel.com]
|Non (Erreur 403)
|Non
|}{{Bannière Info|Contenu=On ajoute manuellement " · [Nitter]" derrière l'URL du tweet archivé, quelle que soit l'instance utilisée.}}


== Méthodes d'archivage pour les vidéos ==
== Méthodes d'archivage pour les vidéos ==


=== YouTube ===
=== YouTube ===

Dernière version du 4 septembre 2025 à 23:04

Cet article est en cours de rédaction ou de réécriture. La version que vous lisez n'est pas définitive et peut manquer d'informations importantes ou de sources.

Cette page vise à compiler les méthodes d'archivage préférées pour les ressources utilisées sur JVFlux, qu'elles soient mises en ligne sur le site ou utilisées comme sources. Elle est en travaux et offre principalement des suggestions et outils aux forumeurs souhaitant aider à archiver le patrimoine numérique du forum. Son respect n'est pas impératif mais est conseillé, particulièrement dans le cas d'archivage massif de ressources.

Principes généraux[modifier | modifier le wikicode]

Méthodes d'archivage pour l'audio[modifier | modifier le wikicode]

Vocaroo[modifier | modifier le wikicode]

Vocaroo permet aux utilisateurs de télécharger directement les fichiers hébergés.

Information
Pour archiver un vocaroo, on le met en ligne directement sur JVFlux. Il est conseillé de conserver le nom original du fichier car celui-ci contient un identifiant unique qui facilite sa recherche.


Méthodes d'archivage pour les images[modifier | modifier le wikicode]

Jeuxvideo.com+Noelshack[modifier | modifier le wikicode]

à gauche l'original en PNG, à droite la version WebP.

Jeuxvideo.com et Noelshack utilisent Google Cloud, qui fournit par défaut les images au format WebP (y compris lorsque le fichier est présenté au format .JPG ou .PNG). C'est un problème d'un point de vue archivistique car ce format est destructeur et se substitue à la "vraie" image qui a été mise en ligne soit par un forumeur, soit par un rédacteur du site

Information
Pour obtenir les images dans leur qualité originelle, il est nécessaire de simuler le non-support du format WebP par le navigateur, afin que le site fournisse les vraies images à leur place.


sommaire puces.pngPlugin pour Firefox

Information
Alternativement, on peut obtenir l'image via Risibank


Méthodes d'archivage pour le texte[modifier | modifier le wikicode]

4chan[modifier | modifier le wikicode]

Dans de rares cas il peut être nécessaire d'archiver du contenu qui a été posté sur 4chan. Etant donné la nature ephémère des posts sur le site (de quelques jours à quelques semaines selon les boards) il est nécessaire de passer par un site d'archivage.

Il en existe plusieurs, aucun n'archivant tous les boards. Le site 4search propose un index (long mais incomplet) permettant de retrouver les sites d'archive correspondant au board dont on souhaite archiver le message. Il n'est pas nécessaire de mettre un lien vers chaque archive, cependant on précise toujours le nom de domaine complet du site.

Ci-dessous une liste des sites d'archive de 4chan au 4 septembre 2025 :

Site Boards Images scraper archive.org scraper archive.is
arch.b4k.dev g / mlp / qb / v / vg / vm / vmg / vp / vrpg / vst Oui ? ?
archive.4plebs.org adv / f / hr / o / pol / s4s / sp / tg / trv / tv /x Oui ? ?
archive.alice.al vg Non ? ?
archived.moe 3 / a / aco / adv / an / asp / b / bant / biz / c / can / cgl / ck / cm / co / cock / con / d / diy / e / f / fa / fap / fit / fitlit / g / gd / gif / h / hc / his / hm / hr / i / ic / int / jp / k / lgbt / lit / m / mlp / mlpol / mo / mtv / mu / n / news / o / out / outsoc / p / po / pol / pw / q / qa / qb / qst / r / r9k / s / s4s / sci / soc / sp / spa / t / tg / toy / trash / trv / tv / u / v / vg / vint / vip / vm / vmg / vp / vrpg / vst / vt / w / wg / wsg / wsr / x / xs / y Partiel ? ?
archiveofsins.com h / hc / hm / i / lgbt / r / s / soc / t / u Oui ? ?
archive.palanq.win bant / c / con / e / i / n / news / out / p / pw / qst / toy / vip / vp / vt / w / wg / wsr Oui ? ?
desuarchive.org a / aco / an / c / cgl / co / d / fit / g / his / int / k / m / mlp / mu / q / qa / r9k / tg / trash / vr / wsg Oui ? ?
thebarchive.com b / bant Partiel ? ?
warosu.org 3 / biz / cgl / ck / diy / fa / ic / jp / lit / sci / vr / vt Oui ? ?

Articles de presse[modifier | modifier le wikicode]

TODO flowchart

Les articles de presse peuvent être des sources indispensables pour certaines informations, cependant ils peuvent facilement disparaître avec le temps. archive.org et archive.ph peuvent aisément en fournir une copie archivée consultable même en cas de fermeture ou de remaniement du site qui les héberge.

Posts sur le 18-25[modifier | modifier le wikicode]

Les posts sur le forum 18-25 ans sont automatiquement archivés par JVArchive. Cependant l'archivage peut ne pas se faire dans certains cas (topic antérieur à 2021, ou posté pendant une panne du scraper.)

Information
Dans ce cas, il faut upper le topic sur le forum (quand c'est possible) pour que l'archiveur puisse le repérer et le sauvegarder.


Cas d'un topic du 18-25 antérieur à Respawn[modifier | modifier le wikicode]

Dans le cas d'un topic antérieur à Respawn (décembre 2014) L'URL contiendra 1-51 au lieu de 42-51, ce qui empêche la génération automatique du lien vers JVArchive.

Chaque URL en 1-51 possède son équivalent en 42-51 utilisant la valeur de la variable forum_topic_id présente dans le code source de la page.

Exemple :

Information
Dans ce cas, il faut upper le topic sur le forum (quand c'est possible) et convertir l'URL en suivant le protocole ci-dessus


Tweets (X)[modifier | modifier le wikicode]

Archiver un tweet directement via x.com n'est pas possible en raison de la protection contre le scraping.

Il est cependant possible d'archiver un tweet en sauvegardant la page d'une instance Nitter pour ce même tweet.

Voici une liste des instances fonctionnelles à ce jour  :

sommaire puces.pngConsulter le statut des instances nitter en temps réel

Instances Nitter fonctionnant avec le scraper d'archive.org au 30 août 2025
Instance Archivage possible Contenu NSFW
lightbrd.com Oui Oui
nitter.kuuro.net Non (go-away) Oui
nitter.privacyredirect.com Oui Non
nitter.net Intermittent Non
nitter.space Non (Cloudflare) Oui
nuku.trabun.org Non (Cloudflare) Non
twitt.re Non (go-away) Non
xcancel.com Non (Erreur 403) Non

Information
On ajoute manuellement " · [Nitter]" derrière l'URL du tweet archivé, quelle que soit l'instance utilisée.


Méthodes d'archivage pour les vidéos[modifier | modifier le wikicode]

YouTube[modifier | modifier le wikicode]