« JVFlux:Guide de l'archiviste » : différence entre les versions
(archivage des tweets) |
(section 4chan) |
||
| (3 versions intermédiaires par le même utilisateur non affichées) | |||
| Ligne 1 : | Ligne 1 : | ||
{{Bannière Travaux}} | {{Bannière Travaux}} | ||
Cette page vise à compiler les méthodes d'archivage | Cette page vise à compiler les méthodes d'archivage préférées pour les ressources utilisées sur [[JVFlux|JVFlux,]] qu'elles soient mises en ligne sur le site ou utilisées comme sources. Elle est en travaux et offre principalement des suggestions et outils aux forumeurs souhaitant aider à archiver le patrimoine numérique du forum. Son respect n'est pas impératif mais est conseillé, particulièrement dans le cas d'archivage massif de ressources. | ||
==Principes généraux== | ==Principes généraux== | ||
| Ligne 17 : | Ligne 17 : | ||
Jeuxvideo.com et Noelshack utilisent Google Cloud, qui fournit par défaut les images au format [https://fr.wikipedia.org/wiki/WebP WebP] (y compris lorsque le fichier est présenté au format .JPG ou .PNG). C'est un problème d'un point de vue archivistique car ce format est destructeur et se substitue à la "vraie" image qui a été mise en ligne soit par un forumeur, soit par un rédacteur du site{{Bannière Info|Contenu=Pour obtenir les images dans leur qualité originelle, il est nécessaire de simuler le non-support du format WebP par le navigateur, afin que le site fournisse les vraies images à leur place.}} | Jeuxvideo.com et Noelshack utilisent Google Cloud, qui fournit par défaut les images au format [https://fr.wikipedia.org/wiki/WebP WebP] (y compris lorsque le fichier est présenté au format .JPG ou .PNG). C'est un problème d'un point de vue archivistique car ce format est destructeur et se substitue à la "vraie" image qui a été mise en ligne soit par un forumeur, soit par un rédacteur du site{{Bannière Info|Contenu=Pour obtenir les images dans leur qualité originelle, il est nécessaire de simuler le non-support du format WebP par le navigateur, afin que le site fournisse les vraies images à leur place.}} | ||
{{PuceJVC}}[https://addons.mozilla.org/fr/firefox/addon/dont-accept-webp/ Plugin pour Firefox] | {{PuceJVC}}[https://addons.mozilla.org/fr/firefox/addon/dont-accept-webp/ Plugin pour Firefox]{{Bannière Info|Contenu=Alternativement, on peut obtenir l'image via Risibank}} | ||
== Méthodes d'archivage pour le texte == | == Méthodes d'archivage pour le texte == | ||
=== 4chan === | |||
Dans de rares cas il peut être nécessaire d'archiver du contenu qui a été posté sur [[4Chan|4chan]]. Etant donné la nature ephémère des posts sur le site (de quelques jours à quelques semaines selon les ''boards'') il est nécessaire de passer par un site d'archivage. | |||
Il en existe plusieurs, aucun n'archivant tous les ''boards''. Le site [https://4search.neocities.org/ 4search] propose un index (long mais incomplet) permettant de retrouver les sites d'archive correspondant au board dont on souhaite archiver le message. Il n'est pas nécessaire de mettre un lien vers chaque archive, cependant on précise toujours le nom de domaine complet du site.{{Bannière Info|Contenu=Exemple : https://boards.4chan.org/b/thread/939326172 · [https://thebarchive.com/b/thread/939326172/ <nowiki>[thebarchive.com]</nowiki>]}}Ci-dessous une liste des sites d'archive de 4chan au 4 septembre 2025 : | |||
{| class="wikitable sortable mw-collapsible mw-collapsed" | |||
|+ | |||
!Site | |||
!Boards | |||
!Images | |||
!scraper archive.org | |||
!scraper archive.is | |||
|- | |||
|[https://arch.b4k.dev/g/ arch.b4k.dev] | |||
|g / mlp / qb / v / vg / vm / vmg / vp / vrpg / vst | |||
|Oui | |||
|? | |||
|? | |||
|- | |||
|[https://archive.4plebs.org/ archive.4plebs.org] | |||
|adv / f / hr / o / pol / s4s / sp / tg / trv / tv /x | |||
|Oui | |||
|? | |||
|? | |||
|- | |||
|[https://archive.alice.al archive.alice.al] | |||
|vg | |||
|Non | |||
|? | |||
|? | |||
|- | |||
|[https://archived.moe/ archived.moe] | |||
|3 / a / aco / adv / an / asp / b / bant / biz / c / can / cgl / ck / cm / co / cock / con / d / diy / e / f / fa / fap / fit / fitlit / g / gd / gif / h / hc / his / hm / hr / i / ic / int / jp / k / lgbt / lit / m / mlp / mlpol / mo / mtv / mu / n / news / o / out / outsoc / p / po / pol / pw / q / qa / qb / qst / r / r9k / s / s4s / sci / soc / sp / spa / t / tg / toy / trash / trv / tv / u / v / vg / vint / vip / vm / vmg / vp / vrpg / vst / vt / w / wg / wsg / wsr / x / xs / y | |||
|Partiel | |||
|? | |||
|? | |||
|- | |||
|[https://archiveofsins.com/ archiveofsins.com] | |||
|h / hc / hm / i / lgbt / r / s / soc / t / u | |||
|Oui | |||
|? | |||
|? | |||
|- | |||
|[https://archive.palanq.win/ archive.palanq.win] | |||
|bant / c / con / e / i / n / news / out / p / pw / qst / toy / vip / vp / vt / w / wg / wsr | |||
|Oui | |||
|? | |||
|? | |||
|- | |||
|[https://desuarchive.org desuarchive.org] | |||
|a / aco / an / c / cgl / co / d / fit / g / his / int / k / m / mlp / mu / q / qa / r9k / tg / trash / vr / wsg | |||
|Oui | |||
|? | |||
|? | |||
|- | |||
|[https://thebarchive.com/ thebarchive.com] | |||
|b / bant | |||
|Partiel | |||
|? | |||
|? | |||
|- | |||
|[https://warosu.org/ warosu.org] | |||
|3 / biz / cgl / ck / diy / fa / ic / jp / lit / sci / vr / vt | |||
|Oui | |||
|? | |||
|? | |||
|} | |||
=== Articles de presse === | === Articles de presse === | ||
| Ligne 48 : | Ligne 115 : | ||
Voici une liste des instances fonctionnelles à ce jour : | Voici une liste des instances fonctionnelles à ce jour : | ||
{{PuceJVC}}[https://status.d420.de/ Consulter le statut des instances nitter en temps réel] | |||
{| class="wikitable" | {| class="wikitable" | ||
|+Instances Nitter fonctionnant avec le ''scraper'' d'archive.org | |+Instances Nitter fonctionnant avec le ''scraper'' d'archive.org au 30 août 2025 | ||
!Instance | !Instance | ||
!Archivage possible | !Archivage possible | ||
!Contenu NSFW | |||
|- | |- | ||
|[https://lightbrd.com lightbrd.com] | |[https://lightbrd.com lightbrd.com] | ||
|Oui | |||
|Oui | |Oui | ||
|- | |- | ||
|[https://nitter.kuuro.net nitter.kuuro.net] | |[https://nitter.kuuro.net nitter.kuuro.net] | ||
|Non (go-away) | |Non (go-away) | ||
|Oui | |||
|- | |- | ||
|[https://nitter.privacyredirect.com nitter.privacyredirect.com] | |[https://nitter.privacyredirect.com nitter.privacyredirect.com] | ||
|Oui | |Oui | ||
|Non | |||
|- | |- | ||
|[https://nitter.net nitter.net] | |[https://nitter.net nitter.net] | ||
|Intermittent | |Intermittent | ||
|Non | |||
|- | |||
|[https://nitter.space nitter.space] | |||
|Non (Cloudflare) | |||
|Oui | |||
|- | |- | ||
|[https://nuku.trabun.org nuku.trabun.org] | |[https://nuku.trabun.org nuku.trabun.org] | ||
|Non (Cloudflare) | |Non (Cloudflare) | ||
|Non | |||
|- | |||
|[https://twitt.re twitt.re] | |||
|Non (go-away) | |||
|Non | |||
|- | |- | ||
|[https://xcancel.com xcancel.com] | |[https://xcancel.com xcancel.com] | ||
|Non (Erreur 403) | |Non (Erreur 403) | ||
|} | |Non | ||
|}{{Bannière Info|Contenu=On ajoute manuellement " · [Nitter]" derrière l'URL du tweet archivé, quelle que soit l'instance utilisée.}} | |||
== Méthodes d'archivage pour les vidéos == | == Méthodes d'archivage pour les vidéos == | ||
=== YouTube === | === YouTube === | ||
Dernière version du 4 septembre 2025 à 23:04
Cet article est en cours de rédaction ou de réécriture. La version que vous lisez n'est pas définitive et peut manquer d'informations importantes ou de sources.
Cette page vise à compiler les méthodes d'archivage préférées pour les ressources utilisées sur JVFlux, qu'elles soient mises en ligne sur le site ou utilisées comme sources. Elle est en travaux et offre principalement des suggestions et outils aux forumeurs souhaitant aider à archiver le patrimoine numérique du forum. Son respect n'est pas impératif mais est conseillé, particulièrement dans le cas d'archivage massif de ressources.
Principes générauxModifier
Méthodes d'archivage pour l'audioModifier
VocarooModifier
Vocaroo permet aux utilisateurs de télécharger directement les fichiers hébergés.
Information
Pour archiver un vocaroo, on le met en ligne directement sur JVFlux. Il est conseillé de conserver le nom original du fichier car celui-ci contient un identifiant unique qui facilite sa recherche.
Méthodes d'archivage pour les imagesModifier
Jeuxvideo.com+NoelshackModifier
Jeuxvideo.com et Noelshack utilisent Google Cloud, qui fournit par défaut les images au format WebP (y compris lorsque le fichier est présenté au format .JPG ou .PNG). C'est un problème d'un point de vue archivistique car ce format est destructeur et se substitue à la "vraie" image qui a été mise en ligne soit par un forumeur, soit par un rédacteur du site
Information
Pour obtenir les images dans leur qualité originelle, il est nécessaire de simuler le non-support du format WebP par le navigateur, afin que le site fournisse les vraies images à leur place.
Méthodes d'archivage pour le texteModifier
4chanModifier
Dans de rares cas il peut être nécessaire d'archiver du contenu qui a été posté sur 4chan. Etant donné la nature ephémère des posts sur le site (de quelques jours à quelques semaines selon les boards) il est nécessaire de passer par un site d'archivage.
Il en existe plusieurs, aucun n'archivant tous les boards. Le site 4search propose un index (long mais incomplet) permettant de retrouver les sites d'archive correspondant au board dont on souhaite archiver le message. Il n'est pas nécessaire de mettre un lien vers chaque archive, cependant on précise toujours le nom de domaine complet du site.
Information
Exemple : https://boards.4chan.org/b/thread/939326172 · [thebarchive.com]
Ci-dessous une liste des sites d'archive de 4chan au 4 septembre 2025 :
| Site | Boards | Images | scraper archive.org | scraper archive.is |
|---|---|---|---|---|
| arch.b4k.dev | g / mlp / qb / v / vg / vm / vmg / vp / vrpg / vst | Oui | ? | ? |
| archive.4plebs.org | adv / f / hr / o / pol / s4s / sp / tg / trv / tv /x | Oui | ? | ? |
| archive.alice.al | vg | Non | ? | ? |
| archived.moe | 3 / a / aco / adv / an / asp / b / bant / biz / c / can / cgl / ck / cm / co / cock / con / d / diy / e / f / fa / fap / fit / fitlit / g / gd / gif / h / hc / his / hm / hr / i / ic / int / jp / k / lgbt / lit / m / mlp / mlpol / mo / mtv / mu / n / news / o / out / outsoc / p / po / pol / pw / q / qa / qb / qst / r / r9k / s / s4s / sci / soc / sp / spa / t / tg / toy / trash / trv / tv / u / v / vg / vint / vip / vm / vmg / vp / vrpg / vst / vt / w / wg / wsg / wsr / x / xs / y | Partiel | ? | ? |
| archiveofsins.com | h / hc / hm / i / lgbt / r / s / soc / t / u | Oui | ? | ? |
| archive.palanq.win | bant / c / con / e / i / n / news / out / p / pw / qst / toy / vip / vp / vt / w / wg / wsr | Oui | ? | ? |
| desuarchive.org | a / aco / an / c / cgl / co / d / fit / g / his / int / k / m / mlp / mu / q / qa / r9k / tg / trash / vr / wsg | Oui | ? | ? |
| thebarchive.com | b / bant | Partiel | ? | ? |
| warosu.org | 3 / biz / cgl / ck / diy / fa / ic / jp / lit / sci / vr / vt | Oui | ? | ? |
Articles de presseModifier
TODO flowchart
Les articles de presse peuvent être des sources indispensables pour certaines informations, cependant ils peuvent facilement disparaître avec le temps. archive.org et archive.ph peuvent aisément en fournir une copie archivée consultable même en cas de fermeture ou de remaniement du site qui les héberge.
Posts sur le 18-25Modifier
Les posts sur le forum 18-25 ans sont automatiquement archivés par JVArchive. Cependant l'archivage peut ne pas se faire dans certains cas (topic antérieur à 2021, ou posté pendant une panne du scraper.)
Information
Dans ce cas, il faut upper le topic sur le forum (quand c'est possible) pour que l'archiveur puisse le repérer et le sauvegarder.
Cas d'un topic du 18-25 antérieur à RespawnModifier
Dans le cas d'un topic antérieur à Respawn (décembre 2014) L'URL contiendra 1-51 au lieu de 42-51, ce qui empêche la génération automatique du lien vers JVArchive.
Chaque URL en 1-51 possède son équivalent en 42-51 utilisant la valeur de la variable forum_topic_id présente dans le code source de la page.
Exemple :
- Le topic https://www.jeuxvideo.com/forums/42-51-73344903-1-0-1-0-hummer-rouge.htm [JvArchive] utilise le nouveau format d'URL. JVFlux lui a automatiquement ajouté la balise [JVArchive]
- Le topic https://www.jeuxvideo.com/forums/1-51-65555382-3-0-1-0-j-ai-explose-a-cette-image-rire.htm utilise l'ancien format d'URL. JVFlux ne peut pas lui ajouter la balise [JVArchive]
- Si on remplace le
1-51de l'URL par42-51: https://www.jeuxvideo.com/forums/42-51-65555382-3-0-1-0-j-ai-explose-a-cette-image-rire.htm [JvArchive] alors on est redirigé vers un topic complètement différent. - Maintenant si on remplace le troisième champ numérique par la valeur de
forum_topic_id: https://www.jeuxvideo.com/forums/42-51-22598711-3-0-1-0-j-ai-explose-a-cette-image-rire.htm [JvArchive] alors on est redirigé vers la page en1-51sur jeuxvideo.com ET sur la bonne page JVArchive.
Information
Dans ce cas, il faut upper le topic sur le forum (quand c'est possible) et convertir l'URL en suivant le protocole ci-dessus
Tweets (X)Modifier
Archiver un tweet directement via x.com n'est pas possible en raison de la protection contre le scraping.
Il est cependant possible d'archiver un tweet en sauvegardant la page d'une instance Nitter pour ce même tweet.
Voici une liste des instances fonctionnelles à ce jour :
Consulter le statut des instances nitter en temps réel
| Instance | Archivage possible | Contenu NSFW |
|---|---|---|
| lightbrd.com | Oui | Oui |
| nitter.kuuro.net | Non (go-away) | Oui |
| nitter.privacyredirect.com | Oui | Non |
| nitter.net | Intermittent | Non |
| nitter.space | Non (Cloudflare) | Oui |
| nuku.trabun.org | Non (Cloudflare) | Non |
| twitt.re | Non (go-away) | Non |
| xcancel.com | Non (Erreur 403) | Non |
Information
On ajoute manuellement " · [Nitter]" derrière l'URL du tweet archivé, quelle que soit l'instance utilisée.