« JvArchive » : différence entre les versions

user: 538fc06 (?)
Aucun résumé des modifications
user: 5c4a634 (?)
Nouveau schéma PostgreSQL ("v3"), merci au groupe anti-jva de pas me le piquer cette fois. :)
 
Ligne 46 : Ligne 46 :
JvArchive proposait des archives complètes du 18-25 comprenant l'intégralité des messages depuis décembre [[Histoire du Blabla 18-25 ans en 2020|2020]], plus tous ceux des topics antérieurs qui ont été [[Up|uppés]] après le début de l'indexation. On y obtient également les topics, des ''flags'' qui indiquent si les topics ont été supprimés ou non par l'auteur ou la modération, et on a également une liste de pseudos avec leur ID associé. Il est possible d'importer les archives en question dans une base [https://fr.wikipedia.org/wiki/PostgreSQL PostgreSQL] afin de pouvoir les traiter comme désiré. Les archives étant au format [https://fr.wikipedia.org/wiki/Comma-separated_values CSV], elles peuvent être importées dans des tables avec la fonction COPY de PostgreSQL.
JvArchive proposait des archives complètes du 18-25 comprenant l'intégralité des messages depuis décembre [[Histoire du Blabla 18-25 ans en 2020|2020]], plus tous ceux des topics antérieurs qui ont été [[Up|uppés]] après le début de l'indexation. On y obtient également les topics, des ''flags'' qui indiquent si les topics ont été supprimés ou non par l'auteur ou la modération, et on a également une liste de pseudos avec leur ID associé. Il est possible d'importer les archives en question dans une base [https://fr.wikipedia.org/wiki/PostgreSQL PostgreSQL] afin de pouvoir les traiter comme désiré. Les archives étant au format [https://fr.wikipedia.org/wiki/Comma-separated_values CSV], elles peuvent être importées dans des tables avec la fonction COPY de PostgreSQL.


Un schéma SQL est mis en ligne sur Pastebin, à jour depuis décembre 2025<ref>https://pastebin.com/jBaxBjFb</ref>.
Un schéma SQL est mis en ligne sur Pastebin, à jour depuis mars 2026<ref>https://pastebin.com/XewJjkmY</ref>.


Notez que les dumps étants lourds (environ 50 Go de messages à traiter), il est recommandé d'utiliser au maximum des index et le tout sur une machine haute performance côté disque (de préférence un RAID de disques SAS, ou du NVMe).
Notez que les dumps étants lourds (environ 50 Go de messages à traiter), il est recommandé d'utiliser au maximum des index et le tout sur une machine haute performance côté disque (de préférence un RAID de disques SAS, ou du NVMe).
Récupérée de "https://jvflux.fr/JvArchive"