« JvArchive » : différence entre les versions
user: 538fc06 (?) Aucun résumé des modifications |
user: 5c4a634 (?) Nouveau schéma PostgreSQL ("v3"), merci au groupe anti-jva de pas me le piquer cette fois. :) |
||
| Ligne 46 : | Ligne 46 : | ||
JvArchive proposait des archives complètes du 18-25 comprenant l'intégralité des messages depuis décembre [[Histoire du Blabla 18-25 ans en 2020|2020]], plus tous ceux des topics antérieurs qui ont été [[Up|uppés]] après le début de l'indexation. On y obtient également les topics, des ''flags'' qui indiquent si les topics ont été supprimés ou non par l'auteur ou la modération, et on a également une liste de pseudos avec leur ID associé. Il est possible d'importer les archives en question dans une base [https://fr.wikipedia.org/wiki/PostgreSQL PostgreSQL] afin de pouvoir les traiter comme désiré. Les archives étant au format [https://fr.wikipedia.org/wiki/Comma-separated_values CSV], elles peuvent être importées dans des tables avec la fonction COPY de PostgreSQL. | JvArchive proposait des archives complètes du 18-25 comprenant l'intégralité des messages depuis décembre [[Histoire du Blabla 18-25 ans en 2020|2020]], plus tous ceux des topics antérieurs qui ont été [[Up|uppés]] après le début de l'indexation. On y obtient également les topics, des ''flags'' qui indiquent si les topics ont été supprimés ou non par l'auteur ou la modération, et on a également une liste de pseudos avec leur ID associé. Il est possible d'importer les archives en question dans une base [https://fr.wikipedia.org/wiki/PostgreSQL PostgreSQL] afin de pouvoir les traiter comme désiré. Les archives étant au format [https://fr.wikipedia.org/wiki/Comma-separated_values CSV], elles peuvent être importées dans des tables avec la fonction COPY de PostgreSQL. | ||
Un schéma SQL est mis en ligne sur Pastebin, à jour depuis | Un schéma SQL est mis en ligne sur Pastebin, à jour depuis mars 2026<ref>https://pastebin.com/XewJjkmY</ref>. | ||
Notez que les dumps étants lourds (environ 50 Go de messages à traiter), il est recommandé d'utiliser au maximum des index et le tout sur une machine haute performance côté disque (de préférence un RAID de disques SAS, ou du NVMe). | Notez que les dumps étants lourds (environ 50 Go de messages à traiter), il est recommandé d'utiliser au maximum des index et le tout sur une machine haute performance côté disque (de préférence un RAID de disques SAS, ou du NVMe). | ||