Aller au contenu

« Discussion:Boucling.com » : différence entre les versions

update
user: 3438c0b (?)
(→‎Doutes sur l'indépendance du crawler : reponse et correction date)
user: 32c692b (?)
(update)
 
(14 versions intermédiaires par 11 utilisateurs non affichées)
Ligne 95 : Ligne 95 :


Les coïncidences sourcées précédemment sont quand même troublantes ... - 26 mai 2025
Les coïncidences sourcées précédemment sont quand même troublantes ... - 26 mai 2025
Sur les milliers de topics, que certains soient archivés en même temps n'est pas un fait troublant ... - 26 mai 2025
L'observation a été faite à la main, et sur seulement 30 minutes environ (voir dates snapshots), en prenant des topics aléatoirement. Donc ce n'est pas basé sur des milliers de topics, loin de la, et c'est facile à reproduire ...
EDIT : Je rajoute encore une "coïncidence" https://jvarchive.st/forums/42-51-75878975-1-0-1-0-matthieu-kassovitz-fin-de-race-pour-les-blancs-de-souche https://boucling.com/topic/matthieu-kassovitz-fin-de-race-pour-les-blancs-de-2ec9ed7345858478 sur laquelle je suis tombé par hasard. C'est très très courant. Voir systématique.
- 26 mai 2025
Ok et là, on a moins de messages sur Boucling que sur JvArchive, où veux tu en venir ? https://jvarchive.st/forums/42-51-75846581-1-0-1-0-photos-la-dystopie-covid-19-en-images-ayaaaaaaa
https://boucling.com/topic/photos-la-dystopie-covid-19-en-images-ayaaaaaaa-9e57d0034e4602ab
Si Boucling copiait les messages sur JvArchive, on aurait les mêmes pages ... - 26 mai 2025
Hypothèse : Boucling utilise son propre scraper et complète avec les résultats de JVArchive. Qu'en pensez-vous ? ça paraît plausible ?
-- [[Utilisateur:Chanclarchiviste|Chanclarchiviste]] ([[Discussion utilisateur:Chanclarchiviste|discussion]]) 27 mai 2025 à 00:05 (CEST)
Il y a aucun doute sur l'indépendance du crawler vu que Boucling archive des messages que JvArchive n'achive pas. Il y a pas de débat. C'est impossible que Boucling se base sur JvArchive.
Ce que j'ai remarqué c'est que JvArchive archive beaucoup de topics sans archiver aucun message. Sur les petits topics supprimé rapidement. Et sur Boucling, on peut retrouver les messages. Sur les gros topics, il y a pas de différence. 29 mai 2025.
== Doutes sur l'indépendance du crawler : Nouvelles preuves ==
Voici des nouveaux snapshots.
J'ai repris la même méthodologie que mon précédent message, en prenant cette fois des snapshots des 3 topics les plus tendances de JVArchive (voir snapshot au moment de l'étude https://archive.is/k6Tyh ). Les snapshots ont été pris sur une période très réduite de 2 min, pour éviter de faire une sélection et eviter les coïncidences.
Encore une fois le ""crawler"" de Boucling archive ses messages quasiment au même moment que JVArchive. On le remarque car le dernier message archivé sur le topic correspond au dernier message archivé sur JVArchive.
- https://jvarchive.st/forums/42-51-75850809-5-0-1-0-classement-departement-qualite-de-vie-comment-on-vit-chez-toi
https://archive.is/btKjS (JVArchive) https://archive.is/mc5va (Boucling). Sur l'archive actualisée, on remarque qu'un message a été 25 secondes après.
- https://jvarchive.st/forums/42-51-75861320-10-0-1-0-aya-interdiction-de-fumer-sur-les-plages-et-parcs-a-partir-du-1er-juillet
https://archive.is/iMnoJ (JVArchive) https://archive.is/JsmOM (Boucling). Sur l'archive actualisée, on remarque qu'un message a été posté 19 secondes après (!!)
- https://jvarchive.st/forums/42-51-75890383-5-0-1-0-n-installez-jamais-linux-bordel
https://archive.is/5EY7H (JVArchive) https://archive.is/KciK7 (Boucling). Sur l'archive actualisée, on remarque qu'un message a été posté 1 minute après.
Je pense que ça semble maintenant évident que Boucling, d'une manière ou d'une autre utilise les données ou métadonnées de JVArchive pour son crawler, et qu'il n'est pas entièrement indépendant.
Cela ne prouve rien. Les deux crawlent le même site. Que l'un poste un message après l'autre prouve absolument rien.
Le fait qu'à un moment donné les 2 archives s’arrêtent au même message, et qu'il y ait sur JVC un autre message quelques secondes après, veut dire que les 2 archives ont archivés le topic au même moment, à quelques secondes prêt. Si ça peut effectivement arriver sur un topic ici et là, on pourrait dire que c'est une coïncidence. Mais vu que c'est quasi systématique comme cela a été démontré, ça montre qu'une des archives pompe les données/métadonnées de l'autre. Or, JvArchive est là depuis bien avant Boucling.  - 29 mai 2025.
Rien n'a été démontré. Son statut d'archive n'est pas remis en cause. D'ailleurs tu ignores ce qui a été dit "Ce que j'ai remarqué c'est que JvArchive archive beaucoup de topics sans archiver aucun message. Sur les petits topics supprimé rapidement. Et sur Boucling, on peut retrouver les messages".
'''Puis, il va falloir des preuves fiables. Un coup, c'est Boucling qui est une copie de Bruiter (et donc, a la technologie d'archiver par lui même). Ou alors, Boucling prend tout de JvArchive (comme tu le montres avec des preuves bancales).'''
Simple test sur le premier topic que je vois:
https://archive.ph/joUYF Boucling, 30 May 2025 23:57:35 UTC, 10 messages archivés.
https://archive.ph/sMR4U JvArchive, 30 May 2025 23:57:56 UTC, 9 messages, archivés.
Conclusion: non seulement Boucling archive plus de messages, mais en plus j'ai fait le screenshot de Boucling 21 secondes avant celui de JVArchive!
21 secondes après, JVA n'avait toujours pas archivé le message manquant.
Les liens sont vérifiables. La date est inscrit. Donc arrêter de raconter de la merde en boucle.
Update 31 Mai: j'ai refait le test sur une dizaine de topics récents et c'est toujouts le même constat. Soit Boucling a plus de messages, soit ils ont le même nombre. Donc non seulement le crawler est indépendant, mais il est nettement plus performant que celui de JVA.
Faites le test par vous-même.
Utilisateur anonyme