« Discussion:Boucling.com » : différence entre les versions
update
user: ebc6a62 (?) (→Réponse: Sur la décision de JvFlux : nouvelle section) |
user: 32c692b (?) (update) |
||
| (19 versions intermédiaires par 16 utilisateurs non affichées) | |||
| Ligne 49 : | Ligne 49 : | ||
Autre sujet, pourquoi cacher l'origine des topics sur Boucling.com (comme c'était d'ailleurs le cas sur Bruiter ...) ? | Autre sujet, pourquoi cacher l'origine des topics sur Boucling.com (comme c'était d'ailleurs le cas sur Bruiter ...) ? | ||
Pas possible d'avoir l'URL/l'id d'origine du topic d'origine. Aucune mention du fait que le site est une archive du 18-25 sur le site. Pas de possibilité de contact. | Pas possible d'avoir l'URL/l'id d'origine du topic d'origine. Aucune mention du fait que le site est une archive du 18-25 sur le site. Pas de possibilité de contact. | ||
Comme a bien noté un khey sur le discord JVFlux : | Comme a bien noté un khey sur le discord JVFlux : | ||
Il y a comme une volonté de drainer du trafic de JVC, dans un sens unique | Il y a comme une volonté de drainer du trafic de JVC, dans un sens unique | ||
On se demande si Boucling en a quelque chose à faire de l'archivage, et si c'est pas juste une excuse pour faire un nouveau JV-like. | On se demande si Boucling en a quelque chose à faire de l'archivage, et si c'est pas juste une excuse pour faire un nouveau JV-like. | ||
Que deviendrons les données archivées si le site vient à mourir ? Est-ce qu'il disparaîtra sans donner de suites, comme à fait son prédécesseur Bruiter ? | Que deviendrons les données archivées si le site vient à mourir ? Est-ce qu'il disparaîtra sans donner de suites, comme à fait son prédécesseur Bruiter ? | ||
L'arrivée d'une archive supplémentaire est une bonne nouvelle, surtout dans le cadre du wiki JVFlux, mais encore faudrait-il connaître les véritables intentions de Boucling. | L'arrivée d'une archive supplémentaire est une bonne nouvelle, surtout dans le cadre du wiki JVFlux, mais encore faudrait-il connaître les véritables intentions de Boucling. | ||
Après le site est jeune c'est vrai, en espérant qu'il y aura plus de clarifications de ce coté la dans le futur. | Après le site est jeune c'est vrai, en espérant qu'il y aura plus de clarifications de ce coté la dans le futur. | ||
== Réponse: Réponse: Sur la décision de JvFlux == | |||
La cessation des activités de Bruiter est principalement due à des actions en justice entreprises par Webedia. Pour ce qui est des éventuelles connexions entre Bruiter et Boucling.com, il est plus prudent de ne pas les détailler afin de ne pas fournir d'arguments juridiques qui pourraient être utilisés pour fermer le site. Boucling est un site relativement récent, et il semble disproportionné de lui reprocher de ne pas inclure de liens vers JVC, surtout lorsque JvArchive le fait de manière très discrète, sans que cela n'apporte une réelle utilité. | |||
En ce qui concerne l'accusation de détourner le trafic de JVC, il est important de noter que JvArchive propose également une section de commentaires et génère des revenus grâce à des dons et des publicités. De plus, JvArchive n'est pas entièrement transparent sur ses intentions ou sur l'identité de ses développeurs, malgré la présence d'une page "à propos". Et aussi vous pouvez vous référer aux critiques disponibles sur la page Jvflux de JvArchive. | |||
== Doutes sur l'indépendance du crawler == | |||
J'ai observé en comparant à plusieurs reprises ce matin sur des topics rapidement supprimés, que ceux-ci étaient archivés en partie par JVArchive, mais pas par Boucling. Et que mystérieusement, malgré leur suppression de JVC, ils se retrouvaient un peu plus tard sur Boucling. | |||
Je n'ai pas pu prendre de snapshots pour prouver ce cas assez particulier (il faut que le topic ait de nombreux messages rapidement et soit supprimé très rapidement). | |||
Cependant j'ai constaté un autre fait troublant : Le ""crawler"" de Boucling semble archiver ses messages quasiment au même moment que JVArchive. On le remarque car le dernier message archivé sur le topic correspond au dernier message archivé sur JVArchive. | |||
On peut le remarquer sur sur de multiples topics : | |||
- https://jvarchive.st/forums/42-51-75846357-2-0-1-0-l-enorme-cul-de-cette-flic-mexicaine | |||
Premier snapshot https://archive.is/yIBai (JVArchive) https://archive.is/6ZWJy (Boucling). Sur l'archive actualisée, on remarque qu'un message a été posté une minute après. | |||
- https://jvarchive.st/forums/42-51-75859923-1-0-1-0-les-collabos-qui-peuvent-plus-ddb-rire | |||
Premier snapshot https://archive.is/aU26j (JVArchive) https://archive.is/mPw5V (Boucling). Sur l'archive actualisée, on remarque qu'un message a été posté une minute après. | |||
- https://jvarchive.st/forums/42-51-75838937-1-0-1-0-l-administration-jvc-nous-a-baises-nofake | |||
Premier snapshot https://archive.is/SNMqS (JVArchive) https://archive.ph/CQ8b7 (Boucling). Sur l'archive actualisée, on remarque qu'un message a été posté 30 secondes après (!!). | |||
Deuxième snapshot https://archive.is/Funp1 (JVArchive) https://archive.ph/O0OjT (Boucling). Sur l'archive actualisée, on remarque qu'un message a été posté 30 secondes après. | |||
Cela signifie qu'à chacun de ces exemples, le crawler de Boucling.com aurait archivé le topic seulement quelques secondes après le crawler de JVArchive. Étant donné que cette "étude" a été effectuée sur une période de temps assez réduite, cela fait quand-même un curieux enchaînement de "coïncidence". C'est en tout cas facile à reproduire. | |||
Il faudrait pousser l’enquête, mais ça pose des questions : | |||
Le crawler de Boucling est-il vraiment indépendant, ou se sert-il des données de JVArchive ? | |||
Cela impliquerait une grosse correction de cette article. | |||
Non, on a la réponse car Boucling enregistre des messages que JvArchive n'enregistre pas. - 26 mai 2025 | |||
Les coïncidences sourcées précédemment sont quand même troublantes ... - 26 mai 2025 | |||
Sur les milliers de topics, que certains soient archivés en même temps n'est pas un fait troublant ... - 26 mai 2025 | |||
L'observation a été faite à la main, et sur seulement 30 minutes environ (voir dates snapshots), en prenant des topics aléatoirement. Donc ce n'est pas basé sur des milliers de topics, loin de la, et c'est facile à reproduire ... | |||
EDIT : Je rajoute encore une "coïncidence" https://jvarchive.st/forums/42-51-75878975-1-0-1-0-matthieu-kassovitz-fin-de-race-pour-les-blancs-de-souche https://boucling.com/topic/matthieu-kassovitz-fin-de-race-pour-les-blancs-de-2ec9ed7345858478 sur laquelle je suis tombé par hasard. C'est très très courant. Voir systématique. | |||
- 26 mai 2025 | |||
Ok et là, on a moins de messages sur Boucling que sur JvArchive, où veux tu en venir ? https://jvarchive.st/forums/42-51-75846581-1-0-1-0-photos-la-dystopie-covid-19-en-images-ayaaaaaaa | |||
https://boucling.com/topic/photos-la-dystopie-covid-19-en-images-ayaaaaaaa-9e57d0034e4602ab | |||
Si Boucling copiait les messages sur JvArchive, on aurait les mêmes pages ... - 26 mai 2025 | |||
Hypothèse : Boucling utilise son propre scraper et complète avec les résultats de JVArchive. Qu'en pensez-vous ? ça paraît plausible ? | |||
-- [[Utilisateur:Chanclarchiviste|Chanclarchiviste]] ([[Discussion utilisateur:Chanclarchiviste|discussion]]) 27 mai 2025 à 00:05 (CEST) | |||
Il y a aucun doute sur l'indépendance du crawler vu que Boucling archive des messages que JvArchive n'achive pas. Il y a pas de débat. C'est impossible que Boucling se base sur JvArchive. | |||
Ce que j'ai remarqué c'est que JvArchive archive beaucoup de topics sans archiver aucun message. Sur les petits topics supprimé rapidement. Et sur Boucling, on peut retrouver les messages. Sur les gros topics, il y a pas de différence. 29 mai 2025. | |||
== Doutes sur l'indépendance du crawler : Nouvelles preuves == | |||
Voici des nouveaux snapshots. | |||
J'ai repris la même méthodologie que mon précédent message, en prenant cette fois des snapshots des 3 topics les plus tendances de JVArchive (voir snapshot au moment de l'étude https://archive.is/k6Tyh ). Les snapshots ont été pris sur une période très réduite de 2 min, pour éviter de faire une sélection et eviter les coïncidences. | |||
Encore une fois le ""crawler"" de Boucling archive ses messages quasiment au même moment que JVArchive. On le remarque car le dernier message archivé sur le topic correspond au dernier message archivé sur JVArchive. | |||
- https://jvarchive.st/forums/42-51-75850809-5-0-1-0-classement-departement-qualite-de-vie-comment-on-vit-chez-toi | |||
https://archive.is/btKjS (JVArchive) https://archive.is/mc5va (Boucling). Sur l'archive actualisée, on remarque qu'un message a été 25 secondes après. | |||
- https://jvarchive.st/forums/42-51-75861320-10-0-1-0-aya-interdiction-de-fumer-sur-les-plages-et-parcs-a-partir-du-1er-juillet | |||
https://archive.is/iMnoJ (JVArchive) https://archive.is/JsmOM (Boucling). Sur l'archive actualisée, on remarque qu'un message a été posté 19 secondes après (!!) | |||
- https://jvarchive.st/forums/42-51-75890383-5-0-1-0-n-installez-jamais-linux-bordel | |||
https://archive.is/5EY7H (JVArchive) https://archive.is/KciK7 (Boucling). Sur l'archive actualisée, on remarque qu'un message a été posté 1 minute après. | |||
Je pense que ça semble maintenant évident que Boucling, d'une manière ou d'une autre utilise les données ou métadonnées de JVArchive pour son crawler, et qu'il n'est pas entièrement indépendant. | |||
Cela ne prouve rien. Les deux crawlent le même site. Que l'un poste un message après l'autre prouve absolument rien. | |||
Le fait qu'à un moment donné les 2 archives s’arrêtent au même message, et qu'il y ait sur JVC un autre message quelques secondes après, veut dire que les 2 archives ont archivés le topic au même moment, à quelques secondes prêt. Si ça peut effectivement arriver sur un topic ici et là, on pourrait dire que c'est une coïncidence. Mais vu que c'est quasi systématique comme cela a été démontré, ça montre qu'une des archives pompe les données/métadonnées de l'autre. Or, JvArchive est là depuis bien avant Boucling. - 29 mai 2025. | |||
Rien n'a été démontré. Son statut d'archive n'est pas remis en cause. D'ailleurs tu ignores ce qui a été dit "Ce que j'ai remarqué c'est que JvArchive archive beaucoup de topics sans archiver aucun message. Sur les petits topics supprimé rapidement. Et sur Boucling, on peut retrouver les messages". | |||
'''Puis, il va falloir des preuves fiables. Un coup, c'est Boucling qui est une copie de Bruiter (et donc, a la technologie d'archiver par lui même). Ou alors, Boucling prend tout de JvArchive (comme tu le montres avec des preuves bancales).''' | |||
Simple test sur le premier topic que je vois: | |||
https://archive.ph/joUYF Boucling, 30 May 2025 23:57:35 UTC, 10 messages archivés. | |||
https://archive.ph/sMR4U JvArchive, 30 May 2025 23:57:56 UTC, 9 messages, archivés. | |||
Conclusion: non seulement Boucling archive plus de messages, mais en plus j'ai fait le screenshot de Boucling 21 secondes avant celui de JVArchive! | |||
21 secondes après, JVA n'avait toujours pas archivé le message manquant. | |||
Les liens sont vérifiables. La date est inscrit. Donc arrêter de raconter de la merde en boucle. | |||
Update 31 Mai: j'ai refait le test sur une dizaine de topics récents et c'est toujouts le même constat. Soit Boucling a plus de messages, soit ils ont le même nombre. Donc non seulement le crawler est indépendant, mais il est nettement plus performant que celui de JVA. | |||
Faites le test par vous-même. | |||