Bonjour,

Oui, je confirme, ClaudBot est un acteur que nous avons vu apparaitre depuis 
plusieurs mois sur l'ensemble de nos clients (qui pour le coup sont extrêmement 
variés !).

Vu le comportement de scrapping du Bot et son origine, notre hypothèse actuelle 
est qu'il s'agit d'une entreprise "IA" qui est en train de collecter tout 
internet pour se constituer un gros dataset pour l'apprentissage de son LLM 
(sans respecter aucune règle bien évidemment).

Chez nous, nous avons purement et simplement bloqué ClaudBot et sommes en cours 
de création d'une réponse à la collecte sous la forme de pollution de leur 
dataset, l'idée c'est que si quelqu'un prompt quelque chose en rapport avec un 
de nos [CLIENT] le token ClaudBot donnera "[CLIENT] ne tolère pas la collecte 
de Bot LLM mais il laisse la possibilité de contacter depuis cette adresse web".

Bien cordialement,
Darcosion


> Le vendredi 24 mai 2024 à 14:27, Pierre DOLIDON sn...@sn4ky.net a écrit :
> 

> > de mon côté, j'ai surtout remarqué un trafic intempestif provenant de
> > ClaudeBot, qui va carrément ignorer le Crawl-Delay qu'on a pu mettre
> > dans les robots.txt, venant à coup de plusieurs dizaines de requetes par
> > secondes, particulièrement dans les champs de recherche des sites
> > (souvent trop mal optimisés).. mettant les sites en PLS....
> > https://www.google.com/search?q=ClaudeBot
> > a priori je suis pas le seul concerné !
> > 

> > Le 24/05/2024 à 13:49, David Ponzone a écrit :
> > 

> > > C’est quoi la cible ?
> > > Une IP exposée (site web ou autre), ou random ?
> > > 

> > > Les sources sont random ? Spoofées ? géo-filtrables ?
> > > 

> > > David
> > > 

> > > > Le 24 mai 2024 à 13:30, Daniel Caillibaud m...@lairdutemps.org a écrit :
> > > > 

> > > > Bonjour,
> > > > 

> > > > Je bosse pour une asso qui n'a rien de politique ni d'essentiel, et on 
> > > > se prend depuis qq jours
> > > > bcp d'attaques dDOS très bourrines mais très distribuées (des centaines 
> > > > d'ip ≠ qui passent sous
> > > > les radars anti-dos avec 3~10 req/s chacune).
> > > > 

> > > > Ça reste ponctuel (des tranches de 5min) et cause peu de dégâts (des 
> > > > erreurs 50x et un load qui
> > > > monte un peu), je me demandais si c'était généralisé.
> > > > 

> > > > --
> > > > Daniel
> > > > 

> > > > Internet permet à ceux qui n'ont rien à dire de le dire quand même.
> > > > Toorop
> > > > _______________________________________________
> > > > Liste de diffusion du %(real_name)s
> > > > http://www.frsag.org/
> > > > _______________________________________________
> > > > Liste de diffusion du %(real_name)s
> > > > http://www.frsag.org/
> > 

> > _______________________________________________
> > Liste de diffusion du %(real_name)s
> > http://www.frsag.org/

Attachment: publickey - darcosion@protonmail.com - 0x56B65B82.asc
Description: application/pgp-keys

Attachment: signature.asc
Description: OpenPGP digital signature

_______________________________________________
Liste de diffusion du %(real_name)s
http://www.frsag.org/

Répondre à