Skip to main content

Cloudflare, un dels gegants de la infraestructura d’internet, ha presentat una nova eina dissenyada per combatre els bots que rastregen llocs web amb l’objectiu de recopilar dades per entrenar models d’IA sense permís. Anomenada AI Labyrinth, aquesta tecnologia gratuïta redirigeix els bots cap a una xarxa de pàgines artificials creades mitjançant IA. Aquestes pàgines no contenen informació delicada ni pròpia del lloc, sinó textos verídics però irrellevants, dissenyats específicament per desviar els rastrejadors, fer-los perdre temps i consumir els seus recursos computacionals. Segons va explicar la companyia al seu blog oficial, el contingut generat es basa en fets científics, però no està vinculat al propòsit real del web rastrejat.

La fi del “codi d’honor” entre bots

La proposta s’allunya d’enfocaments tradicionals com l’arxiu robots.txt, que fins ara servia com una mena de “codi d’honor” per indicar als bots què podien o no indexar. Però empreses com Anthropic o Perplexity AI han estat assenyalades per ignorar aquestes normes, la qual cosa ha provocat una cursa entre desenvolupadors de llocs web i rastrejadors automatitzats. Cloudflare afirma que rep més de 50.000 milions de sol·licituds de bots al dia i que, tot i que ja disposa de sistemes per detectar-los, els atacants solen adaptar-se ràpidament.

Font: Cloudflare.

Així funciona AI Labyrinth

En lloc de bloquejar directament els bots, els condueix per una sèrie d’enllaços que els porta a pàgines irrellevants generades per IA. Aquestes pàgines no són visibles per als usuaris humans, i el seu contingut, tot i ser verídic, no té cap relació amb el web objectiu. Això permet a Cloudflare identificar nous patrons de comportament de bots i enriquir la seva base de dades d’agents maliciosos.

Implementació senzilla i contingut controlat

L’eina s’activa fàcilment des del panell de control de Cloudflare, a la secció de gestió de bots. Un cop habilitada, genera i emmagatzema contingut fictici predefinit, que s’enllaça a través de xarxes d’URLs dissenyades específicament per enganyar els rastrejadors. Cloudflare aclareix que aquest contingut no busca desinformar, sinó simplement desviar l’atenció dels bots amb dades inútils per a ells, però segures per al web.

Un precedent en la guerra per les dades

Amb AI Labyrinth, Cloudflare busca protegir els llocs web de ser explotats, i també establir un precedent: els creadors de contingut tenen dret a decidir si les seves dades poden ser utilitzades per alimentar la IA. La guerra per les dades en l’era de la intel·ligència artificial continua escalant, i aquesta eina marca un nou capítol en aquest conflicte.

Obre un parèntesi en les teves rutines. Subscriu-te al nostre butlletí i posa’t al dia en tecnologia, IA i mitjans de comunicació.

Laia Herranz

Comunicadora apassionada per la tecnologia i la IA.

Leave a Reply