Una oleada de tráfico bot está arrasando la red y todo indica que es por entrenamiento masivo de IA

Muchos sospechan que estos bots forman parte de un esfuerzo de alguna empresa de IA por recopilar datos de entrenamiento de páginas web. En 2025, los bots de IA representaban una parte significativa del tráfico web general, ya que rastrean internet en busca de texto y otra información para alimentar grandes modelos de lenguaje (LLM), ávidos de datos.

Sin embargo, hay algunas diferencias clave entre estos bots chinos y otros bots de IA. En primer lugar, son muchos más. King afirma en su sitio web que el tráfico procedente de China y Singapur representa el 22% del total, mientras que el resto de bots de IA representan menos del 10% en conjunto.

La mayoría de las empresas líderes en IA identifican claramente sus bots ante los operadores de sitios web, lo que facilita su bloqueo. Los laboratorios de IA de vanguardia «no están tan interesados en eludir» las normas de bloqueo, afirma Brent Maynard, director sénior de tecnología y estrategia de seguridad de la empresa de infraestructuras de internet Akamai. Según él, las empresas de IA normalmente solo empiezan a intentar camuflar sus bots después de que un sitio web les cierre la puerta. Esta oleada de bots chinos, sin embargo, se disfrazó de usuarios humanos normales desde el principio e incluso ha eludido las normas habituales de bloqueo, según explicaron a WIRED varios propietarios de sitios web.

Además de las empresas de IA, hay otros negocios con incentivos para rastrear internet, como los motores de búsqueda y las compañías de recopilación de inteligencia.


Personas, Persona, Adulto, Niño, Militar, Uniforme Militar y Silueta

Nuevos datos muestran que los bots de IA penetran cada vez más en la web, lo que lleva a los editores a desplegar defensas más agresivas.


Costos crecientes y datos distorsionados

La buena noticia, al menos por ahora, es que los bots no parecen tener un propósito explícitamente malicioso. No se les ha relacionado públicamente con ningún ciberataque y no parece que estén buscando vulnerabilidades. Pero la falta de un motivo claro también aumenta la confusión.

A algunos propietarios de sitios web les preocupa que los bots estén escaneando material protegido por derechos de autor sin permiso. Otros dicen que el aumento los ha obligado a pagar más por el ancho de banda, ya que el tráfico automatizado desplaza a los usuarios humanos, o a invertir en herramientas de prevención más sofisticadas. Las visitas también sesgan los análisis de tráfico y distorsionan los informes sobre quién visita realmente sus sitios.

Sin embargo, el mayor impacto lo sufren quienes obtienen ingresos por atraer clics publicitarios a sus sitios web. «Esto está destruyendo mis estrategias de AdSense, porque dicen que tu sitio web solo lo visitan bots, así que tu contenido no es algo valioso para el espectador», afirma Quintero, propietario de un blog paranormal. Como resultado, sitios web como el suyo pueden ser considerados menos atractivos para los anunciantes y ser penalizados por Google.

Soluciones improvisadas

En los últimos meses, muchas personas se han quejado del problema de los bots de IA procedentes de China en canales de asistencia en línea o han enviado mensajes al respecto directamente a sus proveedores de alojamiento web. Pero, hasta ahora, sigue habiendo pocas respuestas concretas.

Contactado por WIRED, WordPress reconoció que en los últimos meses ha recibido informes de que algunos de sus sitios están experimentando un aumento del tráfico de presuntos bots de IA o scrapers. «Los sitios web de WordPress siempre han tenido una estructura que facilita que los motores de búsqueda los encuentren e indexen. Esas mismas capacidades hacen que también sean fácilmente rastreados por la IA», escribió la compañía en un correo electrónico sin firma. Google, Cloudflare y Squarespace no respondieron a las solicitudes de comentarios.

Algunos operadores de sitios web están tomando cartas en el asunto. En plataformas sociales como Reddit, las víctimas de los bots han intercambiado estrategias improvisadas para identificarlos y bloquearlos. Con el tiempo, han aprendido que estos bots suelen presentarse como usuarios de versiones antiguas del sistema operativo Windows y con relaciones de aspecto de pantalla poco comunes, características que permiten a los operadores bloquearlos como grupo. Si a los sitios no les interesa en absoluto el tráfico procedente de China o Singapur, algunos también optan por impedir que cualquier dirección IP ubicada en esos países acceda a sus páginas.

Andy, administrador de un sitio web de previsión meteorológica, dice que acabó bloqueando cuatro ASN asociados con Tencent, Alibaba y Huawei. Eso bastó para reducir significativamente el número de bots, pero no para eliminarlos por completo. El número de visitas diarias de bots chinos a su sitio pasó de 127,000 en su punto álgido a poco más de 2,000 el día que habló con WIRED.