lunes, 22 de agosto de 2022

Apocalipsis Botspam: Bots Saturan Internet a favor de las Big-Tech

Llamada de atención de Marginalia, gestor del Buscador de internet alternativo Marginalia Search DIY OSI, sobre un efecto indeseable e inesperado de Internet: la saturación por sobreactividad automatizada o bots. O como él denomina Apocalipsis Botspam.

Los bots son pequeños programas automatizados auxiliares que desencadenan su actividad ante eventos determinados programados. De estos bots, alrededor de un 55% sirven a distintas funciones (búsqueda, indexación, curetaje...) mientras que el resto se considera malware (cuentas automatizadas, fake-news feeder-bots, spammer, add). El conjunto de efectos hacen que el volumen de información sea tan grande que se saturen los servidores y, en definitiva, las capacidades de gestión, por lo que solo las empresas más grandes son capaces de tratar la información de forma efectiva. Si en 2014 se calculaba que alrededor del 50% del tráfico de internet podía deberse a bots en 2021 ya se calcula que alrededor de un 66%, seguramente más, podría serlo. ¿Qué sucederá de aquí a 5 años ante el aumento de la digitalización? Se calcula que el 62% de la población mundial está actualmente conectada de uno u otro modo con un incremento anual del 4%. Si aumenta tanto su proporción como la de bots, ¿Qué sucederá cuando el 90% del tráfico de internet sea automático, como ya ocurre con el Comercio de Alta Frecuencia? Colapso en tráfico y servicios con concentración de recursos. Gueto Digital.

Internet no escapa a la acumulación masiva de medios. Las Big-tech acapararon el nicho digital gracias a la innovación, sanciones y absorciones hasta 2015 (reestructuración final de Google en Alphabeth). Resultado es la concentración del 56% del tráfico de internet en solo 6 compañías estadounidenses de servicios de internet, las GAFAM+N. Ahora el propio diseño del medio dirige a la industria a la eliminación de la iniciativa autónoma y de la pequeña empresa en favor de los grandes inversores.

¿Será capaz la industria digital de ahogar la iniciativa autónoma hasta paralizar el ecosistema? Las GAFAMN están sufriendo en estos mismos momentos un parón de innovaciones en sus proyectos (fracaso de META, caída de Netflix y Microsoft, incapacidad de implementar el 5G y retraso en la IA). Parece que ese es el camino. El medio ambiente se les queda corto, los capitalistas son capaces de cargarse hasta el ecosistema digital.

Salud! PHkl/tctca

_________________

Traducción tarcoteca - MEMEX - Botspam Apocalypse [ 2022-08-03 ]

Los bots están paralizando absolutamente todo el ecosistema de Internet.

El "futuro" de la película Terminator 2 está ambientado en la década de 2020. Si aplicamos sus predicciones al funcionamiento de un sitio web, honestamente, es muy precisa.

El tráfico de los bots moderno es prácticamente indistinguible del tráfico humano y puede derribar cualquier servicio autohospedado, inundar cualquier formulario con comentarios no deseados y es un dolor de cabeza crónico para casi cualquier operador de servicios web a pequeña escala.

Son una parte importante en la eliminación de los foros web y un jarro de agua para cualquier tipo de creatividad o experimentación divertida en Internet.

Los únicos que pueden sobrevivir al apocalipsis bot son los grandes servicios web. Tus reddits, facebook, twitter, tus comentarios en SaaS [software as service, suscripciones online] y discords. Tienen las economías de escala para desarrollar contramedidas viables, contratar equipos de personas para trabajar en el problema a tiempo completo y tal vez al menos mantenerse al día con los bots en constante evolución.

El resto se ve obligado a construir servicios web sin interactividad, o buscar refugio detrás de algo como Cloudflare, que discrimina configuraciones específicas del navegador y utiliza la reputación de IP para filtrar el tráfico de forma selectiva.

Si Marginalia Search no usara Cloudflare, no podría atender el tráfico. Ha habido más de 15 consultas por segundo de bots. Simplemente no hay forma de lidiar con ese tipo de tráfico, ni siquiera para rechazarlo. El motor de búsqueda está alojado en banda ancha residencial, está alojado en una PC mejorada.

No puedo permitirme operar un centro de datos para atender un tráfico que ni siquiera es humano. Todo este tráfico de spam proviene de botnets con direcciones IP en todo el mundo. Decenas, tal vez cientos de miles de direcciones IP, cada una con tasas de consulta relativamente modestas, por lo que la limitación de tasas afecta a todos.

La única opción es enrutar todo el tráfico de búsqueda a través de este incompleto servicio a terceros. Apesta en un sentido más amplio porque empeora Internet, impulsa una mayor centralización de cualquier tipo de servicio que ofrezca comunicación o interactividad, nos convierte a todos en inquilinos en lugar de propietarios de nuestra presencia en la web. Eso es exactamente lo contrario de lo que necesitamos.

La otra opción sería requerir el inicio de sesión de los usuarios, que además de ser un inconveniente, no quiero saber quién está usando el buscador, pero si no sé quién está usando el buscador, no sé quién está abusando del buscador.

Cloudflare es el mal *menor* en este caso. No es justo, pero al menos permite que el servicio permanezca abierto y atienda el tráfico de una manera que al menos no moleste a todos los visitantes humanos todo el tiempo.

La puerta de enlace API es otra puñalada en esto, puede elegir entre una API pública con un límite de velocidad común o revelar su identidad con una clave API (y sacrificar el anonimato).

Todas las otras alternativas, hasta donde llega mi conocimiento, apestan. Son prohibitivamente intrincadas o tonterías de microtransacción de criptomoneda web3 que, si bien seguro que funcionaría, también monetizan cada interacción de una manera que es más distópica que el desquiciante apocalipsis robot.

Si alguien pudiera seguir adelante y encontrar una solución a este lío, sería genial, porque está sofocando Internet por completo y es doloroso pensar en todos los pequeños y maravillosos proyectos que se cancelan o abandonan cuando se enfrentan a la realidad de tener que lidiar con un ecosistema digital tan atrozmente hostil.
_____________

Para Saber Más

1 comentario:

Tu opinión es importante