La inteligencia artificial está reduciendo el costo de identificar a usuarios anónimos en internet y, con ello, ampliando los riesgos para la privacidad,…
La inteligencia artificial está reduciendo el costo de identificar a usuarios anónimos en internet y, con ello, ampliando los riesgos para la privacidad, la participación pública y el disenso político. Un estudio publicado en arXiv, titulado Desanonimización en línea a gran escala con LLM, mostró que es posible reconstruir identidades a partir de datos dispersos y texto publicado libremente en la red.
De perfiles seudónimos a identidades reales
La investigación tomó perfiles de Hacker News, donde las personas participan bajo seudónimo, y los cruzó con cuentas de LinkedIn usando únicamente la información textual disponible públicamente. Sin contraseñas, sin intrusiones y sin acceso a datos privados, el modelo logró identificar correctamente a 226 de 338 perfiles analizados, con una precisión de 90%.
De acuerdo con los resultados, tareas que antes exigían horas de trabajo especializado pueden automatizarse hoy a escala y por un costo estimado entre 1 y 4 dólares. Aunque el sistema no es infalible, el avance plantea nuevas preguntas sobre el alcance real del anonimato digital.
El efecto en la participación pública
La posibilidad de ser observado suele generar autocensura, incluso cuando la vigilancia no es sistemática. En ese contexto, activistas, periodistas, disidentes y otras personas que intervienen en debates públicos pueden optar por moderar opiniones o evitar vínculos con causas consideradas riesgosas.
El problema no se limita a la identificación individual. Si una persona sabe que puede ser rastreada a partir de lo que publica, el espacio para la deliberación libre, la organización y el disenso se reduce de manera silenciosa. La pérdida del anonimato ya no sería un asunto técnico, sino una limitación directa a la autonomía política.
Riesgos en entornos de vigilancia
En contextos autoritarios, la erosión del anonimato digital adquiere una dimensión más grave. En Venezuela, el informe Los vigilantes en la mira señala que el Estado ha destinado más de mil millones de dólares a infraestructura de vigilancia digital, con recursos como reconocimiento facial con inteligencia artificial, intercepción masiva de telecomunicaciones y ciberpatrullaje sistemático.
En Cuba, el Primer Informe Integral sobre Vigilancia Digital en Cuba (2026) documenta, a partir de 200 declaraciones de ciudadanos, que 88% reportó que las autoridades mencionaron o reprocharon sus publicaciones y mensajes digitales como causa de citaciones, detenciones e interrogatorios.
En ambos casos, la vigilancia digital aparece como una herramienta de control político. Bajo ese escenario, las capacidades de desanonimización masiva aumentan el riesgo de que quienes usan seudónimos para proteger su identidad terminen expuestos a represalias por sus opiniones.
Debate sobre límites y supervisión
El alcance de estas tecnologías también preocupa fuera de los regímenes autoritarios. En abril de 2026, más de 600 empleados de Google firmaron una carta abierta dirigida al CEO, Sundar Pichai, para pedir que la empresa rechazara contratos clasificados con el Departamento de Defensa de Estados Unidos. La advertencia apuntaba a que no existe forma de asegurar que estas herramientas no se usen para causar daños o erosionar libertades civiles fuera del escrutinio público.
Al mismo tiempo, la tecnología puede tener usos distintos: desanonimizar a un disidente no es lo mismo que identificar a un ciberdelincuente o rastrear redes de desinformación. Por eso, el debate se centra en quién usa estas herramientas, con qué propósito y bajo qué supervisión.
Entre las medidas planteadas figuran exigir autorización judicial para usos de identificación o vigilancia masiva, hacer públicos y auditables los contratos entre gobiernos y empresas tecnológicas, restringir el acceso a interfaces de programación para datos de usuarios, detectar el raspado automatizado de información y establecer salvaguardas en los propios modelos para que rechacen solicitudes de desanonimización.
También se advierte que marcos clásicos de protección de datos, como la k-anonimidad o la privacidad diferencial, fueron diseñados para bases estructuradas y no contemplan ataques sobre texto libre. En ese marco, la discusión regulatoria tendría que incorporar los riesgos asociados a modelos de lenguaje e información no estructurada.
La presión sobre la libertad digital
La discusión remite a una tensión central: mientras la vigilancia se abarata, ejercer la libertad puede volverse más costoso. Sin condiciones reales de anonimato, asociación sin vigilancia y privacidad, la participación pública pierde una parte de su autonomía y se vuelve más vulnerable al control.
La respuesta, según los elementos planteados, no dependería solo de una ley o de una empresa, sino de marcos de supervisión, acuerdos entre Estados y estándares éticos de alcance global para limitar el uso de estas tecnologías.