Un equipo internacional de investigadores de Anthropic, ETH Zürich y MATS publicó en febrero de 2026 un estudio titulado Large–scale online deanonymization with LLMs (Desanonimización en línea a gran escala con LLMs).
Los investigadores desarrollaron un agente autónomo impulsado por IA capaz de identificar la identidad real de personas a partir de sus perfiles y conversaciones bajo seudónimo en plataformas como Hacker News, Reddit y LinkedIn.
El sistema opera en tres etapas:
- Extracción: El agente analiza todo el texto no estructurado (posts, comentarios, biografías y perfiles) y extrae automáticamente señales altamente identificadoras: estilo de escritura único, referencias geográficas implícitas, profesión, hobbies específicos, valores personales, detalles biográficos, contradicciones temporales y patrones lingüísticos sutiles.
- Búsqueda: Mediante representaciones vectoriales semánticas, filtra millones de candidatos potenciales en Internet y los reduce a un conjunto manejable en cuestión de segundos.
- Razonamiento: El modelo evalúa los mejores candidatos, confirmando las coincidencias reales y eliminando falsos positivos mediante razonamiento en cadena.
Los resultados no son perfectos, pero lograron identificar correctamente al 67 % de los usuarios de Hacker News vinculándolos a sus perfiles reales de LinkedIn (226 de 338 objetivos). En transcripciones completamente anonimizadas de entrevistas a científicos de Anthropic lograron un 82 % de precisión. Todo el proceso se completó en minutos, con un coste de menos de 4 dólares por perfil. El coste total del experimento no superó los 2.000 dólares.
Uno de los investigadores, Simón Lermen, publicó una nota breve explicativa de la mecánica del experimento.
Conclusión
Los LLMs pueden procesar y analizar cantidades masivas de datos no estructurados, extrayendo de forma automática características identificadoras que antes requerirían semanas o meses de análisis manual exhaustivo por parte de expertos humanos. Aunque la precisión aún no es del 100 % (el sistema suele abstenerse cuando no tiene suficiente confianza), los autores advierten que la tecnología mejora rápidamente y que el coste sigue cayendo.
La pseudonimidad simple ya no ofrece la protección que creíamos. Este avance podría poner en riesgo la privacidad y seguridad de periodistas de investigación, activistas, whistleblowers y disidentes que dependen de la pseudonimidad en línea.
No se pierda nuestro podcast sobre el artículo


