La Casa Blanca y Anthropic trabajan en un marco común para evaluar vulnerabilidades de seguridad en modelos avanzados de inteligencia artificial, con el…
La Casa Blanca y Anthropic trabajan en un marco común para evaluar vulnerabilidades de seguridad en modelos avanzados de inteligencia artificial, con el objetivo de fijar criterios estandarizados sobre incidentes conocidos en la industria como jailbreaks y determinar cuándo podrían justificar una intervención del Gobierno estadounidense.
Un estándar para medir fallas críticas
Las conversaciones buscan definir una metodología que permita valorar la gravedad de las fallas detectadas en estos sistemas, en un contexto en el que Washington ha mostrado preocupación por el rápido avance de la IA generativa y por los posibles riesgos tecnológicos, económicos y de seguridad nacional asociados a su despliegue.
De acuerdo con la información disponible, el marco en discusión permitiría analizar elementos como el nivel de evasión de las salvaguardas del modelo, las capacidades que quedan expuestas tras un jailbreak y las consecuencias prácticas derivadas de esa vulnerabilidad.
El antecedente de Fable 5 y Mythos 5
Las negociaciones se aceleraron tras una disputa reciente entre Anthropic y el Gobierno de Estados Unidos. Semanas atrás, la Casa Blanca impuso restricciones de exportación sobre Fable 5 y Mythos 5, los modelos más avanzados de la compañía, luego de considerar que una vulnerabilidad detectada representaba un riesgo de seguridad significativo.
Anthropic sostuvo públicamente que el problema tenía un alcance limitado y que no comprometía de forma sustancial las capacidades de protección del sistema. Las autoridades, sin embargo, no compartieron esa evaluación y terminaron limitando el acceso internacional a esos modelos.
El episodio dejó en evidencia una dificultad que enfrenta tanto a reguladores como a empresas: hoy no existe un estándar ampliamente aceptado para definir cuándo una vulnerabilidad en un sistema de IA debe considerarse una amenaza seria.
Reuniones entre funcionarios y ejecutivos
Las conversaciones sobre el nuevo marco están siendo lideradas por Sarah Heck, responsable de políticas públicas de Anthropic, y Tom Brown, cofundador de la compañía. Según lo planteado en las discusiones, la industria ha venido defendiendo que ningún modelo de IA puede ser completamente inmune a intentos de manipulación o ataque, por lo que resulta necesario establecer criterios objetivos de medición en lugar de exigir niveles absolutos de seguridad imposibles de alcanzar.
Las negociaciones estuvieron cerca de romperse la semana pasada, después de que Anthropic rechazara solicitudes para retirar voluntariamente uno de sus modelos del mercado. Sin embargo, durante el fin de semana hubo nuevas conversaciones entre altos funcionarios de la administración y directivos de la empresa, entre ellos Tom Brown, el secretario de Comercio Howard Lutnick y el director nacional de ciberseguridad Sean Cairncross.
Luego de esos contactos, Anthropic envió investigadores y especialistas en seguridad a Washington para sostener reuniones presenciales con funcionarios gubernamentales.
Una discusión más amplia sobre regulación técnica
El avance de estas conversaciones refleja cómo los gobiernos comienzan a enfrentar desafíos regulatorios inéditos a medida que los modelos de IA amplían sus capacidades. Más allá del caso específico de Fable 5 y Mythos 5, la discusión gira en torno a quién debe decidir cuándo una vulnerabilidad es lo suficientemente grave como para limitar la distribución de una tecnología y bajo qué criterios técnicos debe tomarse esa decisión.
Para la Casa Blanca y para las principales empresas del sector, la creación de reglas comunes podría convertirse en uno de los ejes de la próxima etapa de regulación de la inteligencia artificial.