Claude Fable 5, de Anthropic, enfrenta críticas crecientes después de su relanzamiento del 1 de julio. Usuarios y analistas sostienen que reglas más estrictas redujeron su capacidad para programar, depurar y actuar como agente.
BridgeMind reporta caídas marcadas en depuración y refactorización
El grupo de análisis BridgeMind volvió a evaluar la versión relanzada y encontró retrocesos importantes en BridgeBench. La depuración bajó de 86.2 a 25.9, la refactorización cayó de 73.6 a 38.4 y el manejo de alucinaciones descendió de 75.9 a 61.7.
BridgeMind añadió que solo tres de doce tareas de depuración se completaron sin recurrir a Claude Opus 4.8, y que cada vez que fue necesario usar ese modelo de respaldo, el puntaje fue cero. Según ese grupo, el problema no sería un razonamiento más débil, sino tareas bloqueadas.
“El modelo no empeoró. Lo enjaularon”, indicó BridgeMind en X.
Anthropic dice que reforzó sus filtros y aceptó más bloqueos
Anthropic explicó en un comunicado del 30 de junio que amplió a propósito su margen de seguridad. La compañía afirmó que sus filtros ahora bloquean algunas peticiones que probablemente son inocuas.
La empresa agregó que el filtro mejorado impide el método para saltarse la protección en más del 99% de los intentos, según reportaron investigadores de Amazon. También admitió que el sistema ahora marca como peligrosos más trabajos legítimos de programación y depuración que antes.
Cuando una consulta es bloqueada, pasa a Opus 4.8 y el usuario recibe una notificación. Anthropic sostiene, además, que pruebas propias no mostraron riesgos únicos en Fable 5 y que otros modelos como GPT-5.5 y Kimi K2.7 detectaron las mismas vulnerabilidades.
La compañía dijo que investigadores del Departamento de Comercio de Estados Unidos probaron ambos sistemas de protección y los consideraron muy sólidos.
Una cronología apretada y límites de uso hasta el 7 de julio
Anthropic lanzó Fable 5 el 9 de junio y Washington la retiró tres días después. Las autoridades levantaron los controles de exportación el 30 de junio, cuatro días después de que devolvieran el acceso a Mythos 5 a unas 100 instituciones estadounidenses.
El acceso restaurado también tiene límites: Fable 5 solo permite usar hasta el 50% del tope semanal hasta el 7 de julio, y después se requerirán créditos de uso pagados.
La discusión llega en un momento en el que la compañía trabaja junto con Amazon, Microsoft y Google en un marco de evaluación de la gravedad de los jailbreaks.
Si sus filtros reducen rápido los falsos positivos, el desenlace podría definir si los usuarios avanzados siguen en la plataforma o migran a otra.