Sakana AI lanzó Fugu, un sistema de orquestación multiagente que, según la empresa, busca ofrecer una alternativa frente a la dependencia de un solo…
Sakana AI lanzó Fugu, un sistema de orquestación multiagente que, según la empresa, busca ofrecer una alternativa frente a la dependencia de un solo proveedor de inteligencia artificial. Su modelo principal, Fugu Ultra, afirma igualar el rendimiento de Fable y Mythos, dos modelos de Anthropic afectados por restricciones de exportación.
Un sistema para delegar tareas entre modelos
La compañía con sede en Tokio plantea Fugu como una herramienta pensada para coordinar un grupo de modelos intercambiables. En la práctica, el usuario envía una sola solicitud y el sistema se encarga de elegir, delegar y sintetizar las tareas de manera interna.
El producto tiene dos niveles y funciona a través de una API compatible con OpenAI. Fugu está diseñado para tareas cotidianas y de respuesta rápida, mientras que Fugu Ultra coordina un grupo más amplio de agentes para trabajos más complejos, como investigación en IA o análisis de ciberseguridad.
El contexto: restricciones y soberanía en IA
El lanzamiento llegó después de que Anthropic suspendiera el acceso a Fable 5 y Mythos 5 el 12 de junio, tras una orden de control de exportaciones de Estados Unidos que citó razones de seguridad nacional e impidió el acceso para personas extranjeras.
La propuesta de Sakana se alinea con el debate sobre la soberanía en IA, es decir, la capacidad de países y empresas de controlar los modelos de los que dependen. La empresa sostiene que cualquier gobierno o empresa que apoye sistemas esenciales en la inteligencia artificial de un solo proveedor enfrenta una vulnerabilidad importante.
En ese sentido, Sakana afirma que el problema ya no es teórico, sino una situación que ya está ocurriendo. La compañía señaló que, con los controles de exportación recientes sobre modelos como Fable y Mythos, el acceso puede desaparecer de un momento a otro.
Cómo se compara Fugu Ultra
Sakana comparó Fugu Ultra con Fable 5, Mythos Preview, Gemini 3.1 Pro, GPT 5.5 y Opus 4.8. Los resultados fueron mixtos y no mostraron un ganador absoluto. Fugu Ultra lideró en cuatro de ocho pruebas, entre ellas LiveCodeBench, con 93,2 puntos, y GPQA-D, con 95,5.
Fable 5 ganó en tres pruebas. Encabezó SWEBench Pro con 80,0, por encima del 73,7 de Fugu Ultra. También quedó al frente en SciCode y Humanity’s Last Exam, mientras que Opus 4.8 fue superior en CTI-REALM.
Frente a Mythos Preview, Fugu Ultra obtuvo mejores resultados en cada prueba compartida, aunque las diferencias fueron pequeñas.
Demostraciones y pruebas adicionales
Además de las tablas comparativas, Sakana presentó demostraciones de tareas. En un test de aprendizaje automático autónomo, Fugu Ultra completó más de 100 experimentos durante 14 horas usando una sola GPU H100.
La empresa aseguró que Fugu Ultra alcanzó el mejor rendimiento medio, con 0,9774, y también la mejor ejecución individual de todo el experimento, con 0,9748, por encima de todas las referencias evaluadas.
Otras demostraciones incluyeron trading, ajedrez y diseño. Con este lanzamiento, Fugu se suma al esfuerzo de distintas empresas y países por desarrollar alternativas, en un entorno donde el acceso a los modelos más avanzados es cada vez más limitado.
La propia empresa destacó que el sistema busca esquivar las restricciones de los proveedores al orquestar un conjunto de agentes intercambiables y coordinar modelos disponibles para sostener una propuesta de soberanía real en IA.