Anthropic bloquea el acceso de todos los clientes a Fable 5 y Mythos 5
Anthropic ha deshabilitado el acceso de todos sus clientes a Fable 5 y Mythos 5 para garantizar el cumplimiento de una orden que recibió del gobierno el viernes 12 de junio. Todos sus otros modelos y su chatbot Claude no se ven afectados. La empresa dijo en su anuncio que el gobierno de EE. UU. quería que suspendiera el acceso de todos los nacionales extranjeros a sus modelos de IA recién lanzados, ya estén dentro o fuera de EE. UU. e incluso si son empleados de Anthropic, citando preocupaciones de seguridad nacional.
Si bien el gobierno de EE. UU. no especificó cuáles son esas preocupaciones, Anthropic cree que se debe a que el gobierno se enteró de un método para desbloquear Fable 5. La compañía lanzó recientemente el modelo de IA Fable, que fue diseñado para llevar muchas de las capacidades de Mythos al público, el 9 de junio. Si recordamos, Mythos es su modelo de ciberseguridad de última generación que solo está disponible para sus socios de Project Glasswing. Las capacidades de Fable "superan" cualquier modelo anterior que Anthropic haya lanzado. Superó a Pokémon FireRed durante las pruebas de la compañía, por ejemplo, mientras que Claude no pudo superar a Pokémon Red, el juego original en el que se basó.
Anthropic enumeró las medidas que tomó para garantizar que Fable estuviera seguro en su publicación. Dijo que instituyó fuertes salvaguardias para "reducir la probabilidad de que Fable se utilice de manera indebida para tareas relacionadas con la ciberseguridad" y agregó que sus "salvaguardias son tan fuertes que muchos usuarios se han quejado de que son demasiado amplias". La compañía también explicó que ningún proveedor puede garantizar resistencia perfecta a intentos de desbloqueo, y cada modelo es vulnerable a desbloqueos hechos especialmente para él. "Nuestro objetivo era hacer que los desbloqueos fueran estrechos (en el caso de desbloqueos no universales) o muy costosos de producir (en el caso de desbloqueos universales), y combinar esto con un monitoreo exhaustivo para detectar y detener rápidamente cualquier ataque exitoso", dijo sobre su estrategia de defensa.
El gobierno aparentemente le proporcionó a la empresa evidencia verbal de un posible desbloqueo estrecho y no universal que una entidad no nombrada compartió con funcionarios. Anthropic prometió compartir más detalles en las próximas 24 horas, pero aclaró que no está de acuerdo en que un posible desbloqueo deba ser motivo para retirar un modelo comercial.
"Como hemos declarado públicamente, creemos que el gobierno debería tener la capacidad de bloquear implementaciones inseguras, como parte de un proceso estatutario que sea transparente, justo, claro y fundamentado en hechos técnicos", escribió Anthropic, que ha sido vocal sobre sus advertencias acerca de la necesidad de más supervisión de la IA. "Esta acción no se adhiere a esos principios."
