Anthropic ha revelado que su nuevo modelo de propósito general, Claude Mythos, ha detectado "miles de vulnerabilidades de alta gravedad" en sistemas operativos y navegadores web. Este modelo ha identificado que el 99% de las vulnerabilidades encontradas aún no han sido parcheadas, lo que genera preocupaciones significativas sobre la seguridad del software.
Además del lanzamiento de Claude Mythos, la compañía también ha iniciado el Proyecto Glasswing, una colaboración con importantes empresas como Amazon Web Services, Apple y Microsoft, destinada a asegurar el software crítico a nivel mundial. Esta iniciativa busca abordar las vulnerabilidades detectadas por Mythos y mejorar la seguridad en general.
Un ejemplo notable de las capacidades de Mythos es la creación de un exploit para una vulnerabilidad antigua en FFmpeg, que data de un error introducido en 2003. A pesar de haber pasado desapercibido por expertos, Mythos logró identificarlo tras realizar varios cientos de análisis del repositorio, destacando la eficacia de los modelos avanzados de lenguaje.
Anthropic también mencionó que, aunque los costos de operar sus servidores de IA son elevados, al realizar un millar de ejecuciones en busca de vulnerabilidades, el gasto total fue de menos de $20,000, lo que permitió descubrir varias docenas de hallazgos adicionales.