A era da liberação irrestrita de novos modelos de inteligência artificial pode estar ganhando um novo freio. A Anthropic tomou uma decisão drástica em relação ao seu mais recente modelo, chamado de Mythos: o lançamento público foi limitado. O motivo seria porque o sistema provou ser tão eficiente em encontrar e explorar falhas de segurança que, nas mãos erradas, poderia viabilizar ciberataques em escala sem precedentes.
Para mitigar esse risco e virar o jogo a favor da segurança, a empresa anunciou a criação do Project Glasswing, uma força-tarefa de testes restrita a um seleto grupo de gigantes da tecnologia.
O que é o Project Glasswing?
Através do Project Glasswing, empresas como Microsoft, Apple, Amazon e Cisco terão acesso antecipado ao modelo Mythos.
A meta é que essas organizações testem a IA exaustivamente dentro de seus próprios produtos, identificando e corrigindo vulnerabilidades de software antes que o modelo chegue ao público geral. As descobertas feitas durante esse período serão compartilhadas coletivamente entre os participantes do projeto.
Essa precaução reflete uma preocupação crescente na indústria. Modelos sofisticados de IA já estão na mira de cibercriminosos e hackers patrocinados por Estados para contornar defesas. Recentemente, por exemplo, ferramentas de IA foram utilizadas para facilitar uma invasão direcionada ao governo mexicano.
As Capacidades Surpreendentes do Mythos
O detalhe mais intrigante é que o Mythos é um modelo de IA de uso geral, não tendo sido treinado especificamente para cibersegurança. Mesmo assim, os testes internos da Frontier Red Team (equipe de segurança da Anthropic) revelaram um potencial impressionante.
O “Mythos Preview” demonstrou ser capaz de:
- Explorar sistemas globais: Identificar e explorar vulnerabilidades em todos os principais sistemas operacionais e navegadores web quando instruído por um usuário.
- Criar ataques complexos: Em um dos testes, o sistema desenvolveu sozinho um exploit para navegador que encadeava quatro vulnerabilidades simultaneamente.
- Desenterrar falhas históricas: A IA descobriu um bug de segurança de 27 anos escondido em um software crítico de infraestrutura da internet.
- Superar testes tradicionais: O Mythos encontrou uma vulnerabilidade de 16 anos em uma linha de código de um software de vídeo popular. Essa mesma linha já havia sido analisada cinco milhões de vezes por ferramentas automatizadas de teste tradicionais, sem que a falha fosse detectada.
Segredo Revelado por Acidente
Para garantir que o Mythos não vaze ou seja acessado indevidamente durante a fase do Project Glasswing, Dianne Penn, chefe de gestão de produto para pesquisa da Anthropic, garantiu que existem proteções e controles de acesso rigorosos em vigor, embora os detalhes permaneçam em segredo por questões de segurança.
Curiosamente, a própria existência do Mythos quase foi mantida sob sigilo absoluto até o lançamento oficial. O mundo da tecnologia só tomou conhecimento do modelo no final do mês passado, após um rascunho de uma postagem de blog da Anthropic ter sido deixado inadvertidamente em um repositório de dados público.















