앤트로픽의 클로드 페이블 5가 7월 1일 재출시 이후 거센 비판에 직면했다. 사용자들은 강화된 안전 규칙이 주요 모델의 코딩, 디버깅, 도구 사용 기능을 망가뜨렸다고 주장한다. 테스트 그룹 브리지마인드는 자체 테스트 전반에서 점수가 크게 하락한 것을 확인했으며, AI의 핵심 논리는 여전히 강력하지만 새로운 필터가 실제 작업을 차단하고 있다고 밝혔다. 브리지마인드는 작업이 끝까지 실행될 경우 모델이 이전과 동일하게 작동한다며, 모델이 나빠진 것이 아니라 "갇혔다"고 결론지었다.
이러한 마찰은 긴장된 정부 대치 직후 발생했다. 워싱턴은 6월 9일 첫 출시 3일 만에 페이블 5를 오프라인으로 전환했으며, 6월 30일에야 무역 제재를 해제했다. 기술 애호가들은 접근이 다시 가능해진 것을 반기지만, 엄격한 새 안전 장벽이 일상적인 코딩 작업에 AI를 사용하기 훨씬 어렵게 만들고 있다.

새로운 안전 규칙은 독립 평가 점수의 큰 하락을 초래했다. 이 점수는 외부 테스트 그룹에서 나온 것으로, 앤트로픽과 완전히 별개인 조직들이 AI를 표준화된 테스트로 실행해 실제 성능을 측정한 결과다.
이번 테스트는 클로드가 소프트웨어 코드에서 오류를 찾는 능력(디버깅)과 코드를 더 깔끔하게 재작성하는 능력(코드 수정)을 측정했다. 점수가 높을수록 AI가 작업을 독립적으로 성공적으로 완료했다는 의미다. 브리지마인드는 7월 1일 버전의 페이블 5를 다시 테스트한 결과 점수가 완전히 떨어진 것을 확인했다. 디버깅 점수는 86.2에서 25.9로 급락했고, 코드 수정은 73.6에서 38.4로 하락했다.
앤트로픽은 새로운 안전 조치를 옹호하며, 보안망을 의도적으로 훨씬 넓게 만들었다고 설명했다. 이는 AI 필터가 완전히 안전할 가능성이 높은 프롬프트도 적극적으로 차단해 나쁜 것이 빠져나가지 않도록 한다는 의미다. 아마존 (AMZN) 연구진에 따르면, 이 업그레이드된 필터는 일반적인 우회 시도의 99% 이상을 차단한다.
앤트로픽은 새 필터가 많은 실제 무해한 코딩 작업을 차단한다는 점을 인정하면서도, 자체 테스트 결과 페이블 5가 특별한 위험을 제기하지 않는다고 밝혔다. 실제로 오픈AI의 GPT-5.5와 키미 K2.7 같은 경쟁 모델도 동일한 취약점을 표시했다. 미국 상무부 정부 연구진도 새 안전 시스템을 테스트한 후 보호 기능이 매우 강력하다고 평가했다. 앤트로픽은 현재 아마존, 마이크로소프트 (MSFT), 구글 (GOOGL)과 협력해 해킹 추적을 위한 더 나은 시스템을 구축하고 있지만, 파워 유저들이 다른 옵션으로 전환하기 전에 이러한 오탐지를 빠르게 해결해야 한다.