클로드 챗봇 개발사 앤트로픽이 미국 상무부의 수출 금지 조치 해제에 따라 Fable 5 AI 모델을 공식적으로 재가동했다. 이번 재출시는 X와 같은 소셜 미디어 플랫폼에서 개발자들의 엇갈린 반응을 불러일으켰다. 일부는 성능을 칭찬했지만, 다른 이들은 유출된 시스템 로그를 통해 앤트로픽이 사용자 몰래 요청을 다운그레이드하고 있었다는 사실이 드러나자 분노했다.
앤트로픽은 모델에 새로운 안전 장치를 추가해 특정 탈옥 기법을 99% 이상 차단하고 있다. 그러나 더 엄격해진 필터에는 대가가 따른다. 일부 일반적인 코딩 및 디버깅 요청이 이제 차단되고 있으며, 많은 사용자들이 우려를 표명하고 있다.
X의 일부 사용자들은 추가 안전장치를 환영하며 수출 금지 이후 모델을 되찾기 위한 합당한 대가로 보고 있다. 반면 다른 이들은 새로운 가드레일이 지나치게 신중하다고 비판하며, 앤트로픽이 무해한 프롬프트를 너무 빨리 거부하도록 만들어 한 문제를 다른 문제로 바꿨다고 말한다.
에이전트 코딩 플랫폼 브리지마인드는 앤트로픽의 새로운 가드레일을 비판했다. 이 회사는 AI 기업이 Fable 5의 "성능 저하" 버전을 출시했다고 밝혔다. 브리지마인드는 또한 Fable 5의 디버깅 성공률이 금지 전 86.2%에서 재가동 후 25.9%로 떨어졌다고 지적했다. 모델의 리팩토링 및 환각 점수도 각각 73.6%에서 38.4%로, 75.9%에서 61.7%로 크게 악화됐다.
X의 개발자들은 Fable 5의 가드레일이 지나치게 민감하다고 말했다. 그들에 따르면 일반적인 코딩 작업이 잠재적으로 유해한 것으로 표시되고 있으며, 모델의 안전 필터가 패닉 상태에 빠져 사이버 무기를 만들려 한다고 가정하고 있다. 그 결과 이러한 작업들이 구형 Opus 4.8 모델로 넘겨지고 있다.
이러한 사례 중 하나는 오픈소스 코딩 도구 오픈코드를 개발 중인 개발자 댁스에게서 나왔다. 그는 Fable 5에 대한 자신의 일반적인 요청이 조용히 Opus 4.8로 다운그레이드되고 있음을 보여주는 시스템 로그를 공유했다.
로그 플래그에는 TOO_DUMB_TO_NEED_FABLE이라고 적혀 있었는데, 이는 앤트로픽의 시스템이 그의 작업이 프리미엄 모델을 필요로 할 만큼 복잡하지 않다고 판단했다는 의미다.
댁스가 로그를 게시한 후, 클로드 코드 엔지니어 타릭 시히파르는 "솔직히 당신이 로그를 볼 거라고는 예상하지 못했다"고 답했다. 이 발언은 소셜 미디어에서 반발을 불러일으켰고, 개발자들은 이를 앤트로픽이 사용자들이 Fable 5를 다운그레이드된 모델로 교체한 것을 알아차리지 못할 것으로 예상했다는 증거로 받아들였다.
타릭은 나중에 해당 플래그가 3월의 증류 방지 실험의 일부였으며 롤백될 것이라고 해명했다. 그러나 그 시점에 개발자들의 신뢰는 이미 손상된 상태였다.
앤트로픽은 아직 상장되지 않은 비상장 기업으로 공개 거래되는 주식이 없다. 그러나 AI 주식에 대한 노출을 원하는 투자자들은 팁랭크스가 추적하는 최고의 인공지능 주식을 고려할 수 있다.
