생성형 AI가 연구 실험 단계에서 기업과 고객이 실제 사용하는 시스템으로 발전하기까지는 불과 몇 년밖에 걸리지 않았다. 하지만 AI 사용이 확대되면서 기업들은 이러한 도구의 안전성과 신뢰성 확보가 필요한 상황이다. 이에 기술 대기업 IBM이 보안 취약점 발견 전문기업 해커원과 협력해 자사의 그래나이트 AI 모델을 대상으로 하는 버그바운티 프로그램을 시작한다.
이 프로그램은 윤리적 해커들이 해커원 플랫폼을 통해 그래나이트 모델을 테스트하고 의도하지 않은 방식으로 작동하도록 유도하는 방식으로 진행된다. 연구자들이 모델을 성공적으로 속이면 AI 안전성, 보안, 거버넌스 전문가로 구성된 IBM 내부 팀이 결과를 분석하고 이를 모델 개선에 활용한다. IBM은 발견된 문제의 중요도에 따라 최대 10만 달러의 보상금을 제공할 예정이다.
또한 이 프로그램은 모든 대규모 언어 모델과 함께 작동하도록 설계된 오픈소스 안전 도구인 그래나이트 가디언으로 시작된다. 목표는 실제 상황에서 모델의 한계를 시험하는...........................................................................................................................................................................................................................................................................................................................