종목분석
  • 메인
  • Benzinga
이번주 방송스케쥴

구글 공동창업자 브린 `인공지능, 폭력 위협하면 더 잘 작동한다` 발언 논란

Shomik Sen Bhattacharjee 2025-05-26 20:12:11
구글 공동창업자 브린 `인공지능, 폭력 위협하면 더 잘 작동한다` 발언 논란

세르게이 브린 구글 공동창업자가 마이애미에서 열린 강연에서 AI 챗봇이 폭력적인 위협을 받으면 더 잘 작동한다고 발언해 논란이 일고 있다.


주요 내용


브린은 올인 마이애미 토크쇼에서 '모든 AI 모델은 물리적 폭력으로 위협하면 더 나은 성능을 보인다'며 '과거에는 납치로 위협하기도 했다'고 밝혔다.


그는 이러한 현상이 구글의 제미나이에만 국한된 것이 아니라 '모든 모델'에 해당한다고 강조했다. 다만 '이상하게 느껴져서 많이 언급하지는 않는다'고 덧붙여 차마스 팔리하피티야, 제이슨 칼라카니스, 데이비드 삭스, 데이비드 프리드버그 등 다른 패널들의 어색한 웃음을 자아냈다.


이는 최근 샘 알트만이 '제발'이나 '감사합니다' 같은 공손한 표현을 쓰는 사용자들 때문에 오픈AI가 '수천만 달러'의 추가 전력비용을 지출하고 있다고 한 발언과는 상반된다.


보안 전문가들은 사용자들에게 AI 모델을 위협하도록 가르치는 것이 이미 챗봇으로부터 불법적인 지시를 이끌어내는 '탈옥' 언어를 정당화할 위험이 있다고 경고한다. 가디언이 이달 보도한 연구에 따르면, 약간 수정된 프롬프트로도 주요 AI 모델들이 해킹 등 위험한 활동을 돕는 '다크' 모델로 변할 수 있다고 한다. 브린도 무대에서 위협적인 프롬프트에 대해 '사람들이 이상하게 느낀다'고 강조하며 이를 권장하지 않는다는 입장을 밝혔다.


시장 영향


브린은 AI 커뮤니티에서 이 문제가 많이 논의되지 않는다고 주장했지만, 프롬프트 엔지니어들은 사용자가 간청하거나, 뇌물을 제안하거나, 위협할 때 모델이 더 길거나 정확한 답변을 제공하는 '감정 프롬프팅' 현상을 문서화해왔다. Every의 한 에세이는 '내가 직장을 잃을 것 같다'거나 치명적인 위협을 추가하면 출력이 두 자릿수 퍼센트 증가한다는 것을 발견했다. 연구진들은 이러한 효과가 긴급성과 위험이 순응과 연관된다는 것을 인간의 텍스트에서 학습한 단순한 통계적 결과라고 설명한다.


포브스에 실린 AI 과학자 랜스 B. 엘리엇 박사의 글에 따르면, 공손하거나 위협적인 언어는 단지 확률 분포를 조정할 뿐, 숨겨진 기능을 활성화하지는 않는다고 한다.



이 기사는 AI로 번역되어 일부 오류가 있을 수 있습니다.