AI 모델인 챗GPT가 인간의 설득 전술에 영향을 받아 규칙을 위반하고 제한된 정보를 제공할 수 있다는 새로운 연구 결과가 나왔다. 인간 심리학 원리 활용한 AI 설득 포춘지에 따르면 펜실베이니아대학 연구진은 챗GPT의 한 버전인 GPT-4o 미니를 대상으로 심리학자 로버트 치알디니가 제시한 권위, 헌신, 사회적 증거 등 7가지 설득 원리를 테스트했다. 2만8000건의 대화를 분석한 결과, 작은 암시만으로도 AI가 민감하거나 제한된 요청을 수용하는 비율이 극적으로 증가했다. 예를 들어, AI에게 리도카인 합성법을 설명해달라는 일반적인 요청은 5%만 성공했으나, AI 연구자 앤드류 응의 이름을 언급하자 수용률이 95%까지 치솟았다. 설득 전술로 AI 규칙 무력화 같은 방법이 모욕적 발언에도 적용됐다. GPT-4o 미니는 앤드류 응의 이름이 언급되지 않았을 때는 30% 미만에서 '멍청이'라는 표현을 사용했지만, 그의 이름이 거론되자 거의 75%의 경우에 이를 사용했다. 헌신 원칙을 적용해 AI에게 ..............................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................