종목분석
  • 메인
  • Benzinga

앤트로픽 공동창업자 "2028년 AGI 가능하나 `경제적 튜링테스트` 통과해야 진정한 혁신 AI"

Shomik Sen Bhattacharjee 2025-06-14 20:01:55
앤트로픽 공동창업자

앤트로픽의 공동창업자 벤 만은 진정한 '혁신적 AI'는 자신이 말하는 '경제적 튜링테스트'를 통과한 후에야 등장할 것이라고 밝혔다.


주요 내용


벤 만은 최근 '노 프라이어스' 팟캐스트에 출연해 '경제적 튜링테스트'를 한 달간의 계약직과 AI 에이전트 중 채용 담당자가 선택해야 하는 직장 내 시험이라고 정의했다.


만은 이 테스트의 통과가 "사회적, 문화적 관점에서 정말 흥미로운 일이 시작되는 시점"이 될 것이라고 설명했다.


그는 실험실 기준치 대신 "경제적으로 가치 있는 업무의 50%를 포괄하는" 시장 기준을 제시했다. 각 관리자는 업무 수행을 위해 'AI 에이전트를 고용'하게 되며, 한 달이 지난 후 관리자가 기계를 선호한다면 "테스트를 통과한 것"이라고 말했다.


한계점


만은 이 시험에도 한계가 있다고 경고했다. 그는 "면접은 실제 업무 성과를 나타내는 부족한 근사치에 불과하다"며 현재의 테스트 방식이 제한적이고 너무 이론적이라고 지적했다.


앤트로픽은 이미 자사의 클로드 모델을 내부 면접에서 테스트했고 "매우 우수한" 결과를 얻었다. 다만 만은 공식 시험은 "아직 시작되지 않았으며" 다음 출시 주기 이후에나 가능할 것이라고 인정했다. 그는 2028년을 인공일반지능(AGI) 실현의 "매우 가능성 있는" 시기로 지목했지만, 정확한 일정은 여전히 추측에 불과하다고 신중한 입장을 보였다.


시장 영향


'경제적 튜링테스트'라는 용어는 컴퓨터가 인간처럼 사고할 수 있는지 판단하는 인공지능 분야의 간단한 조사 방법인 튜링테스트에서 발전된 개념이다.


오픈AI의 ChatGPT 4는 2024년 7월 인간 대화 상대를 54%의 확률로 속여 최초로 2인 튜링테스트를 통과한 AI LLM이 되었다. GPT-4.5는 올해 3월 더 공식적인 테스트에서 73%의 성공률을 달성했다. 하지만 전문가들은 이 테스트가 기계의 진정한 지능을 판단하는 정확도에 대해 여러 의문을 제기해왔다.


최근 와튼스쿨의 연구에 따르면 대규모 언어 모델이 이제 일반인보다 더 재미있는 밈을 만들어내 '밈 튜링테스트'를 통과한 것으로 나타났다.


앤트로픽의 성장세는 가속화되고 있다. 3월 시리즈E 라운드에서 기업가치가 615억 달러로 평가되면서, 아마존닷컴(NASDAQ:AMZN)과 알파벳(NASDAQ:GOOGL)(NASDAQ:GOOG)이 투자한 이 스타트업은 오픈AI의 가장 강력한 비상장 경쟁자로 자리매김했다.

이 기사는 AI로 번역되어 일부 오류가 있을 수 있습니다.