종목분석
  • 메인
  • Benzinga

애플 연구진 `AI 자체적 사고 가능성` 연구 발표...전문가들 `인위적 한계` 지적

Proiti Seal Acharya 2025-06-12 19:17:11
애플 연구진 `AI 자체적 사고 가능성` 연구 발표...전문가들 `인위적 한계` 지적

애플(NASDAQ:AAPL)이 AI 모델의 진정한 추론 능력과 단순 지능적 행동 모방을 구분하는 연구를 발표해 논란이 일고 있다. GPT-4 변형 모델과 클로드 등을 대상으로 고전적 논리 퍼즐을 테스트한 결과, 실제 문제 해결이 필요한 상황에서 이들 도구의 한계가 드러났다.


주요 내용
애플은 대규모 언어 모델(LLM)의 논리적 추론 능력에 의문을 제기하는 연구를 발표했다. 아스 테크니카에 따르면 연구진은 오픈AI의 o1, o3, 클로드 3.7 소넷, 딥시크-R1 등 주요 모델을 대상으로 하노이 탑과 강 건너기 같은 고전적 논리 퍼즐을 테스트했다. 그 결과 체계적 사고가 필요한 낯선 과제에서 이들 시스템이 실패하는 경우가 많았다.


기존 알고리즘을 갖추고 있음에도 모델들은 어려움을 겪었다. 이는 지능적 수행과 논리적 사고 사이에 존재하는 핵심적 격차를 보여준다.


AI 연구원 게리 마커스는 "LLM이 하노이 문제를 안정적으로 해결하지 못한다는 것은 정말 부끄러운 일"이라고 말했으며, 공동 연구책임자 이만 미르자데는 "모델들의 행동이 논리적이지도 지능적이지도 않다"고 지적했다.


연구진은 또한 일부 모델이 단계별 추론을 통해 중간 난이도 과제에서는 더 나은 성과를 보였으나, 복잡성이 증가하면 추론 노력을 확장하기는커녕 오히려 줄이면서 완전히 실패하는 것을 발견했다.


충분한 컴퓨팅 자원이 있음에도 이처럼 노력이 감소하는 이상 현상은 연구진이 '직관에 반하는 스케일링 한계'라고 부르는 것을 보여준다. 다양한 퍼즐에서 일관성 없는 결과가 나타난 것으로 보아 이러한 실패는 기술적 문제라기보다 과제 특성에 따른 것으로 보인다.


시장 영향
일부 전문가들은 애플의 결론에 반박하며, AI 모델의 추론 실패가 본질적 결함이 아닌 내재된 제약에서 비롯됐을 수 있다고 주장한다.


뉴스트리트리서치의 피에르 페라구 애널리스트는 이 논문이 "존재론적 넌센스로 가득 차 있다"고 비판했다.


케빈 A. 브라이언 이코노미스트는 이러한 시스템들이 제한된 컴퓨팅 예산 하에서 지름길을 사용하도록 훈련되었다고 설명했다. 그와 다른 전문가들은 내부 벤치마크에서 더 많은 토큰이 허용될 때 모델들의 성능이 향상된다고 지적하면서, 생산 시스템이 비효율을 피하기 위해 의도적으로 이를 제한한다고 말했다.


소프트웨어 엔지니어 션 괴데케와 AI 연구원 사이먼 윌리슨 같은 전문가들은 논리 퍼즐이 언어 모델을 테스트하는 공정한 방법인지에 의문을 제기했다. 괴데케는 딥시크-R1이 하노이 탑 문제에서 실패한 것은 능력 부족이 아닌 비실용적 출력을 피하기 위한 의식적 결정이라고 설명했다.


주가 동향
애플 주식은 장전 거래에서 0.01% 하락한 198.76달러에 거래되고 있다.

이 기사는 AI로 번역되어 일부 오류가 있을 수 있습니다.