
중국의 딥시크(DeepSeek)가 칭화대 연구진과 협력해 대규모 언어모델(LLM)의 추론 능력을 향상시키는 새로운 기술을 개발했다. 사우스차이나모닝포스트(SCMP)는 지난 금요일 발표된 논문을 인용해 이 기술이 생성형 보상 모델링(GRM)과 자체 원칙 비평 튜닝을 결합한 것이라고 보도했다.
이 이중 접근법은 LLM이 일반적인 질의에 대해 더 나은 결과를 더 빠르게 제공하는 것을 목표로 한다.
연구진에 따르면 딥시크-GRM 모델이 기존 방식보다 우수한 성능을 보인 것으로 나타났다.
딥시크는 이 GRM 모델을 오픈소스로 공개할 계획이다. 딥시크의 등장과 저렴한 AI 모델 제공 선언은 미국에서 1조 달러 규모의 시장 가치 하락을 초래했으며, 중국 내 가격 경쟁을 촉발해 중국 빅테크 기업들이 저가 AI 모델을 출시하게 만들었다.
딥시크는 지난 3월 업그레이드된 V3 모델을 통해 향상된 추론 능력, 최적화된 프론트엔드 웹 개발, 중국어 작문 능력 개선을 제공했다고 밝혔다.
2월에는 5개의 코드 저장소를 오픈소스로 공개했으며, 2월 말에는 딥시크의 창업자 량원펑이 베이징에서 시진핑 중국 국가주석이 주최한 기술기업가 좌담회에 참석했다.
중국 전자상거래 공룡 알리바바(NYSE:BABA)는 4월까지 자사의 주력 AI 모델 업그레이드 버전을 출시할 계획이다.
딥시크의 발표는 중국 기술 기업들이 저렴한 AI 서비스를 시장에 쏟아내는 계기가 되었다.
오픈AI, 알파벳(NASDAQ:GOOG)(NASDAQ:GOOGL) 구글, 앤트로픽 역시 유사하게 새로운 모델들을 출시했다.
메타(NASDAQ:META)는 세계에서 가장 진보된 대규모 언어모델 중 하나를 기반으로 한 새로운 라마 4 인공지능 모델을 발표했다.
주목할 만한 점은 아이셰어스 차이나 라지캡 ETF(NYSE:FXI)가 연초 대비 10% 상승한 반면, 아이셰어스 차이나 라지캡 ETF(NASDAQ:QQQ)는 17% 이상 하락했다는 것이다.