



![[박준석] TV스페셜](https://img.wownet.co.kr/banner/202508/2025082621c6d0c271f84886a953aee25d7ba0c0.jpg)
AI가 단순히 대화를 넘어 실제로 일을 처리하려면 인터넷상의 앱이나 서비스 같은 실제 도구를 사용하는 방법을 알아야 한다. 이 과정을 툴 콜링(tool-calling)이라고 하며, AI 에이전트에게 가장 중요한 기능 중 하나다. 하지만 AI에게 이를 가르치는 것은 쉽지 않다. 많은 양의 우수한 실제 사례가 필요한데, 이를 찾기가 어렵기 때문이다. 이것이 바로 거대 기술 기업 IBM (IBM)과 워싱턴대학교가 투칸(Toucan)을 만든 이유다. 흥미롭게도 투칸은 현재 AI를 위한 툴 사용 사례의 가장 큰 공개 컬렉션으로, 2,000개 이상의 다양한 온라인 도구를 활용하는 150만 개의 실제 작업을 포함하고 있다.
이러한 사례에는 보고서 분석, 캘린더 초대 발송, 요약문 작성 같은 실용적인 시나리오가 포함되어 있으며, 깃허브(GitHub)와 스미서리닷에이아이(Smithery.ai)에서 찾은 API 서버의 실제 메타데이터를 사용해 구축되었다. 특히 연구진은 작동하지 않는 도구를 걸러내고, 5개의 대형언어모델(LLM)을 사용해 하나 이상의 도구를 포함하는 작업 계획을 생성했다. 또한 다른 모델들은 AI 에이전트가 각 작업을 단계별로 완료하는 방식을 시뮬레이션하는 데 사용되었으며, 별도의 모델 그룹이 각 시나리오의 난이도와 품질을 평가해 연구팀이 최상의 사례를 선택하는 데 도움을 주었다.
더욱이 초기 테스트 결과 투칸으로 훈련된 모델들은 잘 알려진 벤치마크에서 강력한 성능을 보였다. 예를 들어, 투칸으로 미세 조정된 큐웬-2.5 모델(32B)은 버클리 함수 호출 리더보드(BFCLv3)에서 거의 9퍼센트포인트 향상되었으며, GPT-4.5-프리뷰를 약간 앞섰다. 이 모델은 금융 분석과 웹 검색 같은 실제 작업을 다루는 벤치마크인 MCP-유니버스에서도 좋은 성과를 거뒀다. 그 결과, 연구진은 이제 더 새로운 도구로 투칸을 확장하고 기업 사용 사례를 위한 AI 에이전트를 개발할 훈련 환경을 구축할 계획이다.
월가로 눈을 돌리면, 애널리스트들은 IBM 주식에 대해 지난 3개월간 매수 6건, 보유 6건, 매도 1건을 기록하며 보통 매수(Moderate Buy) 컨센서스 등급을 부여했다. 또한 주당 평균 IBM 목표주가 287.50달러는 주식이 적정 가치 근처에서 거래되고 있음을 시사한다.