![[블랙퀀트에쿼티] 나스닥 셀렉션](https://img.wownet.co.kr/banner/202506/2025061761937cada68743dca576f88b6193a265.jpg)
![[와우글로벌] 알파픽 추가 100명 모집](https://img.wownet.co.kr/banner/202506/20250627a6b5bf8630e44aac8102dfce6f5d94d7.jpg)
![[박준석]차이나는 기회](https://img.wownet.co.kr/banner/202506/2025060490127707fa1042eda00fcf1d11687a87.jpg)
![[블랙퀀트에쿼티] 공개방송 일정](https://img.wownet.co.kr/banner/202506/202506192d97e7aebad84428be3d2e073e6fbeac.png)
![[블랙퀀트에쿼티] 런칭이벤트](https://img.wownet.co.kr/banner/202506/2025061965a36b8591c0415a8027b51a310b4881.jpg)
![[이을수] 미국 ETF 한방에 끝내기 VOD](https://img.wownet.co.kr/banner/202505/20250523ba9d39248d5247a9b67a04651daebc55.jpg)
IBM의 최신 AI 모델인 그래나이트 비전 3.3 2B가 OCR벤치 리더보드에서 2위를 차지했다. 이는 70억 개 미만의 파라미터를 가진 멀티모달 모델 중 최고 성능을 기록한 것이다. 이는 다중 감각을 통해 세상을 이해하는 AI 모델을 개발하려는 IBM의 큰 계획의 일환이다. 그래나이트 비전은 차트, 표, 손글씨 메모, 문서 내 이미지 등 직장에서 일상적으로 접하는 시각 데이터를 이해하도록 설계됐다. 이는 최근 IBM의 새로운 음성인식 모델이 인상적인 결과를 보여준 데 이은 성과다.
AI 업계는 이러한 모델들의 시각적 콘텐츠 이해도를 테스트하기 위해 OCR벤치라는 벤치마크를 사용한다. 이는 모델이 텍스트를 읽고, 핵심 정보를 인식하며, 손글씨로 쓴 수학 문제를 이해하고, 시각적 내용에 대한 상세한 질문에 답하는 정확도를 측정한다. 각 모델은 1,000개의 질문으로 테스트되며, 의미 있는 결과를 보장하기 위해 모든 답변은 최소 4개의 기호를 포함해야 한다. 그래나이트 비전 3.3 2B는 특히 손글씨 수학 문제 읽기와 장면 관련 질문 답변에서 뛰어난 성능을 보였다. 심지어 구글, 오픈AI, 메타와 같은 기업의 더 큰 규모 모델들보다 우수한 성능을 보여 IBM의 훈련 방식이 얼마나 효과적인지를 입증했다.
주목할 만한 점은 IBM이 이번 그래나이트 비전 버전에 주요 업데이트를 진행했다는 것이다. 연구팀은 새로운 인코더를 추가하고, IBM의 비즈니스 요구사항에 맞춰 특별히 선별된 문서 중심의 예제들을 사용해 모델을 훈련시켰다. 연구원 로제리오 페리스는 이 모델이 강력할 뿐만 아니라 작고 효율적이어서 사용이 더 쉽고 비용도 저렴하다고 설명했다. IBM 연구팀은 앞으로 그래나이트 비전과 같은 모델들이 상세한 지시 없이도 시각적 정보를 추론하고 행동할 수 있게 될 것으로 전망하고 있다.
월가는 IBM 주식에 대해 중립적 매수 의견을 제시했다. 이는 최근 3개월간 7건의 매수, 5건의 보유, 2건의 매도 의견을 종합한 것이다. IBM의 평균 목표주가는 269.46달러로, 현재 가격 대비 8.6%의 하락 여지를 시사한다.