기술 대기업 IBM(IBM)이 소프트웨어 엔지니어들을 위한 새로운 AI 도구를 개발했다. 이 도구는 버그 찾기 및 수정, 코드 작성과 같은 반복적인 작업을 처리한다. iSWE-Agent라고 불리는 이 도구는 최근 Java 코드의 문제 해결 능력을 테스트하는 유명한 벤치마크에서 1위와 2위를 차지했다. 최고 성능 버전은 앤트로픽의(PC:ANTPQ) Claude 4.5 Sonnet AI를 사용했으며 33%의 문제 해결 성공률을 기록했다. 두 번째로 우수한 버전은 오픈소스 모델만을 사용했으며 31%의 성공률로 근접했다.
이 도구는 버그 리포트와 같은 작업을 읽고 코드를 수정하는 방법을 파악하는 방식으로 작동한다. 특히 IBM은 대부분의 고객이 Java를 사용하기 때문에 Python 대신 Java에 집중했다. Python 벤치마크는 많은 AI 모델이 이미 해당 테스트 세트로 학습되어 신뢰성이 떨어진다. 이로 인해 결과의 신뢰도가 낮아진다. 반면 Java는 더 어렵고 대부분의 AI 도구가 높은 점수를 받지 못하기 때문에 실제 성능을 더 명확하게 보여준다.
iSWE-Agent를 돋보이게 만드는 것은 구축 방식이다. 안전하지 않거나 지나치게 복잡한 방법을 사용하는 대신 IBM 자체의 오픈소스 툴킷을 활용한다. 또한 단순히 추측하는 것이 아니라 더 지능적으로 코드를 편집한다. 그 결과 IBM은 이제 도구를 더욱 개선하고 궁극적으로 소프트웨어 충돌 시 자동으로 버그를 수정하는 시스템에 연결할 계획이다.
증권가에서는 지난 3개월간 9건의 매수, 5건의 보유, 1건의 매도 의견을 바탕으로 IBM 주식에 대해 보통 매수 컨센서스 등급을 부여했다. 또한 IBM의 평균 목표주가는 주당 303.08달러로 현재 주가가 적정 가치 수준에서 거래되고 있음을 시사한다.
