앤트로픽이 최신 AI 모델 '클로드 오푸스 4.5'를 24일 공개했다.
앤트로픽에 따르면, 오푸스 4.5는 성능 엔지니어링 지원자에게 제공하는 고난도 과제 시험에서 정해진 2시간 제한 내에 어떤 인간 지원자보다 높은 점수를 받았다.
실제 소프트웨어 엔지니어링 평가 벤치마크인 SWE-bench Verified에서도 오푸스 4.5는 경쟁 모델들을 제치고 1위를 차지했다.
출시 전 내부 테스트에서 앤트로픽 직원들은 오푸스 4.5가 모호한 상황을 처리하고, 별다른 안내 없이도 복잡한 다중 시스템 버그를 해결한다고 평가했다.
오푸스 4.5는 앤트로픽의 앱과 API, 3대 주요 클라우드 플랫폼에서 이용 가능하다. 가격은 100만 토큰당 5달러/25달러로 책정돼 이전보다 접근성이 높아졌다.
앤트로픽은 시스템 카드를 통해 오푸스 4.5가 지금까지 출시한 모델 중 가장 안전하게 정렬된 모델이라고 밝혔으며, 특히 모델을 속여 유해한 행동을 하도록 하는 *프롬프트 인젝션 공격에 대한 견고함이 뛰어나다.
*프롬프트 인젝션 공격: 대형 언어 모델(LLM)에 대한 사이버 공격의 한 유형으로, LLM이 개발자 프롬프트와 사용자의 입력을 구분하지 못하는 점을 악용해서 의도한 제어를 우회해 민감한 정보의 유출이나 잘못된 정보의 생성을 유도하는 공격
앤트로픽 뉴스룸, Introducing Claude Opus 4.5