이번에 길고 복잡한 코딩 작업에 최적화됐다고 해서 써봤는데, 진짜 성능 미쳤음…
놀라운 건 SWE-벤치 베리파이드 테스트에서
77.9% 기록했다는 거야.
참고로
제미나이 3: 76.2%
Claude Sonnet 4.5: 77.2%
보다도 높은 수치임.
속도도 이전 Codex보다 27~42% 더 빠르다고 하니까,
아직 안 써봤으면 한번 체험해보는 거 추천함!
개인적으로는 긴 파일 리팩터링할 때 진가 발휘하더라 👀
사용 링크 => https://developers.openai.com/codex