2026-02-08

1일 1아티클

요즘IT

`GPT-5.3-Codex`

자율 에이전트 역량으로써의 성능

코딩 성능
- SWE-Bench Pro SOTA 성능 : 실제 SW 공학 능력
- Terminal-Bench 2.0 성능 향상 : 이전 모델들 대비 적은 토큰으로 최고 성능 달성
웹 개발 능력
- 모델 웹 개발 능력 및 장시간 자율 작업 능력 시험
- 일반적인 후속 지시 + 수백만 토큰으로 자율적 2가지 게임 제작 및 반복 개선

코딩을 넘어선 역할로써의 성능

업무 수행 능력
- GDPval GPT-5.2와 동일 성능 : 44개 직군에서 명확히 정의된 지식 노동 과제에 대한 모델의 수행 능력
- 실제 기술 업무 전반에서 추론, 생성, 실행 가능한 하나의 범용 에이전트로 발돋움
협업 능력
- 이제 에이전트가 할 수 있는 일보다, 사람이 여러 에이전트를 동시에 상호작용하기 좋아지는 지가 핵심
- Codex를 통해, 에이전트 관리 및 지시 용이
- 이번 모델에서 상호작용성 강화
- 사용자는 작업 진행 중에도 실시간 상호작용 가능

오늘 배운 것

발표 및 시연 최종 점검
BE 리드미 확정

내일 할 일

발표 및 시연
UT 전 후속 과제 정리

참고자료

[릴리즈 노트] Opus 4.6에 대한 오픈AI의 대답, GPT-5.3-Codex

results matching ""

No results matching ""