2026-02-08
1일 1아티클
요즘IT
GPT-5.3-Codex
자율 에이전트 역량으로써의 성능
- 코딩 성능
SWE-Bench ProSOTA 성능 : 실제 SW 공학 능력Terminal-Bench 2.0성능 향상 : 이전 모델들 대비 적은 토큰으로 최고 성능 달성
- 웹 개발 능력
- 모델 웹 개발 능력 및 장시간 자율 작업 능력 시험
- 일반적인 후속 지시 + 수백만 토큰으로 자율적 2가지 게임 제작 및 반복 개선
코딩을 넘어선 역할로써의 성능
- 업무 수행 능력
GDPvalGPT-5.2와 동일 성능 : 44개 직군에서 명확히 정의된 지식 노동 과제에 대한 모델의 수행 능력- 실제 기술 업무 전반에서 추론, 생성, 실행 가능한 하나의 범용 에이전트로 발돋움
- 협업 능력
- 이제 에이전트가 할 수 있는 일보다, 사람이 여러 에이전트를 동시에 상호작용하기 좋아지는 지가 핵심
Codex를 통해, 에이전트 관리 및 지시 용이- 이번 모델에서 상호작용성 강화
- 사용자는 작업 진행 중에도 실시간 상호작용 가능
오늘 배운 것
- 발표 및 시연 최종 점검
- BE 리드미 확정
내일 할 일
- 발표 및 시연
- UT 전 후속 과제 정리