2026-02-08

1일 1아티클

요즘IT

GPT-5.3-Codex

자율 에이전트 역량으로써의 성능

  1. 코딩 성능
    • SWE-Bench Pro SOTA 성능 : 실제 SW 공학 능력
    • Terminal-Bench 2.0 성능 향상 : 이전 모델들 대비 적은 토큰으로 최고 성능 달성
  2. 웹 개발 능력
    • 모델 웹 개발 능력 및 장시간 자율 작업 능력 시험
    • 일반적인 후속 지시 + 수백만 토큰으로 자율적 2가지 게임 제작 및 반복 개선

코딩을 넘어선 역할로써의 성능

  1. 업무 수행 능력
    • GDPval GPT-5.2와 동일 성능 : 44개 직군에서 명확히 정의된 지식 노동 과제에 대한 모델의 수행 능력
    • 실제 기술 업무 전반에서 추론, 생성, 실행 가능한 하나의 범용 에이전트로 발돋움
  2. 협업 능력
    • 이제 에이전트가 할 수 있는 일보다, 사람이 여러 에이전트를 동시에 상호작용하기 좋아지는 지가 핵심
    • Codex를 통해, 에이전트 관리 및 지시 용이
    • 이번 모델에서 상호작용성 강화
    • 사용자는 작업 진행 중에도 실시간 상호작용 가능

오늘 배운 것

  1. 발표 및 시연 최종 점검
  2. BE 리드미 확정

내일 할 일

  1. 발표 및 시연
  2. UT 전 후속 과제 정리

참고자료

results matching ""

    No results matching ""