2025-12-13
1일 1아티클
요즘IT
GPT-5.2
소개
- 44개 직종의 지식 업무 평가 지표(
GDPval)에서 최초로 전문가 수준에 도달 - 어려운 지식 작업의 70.7%에서 업계 최고 수준 또는 이상의 결과
- 소프트웨어 엔지니어링 벤치마크(
SWE-Bench Pro)에서 55.6%로 최고 기록 달성 - 개발 업무 안정성 대폭 향상
- 프론트엔드, 3D 요소가 포함된 복잡하거나 비표준적 UI 작업 성능 향상
- GPT-5.1 Thinking 대비 환각 오류 38% 감소
- 연구, 분석, 의사 결정 지원 등 전문 작업 신뢰도 향상
- 석박사급 난도의 과학 문제 벤치마크(
GPQA Diamond)에서 93.2%로 세계 최고 수준 - 긴 컨텍스트 추론 강화 (최대 256k 토큰의 심층 문서 분석에서 일관성 및 정확성 유지)
- 방대한 정보 기반 추론 작업에 강점, 최대 컨텍스트 윈도우 넘는 추론을 위한
/compact엔드포인트 추가 - 여러 시스템으로부터 데이터 수집/분석/최종 산출물 생성하는 End-to-End Workflow 안정적 처리
- 차트 해석 및 GUI 스크린샷 이해 등 시각 정보가 중요한 Workflow 정확한 지원
오늘 배운 것
- 알고리즘 복습