2026-03-30
인공지능 모델링
데이터를 바탕으로 패턴을 학습해서 예측·분류·판단할 수 있게 만드는 과정
인공지능 / 머신러닝 / 딥러닝 차이
- 인공지능 AI: 사람처럼 판단·추론·문제해결을 하도록 만든 기술 전체
- 머신러닝 ML: 데이터를 학습해서 규칙을 스스로 찾는 AI의 한 분야
- 딥러닝 DL: 인공신경망을 여러 층으로 쌓아 복잡한 패턴까지 학습하는 머신러닝의 한 분야
AI > 머신러닝 > 딥러닝
모델링이란?
문제를 해결하기 위해 데이터를 가지고 학습 모델을 만드는 과정
예시
- 고객이 대출 연체할지 예측
- 이상 거래를 탐지
- 주가 방향을 분류
- 고객 이탈 여부를 예측
지도학습 / 비지도학습 / 강화학습
지도학습
정답이 있는 데이터로 학습
예시
- 스팸 메일 분류
- 대출 연체 예측
문제 유형
- 분류: yes/no, A/B/C
- 회귀: 숫자 예측
비지도학습
정답 없이 데이터 구조나 패턴을 찾음
예시
- 고객 군집화
- 이상 패턴 탐지
강화학습
행동에 대한 보상을 받으면서 최적 행동을 학습
예시
- 게임 AI
- 자율주행 일부 의사결정
요약
- 정답 있으면 지도학습
- 정답 없고 군집 나누면 비지도학습
- 보상 기반이면 강화학습
분류와 회귀
분류 Classification
결과가 범주형
예시
- 사기거래 여부
- 대출 승인 여부
- 고객 이탈 여부
회귀 Regression
결과가 연속형 숫자
예시
- 매출 예측
- 주택 가격 예측
- 수요 예측
학습 데이터 / 검증 데이터 / 테스트 데이터
- 학습 데이터: 모델을 학습시키는 데 사용
- 검증 데이터: 모델 성능 조정, 하이퍼파라미터 튜닝에 사용
- 테스트 데이터: 최종 성능 평가용
핵심
- 학습용으로 시험 보면 안 됨
- 마지막 평가는 테스트 데이터로 해야 함
과적합 Overfitting
훈련 데이터에는 너무 잘 맞는데, 새로운 데이터에서는 성능이 떨어지는 현상
왜 생기나
- 모델이 너무 복잡함
- 데이터가 부족함
- 특정 데이터에만 지나치게 맞춤
해결 방법
- 데이터 늘리기
- 모델 단순화
- 정규화
- 드롭아웃
- 교차검증
↔ 과소적합 Underfitting
- 너무 단순해서 학습 자체가 잘 안 되는 상태
정확도만 보면 안 되는 이유
예시
사기 거래가 1000건 중 10건뿐인데,
모든 거래를 정상이라고 예측해도 정확도는 높게 나올 수 있음.
그래서 정확도만 보면 안 되고 아래 지표도 봐야 함.
정확도 Accuracy
전체 중 맞춘 비율
정밀도 Precision
사기라고 예측한 것 중 실제 사기 비율
재현율 Recall
실제 사기인 것 중 잡아낸 비율
F1 Score
정밀도와 재현율의 조화평균
시험 포인트
- 불균형 데이터에서는 Accuracy만 믿으면 안 됨
- 금융 이상거래 탐지에서는 재현율 중요하게 볼 수 있음
지도학습 대표 알고리즘
회귀
- 선형회귀
분류
- 로지스틱 회귀
- 의사결정나무
- 랜덤포레스트
- SVM
딥러닝
- 인공신경망 ANN
- CNN
- RNN
- Transformer
생성형 AI 시사 연결
생성형 AI
텍스트, 이미지, 코드 같은 새로운 결과물을 생성하는 AI
예시
- ChatGPT
- 이미지 생성 AI
- 코드 생성 AI
관련 키워드
- LLM 대규모 언어모델
- 프롬프트
- 할루시네이션
- 저작권 이슈
- 개인정보 보호
- AI 윤리
포인트
- 생성형 AI의 장점: 생산성 향상, 자동화
- 문제점: 허위정보, 편향, 보안, 저작권, 개인정보