2026-03-30

인공지능 모델링

데이터를 바탕으로 패턴을 학습해서 예측·분류·판단할 수 있게 만드는 과정

인공지능 / 머신러닝 / 딥러닝 차이

  • 인공지능 AI: 사람처럼 판단·추론·문제해결을 하도록 만든 기술 전체
  • 머신러닝 ML: 데이터를 학습해서 규칙을 스스로 찾는 AI의 한 분야
  • 딥러닝 DL: 인공신경망을 여러 층으로 쌓아 복잡한 패턴까지 학습하는 머신러닝의 한 분야

AI > 머신러닝 > 딥러닝

모델링이란?

문제를 해결하기 위해 데이터를 가지고 학습 모델을 만드는 과정

예시

  • 고객이 대출 연체할지 예측
  • 이상 거래를 탐지
  • 주가 방향을 분류
  • 고객 이탈 여부를 예측

지도학습 / 비지도학습 / 강화학습

지도학습

정답이 있는 데이터로 학습

예시

  • 스팸 메일 분류
  • 대출 연체 예측

문제 유형

  • 분류: yes/no, A/B/C
  • 회귀: 숫자 예측

비지도학습

정답 없이 데이터 구조나 패턴을 찾음

예시

  • 고객 군집화
  • 이상 패턴 탐지

강화학습

행동에 대한 보상을 받으면서 최적 행동을 학습

예시

  • 게임 AI
  • 자율주행 일부 의사결정

요약

  • 정답 있으면 지도학습
  • 정답 없고 군집 나누면 비지도학습
  • 보상 기반이면 강화학습

분류와 회귀

분류 Classification

결과가 범주형

예시

  • 사기거래 여부
  • 대출 승인 여부
  • 고객 이탈 여부

회귀 Regression

결과가 연속형 숫자

예시

  • 매출 예측
  • 주택 가격 예측
  • 수요 예측

학습 데이터 / 검증 데이터 / 테스트 데이터

  • 학습 데이터: 모델을 학습시키는 데 사용
  • 검증 데이터: 모델 성능 조정, 하이퍼파라미터 튜닝에 사용
  • 테스트 데이터: 최종 성능 평가용

핵심

  • 학습용으로 시험 보면 안 됨
  • 마지막 평가는 테스트 데이터로 해야 함

과적합 Overfitting

훈련 데이터에는 너무 잘 맞는데, 새로운 데이터에서는 성능이 떨어지는 현상

왜 생기나

  • 모델이 너무 복잡함
  • 데이터가 부족함
  • 특정 데이터에만 지나치게 맞춤

해결 방법

  • 데이터 늘리기
  • 모델 단순화
  • 정규화
  • 드롭아웃
  • 교차검증

과소적합 Underfitting

  • 너무 단순해서 학습 자체가 잘 안 되는 상태

정확도만 보면 안 되는 이유

예시

사기 거래가 1000건 중 10건뿐인데,

모든 거래를 정상이라고 예측해도 정확도는 높게 나올 수 있음.

그래서 정확도만 보면 안 되고 아래 지표도 봐야 함.

정확도 Accuracy

전체 중 맞춘 비율

정밀도 Precision

사기라고 예측한 것 중 실제 사기 비율

재현율 Recall

실제 사기인 것 중 잡아낸 비율

F1 Score

정밀도와 재현율의 조화평균

시험 포인트

  • 불균형 데이터에서는 Accuracy만 믿으면 안 됨
  • 금융 이상거래 탐지에서는 재현율 중요하게 볼 수 있음

지도학습 대표 알고리즘

회귀

  • 선형회귀

분류

  • 로지스틱 회귀
  • 의사결정나무
  • 랜덤포레스트
  • SVM

딥러닝

  • 인공신경망 ANN
  • CNN
  • RNN
  • Transformer

생성형 AI 시사 연결

생성형 AI

텍스트, 이미지, 코드 같은 새로운 결과물을 생성하는 AI

예시

  • ChatGPT
  • 이미지 생성 AI
  • 코드 생성 AI

관련 키워드

  • LLM 대규모 언어모델
  • 프롬프트
  • 할루시네이션
  • 저작권 이슈
  • 개인정보 보호
  • AI 윤리

포인트

  • 생성형 AI의 장점: 생산성 향상, 자동화
  • 문제점: 허위정보, 편향, 보안, 저작권, 개인정보

results matching ""

    No results matching ""