2025-08-25

1일 1아티클

데보션

에이닷의 자동화 슬랙봇 구현

상황

  • 1인 1에이전트 시대
    • 개인화된 AI 에이전트가 일상과 업무에 침투
    • 업무의 중심은 직접 수행에이전트 설계/관리로 전환되는 추세

에이닷 RM(Risk Management) 프로세스

  1. 장애 감지 및 판단
    • 서비스 정상 동작 여부 및 에러 로그 상시 모니터링
    • 지속적인 에러 로그 감지 → 조치 필요 여부 판단
  2. 담당자 전파
    • 장애 원인 파악 및 조치가 필요한 경우 담당자에게 즉시 전파
    • 지속적인 장애 발생 시 점검 팝업 노출로 해당 기능 사용 제한, 공지를 통한 상황 안내로 고객 불편 최소화
  3. 원인 파악 및 조치
    • 원인 사례 : 네트워크/플랫폼, 앱 배포, 외부 LLM/API 장애, etc.
  4. 정상화 및 장애 이력 관리
    • 서비스 정상화 후 장애 히스토리 관리

과제 설정

  • RM 프로세스의 1~2를 자동화하자 (기존 RM 담당자의 수동 대응 업무를 대체)
  • 이후 자동화 봇이 활용하는 데이터 범위를 확대하여, 대응 방안 제안까지 이어지는 확장성 고려

기대 효과

  • 인력 중심의 장애 감지/전파 업무 수행 시 한계
    • 에러 로그를 24시간 모니터링해야 함 → 리소스 비효율
    • 장애 발생 시 전파 기준 준수의 어려움
    • 감지/전파 지연 및 담당자 오지정 (장애 발생 후 전파까지 평균 약 8분)
  • 자동화 봇의 정착 후
    • 명확한 전파 기준을 준수
    • 누락 없는 장애 상황 감지
    • 장애 발생 이력 관리 효율성 증대 (기간별 통계 리포트 자동 생성, etc.)

1년전 프로젝트 때에도 실시간 오류 모니터링에는 한계가 있었기에, 오류 발생시 즉각 알림을 보내는 슬랙 봇 형태로 구현하여 오류에 대한 대응 속도 향상을 경험한 바 있었다. 에이닷에서도 이런 방식을 채택하다니 신기할 따름.

오늘 배운 것

  1. 알고리즘
    • swea 1868 파핑파핑지뢰찾기
    • 주변 지뢰 수 계산 → ‘0’ 영역 우선 탐색(클릭시 연쇄적으로 8방탐색), bfs → 방문하지 않은 지뢰가 아닌 영역

내일 할 일

  1. 상담 피드백 바탕으로 포트폴리오 수정 (다음주 주말까지는 완료)

참고자료

results matching ""

    No results matching ""