2025-08-25
1일 1아티클
데보션
에이닷의 자동화 슬랙봇 구현
상황
- 1인 1에이전트 시대
- 개인화된 AI 에이전트가 일상과 업무에 침투
- 업무의 중심은 직접 수행 → 에이전트 설계/관리로 전환되는 추세
에이닷 RM(Risk Management) 프로세스
- 장애 감지 및 판단
- 서비스 정상 동작 여부 및 에러 로그 상시 모니터링
- 지속적인 에러 로그 감지 → 조치 필요 여부 판단
- 담당자 전파
- 장애 원인 파악 및 조치가 필요한 경우 담당자에게 즉시 전파
- 지속적인 장애 발생 시 점검 팝업 노출로 해당 기능 사용 제한, 공지를 통한 상황 안내로 고객 불편 최소화
- 원인 파악 및 조치
- 원인 사례 : 네트워크/플랫폼, 앱 배포, 외부 LLM/API 장애, etc.
- 정상화 및 장애 이력 관리
- 서비스 정상화 후 장애 히스토리 관리
과제 설정
- RM 프로세스의 1~2를 자동화하자 (기존 RM 담당자의 수동 대응 업무를 대체)
- 이후 자동화 봇이 활용하는 데이터 범위를 확대하여, 대응 방안 제안까지 이어지는 확장성 고려
기대 효과
- 인력 중심의 장애 감지/전파 업무 수행 시 한계
- 에러 로그를 24시간 모니터링해야 함 → 리소스 비효율
- 장애 발생 시 전파 기준 준수의 어려움
- 감지/전파 지연 및 담당자 오지정 (장애 발생 후 전파까지 평균 약 8분)
- 자동화 봇의 정착 후
- 명확한 전파 기준을 준수
- 누락 없는 장애 상황 감지
- 장애 발생 이력 관리 효율성 증대 (기간별 통계 리포트 자동 생성, etc.)
1년전 프로젝트 때에도 실시간 오류 모니터링에는 한계가 있었기에, 오류 발생시 즉각 알림을 보내는 슬랙 봇 형태로 구현하여 오류에 대한 대응 속도 향상을 경험한 바 있었다. 에이닷에서도 이런 방식을 채택하다니 신기할 따름.
오늘 배운 것
- 알고리즘
- swea 1868 파핑파핑지뢰찾기
- 주변 지뢰 수 계산 → ‘0’ 영역 우선 탐색(클릭시 연쇄적으로 8방탐색), bfs → 방문하지 않은 지뢰가 아닌 영역
내일 할 일
- 상담 피드백 바탕으로 포트폴리오 수정 (다음주 주말까지는 완료)