9.4 Kubernetes 자동화
AWS 프로파일과 Amazon Q Developer CLI를 활용해 EKS 운영을 자동화하는 현실적인 워크플로를 정리했습니다.
1. 프로파일 기반 실행 환경 준비
9.1에서 설정한 AWS 프로파일을 그대로 활용합니다. 모든 명령은 AWS_PROFILE을 명시해 어떤 계정·역할로 작업하는지 명확히 남기는 것이 핵심입니다.
여러 계정을 다뤄야 할 때는 아래처럼 반복문으로 프로파일을 전환하며 점검합니다. 이 패턴은 운영 현장에서 많이 활용됩니다.
2. Amazon Q Developer CLI로 운영 문서화
Amazon Q Developer CLI는 AWS CLI와 동일한 인증 체인을 사용합니다. 프로파일을 설정한 뒤 자연어 프롬프트로 점검 보고서나 배포 체크리스트를 생성하고, 결과를 DOCS 포맷으로 정리하도록 지시할 수 있습니다.
실무 프롬프트 예시
# 비용 최적화/운영 보고서를 DOCS 형태로 작성 AWS_PROFILE=bespin-test q chat --no-interactive $'당신은 AWS 시니어 컨설턴트입니다. bespin-test 프로파일에서 최근 7일간 사용량을 분석해 비용 최적화 방안을 DOCS 형식으로 정리하고 절감액 추정치와 실행 우선순위를 포함해 주세요.'
위와 같이 작성하면 Q CLI가 실사용 데이터를 기반으로 보고서를 구성합니다. 운영 문서, 장애 보고서, 배포 체크리스트 등도 같은 방식으로 만들 수 있습니다.
3. AI를 활용한 Kubernetes 운영 절차 생성
AI가 kubectl 명령을 대신 실행해 주지는 않습니다. 대신, 정확한 맥락과 프로파일 정보를 프롬프트에 전달하면, 점검 항목·운영 매뉴얼·자동화 스크립트를 빠르게 초안으로 만들어 줍니다. 생성된 내용은 반드시 검토 후 적용합니다.
핵심 프롬프트 작성 패턴
- 컨텍스트 명시: “EKS 클러스터
core-platform, 네임스페이스production” - 리눅스 도구 지정: 필요한 경우
kubectl,helm,eksctl사용을 명시 - 검증 단계 요구: “명령 실행 후 예상 결과와 확인 절차를 함께 제시”
- 출력 포맷: “Markdown 체크리스트” 또는 “DOCS 구조” 등 원하는 형식을 기재
# 배포 전 점검 플레이북 초안 생성 AWS_PROFILE=bespin-test q chat --no-interactive $'당신은 AWS/EKS 운영 전문가입니다. core-platform 클러스터의 production 네임스페이스에서 신규 버전 배포 전 수행해야 할 체크리스트를 Markdown 형식으로 작성하세요. 각 항목에 대응하는 kubectl 명령과 기대 결과를 포함하세요.'
4. 시나리오: 장애 분석 후 대응 문서 작성
다음은 실제 운영에서 자주 발생하는 Pod 장애 사례를 AI와 함께 정리하는 절차입니다. AI가 제시한 명령은 반드시 샌드박스 환경에서 검증 후 적용합니다.
1) 현상 파악
기본적인 진단은 직접 수행합니다. 수집한 로그/메트릭 요약을 프롬프트에 포함해 AI에게 원인 분석을 요청합니다.
2) AI에게 원인 분석 + 대응 전략 요청
# 원인 분석 및 대응 문서 생성 AWS_PROFILE=bespin-test q chat --no-interactive $'당신은 AWS/EKS 시니어 컨설턴트입니다. 아래 로그 요약을 토대로 근본 원인을 진단하고 재발 방지 대책과 즉시 조치 방안을 DOCS 문서 구조로 작성하세요. - 로그 요약: ...'
생성된 문서는 변경관리 도구(Service Catalog Change Manager 등)에 첨부해 승인·공유합니다.
3) 실행 계획 검증
AI가 제안한 kubectl/helm 명령은 운영 가이드에 따라 2인 검토 후 적용합니다. IaC(Terraform, CDK) 변경이 필요한 경우에는 코드로 반영하고 PR을 생성합니다.
5. 모범 운영 수칙
권장 사항
- 모든 자동화 스크립트는 프로파일 기반으로 작성하고, 실행 이력을 AWS CloudTrail에 남깁니다.
- AI가 생성한 매니페스트는 GitOps 저장소에 커밋해 변경 이력을 추적합니다.
- Amazon Q 결과물은 사후 검증자를 지정해 품질을 보장합니다.
주의 사항
- 실제 존재하지 않는 명령(예:
claude k8s-provision)은 사용하지 않습니다. - AI가 제안한 삭제·스케일다운 명령은 즉시 실행하지 말고 변경관리 프로세스를 거칩니다.
- 민감 데이터가 포함된 로그는 마스킹 후 AI에게 전달합니다.
이러한 절차를 표준화하면, AI는 “자동 실행 도구”가 아니라 신뢰할 수 있는 시니어 컨설턴트로서 팀의 생산성을 끌어올립니다. 9.5에서는 비용 최적화와 IaC 연계를 심화해 보겠습니다.