Tech-Blog: K8S와 Cloud-Native 기술 탐구

  • Proxmox + Terraform으로 Ubuntu 22.04 테스트 VM 자동화하기

    Proxmox + Terraform으로 Ubuntu 22.04 테스트 VM 자동화하기 회사 내부 테스트 환경에서 VM을 자주 만들어야 하는 경우, 매번 ISO 부팅 → OS 설치 → 계정 설정 과정을 반복하는 것은 비효율적입니다. pu4ro/proxmox-terraform 리포는 이 과정을 완전히 자동화하기 위해 만들었습니다. 이 글에서는 Ubuntu 22.04 템플릿 생성 → Terraform으로 VM 생성·관리를 전부 다룹니다. 또한, 원본 리포의 README에서 제공하는 Read more

  • Kubernetes 환경에서 PostgreSQL 백업과 복구하기

    🖼️ Section 1. 들어가며 Kubernetes 환경에서 PostgreSQL을 운영하다 보면 etcd 백업으로 클러스터는 복구했는데, 막상 PostgreSQL PVC 안의 데이터는 복구가 안 돼서 애를 먹는 경우가 많다. 이런 상황에서 PostgreSQL의 백업과 복구도 함께 자동화해놔야 etcd 복원 후에도 DB 상태를 동기화할 수 있다. 이 포스트는 그런 상황을 대비해서 만든, 실제 운영 환경에서 사용 중인 PostgreSQL 백업/복구 자동화 스크립트를 Read more

  • k8s 마스터 장애, 당황하지 마세요! kubeadm HA etcd 백업/복구 Step-by-Step

    1. 도입: 롤백을 위해 백업부터! 쿠버네티스 환경에서 etcd 데이터의 안전한 백업은 장애 대응의 핵심입니다. 저 역시 클러스터에서 예상치 못한 장애나 설정 실수에 대비해 스냅샷 백업을 받아두었고, 실제로 복구(롤백)까지 진행한 경험을 정리합니다. 이 글은 kubeadm으로 구축한 3중화(HA) etcd 클러스터 환경에서 2. etcd 3중화 환경에서 백업하기 etcdctl 설치 및 환경 준비 백업 명령 실행 3. 장애/문제 발생 Read more

  • 🐚 K9s로 nodeshell로 Node 접속하기

    Ubuntu 기반 shellPod 이미지 + 자동화 스크립트로 운영 생산성 향상 💡 왜 이 작업을 하게 되었는가? Kubernetes를 운영하다 보면, 어떤 **노드(Node)**에서 문제가 발생했는지 직접 확인해야 할 일이 생긴다. 보통은 SSH로 해당 노드에 접속해서 top, netstat, ps 등을 통해 시스템 상태를 보게 된다. 하지만 실제 운영 환경에서는 다음과 같은 상황이 흔하다: 이럴 때 대안이 되는 것이 Read more

  • 🧨 OSD 하나 뺐더니 복구가 안 끝나요… scrub이 안 돌아갈 때 꼭 봐야 할 것들

    얼마 전 실제 운영 중이던 Ceph 클러스터에서, 고객의 요청으로 OSD 하나를 제거했더니 일이 꼬이기 시작했습니다. 처음엔 별일 아닌 줄 알았어요. PG 몇 개가 잠깐 degraded 뜨더니, 금방 recovery 되겠지 싶었는데… 계속 HEALTH_WARN은 사라지지 않았습니다. ceph pg scrub, ceph pg deep-scrub 명령 다 넣어봐도 반응 없음. scrub이 안 되니까 PG 상태도 끝까지 clean으로 돌아가지 않고, 그냥 Read more

  • Airgapped 환경에서 클러스터 시간 동기화 방법

    클러스터 시스템을 구축할 때, 예를 들어 Kubernetes(K8s)나 OpenStack 같은 환경에서는 모든 노드 간 시간이 정확히 일치해야 합니다. 그렇지 않으면 다음과 같은 문제가 발생할 수 있습니다: 특히 에어갭(Air-gapped) 환경에서는 외부 시간 서버에 접근할 수 없기 때문에, 내부에 시간 서버를 구성하고 모든 노드가 해당 서버와 동기화되도록 구성하는 작업이 필수입니다. 이 글에서는 chrony를 사용해 에어갭 환경에서 내부 시간 Read more