매주 한 page, 기술 한 spoon

Proxmox + Terraform으로 Ubuntu 22.04 테스트 VM 자동화하기

Proxmox + Terraform으로 Ubuntu 22.04 테스트 VM 자동화하기 회사 내부 테스트 환경에서 VM을 자주 만들어야 하는 경우, 매번 ISO 부팅 → OS 설치 → 계정 설정 과정을 반복하는 것은 비효율적입니다. pu4ro/proxmox-terraform 리포는 이 과정을 완전히 자동화하기 위해 만들었습니다. 이 글에서는 Ubuntu 22.04 템플릿 생성 → Terraform으로 VM 생성·관리를 전부 다룹니다. 또한, 원본 리포의 README에서 제공하는 Read more

2025년 8월 10일
Kubernetes 환경에서 PostgreSQL 백업과 복구하기

🖼️ Section 1. 들어가며 Kubernetes 환경에서 PostgreSQL을 운영하다 보면 etcd 백업으로 클러스터는 복구했는데, 막상 PostgreSQL PVC 안의 데이터는 복구가 안 돼서 애를 먹는 경우가 많다. 이런 상황에서 PostgreSQL의 백업과 복구도 함께 자동화해놔야 etcd 복원 후에도 DB 상태를 동기화할 수 있다. 이 포스트는 그런 상황을 대비해서 만든, 실제 운영 환경에서 사용 중인 PostgreSQL 백업/복구 자동화 스크립트를 Read more

2025년 7월 19일
k8s 마스터 장애, 당황하지 마세요! kubeadm HA etcd 백업/복구 Step-by-Step

1. 도입: 롤백을 위해 백업부터! 쿠버네티스 환경에서 etcd 데이터의 안전한 백업은 장애 대응의 핵심입니다. 저 역시 클러스터에서 예상치 못한 장애나 설정 실수에 대비해 스냅샷 백업을 받아두었고, 실제로 복구(롤백)까지 진행한 경험을 정리합니다. 이 글은 kubeadm으로 구축한 3중화(HA) etcd 클러스터 환경에서 2. etcd 3중화 환경에서 백업하기 etcdctl 설치 및 환경 준비 백업 명령 실행 3. 장애/문제 발생 Read more

2025년 7월 5일
🐚 K9s로 nodeshell로 Node 접속하기

Ubuntu 기반 shellPod 이미지 + 자동화 스크립트로 운영 생산성 향상 💡 왜 이 작업을 하게 되었는가? Kubernetes를 운영하다 보면, 어떤 **노드(Node)**에서 문제가 발생했는지 직접 확인해야 할 일이 생긴다. 보통은 SSH로 해당 노드에 접속해서 top, netstat, ps 등을 통해 시스템 상태를 보게 된다. 하지만 실제 운영 환경에서는 다음과 같은 상황이 흔하다: 이럴 때 대안이 되는 것이 Read more

2025년 6월 15일
🧨 OSD 하나 뺐더니 복구가 안 끝나요… scrub이 안 돌아갈 때 꼭 봐야 할 것들

얼마 전 실제 운영 중이던 Ceph 클러스터에서, 고객의 요청으로 OSD 하나를 제거했더니 일이 꼬이기 시작했습니다. 처음엔 별일 아닌 줄 알았어요. PG 몇 개가 잠깐 degraded 뜨더니, 금방 recovery 되겠지 싶었는데… 계속 HEALTH_WARN은 사라지지 않았습니다. ceph pg scrub, ceph pg deep-scrub 명령 다 넣어봐도 반응 없음. scrub이 안 되니까 PG 상태도 끝까지 clean으로 돌아가지 않고, 그냥 Read more

2025년 5월 31일
Airgapped 환경에서 클러스터 시간 동기화 방법

클러스터 시스템을 구축할 때, 예를 들어 Kubernetes(K8s)나 OpenStack 같은 환경에서는 모든 노드 간 시간이 정확히 일치해야 합니다. 그렇지 않으면 다음과 같은 문제가 발생할 수 있습니다: 특히 에어갭(Air-gapped) 환경에서는 외부 시간 서버에 접근할 수 없기 때문에, 내부에 시간 서버를 구성하고 모든 노드가 해당 서버와 동기화되도록 구성하는 작업이 필수입니다. 이 글에서는 chrony를 사용해 에어갭 환경에서 내부 시간 Read more

2025년 5월 11일

Tech-Blog: K8S와 Cloud-Native 기술 탐구