'클라우드' 카테고리의 글 목록

>> etcd 백업 & 복구

<백업-backup>

ETCDCTL_API=3 etcdctl\
--endpoints=https://127.0.0.1:2379\
--cacert=<trusted-ca-file>\
--cert=<cert-file>\
--key=<key-file>\
snapshot save <backup-file-location>

ETCDCTL_API=3 etcdctl --endpoints=https://127.0.0.1:2379 \
--cacert=/etc/kubernetes/pki/etcd/ca.crt \
--cert=/etc/kubernetes/pki/etcd/server.crt \
--key=/etc/kubernetes/pki/etcd/server.key \
snapshot save /data/etcd-snapthot.db

<복구 -restore>
ETCDCTL_API=3 etcdctl\
--data-dir <data-dir-location>\
snapshot restore snapshotdb

export ETCDCTL_API=3

etcdctl snapshot restore --data-dir /var/lib/etcd_new etcd-snapshotdb

>> POD 생성

--------------------------------------------------------------------

cluster: k8s
namespace name: ecommerce
pod Name: eshop-main
image: nginx:1.17
env: DB=mysql
--------------------------------------------------------------------
$> kubectl run eshop-main --image=nginx:1.17 --namespace ecommerce --env="DB=mysql"

>>multi-container Pod
$ sudo vi ./multi.yaml
apiVersion: v1
kind: Pod
metadata:
  name: lab004
spec:
  containers:
  - image: nginx
    name: nginx
  - image: redis
    name: redis
  - image: memcached
    name: memcached

>>Side-car Container
busybox 추가
  - name: sidecar
    image: busybox
    args: [/bin/sh, -c, 'tail -n+1 -F /var/log/cart-app.log']
    volumeMounts:
    - name: varlog
      mountPath: /var/log
    volumeMounts:
    - name: varlog
      mountPath: /var/log/nginx/
  volumes:
  - emptyDir: {}
    name: varlog

>> Rolling update
$> sudo kubectl create deployment nginx-app --image=nginx:1.11.10-alpine --replicas=3
$> sudo kubectl set image deployment nginx-app nginx=nginx:1.11.13-alpine --record

-상태 확인
$> kubectl rollout status deployment nginx-app
$> kubectl rollout history deployment nginx-app

-Rollback 하기
$> kubectl rollout undo deployment nginx-app

>>Node Selector

nodeSelector:
disktype: ssd

$> kubectl label node/cp-k8s disktype=ssd

root@cp-k8s:/data/k8s# k get node/cp-k8s -L disktype
NAME     STATUS   ROLES           AGE   VERSION   DISKTYPE
cp-k8s   Ready    control-plane   26d   v1.29.9   ssd

>> node 관리
- cordon & drain
$> kubectl drain <node-name> --ignore-daemonsets --force --delete-emptydir-data

$> sudo kubectl describe node cp-k8s | grep -i noschedule

>>Pod Log 추출 / CPU 사용량 높은 Pod 검색
$> sudo kubectl top pods -l name=overloaded-cpu --sort-by=cpu

- CPU 사용률 가장 높은 pod를 /var/CKA2022/cpu_load_pod.txt 에 기록한다.
$> sudo echo "POD_NAME" > /var/CKA2022/cpu_load_pod.txt

>>Init container를 포함한 pod 운영
-  Pod 가 실행될 때 main 컨테이너가 동작하기 전에 먼저 실행되는 컨테이너
- 유틸리티 또는 설정 스크립트등을 포함할 수 있음

  initContainers:
  - name: init
    image: busybox:1.28
    command: ['sh', '-c', "touch /workdir/data.txt"]
    volumeMounts:
    - name: workdir
      mountPath: "/workdir"

>>configmap
$> kubectl create configmap web-config -n ckad \
--from-literal=connection_string=localhost:80
--from-literal=external_url=cncf.io

$> sudo kubectl run web-pod --image=nginx:1.19.8-alpine --port=80 --dry-run=client -o yaml > web-pod.yaml

$> sudo vi web-pod.yaml
apiVersion: v1
kind: Pod
metadata:
  name: web-pod
  namespace: ckad
spec:
  containers:
  - image: nginx:1.19.8-alpine
    name: web-pod
    envFrom:
    - configMapRef:
        name: web-config

>> Secret 운영
$> kubectl create secret generic super-secret \
--from-literal=password=secretpass

ex) Create a Pod named pod-secrets-via-file, using the redis image, which mounts a secret named

super-secret at /secrets.
$> sudo vi pod-secret-via-file.yaml
apiVersion: v1
kind: Pod
metadata:
  name: pod-secrets-via-file
spec:
  containers:
  - name: mypod
    image: redis
    volumeMounts:
    - name: foo
      mountPath: "/secrets"
  volumes:
  - name: foo
    secret:
      secretName: super-secret

$> kubectl apply -f pod-secret-via-file.yaml
ex) Create a second Pod named pod-secrets-via-env, using the redis image, which exports password as PASSWORD
$> vi pod-secret-via-env.yaml
apiVersion: v1
kind: Pod
metadata:
  name: pod-secrets-via-env
spec:
  containers:
  - name: mycontainer
    image: redis
    env:
      - name: PASSWORD
        valueFrom:
          secretKeyRef:
            name: super-secret
            key: password

$> kubectl apply -f pod-secret-via-env.yaml

>>Ingress 구성
- nginx Pod 생성
$> kubectl run nginx --image=nginx --labels=app=nginx -n ingress-nginx
$> kubectl expose -n ingress-nginx pod nginx --port=80 --target-port=80

- ingress 생성 (kubenetes commulit 참조)
$> vi app-ingress.yaml
apiVersion: networking.k8s.io/v1
kind: Ingress
metadata:
  namespace: ingress-nginx
  name: app-ingress
  annotations:
    nginx.ingress.kubernetes.io/rewrite-target: /
    kubernetes.io/ingress.class: nginx
spec:
  rules:
  - http:
      paths:
      - path: /
        pathType: Prefix
        backend:
          service:
            name: nginx
            port:
              number: 80
      - path: /app
        pathType: Prefix
        backend:
          service:
            name: appjs
            port:
              number: 80

$> kubectl apply -f app-ingress.yaml

>> Persistent Volume 생성
ex) Create a persistent volume with name app-config, of capacity 1Gi and access mode ReadWriteMany.
- storageClass : az-c
- The type of volume is hostPath and its location is /srv/app-config

$> vi app-config-pv.yaml (kubenetes -커뮤니티 블로그 참조하여 생성)
apiVersion: v1
kind: PersistentVolume
metadata:
  name: app-config
spec:
  capacity:
    storage: 1Gi
  accessModes:
    - ReadWriteMany
  storageClassName: az-c
  hostPath:
    path: /srv/app-config

$> kubectl apply -f app-config-pv.yaml

>>Persistent Volume Claim을 사용하는 Pod 운영

ex)

- Create a new PersistentVolumeClaim:
Name: app-volume
StorageClass: app-hostpath-sc
Capacity: 10Mi
- Create a new Pod which mounts the PersistentVolumeClaim as a volume:
Name: web-server-pod
Image: nginx
Mount path: /usr/share/nginx/html
- Configure the new Pod to have ReadWriteMany access on the volume.

$> vi app-volume-pvc.yaml
apiVersion: v1
kind: PersistentVolumeClaim
metadata:
  name: app-volume
spec:
  accessModes:
    - ReadWriteMany
  resources:
    requests:
      storage: 10Mi
  storageClassName: app-hostpath-sc

$> kubectl apply -f app-volume-pvc.yaml

----------------------------------------------------------------
$> vi web-server-pod.yaml
apiVersion: v1
kind: Pod
metadata:
  name: web-server-pod
spec:
  containers:
    - name: nginx
      image: nginx
      volumeMounts:
      - mountPath: "/usr/share/nginx/html"
        name: mypd
  volumes:
    - name: mypd
      persistentVolumeClaim:
        claimName: app-volume

$> kubectl apply -f web-server-pod.yaml
----------------------------------------------------------------

>> Check Resource Information
$> kubectl get pv --sort-by=metadata.name

>> Kubernetes Upgrade
$> apt update
$> apt-cache madison kubeadm | grep 1.21.3

- kubeadm upgrade
$> apt-mark unhold kubeadm && apt-get update && apt-get install -y kubeadm=1.21.3-00 && apt-mark hold kubeadm

$> apt install kubeadm=1.22.2-00 kubelet=1.22.2-00 kubectl=1.22.2-00

- kubectl upgrade
$> apt-mark unhold kubelet kubectl && apt-get update && apt-get install -y kubelet=1.21.3-00 kubectl=1.21.3-00 && apt-mark hold kubelet kubectl
$> systemctl daemon-reload
$> systemctl restart kubelet

$> kubeadm upgrade plan v1.21.3
$> kubeadm upgrade apply v1.21.3

>> network policy
- 특정 파드에서만 접근을 허용하고자 하는 경우

apiVersion: networking.k8s.io/v1
kind: NetworkPolicy
metadata:
  name: db-policy
  namespace: prod
spec:
  podSelector:
    matchLabels:
      role: db
  policyTypes:
    - Ingress
  ingress:
    - from:
        - podSelector:
            matchLabels:
              role: api-pod
      ports:
        - protocol: TCP
          port: 3306

- 특정 네임스페이스의 특정 파드에서만 접근을 허용하고자 하는 경우

apiVersion: networking.k8s.io/v1
kind: NetworkPolicy
metadata:
  name: db-policy
  namespace: prod
spec:
  podSelector:
    matchLabels:
      role: db
  policyTypes:
    - Ingress
  ingress:
    - from:
        - podSelector:
            matchLabels:
              role: api-pod
          namespaceSelector:
            matchLabels:
              name: dev
      ports:
        - protocol: TCP
          port: 3306

- 특정 네임스페이스의 모든 파드에서 접근을 허용하고자 하는 경우

apiVersion: networking.k8s.io/v1
kind: NetworkPolicy
metadata:
  name: db-policy
  namespace: prod
spec:
  podSelector:
    matchLabels:
      role: db
  policyTypes:
    - Ingress
  ingress:
    - from:
        - namespaceSelector:
            matchLabels:
              name: dev
      ports:
        - protocol: TCP
          port: 3306

- 클러스터 외부의 특정 서버로부터 접근을 허용하고자 하는 경우

apiVersion: networking.k8s.io/v1
kind: NetworkPolicy
metadata:
  name: db-policy
  namespace: prod
spec:
  podSelector:
    matchLabels:
      role: db
  policyTypes:
    - Ingress
  ingress:
    - from:
      - ipBlock:
          cidr: 192.168.1.100/32
      ports:
        - protocol: TCP
          port: 3306

- DB에서 특정 파드로 접근을 허용하고자 하는 경우

apiVersion: networking.k8s.io/v1
kind: NetworkPolicy
metadata:
  name: db-policy
  namespace: prod
spec:
  podSelector:
    matchLabels:
      role: db
  policyTypes:
    - Egress
  egress:
    - to:
        - podSelector:
            matchLabels:
              role: etc-pod
      ports:
        - protocol: TCP
          port: 8080

- DB에서 클러스터 외부의 특정 서버로 접근을 허용하고자 하는 경우

apiVersion: networking.k8s.io/v1
kind: NetworkPolicy
metadata:
  name: db-policy
  namespace: prod
spec:
  podSelector:
    matchLabels:
      role: db
  policyTypes:
    - Egress
  egress:
    - to:
        - ipBlock:
            cidr: 192.168.1.100/32
      ports:
        - protocol: TCP
          port: 8080

>> NetworkPolicy 목록 확인
$> kubectl get networkpolicies

- key file 및 csr 파일 생성
$> mkdir -p /data/cka/
$> openssl genrsa -out /data/cka/ckauser.key 2048
$> openssl req -new -key /data/cka/ckauser.key -out /data/cka/ckauser.csr

$> cat /data/cka/ckauser.csr | base64 | tr -d "\n"

- CertificateSigningRequest 요청을 위에서 확인한 request 항목으로 교체하여 다음과 같이 진행한다.
$> cat <<EOF | sudo kubectl apply -f -
apiVersion: certificates.k8s.io/v1
kind: CertificateSigningRequest
metadata:
  name: ckauser
spec:
  request: LS0tLS1CRUdJTiBDRVJUSUZJQ0FURSBSRVFVRVNULS0tLS0KTUlJQ2lqQ0NBWElDQVFBd1JURUxNQWtHQTFVRUJoTUNRVlV4RXpBUkJnTlZCQWdNQ2xOdmJXVXRVM1JoZEdVeApJVEFmQmdOVkJBb01HRWx1ZEdWeWJtVjBJRmRwWkdkcGRITWdVSFI1SUV4MFpEQ0NBU0l3RFFZSktvWklodmNOCkFRRUJCUUFEZ2dFUEFEQ0NBUW9DZ2dFQkFNTjVFWXpBeGZZY3JOMGlQT0dzajZPaGVBOVc1WkVvR1ZnZENnTnEKUXNDdXJNdEZWbmsyM1dOT2hzTXIvN2hWRU1IdFFNVkhrWmFaZ0JiK2R0K0wxSFpNOWkweHhIdExmRzlQK3hSdApVV2tOamh6VkZqenowZnVQZ2RlVW5CSmlpRWJQREl5LzhOaGlPbDVGa2lMejFCTHhMSVQxZWpLODJpaUZNa3RPClU2ZGFlczI1MEpZMFcyM0pkeWl6d1I3bGtKc0pMVlZNSEt0ZzBkM3Y0c2taQlp2MDAyckxrV3FJRFJBWU5WRm8KUDRZeEZEMHlxL0tRLzhncHB6ZTNkUXZWS0FYT1p4VVppM0tEZDhGMnk5RzA0MmE4R25mRHQyZmQwbnpSU2owegpQU2lMc2pQTXBXamUvMnhFbGlOY0tQbVNVNGNZbi95a3dDbzY0NnhoODhENG1tY0NBd0VBQWFBQU1BMEdDU3FHClNJYjNEUUVCQ3dVQUE0SUJBUUJ0a3VNU2NYd3E4clRuNlQzeUFLcWxLdEE3c3RoWTZOSXgxNVBMbTJoWmJPdHoKMis4UzFyTDlVUUJJcUJRMlFWdVJNa2U2ZnFjOTRpNFU2dFI2SnpnK1QrMXJoSTJhSS96anBkL2Q3dEoxa01FUgpmZzBwUHd6Q2lZb056M0F6YytyWEh3bklIRmhoN0wwK0l1Ym9tdTBvcURiMzVnR0RNdHNHMnVEV2x0eEZwdGtECklaWXREVHJJT3ZqYVVRd2VGVkhpdGw5SkJGVEF0dnVIZVBCNUZtQlF3dU56VEo0VmkvRmN0dm9hRzVEUlVsRnUKK0pvNWlxSTNBYzAzNjJBT3hTeXV0L3FLdzNDTE8wZHlGbElNMzM2NEJTQnNPQTJVbkswSHhXQjZZSWRXdHhFZwpZUEdvSElxUGFDV25obzJ0ZTAxZ3c5U2ZCRkgwNFhMME80Tm00cHFFCi0tLS0tRU5EIENFUlRJRklDQVRFIFJFUVVFU1QtLS0tLQo=
  signerName: kubernetes.io/kube-apiserver-client
  usages:
  - client auth
EOF

- CertificateSigningRequest 상태 확인
$> kubectl get csr

- CertificateSigningRequest 를 승인
$> kubectl certificate approve ckauser

>> Role 생성
$ kubectl create role pod-role --verb=create,delete,watch,list,get --resource=pods

- Role 과 User 를 binding
$ kubectl create rolebinding pod-rolebinding --role=pod-role --user=ckauser

>> Context
$ kubectl config set-credentials ckauser \
--client-key=/data/cka/ckauser.key \
--client-certificate=/data/cka/ckauser.csr \
--embed-certs=true

- 자격 증명 설정
kubectl config set-credentials 명령어는 기본적으로 사용자의 자격 증명을 설정하는데 사용됩니다. 예를 들어, 사용자 이름, 인증서, 토큰 등의 인증 정보를 설정할 수 있습니다.
$> kubectl config set-credentials ckauser --username=<USERNAME> --password=<PASSWORD>

인증서를 사용하는 경우:
$> kubectl config set-credentials ckauser --client-certificate=<PATH_TO_CERT> --client-key=<PATH_TO_KEY>

--username: 사용자의 이름을 설정합니다.
--password: 사용자의 비밀번호를 설정합니다.
--client-certificate: 사용자의 클라이언트 인증서를 설정합니다.
--client-key: 클라이언트 인증서에 대응하는 비밀 키를 설정합니다.
--token: 인증에 사용할 토큰을 설정합니다

$> kubectl config set-context ckauser --cluster=kubernetes --user=ckauser
여러 context를 사용하여 서로 다른 클러스터나 사용자 자격 증명에 대해 작업을 할 수 있습니다.
kubectl config set-context 명령어는 새로운 context를 설정하거나 기존 context를 수정합니다.

kubectl config set-context 명령어는 다음의 세 가지 주요 요소를 결합하여 context를 설정합니다:
1)클러스터 (--cluster): 연결할 Kubernetes 클러스터.
2)사용자 (--user): 인증에 사용할 사용자 자격 증명.
3)네임스페이스 (--namespace, 옵션으로 제공 가능): 기본적으로 사용될 네임스페이스. 설정하지 않으면 기본 네임스페이스인 default가 사용됩니다.

ckauser context로 스위칭
$> kubectl config set-context ckauser --cluster=kubernetes --user=ckauser

$> kubectl config get-contexts 전체 리스트
$> kubectl config user-context 스위칭

$> kubectl config view --flatten > ~/config

context 추가
$> kubectl config set-context ckauser --cluster=kubernetes --user=ckauser

>>User Cluster Role Binding
- ClusterRole 생성
$> kubectl create clusterrole app-clusterrole --verb=get,list,watch --resource=deployment,service

- ClusterRole binding
$> kubectl create clusterrolebinding app-clusterrolebinding --clusterrole=app-clusterrole --user=ckauser

>> ServiceAccount Role binding
1) Service Accounts 생성
$> kubectl create namespace apps
$> kubectl create serviceaccount pod-access

2) Pod Role 생성
$> kubectl create role pod-role --verb=get,list,watch --resource=pods -n apps

3) Rolebinding
$> kubectl create rolebinding pod-rolebinding --serviceaccount=apps:pod-access --role=pod-role -n apps

>>ServiceAccount Cluster Role binding
1) Service Account 생성
$ kubectl create serviceaccount cicd-token -n apps

2) ClusterRole 생성
$ kubectl create clusterrole deployment-clusterrole --verb=create --resource=Deployment,statefulset,daemonSet -n apps

3) ClusterRole binding
$ kubectl create clusterrolebinding deployment-clusterrole-binding --clusterrole=deployment-clusterrole --serviceaccount=apps:cicd-token -n apps

>>Kube-DNS
- pod 생성 및 expose
$ kubectl run nginx-resolver --image=nginx
$ kubectl expose pod nginx-resolver --name nginx-resolver-service --port=80 --target-port=80

- nslookup 질의
2.1 dns 질의를 위한 busybox 이미지 파드를 임시로 생성한다.
$ kubectl run busybox --image=busybox:1.28 --rm -it --restart=Never -- /bin/sh

- service에 대해서 nslookup 조회
# nslookup my-resolver-service.default.svc.cluster.local.
# nslookup 10-244-1-2.default.pod.cluster.local

- 파일에 내용 입력
$ cat > /tmp/nginx.svc
Server:    10.96.0.10
Address 1: 10.96.0.10 kube-dns.kube-systehttp://m.svc.cluster.local

Name:      nginx-resolver-service.default.svc.cluster.local.
Address 1: 10.97.185.41 nginx-resolver-service.default.svc.cluster.local

$ cat /tmp/nginx.pod
Server:    10.96.0.10
Address 1: 10.96.0.10 kube-dns.kube-systehttp://m.svc.cluster.local

Name:      10-244-1-2.default.pod.cluster.local
Address 1: 10.244.1.2 10-244-1-2.nginx-resolver-service.default.svc.cluster.local

>>라벨링 확인
$> kubectl get pod --show-labels
$> kubectl get ns nginx --show-labels

'클라우드' 카테고리의 다른 글

[K8S] kubernetes 기본 & 운영 명령어 (0)	2024.11.27
[Elasticsearch] index 의 shard(샤드) 개념 (0)	2024.11.27
[k8s]Airflow Helm Install 가이드 (0)	2024.11.26
베어 메탈(Bare Metal)이란.. (0)	2023.06.15

- k8s 운영시 알아두면 유용한 기본명령어 -

1. 기본 명령어

클러스터 및 리소스 정보 조회

kubectl cluster-info # 클러스터 정보 확인
kubectl get nodes # 노드 목록 확인
kubectl get pods # 모든 네임스페이스의 파드 목록 조회
kubectl get services -n <namespace> # 특정 네임스페이스의 서비스 조회
kubectl describe pod <pod-name> # 특정 파드 상세 정보 확인
kubectl logs <pod-name> # 특정 파드 로그 조회
kubectl logs <pod-name> -c <container-name> # 특정 컨테이너 로그 조회
kubectl exec -it <pod-name> -- /bin/bash # 특정 파드의 쉘에 접속
kubectl top pods # 리소스 사용량 조회 (Metrics 서버 필요)

2. Deployment 관련 명령어

Deployment 생성 및 관리

kubectl create deployment <name> --image=<image-name> # Deployment 생성
kubectl get deployments # Deployment 목록 조회
kubectl describe deployment <deployment-name> # Deployment 상세 정보 확인
kubectl delete deployment <deployment-name> # Deployment 삭제
kubectl scale deployment <deployment-name> --replicas=<num> # Replica 수 조정
kubectl set image deployment/<deployment-name> <container-name>=<new-image> # 컨테이너 이미지 업데이트

3. Patch 관련 명령어

리소스 수정

kubectl patch <resource-type>/<name> --patch '<json-patch>' # JSON 형식으로 리소스 수정
kubectl patch deployment <deployment-name> -p '<json-patch>' # Deployment 수정
kubectl edit <resource-type>/<name> # 리소스를 에디터로 수정 (기본 vi 에디터)
kubectl annotate <resource-type>/<name> key=value # 리소스에 Annotation 추가
kubectl label <resource-type>/<name> key=value # 리소스에 Label 추가

4. Rollout 관련 명령어

Deployment의 롤아웃 관리

kubectl rollout status deployment/<deployment-name>            # 롤아웃 상태 확인
kubectl rollout history deployment/<deployment-name>           # 롤아웃 히스토리 조회
kubectl rollout undo deployment/<deployment-name>              # 이전 버전으로 롤백
kubectl rollout restart deployment/<deployment-name>           # 롤링 재배포 (Pod 재시작)

5. Config 및 Secret 관리

ConfigMap

kubectl create configmap <name> --from-literal=key=value # 단일 key-value ConfigMap 생성
kubectl create configmap <name> --from-file=<file-path> # 파일로부터 ConfigMap 생성
kubectl get configmap <name> -o yaml # ConfigMap YAML 조회
kubectl delete configmap <name> # ConfigMap 삭제

Secret

kubectl create secret generic <name> --from-literal=key=value # 단일 key-value Secret 생성
kubectl create secret generic <name> --from-file=<file-path> # 파일로부터 Secret 생성
kubectl get secret <name> -o yaml # Secret YAML 조회
kubectl delete secret <name> # Secret 삭제

6. YAML 파일로 리소스 관리

리소스 생성 및 업데이트

kubectl apply -f <file.yaml> # YAML 파일 기반으로 리소스 생성/업데이트
kubectl delete -f <file.yaml> # YAML 파일 기반으로 리소스 삭제
kubectl diff -f <file.yaml> # 적용 전 변경사항 확인
kubectl get -f <file.yaml> # 파일에 정의된 리소스 정보 조회

7. Namespace 관리

kubectl get namespaces # 네임스페이스 목록 조회
kubectl create namespace <namespace-name>         # 네임스페이스 생성
kubectl delete namespace <namespace-name>         # 네임스페이스 삭제
kubectl config set-context --current --namespace=<namespace-name>  # 기본 네임스페이스 변경

8. 기타 명령어

CronJob 및 Job 관리

kubectl create job <name> --image=<image-name> -- <command> # Job 생성
kubectl create cronjob <name> --schedule="<schedule>" --image=<image-name> # CronJob 생성
kubectl get jobs # Job 목록 확인
kubectl get cronjobs # CronJob 목록 확인

Volume 및 PV/PVC 관리

kubectl get pv # PV 목록 조회
kubectl get pvc # PVC 목록 조회
kubectl describe pvc <pvc-name> # PVC 상세 정보 조회
kubectl delete pvc <pvc-name> # PVC 삭제

'클라우드' 카테고리의 다른 글

[kubenetes] CKA 자격증 시험 대비 스터디 (0)	2024.12.18
[Elasticsearch] index 의 shard(샤드) 개념 (0)	2024.11.27
[k8s]Airflow Helm Install 가이드 (0)	2024.11.26
베어 메탈(Bare Metal)이란.. (0)	2023.06.15

▶ Shard 란?

Elasticsearch에서 index의 샤드(shard)는 데이터를 분할하여 저장하는 단위입니다.
샤드는 인덱스 내의 데이터를 물리적으로 분산하여 저장하는 역할을 하며, 이는 Elasticsearch가 분산 시스템이기 때문에 여러 서버(노드)에 데이터를 고르게 분배하고 성능을 최적화하기 위해 사용됩니다.
샤드는 저장소로서의 역할을 하기 보다는, 인덱스 데이터를 분할하고, 데이터를 분산 저장하기 위한 개념입니다. 각 샤드는 하나의 루씬 인덱스(Lucene index)로, 독립적으로 데이터를 저장하고 검색할 수 있습니다. 그래서 각 샤드는 자체적으로 데이터를 저장하는 저장소처럼 기능하지만, 전체적으로는 Elasticsearch 클러스터 내의 여러 노드에서 데이터를 분산 처리하는 방식입니다.

▶ 샤드의 역할

1.데이터 분산 저장: 인덱스 데이터를 여러 샤드로 나누어 여러 노드에 분산시켜 저장합니다. 이는 Elasticsearch가 분산

시스템이기 때문에 데이터를 여러 서버에 효율적으로 저장하고 처리할 수 있게 합니다.
2.성능 향상: 샤드가 여러 노드에 분배되어 저장됨으로써, 검색 요청이 여러 노드에서 병렬로 처리될 수 있습니다.

3.확장성: 샤드를 추가하거나 기존 샤드를 다른 노드로 이동시켜서 Elasticsearch 클러스터를 확장할 수 있습니다.

프라이머리 샤드 (Primary Shard): 실제 데이터를 저장하는 기본 샤드입니다. 하나의 인덱스는 고정된 수의 프라이머리 샤드를 가집니다.
레플리카 샤드 (Replica Shard): 프라이머리 샤드의 복제본으로, 데이터의 고가용성(availability)과 내결함성(fault tolerance)을 높입니다. 레플리카 샤드는 데이터가 여러 복제본으로 저장되도록 해 주며, 검색 성능에도 도움이 됩니다.

▶ 인덱스 생성 시 샤드 수 지정

샤드 수는 인덱스를 생성할 때 지정하며, 이후에는 변경할 수 없습니다(샤드 수를 변경하려면 인덱스를 삭제하고 재생성해야 합니다). 예를 들어, 다음과 같은 명령으로 인덱스를 생성할 수 있습니다.

PUT /my_index
{
  "settings": {
    "number_of_shards": 3,     // 샤드 수
    "number_of_replicas": 2    // 레플리카 수
  }
}

-> 노드 수와 샤드 수는 독립적으로 설정되지만, 샤드를 잘 분배하고 효율적으로 활용하기 위해 노드 수와의 균형을 맞추는 것이 중요합니다.

예를 들어,

인덱스가 3개의 primary shards와 2개의 replica shards로 구성된 경우, 이 인덱스는 총 9개의 샤드를 가집니다(3개의 primary + 6개의 replica). 만약 primary shard 중 하나가 장애로 인해 사용 불가능해지면, replica shard 중 하나가 primary shard로 승격되어 활성 상태가 됩니다. 이때, active primary shard가 새로운 복제본을 통해 활성화됩니다.
Active shard는 이처럼 primary와 replica 모두를 포함한 상태로, 검색/색인 요청을 처리할 수 있는 샤드가 어떤 노드에서든지 활성화될 수 있음을 의미합니다.

1. Active Shard (활성 샤드)
Active shard는 현재 Elasticsearch 클러스터에서 활성화되어 있는 샤드를 의미합니다. 즉, 클러스터의 어떤 노드에 할당되어 있고 데이터가 저장되고 검색 요청을 처리할 수 있는 상태인 샤드를 가리킵니다.

샤드가 활성화되었다는 것은 해당 샤드가 클러스터의 노드에 할당되어 있고 검색 및 색인 작업이 이루어질 수 있다는 의미입니다.
Active shard는 primary shard일 수도 있고, replica shard일 수도 있습니다. 즉, 주 샤드(primary)와 복제 샤드(replica) 모두가 활성 샤드로 존재할 수 있습니다.

2. Active Primary Shard (활성 기본 샤드)
Active primary shard는 특정 인덱스의 primary shard가 활성 상태로 클러스터 내의 어떤 노드에 할당되어 있다는 의미입니다.

Primary shard는 데이터를 처음 저장하는 샤드로, 인덱스 생성 시 설정한 샤드 수에 따라 기본적으로 결정됩니다.
Primary shard는 해당 데이터를 최초로 저장하고 업데이트하는 샤드로, 이후 replica shard가 primary shard의 복제본을 생성합니다.
Active primary shard는 primary shard가 현재 클러스터에서 활성화되어 데이터를 저장하거나 검색할 수 있는 상태를 의미합니다.

요약정리
Active shard는 Elasticsearch 클러스터 내에서 활성화된 샤드 전체를 의미합니다. 이 샤드는 primary 또는 replica일 수 있으며, 실제로 데이터를 처리할 수 있는 샤드를 나타냅니다.
Active primary shard는 인덱스의 primary shard 중에서 현재 활성화되어 데이터를 처리하는 샤드를 의미합니다. primary shard는 인덱스에서 원본 데이터를 저장하고 업데이트하는 역할을 하며, replica shard는 primary shard의 복제본입니다.

'클라우드' 카테고리의 다른 글

[kubenetes] CKA 자격증 시험 대비 스터디 (0)	2024.12.18
[K8S] kubernetes 기본 & 운영 명령어 (0)	2024.11.27
[k8s]Airflow Helm Install 가이드 (0)	2024.11.26
베어 메탈(Bare Metal)이란.. (0)	2023.06.15

Airflow 란?

Apache Airflow는 데이터 파이프라인을 자동화하고, 작업을 스케줄링하며, 워크플로우를 관리하는 데 사용되는 오픈 소스 도구입니다. 머신러닝 작업에 있어 Airflow는 데이터 수집, 모델 훈련, 모델 평가, 배포 등의 다양한 단계에 걸쳐 파이프라인을 효율적으로 관리할 수 있게 도와줍니다. 또한, Airflow는 Kubernetes(K8s) 환경과의 호환성도 제공하여 분산 시스템에서 작업을 쉽게 스케줄링하고 관리할 수 있습니다.

1. Apache Airflow 개념

Apache Airflow는 기본적으로 **DAG(Directed Acyclic Graph)**를 사용하여 파이프라인을 정의하고, 이 DAG 내에서 작업(Tasks)을 정의하여 순차적, 병렬적, 조건부로 실행할 수 있게 해줍니다. DAG는 각 작업을 어떻게 실행할지에 대한 흐름과 의존성을 명시합니다.

DAG (Directed Acyclic Graph): DAG는 작업들의 실행 순서를 정의하는 그래프입니다. 각 작업은 Task로 정의되며, Task 간 의존성은 set_upstream, set_downstream 등을 통해 설정합니다.
Operator: Airflow는 다양한 유형의 작업을 정의하기 위한 Operator를 제공합니다. 예를 들어, PythonOperator, BashOperator, EmailOperator 등이 있습니다. 각각의 Operator는 특정 종류의 작업을 실행하는 역할을 합니다.
Scheduler: Airflow의 스케줄러는 설정된 시간에 DAG를 주기적으로 실행합니다. 스케줄러는 DAG가 주기적으로 실행되도록 관리합니다.
Executor: Airflow는 여러 종류의 Executor를 제공하여 작업이 어떻게 실행될지 제어합니다. SequentialExecutor, LocalExecutor, CeleryExecutor, KubernetesExecutor 등이 있습니다.

2. Airflow를 머신러닝에 활용하는 방법

Airflow는 머신러닝 프로젝트의 여러 단계를 자동화하는 데 유용하게 사용됩니다. 예를 들어:

데이터 파이프라인 관리: 데이터 수집, 전처리, 특성 추출 등 데이터를 준비하는 작업을 관리합니다.
모델 훈련 및 튜닝: 훈련 데이터를 모델에 전달하고, 모델 훈련 및 하이퍼파라미터 튜닝 작업을 자동화합니다.
모델 평가 및 테스트: 훈련된 모델을 테스트하고 성능을 평가하는 작업을 자동으로 수행합니다.
모델 배포: 훈련된 모델을 배포하여 예측 서비스를 제공하는 단계도 자동화할 수 있습니다.
모니터링 및 알림: 머신러닝 파이프라인의 각 단계가 성공적으로 완료되었는지 확인하고, 실패 시 알림을 제공합니다.

3. Kubernetes 환경에서의 Airflow 설치 및 사용법

Kubernetes는 Airflow와 잘 통합되며, KubernetesExecutor를 사용하여 Airflow의 작업을 Kubernetes에서 실행할 수 있습니다. 이 방법은 클러스터 리소스를 효율적으로 사용하고, 분산 환경에서 작업을 실행하는 데 유리합니다.

Kubernetes에서 Airflow 설치 방법

<1. Helm을 통한 Airflow 설치>

Helm은 Kubernetes에서 애플리케이션을 관리하고 배포하는 데 유용한 패키지 관리자입니다. Helm을 사용하여 Airflow를 설치하는 방법은 매우 간단합니다.

설치 순서:

1-1. Helm 설치 (Helm이 설치되지 않은 경우)

# Helm 설치 (Mac 예시)
brew install helm

1-2. Airflow Helm 차트 설치: Airflow 공식 Helm 차트를 사용하여 Kubernetes 클러스터에 Airflow를 설치합니다.

# Airflow의 Helm 차트를 설치할 수 있는 저장소 추가
helm repo add apache-airflow https://airflow.apache.org
helm repo update

1-3. Airflow 설치: Kubernetes 클러스터에 Airflow를 설치합니다.

helm install airflow apache-airflow/airflow \
  --namespace airflow \
  --create-namespace \
  --set executor=KubernetesExecutor \
  --set airflow.image.repository=apache/airflow \
  --set airflow.image.tag=2.5.0 \
  --set airflow.image.pullPolicy=Always \
  --set redis.enabled=true \
  --set postgresql.enabled=true

위 명령은 Kubernetes 클러스터에 Airflow를 설치하고, KubernetesExecutor를 사용하여 작업을 실행하도록 설정합니다. Redis와 PostgreSQL은 기본적으로 사용되는 데이터베이스로 설정됩니다.

1-4. Airflow 웹 UI 접근: Helm 차트를 사용하여 Airflow를 설치하면 웹 UI를 통해 Airflow 대시보드에 접근할 수 있습니다. 설 치 후,kubectl port-forward명령어로 웹 UI에 접근합니다.

kubectl port-forward svc/airflow-webserver 8080:8080 --namespace airflow

웹 브라우저에서 http://localhost:8080으로 접속하여 Airflow UI에 로그인할 수 있습니다.

1-5. KubernetesExecutor 설정: KubernetesExecutor는 Airflow에서 Kubernetes 클러스터 내에서 작업을 실행하는 방식입니다. 각 작업이 독립적인 Pod로 실행되므로, Kubernetes의 자원을 효율적으로 활용할 수 있습니다.

Helm 설치 시 --set executor=KubernetesExecutor를 추가하여 이 설정을 적용합니다.

<2. Airflow KubernetesExecutor 사용법>

Airflow에서 KubernetesExecutor를 사용하면 각 작업이 Kubernetes Pod로 실행됩니다. 이를 통해 작업을 확장 가능하게 관리할 수 있으며, Kubernetes의 자동 스케일링, 리소스 할당 등을 활용할 수 있습니다.

Executor 설정: Airflow를 설치할 때 --set executor=KubernetesExecutor를 설정합니다.
PodOperator 사용: KubernetesPodOperator는 Airflow의 작업을 Kubernetes Pod에서 실행할 수 있도록 해줍니다.

예를 들어, Python 작업을 Kubernetes Pod에서 실행하려면 KubernetesPodOperator를 다음과 같이 사용합니다:

from airflow.providers.cncf.kubernetes.operators.kubernetes_pod import KubernetesPodOperator
from airflow import DAG
from datetime import datetime

dag = DAG('ml_workflow', start_date=datetime(2024, 1, 1))

task = KubernetesPodOperator(
    namespace='default',
    image="python:3.8",
    cmds=["python", "-c", "print('Hello, Kubernetes!')"],
    name="python-task",
    task_id="run-python-task",
    get_logs=True,
    dag=dag,
)

이 예시에서 KubernetesPodOperator는 Python 3.8 이미지를 사용하여 Kubernetes에서 Python 작업을 실행합니다.

Kubernetes에서 리소스 설정: 작업이 실행될 때마다 리소스(CPU, 메모리) 요구 사항을 설정할 수 있습니다. 예를 들어, 작업에 대해 최소한의 CPU나 메모리 리소스를 할당할 수 있습니다.

task = KubernetesPodOperator(
    namespace='default',
    image="python:3.8",
    cmds=["python", "-c", "print('Hello, Kubernetes!')"],
    name="python-task",
    task_id="run-python-task",
    get_logs=True,
    resources={'request_cpu': '500m', 'request_memory': '1Gi'},
    dag=dag,
)

4. 기타 고려사항

헬름 차트 설정: Helm 차트에 포함된 다양한 설정을 통해 Airflow 클러스터의 리소스를 설정하고, 네트워크 및 데이터베이스 연결 등을 맞출 수 있습니다.
모니터링: Kubernetes와 결합한 Airflow는 Prometheus와 Grafana 같은 모니터링 도구와 쉽게 통합할 수 있습니다. 이를 통해 파이프라인의 상태를 실시간으로 확인할 수 있습니다.

AirFlow 도입 사례:

https://www.bucketplace.com/post/2021-04-13-%EB%B2%84%ED%82%B7%ED%94%8C%EB%A0%88%EC%9D%B4%EC%8A%A4-airflow-%EB%8F%84%EC%9E%85%EA%B8%B0/

버킷플레이스 Airflow 도입기 - 오늘의집 블로그

탁월한 데이터플랫폼을 위한 Airflow 도입기

www.bucketplace.com

'클라우드' 카테고리의 다른 글

[kubenetes] CKA 자격증 시험 대비 스터디 (0)	2024.12.18
[K8S] kubernetes 기본 & 운영 명령어 (0)	2024.11.27
[Elasticsearch] index 의 shard(샤드) 개념 (0)	2024.11.27
베어 메탈(Bare Metal)이란.. (0)	2023.06.15

베어메탈(베어 메탈 서버)은 하이퍼스케일 아키텍처를 기반으로 한 서버 구축 방식입니다.

일반적인 클라우드 서비스와의 주요 차이점은 물리적 서버 리소스에 직접 액세스할 수 있다는 것입니다.

베어메탈은 가상화 기술을 사용하지 않고 물리적인 서버 자체를 사용합니다.

이는 높은 성능과 안정성을 제공하며, 가상화 오버헤드를 피할 수 있습니다. 또한 베어메탈은 물리적 서버 자원을 완전히 제어할 수 있으므로, 보안 및 커스터마이징 면에서 더 큰 유연성을 제공합니다.

클라우드 서버는 일반적으로 가상화된 인프라스트럭처에서 실행되며, 가상 서버 인스턴스를 사용하여 리소스를 할당합니다. 클라우드 서버는 자동화된 확장성과 유연성을 제공하여 필요에 따라 리소스를 증가 또는 감소시킬 수 있습니다. 이는 빠른 배포와 다중 테넌시, 고 가용성을 지원하는 데 도움이 됩니다.

요약하자면, 베어메탈은 가상화된 환경 대신 물리적 서버를 사용하는 구축 방식이며, 더 높은 성능과 직접적인 리소스 제어를 제공합니다. 클라우드 서버는 가상화된 환경에서 실행되며, 자동화된 확장성과 유연성을 갖추고 있습니다. 선택은 사용자의 요구 사항과 운영 환경에 따라 달라집니다.

'클라우드' 카테고리의 다른 글

[kubenetes] CKA 자격증 시험 대비 스터디 (0)	2024.12.18
[K8S] kubernetes 기본 & 운영 명령어 (0)	2024.11.27
[Elasticsearch] index 의 shard(샤드) 개념 (0)	2024.11.27
[k8s]Airflow Helm Install 가이드 (0)	2024.11.26

technology_cloud

클라우드

[kubenetes] CKA 자격증 시험 대비 스터디

'클라우드' 카테고리의 다른 글

[K8S] kubernetes 기본 & 운영 명령어

- k8s 운영시 알아두면 유용한 기본명령어 -

1. 기본 명령어

클러스터 및 리소스 정보 조회

2. Deployment 관련 명령어

Deployment 생성 및 관리

3. Patch 관련 명령어

리소스 수정

4. Rollout 관련 명령어

Deployment의 롤아웃 관리

5. Config 및 Secret 관리

ConfigMap

6. YAML 파일로 리소스 관리

리소스 생성 및 업데이트

7. Namespace 관리

8. 기타 명령어

CronJob 및 Job 관리

Volume 및 PV/PVC 관리

'클라우드' 카테고리의 다른 글

[Elasticsearch] index 의 shard(샤드) 개념

▶ Shard 란?

▶ 샤드의 역할

▶ 인덱스 생성 시 샤드 수 지정

'클라우드' 카테고리의 다른 글

[k8s]Airflow Helm Install 가이드

Airflow 란?

1. Apache Airflow 개념

2. Airflow를 머신러닝에 활용하는 방법

3. Kubernetes 환경에서의 Airflow 설치 및 사용법

Kubernetes에서 Airflow 설치 방법

4. 기타 고려사항

'클라우드' 카테고리의 다른 글

베어 메탈(Bare Metal)이란..

'클라우드' 카테고리의 다른 글

+ Recent posts

티스토리툴바