Apache Kafka 복제(Replication)와 장애 허용(Fault Tolerance) 메커니즘 (9편)

Kafka의 Replication과 Fault Tolerance는 데이터의 안정성과 가용성을 보장하는 중요한 요소이다. 이러한 개념들은 Kafka 클러스터가 장애 상황에서도 데이터 손실 없이 정상적으로 작동할 수 있게 해준다.

1-1. 정의:

1-2. 동작 방식:

Leader Partition이 새로운 메시지를 받으면, ISR 내의 Follower Partition들도 이 메시지를 복제한다.
모든 Follower가 메시지를 복제하면, 해당 메시지는 'Commit'된 것으로 간주된다.
Commit된 메시지만이 Consumer에 의해 소비될 수 있다.

1-3. 그림 설명

Producer: 메시지를 생성하여 Leader Partition에 전달한다. (단계 1)
Leader Partition: 메시지를 받아 저장하고, ISR에 있는 Follower Partition들에게 복제한다. (단계 2 → 3, 단계 4)
Follower Partitions: Leader Partition으로부터 메시지를 복제받는다. (단계 2 → 3)
ISR (In-Sync Replicas): 현재 Leader와 동기화되고 있는 Follower Partition들의 집합이다. (단계 4)
Consumer: Leader Partition에서 메시지를 소비한다. (단계 5)

2-1. 정의:

2-2. 동작 방식:

Replication Factor가 3이라면, 하나의 Leader Partition과 두 개의 Follower Partition이 생성된다.
이렇게 하면 하나 또는 두 개의 노드가 실패해도 데이터 손실이 없다.
높은 Replication Factor 설정은 데이터의 안정성을 높이지만, 더 많은 저장 공간과 네트워크 트래픽을 사용한다.

2-3. 동작 과정

Producer: 메시지를 생성하고 Leader Partition에 전송한다. (단계 1)
Leader Partition: 메시지를 받아 Follower Partition에 복제한다. (단계 2 → 3)
Follower Partition 1 & 2: Leader Partition으로부터 메시지를 복제한다. Replication Factor가 3이므로, 하나의 Leader와 두 개의 Follower가 있다. (단계 2 → 3)
Consumer: Leader Partition에서 메시지를 소비한다. (단계 4)

3-1. 정의:

Leader Election은 현재 Leader Partition이 실패할 경우, ISR 내의 Follower Partition 중 하나가 새로운 Leader로 선출되는 과정이다.

3-2. 동작 방식:

3-3. 동작 과정

Leader Partition: 현재 Leader Partition이다.
Follower Partition 1 & 2: Leader Partition과 동기화되고 있는 Follower Partition들이다.
동기화: Leader와 Follower Partition들이 데이터를 동기화한다.
새 Leader 선출: Leader Partition이 실패할 경우, 새로운 Leader가 선출된다. 이 과정은 빨간색 점선으로 표시되어 있다.

4-1. 정의:

4-2. 동작 방식:

Kafka는 Replication과 Leader Election을 통해 높은 수준의 Fault Tolerance를 제공한다.
이를 통해, 일부 노드가 실패하더라도 Kafka 클러스터는 계속해서 정상적으로 작동할 수 있다.

Apache Kafka 오프셋(Offset) 관리와 커밋(Commit) 작동 원리 (8편)

카프카의 Offset과 Commit의 작동 원리를 알아보자 1. Kafka 2.x 버전에서의 Offset과 Commit 이해하기 1-1. 구조 설명 Broker: Kafka 클러스터 내의 브로커다(Kafka 인스턴스). 파티션을 관리한다. Partition: 메시지

curiousjinan.tistory.com

Kafka(카프카) 클러스터와 브로커의 동작 이해하기 (1)	2023.12.27
Kafka(카프카)의 기본 구조 이해하기 (클러스터, 브로커, 토픽, 파티션, 세그먼트) (2)	2023.12.27
Kafka(카프카)란 무엇인가 (2)	2023.12.27
SpringBoot와 Kafka(1) - 기본설명 (0)	2023.10.19
Apache Kafka 오프셋(Offset) 관리와 커밋(Commit) 작동 원리 (8편) (0)	2023.10.19