Hadoop

Hadoop - HDFS 페더레이션

개발 일기92 2024. 7. 4. 15:57

HDFS 페더레이션?

네임 노드의 확장성 문제를 해결하기 위한 네임노드 연합체(2.x 릴리즈 버전부터 지원)

 

여러대의 네임노드가 파일 시스템의 네임스페이스를 일부 나누어 관리하는 방식이다.

ex) A네임노드는 /user/* 디렉토리의 모든 파일관리.

      B네임노드는 /share/* 디렉토리의 모든 파일관리.

 

HDFS 페더레이션을 적용하면 각 네임노드는 네임스페이스 볼륨블록 풀을 관리한다.

네임스페이스 볼륨 : 네임스페이스의 메타데이터를 구성. 서로 독립되어 있다. 네임노드끼리 서로 통신할 필요가 없다. 특정 네임노드가 장애가 나도 가용성에 영향을 주지않는다.

블록 풀 : 네임스페이스에 포함된 파일의 전체 블록을 보관. 

 

모든 데이터노드는 클러스터의 각 네임노드마다 등록되어 있고, 여러 블록 풀로부터 블록을 저장.

 

환경 설정에서 ViewFileSystem과 viewfs://URI를 사용하여 관리할 수 있다.

 

 

'Hadoop' 카테고리의 다른 글

HDFS - 사용량 제한 설정  (0) 2025.01.26
Hadoop - 설정 파일  (0) 2024.07.07
Hadoop - 다수의 작은 파일 vs 하나의 큰 파일  (1) 2024.07.04
Hadoop - HDFS, 네임노드, 데이터 노드, NFS  (0) 2024.05.21
Hive , Impala  (0) 2024.05.17