본문 바로가기
Infra

HDFS에 대해 알아보자

by GOMJ 2025. 8. 17.

빅분기 시험을 공부하다가 HDFS라는 용어가 나왔다.

 

하둡에 대해 간단하게 들어는 봤는데 HDFS는 뭐지 했다. 하둡 분산형 파일 시스템이라고 한다.

 

노드간 데이터를 고속으로 전송하여 주로 빅데이터를 처리할 때 사용 한다고 한다.

 

대규모 데이터 처리에 능하며 내결함성을 지니고 있어 빅데이터 처리에 좋은 선택지 중 하나라고 한다.

 

네임노드, 데이터노드, 클라이언트가 있으며 데이터를 복제 방식으로 처리한다고 한다. 

 

그렇다면 HDFS가 갖는 장점은 무엇일까?

 

내결함성, 속도, 많은 데이터에 액세스 가능, 호환성과 이동성이라고 한다.

 

추후 실습에 쓸일이 있으려나? 아무튼 빅데이터 분야도 흥미가 생겨 더 공부해보도록 해야겠다.

 

'Infra' 카테고리의 다른 글

AWS Kinesis  (0) 2025.08.31
JEUS 에서 Permission Denied 오류  (0) 2025.08.17
서버 및 DB 정기 재기동 이유  (1) 2025.08.03
Peer-to-Peer (P2P)란 ?  (0) 2025.07.06
MDD requiresNew 사용  (0) 2025.07.06