Hadoop Distributed File System (HDFS): HDFS是Hadoop的分布式文件系統,它用于存儲大規模數據集,并提供高容錯性。HDFS將文件分成塊并存儲在集群中的多個節點上,以實現高可靠性和高可擴展性。
Hadoop MapReduce: MapReduce是Hadoop的計算框架,用于處理大規模數據并實現分布式計算。MapReduce將計算任務分成兩個階段:Map階段和Reduce階段,可以并行處理大規模數據集。
Hadoop YARN (Yet Another Resource Negotiator): YARN是Hadoop的資源管理器,用于管理集群中的資源和調度任務。YARN將計算資源和存儲資源分離,使得各種工作負載可以在同一個集群上運行。
Hadoop Common: Hadoop Common包含Hadoop集群中所有組件共同使用的庫和工具。它提供了許多基本功能,如輸入輸出處理、文件系統操作、安全認證等。
Hadoop Ozone: Hadoop Ozone是Hadoop的分布式對象存儲系統,主要用于存儲大規模數據集。它提供了可擴展的、高可靠的對象存儲服務,適用于海量數據的持久化存儲需求。