Hadoop 的三大組件是指 Hadoop 分布式文件系統(HDFS)、MapReduce 和 Yet Another Resource Negotiator(YARN)。
HDFS:Hadoop 分布式文件系統是 Hadoop 的分布式文件系統,它是將大規模數據分散存儲在多個節點上的基礎。HDFS 主要負責數據的存儲和管理,可以將大數據集分成多個數據塊,并將這些數據塊分配到不同的計算節點上存儲,提高數據的可靠性和處理效率。
MapReduce:MapReduce 是 Hadoop 的分布式計算框架,它提供了一種簡單的編程模型,通過將大規模數據分解成多個小任務并行處理,可以大大提高數據處理的效率。MapReduce 模型包括 Map 和 Reduce 兩個階段,其中 Map 階段將數據分解成多個小塊進行處理,Reduce 階段將處理結果合并。
YARN:Yet Another Resource Negotiator(YARN)是 Hadoop 的資源管理器,它負責為多個應用程序分配和管理計算資源,可以有效地提高計算資源的利用率。YARN 可以將集群中的計算資源劃分為多個容器,為不同的應用程序提供適當的資源,并監控和管理各個應用程序的運行狀態。
綜上所述,HDFS、MapReduce 和 YARN 是 Hadoop 的三大組件,它們共同構成了 Hadoop 分布式計算框架的核心。