深入解析Hadoop的架构设计
Hadoop 是一个存储和处理大规模数据的开源软件框架,实现在大量计算机组成的集群中对海量数据进行分布式存储计算。Hadoop 主要有以下几个优点:高扩展性。正在执行的子任务由于某种原因挂掉的话,Hadoop 可以自动让其他节点继续执行该子任务,不影响整个任务的执行。HDFS 和MapReduce 是Hadoop 的两大核心,整个Hadoop 的体系结构主要是HDFS 为海量数据提供了分布式存储,MapReduce 为海量数据的规则提取提供了并行计算。
理论教育
2023-06-14