用戶可以開發分布式程序,而無需了解發行版的底層細節。充分利用集群的力量進行高速操作和存儲。
Hadoop實現了分布式文件系統(HDFS)。HDFS具有高容錯性的特點,旨在部署在低成本的硬件上。此外,它還提供了高吞吐量的應用數據訪問,適用於數據集較大的應用。HDFS放寬)POSIX要求,並且可以流式訪問文件系統中的數據。
Hadoop框架的核心設計是:HDFS和MapReduce。HDFS為海量數據提供存儲,MapReduce為海量數據提供計算。