hdfs的实现原理与优缺点（hdfs三个优点和三个缺点）

hdfs的实现原理与优缺点

实现原理：Hadoop分布式文件系统(HDFS)是一种被设计成适合运行在通用硬件上的分布式文件系统。HDFS是一个高度容错性的系统，适合部署在廉价的机器上。它能提供高吞吐量的数据访问，非常适合大规模数据集上的应用。

hdfs的优点

(1) 高容错性 1) 数据自动保存多个副本。它通过增加副本的形式,提高容错性。 2) 某一个副本丢失以后,它可以自动恢复,这是由 HDFS 内部机制实现的,我们不必关心。

(2) 适合批处理

1) 它是通过移动计算而不是移动数据。

2) 它会把数据位置暴露给计算框架。

(3) 适合大数据处理

1) 数据规模：能够处理数据规模达到 GB、TB、甚至PB级别的数据。

2) 文件规模：能够处理百万规模以上的文件数量，数量相当之大。

3) 节点规模：能够处理10K节点的规模。

(4) 流式数据访问

1) 一次写入，多次读取，不能修改，只能追加。

2) 它能保证数据的一致性。

(5) 可构建在廉价机器上

1) 它通过多副本机制，提高可靠性。

2) 它提供了容错和恢复机制。比如某一个副本丢失，可以通过其它副本来恢复。

2.hdfs的缺点

(1) 不适合低延时数据访问; 1) 比如毫秒级的来存储数据,这是不行的,它做不到。 2) 它适合高吞吐率的场景,就是在某一时间内写入大量的数据。但是它在低延时的情况下是不行的。

(2) 无法高效的对大量小文件进行存储。

1) 存储大量小文件的话，它会占用 NameNode大量的内存来存储文件、目录和块信息。这样是不可取的，因为NameNode的内存总量是有限的。

2) 小文件存储的寻道时间会超过读取时间，它违反了HDFS的设计目标。改进策略

(3) 并发写入、文件随机修改

1) 一个文件只能有一个写，不允许多个线程同时写。

2) 仅支持数据 append（追加），不支持文件的随机修改。

大家还看了

也许喜欢

新课程标准下如何评小学数学课及评课稿怎样去写（小学数学怎样评课从哪几方面入手）
既然是新课程标准下来评小学数学课,那么评课就要围绕新的课程标...
小米粥放冰箱可保存多久
1-2天小米粥放在冰箱可以存放1-2天,虽然冰箱中的低温能抑...
怎样晚上才会做梦
看一本喜欢的书找一本自己喜欢的书，放一曲旋律，让自己沉浸在书...
视频上的标签怎样弄上去
视频上的标签弄上去的方法步骤1打开抖音，点击“+”。2/7点...
adidas是哪国的牌子
adidas（阿迪达斯）是德国的。adidas（阿迪达斯）创...
小时候看过一部不知道是电视局还是电影里面有一个男的救活了一株牡丹后来牡丹变成一个女人叫白牡丹
我模糊也记得有过这样的电影或者电视剧。很老的片子，记不清名字...
中华小当家人物都来自哪里
在《中华小当家》中，“小当家”刘昴星的母亲是出名的川菜厨师，...
加湿器棉棒用什么可以代替
寒冬，女神们经常会购买保湿产品来锁住肌肤水分，但如果脸上没有...