【Linux】面向海量数据的分布式用户态文件系统研究与设计( 三 ) |操作系统|MongoDB|设计|

本文插图
图5 小文件读写测试从图5可以看出，由于使用分布式存储，小文件读写的性能随着线程数的增加而增加；当线程并发数超过256时，读写性能趋于稳定，分别是35 MB/s和80 MB/s左右。它的带宽低于千兆以太网理论带宽的峰值，这是因为对于海量的小文件，读写过程中产生的额外开销不可忽视，如MongoDB元数据读写、文件查询和定位等。从读写整体性能对比来看，相同线程数写入的带宽速率要远高于读取速率，这是因为小文件批量写入时采取的是顺序写的方式，但读取时因为文件大小比较小、数量多，其读取方式相当于随机读取，所以读取带宽速率会小于写入的带宽速率。在大文件测试中，分别使用1～1 024个线程。每个线程分别在挂载目录写入、读取4个1 GB大小的文件，用来模拟现实网络中常见的大文件读写，测试结果如图6所示。其中，随着线程并发数的增加，读写带宽随之增加，最终趋近于各自的峰值140 MB/s和120 MB/s 。这与千兆以太网理论带宽相近。

本文插图
图6 大文件读写测试从整体来看，系统在吞吐量性能方面有着不错的表现，但在小文件读取性能方面有一定的提升空间，因为文件系统通过MongDB访问元数据带来的性能开销在小文件读写中无法忽视，建议对MongoDB服务器配置SSD固态磁盘存储元数据，同时开启MongoDB缓存提高元数据访问速率，进而提高海量小文件读取时的性能。
05
结语
本文的创新点是在分布式存储系统的基础上，结合MongoDB ，使用fuse框架设计，实现了面向海量数据的用户态分布式文件系统，既具有很高的灵活性和可扩展性，又使得用户对分布式存储系统的访问更加便捷，管理更加方便。经过小文件读写和大文件吞吐量测试可以发现，本文设计的文件系统在吞吐量性能和小文件创建方面有着优良的性能表现，但在小文件读取性能方面有进一步的提高空间。作者简介 >>>
龚恒（1993—），男，硕士，主要研究方向为分布式存储系统；
李小勇（1972—）,男，博士，副教授，主要研究方向为大规模分布式存储系统、云计算、大数据。
【【Linux】面向海量数据的分布式用户态文件系统研究与设计】选自《通信技术》2020年第二期（为便于排版，已省去原文参考文献）

【Linux】面向海量数据的分布式用户态文件系统研究与设计( 三 )

推荐阅读

【瓦妮莎】科比离世5个月，马龙追求瓦妮莎彻底实锤！无视慈世平警告，作出重要决定

白茶品牌排行榜,中国白茶品牌排行榜

考古|父亲回应留守女儿选北大考古专业

「方舱」“方舱医院”轻症患者符合什么标准才需要转诊定点医院？

k金是什么意思 k金是什么

内地新生代女演员郭艳郭艳个人资料

央视网|多国专家学者表示：五中全会释放未来中国发展重要信号

怎样看待父母偷看孩子信件这件事

网络营销当今茶业发展的必由之路

海贼资讯|谁的眼妆赢了？，杨超越battle热巴

资产质量|上市银行三季度成绩单出炉——银行业资产质量总体持续好转

「孕晚期」孕晚期胎盘老化对胎儿有什么影响

ps要咋的才能贴图，ps怎么做样机立体贴图

#新华网#阿曼与美英举行联合军演

有声绘本故事之小马过河小马过河的故事

路通|为什么有经验的老司机都会在车轮上挂几个矿泉水瓶？网友：真聪明

|划重点！车辆落水自救指南，关键时刻能救命！

怎样处理原生家庭对自己的负面影响

特朗普|特朗普为何急于从阿富汗撤军

央视网|爱国留学生班雅伦：没人能诋毁我的祖国