用于生物信息的高性能计算集群该咋选择网络文件系统

如果只是几台服务器(5台以下),搭分布式系统没有特别大的性能优势,可能不如直接开几个单独的nfs。服务器多的话选哪个分布式系统性能如果可能主要看如何应用,不过分布式存储的核心精神是:性能不够了就加机器……
■网友
楼主写错了,应该是lustre方向没错,用这几台旧机器搭建lustre并行文件系统,代替nfs简单说,每个job都是通过一个nfs通道在读写数据,lustre是通过多个通道读写数据存储不用动,在存储和计算节点之间,增加I/O节点,上面装lustre
■网友
【用于生物信息的高性能计算集群该咋选择网络文件系统】 都是事隔两年来回答啊。
如果是快要淘汰的节点,就别来做存储的IO了,如果中间死机重启,或者彻底挂了的话,那是自己给自己找麻烦,还不如慢点的能用呢。 我觉得计算节点可以用快淘汰的来补充,存储一定得用新机器。

■网友
一般HPC用的是并行文件系统,要求支持mandatory file lock/range lock。open source的parallel distributed filesystem选择性不多:
Lustre一般是中、大型集群,由san array保证availability和reliability小集群用Glusterfs也可以跑,普通的存储服务器就可以,Gluster自己支持副本,网上GLuserfs的文档也比较多


    推荐阅读