大数据环境下档案迁移问题的研究

其实有好多东西可以考虑,但是都是实战的,理论的东西提取起来比较麻烦,可以看看sqoop跟flume。一个是有schema的一个是文本的,但是这些可以写的理论的东西不多。如果单纯是迁移的话,一般现在用kafka做的很多,这个是个分布式队列问题,如果用队列作为理论的话,可以写的东西就很多了,比如数据切分,你是不是可以自定义数据切分,比如failover,比如保顺序,你只要随便找一个搞分布式队列的理论文章来就可以了。
■网友
从OAIS的模型角度思考看看。
【大数据环境下档案迁移问题的研究】 将档案数据进行封装,对MD5判断进行增量迁移。

■网友
中国的人事档案属于那个时代数据信息最全的材料,是一种整合一定资源辅助于户籍信息的材料。考虑到历史人口迁移和城镇化进程等历史大事件,选择好分析模型也许会对你有帮助……好了我编不下去ˊ_\u0026gt;ˋ


    推荐阅读