大数据环境下档案迁移问题的研究
其实有好多东西可以考虑,但是都是实战的,理论的东西提取起来比较麻烦,可以看看sqoop跟flume。一个是有schema的一个是文本的,但是这些可以写的理论的东西不多。如果单纯是迁移的话,一般现在用kafka做的很多,这个是个分布式队列问题,如果用队列作为理论的话,可以写的东西就很多了,比如数据切分,你是不是可以自定义数据切分,比如failover,比如保顺序,你只要随便找一个搞分布式队列的理论文章来就可以了。
■网友
从OAIS的模型角度思考看看。
【大数据环境下档案迁移问题的研究】 将档案数据进行封装,对MD5判断进行增量迁移。
■网友
中国的人事档案属于那个时代数据信息最全的材料,是一种整合一定资源辅助于户籍信息的材料。考虑到历史人口迁移和城镇化进程等历史大事件,选择好分析模型也许会对你有帮助……好了我编不下去ˊ_\u0026gt;ˋ
推荐阅读
- “一部手机读云南”上线力争建成国家方志大数据中心西南中心
- 河北承德持续改善水环境质量水质达标率100%
- 杭州已整改城市道路无障碍环境问题12467处
- 上海构建现代环境治理体系集成示范区打造超大城市生态环境治理的“样本”
- 联合国大数据全球平台中国区域中心在杭州成立
- 接待日|省生态环境厅来通开展“企业环保接待日”
- 银行的数据中心可以跳槽去互联网公司吗
- |淮安市生态环境局倾心帮扶马渡村脱贫增收
- |大数据赋力 半个多月前拉客的“黑车”精准落网
- 数据采集终端|