世纪|链世纪对话分布式存储|贾永政:人工智能与区块链上的存储和计算
8月18日,由链世纪财经、Ever链动主办,聚英国际、PAI Community联合主办,BTRAC全球数字网络高等智库、察访区块链、币世界、碳链价值协办的链世纪财经对话分布式存储No.6在金色财经及近200个社区平台同步直播。本次活动战略合作金色财经、Cointelegraph、火星财经、布洛克科技、星际视界五家业界优秀媒体,50余家区块链媒体倾情支持。
此次活动以“人工智能与区块链上的存储和计算”为主题,特邀中国技术经济学会区块链分会秘书长贾永政担任嘉宾,链世纪财经CEO焦仕可担任主持,共同解读人工智能与区块链上的存储和计算等热点话题,共享分布式存储领域商业机遇。
文章图片
特邀嘉宾:贾永政
中国技术经济学会区块链分会秘书长,Ever Chain创始人&CEO;。
清华大学计算机科学实验班(姚班)2009级本科,交叉信息研究院博士,曾赴加州大学伯克利分校、宾夕法尼亚大学做访问学者,2013年参与创办是全球最大中文MOOC平台—学堂在线,2018年创办Ever Chain。研究方向包括:大规模社交网络、云计算系统的动态优化,以及将人工智能和区块链技术应用到大规模用户的产品与服务中,在互联网、分布式系统、人工智能、博弈论等多领域顶尖会议/期刊(如WWW、IEEE/ACM Transactions on Networking、JSAC、ICSE、ICDCS等)发表多篇学术论文。
主持人:焦仕可
链世纪财经CEO,BTRAC全球数字网络高等智库合伙人。
链世纪与行业内顶尖专家特别推出对话系列:《对话新基建》《对话IPFS》《对话Filecoin》《对话新三板》等,与各位行业专家、先行者等大咖共同交流,帮助更多人抓住新赛道中的新机遇。
精彩内容连连看Q、人工智能与区块链上的存储和计算有什么关系?
【贾永政】:首先,无论是更早的大数据、云计算,还是当今的人工智能技术,都是建立在对数据的安全存储、价值挖掘以及隐私保护的基础上。
众所周知, 人工智能的算法需要大量的数据和模型,我们需要对海量的数据进行存储和计算。
诞生于2011年的卷积神经网络(CNN)AlexNet,共用0.6亿个参数
Google的NLP模型BERT,流行一时,共有3亿个参数。
GPT-3 模型的前身GPT-2,有15亿个参数。
英伟达的Megatron-BERT,有80 亿参数。
2020年2月,微软Turing NLP,有170 亿参数。
2020年6月,Open AI的GPT-3问世,有1750亿个参数。是迄今为止最大的AI模型。
同时,全球用于各种人工智能和大数据系统的数据也在以每年1800亿TB的速度不断增长,这反映了AI对于海量数据的存储和计算需求。很明显,AI已经进入了数据存储和计算密集型的时代,我们需要充分保障AI数据和算法模型的安全性,防止数据和模型参数丢失。同时,我们还要保障数据的隐私,防止数据在使用的过程中泄露用户隐私造成损失。
我们注意到,分布式存储和区块链技术为AI提供了更好的安全保障。在传统的数据存储系统中,我们往往需要通过冗余备份和容灾技术保障数据和模型的安全存储。此外,以IPFS为代表的的分布式存储使得AI的数据和算法模型被更加安全地存储,有效地防止了单点故障。同时,区块链技术可以很好地为AI数据和算法提供不依赖可信第三方的访问权限控制,并可以在区块链上细粒度地追溯到数据是如何被存储以及使用的。因此,我们可以通过区块链建立更好的数据存储和共享机制,促进数据更好地流通并产生价值,并保护好数据的隐私。
同时,我们还要进一步思考,如何更好地将AI和区块链技术结合起来,使得二者能够相互融合,彼此促进。
在这里,我想和大家分享Project PAI提出的有用工作量证明(Proof of Useful Work,即PoUW)项目,我认为这个研究项目代表了AI和区块链技术融合的趋势,并有机会改变这个行业。
PoUW的目的在于使用AI的计算来替代传统的PoW哈希运算,使得在区块链上的算力能够用于实际的AI应用,让这些算力变得“有用”。未来,这些算力不仅可以用于机器学习训练,还可以拓展到通用的链上计算,如链上数据分析、基于密码学的链上隐私计算(如零知识证明、多方安全计算)等。
众所周知,比特币的开采是一个十分消耗时间和资源的过程。每添加一个区块链交易区块,矿工们都必须花费大量成本,比特币协议所用的工作量证明(Proof of Work, 即PoW)机制,通过大量的哈希运算来完成共识,这些计算工作本身并没有其他用途。基于在区块链上训练机器学习模型,提供了一种新颖的“有用工作量证明”(Proof of Useful Work, PoUW)协议。矿工在诚实地进行一定量的机器学习训练工作之后可以得到一次铸造新虚拟货币的机会,获得出块奖励。同时,我们在网络中引入了对于AI和链上计算的客户,客户会向PoUW区块链网络提交AI训练任务并支付token给参与机器学习训练完成任务的节点。这是对于参与网络的一种额外激励,除了系统提供的出块奖励,并且是基于真实需求的。
下图给出了一个PoUW的工作模型,描述了在PoUW系统中各个参与者是如何协同工作的:首先,客户可以通过支付PAI币,向PAI的PoUW网络提交一个机器学习或者链上计算任务。工作节点(矿工)需要执行AI训练,完成训练和计算任务,网络中的监督者和评估者需要对工作者的工作进行验证,评估收益分配和支付方式,并防止拜占庭节点的恶意行为,普通节点还可以在PoUW网络中执行常规的链上交易,享受通用的区块链服务。如此,PAI 的PoUW区块链保证了整个机器学习训练过程的安全性,使得现实中的AI算法任务利用区块链网络的算力来解决。同时,为区块链引入了更多的激励, 使PoUW区块链上的通证(PAI币)有了更丰富的应用场景。
推荐阅读
- |NEWLINK能链对话世界500强 励志成为能源产业“阿里巴巴”
- |第十六届中国(无锡)国际设计博览会暨第九届太湖奖设计大赛北京推介会在中华世纪坛隆重召开
- 世纪华通|世纪华通2020上半年营收超77亿元 净利润同比增长超36%
- 微生物|对话千年历史,五粮液先干为敬!
- 唐朝|与七世纪的盛唐相遇:女性摆脱了礼教的羁绊,获得更多自由
- [新浪科技]对话APUS李涛:中国企业出海必须“抱团” 内容和游戏值得深耕新浪科技2020-08-28 17:42:100阅
- 卫星|我和先贤来场对话|领异标新 不拘一格
- 环境|我和先贤来场对话|重商之道 在于富民
- 【新浪财经】独家|对话何小鹏:电动车赛道才刚起步 估值都是浮云新浪财经2020-08-28 07:28:170阅
- 青年|欢瑞世纪的艺人粉丝排行,张予曦第五,任嘉伦第二,杨紫则第一?