「专利解密」腾讯基于机器学习的数据迁移方法

【嘉德点评】腾讯发明的基于机器学习的迁移数据确定方法，通过获取服务器向多个终端进行数据迁移的迁移过程数据，基于机器学习对服务器侧的模型进行训练，获得针对于终端进行定制化的迁移模型，基于该迁移模型向终端高效迁移终端所需的数据，提高了迁移数据的准确性和效率。
集微网消息，目前，在特定的应用场景下，比如智能客服应用场景，智能客服能够基于终端侧已有的用户对话记录分析出用户的特征，比如用户的兴趣、习惯以及语言模式等。

本文插图
但是，由于终端侧所积累的用户对话记录的数据量非常小，无法对该智能客服进行训练，也就导致了智能客服无法以符合用户的特征的方式与用户进行交互。在这种背景下，从服务器侧向终端迁移对应的数据对终端侧的模型进行训练的迁移技术应运而生。
通过在服务器上将所有终端的终端侧数据进行匿名汇总之后，在服务器侧进行模型训练，获得多个通用模型，再通过人工匹配的方式，从多个通用模型中确定出符合终端需求的模型，再基于该模型向终端迁移相应的数据，以解决终端侧数据量小而无法实现智能客服训练的问题。
然而，由于在服务器侧所训练好的模型是基于大量终端所积累的终端侧数据进行训练的，因此，所训练出的通用模型无法与特定的终端完全适配，导致通过该通用模型向终端所迁移的数据并不精确。另外，通过人工的方式确定出与终端相匹配的模型需要耗费了大量的人力，效率不高。
因此，腾讯在19年7月15日申请了一项名为“基于机器学习的迁移数据确定方法、装置、设备及介质”（申请号：201910637116.9），申请人为腾讯科技（深圳）有限公司。
根据目前该专利公开的资料，让我们一起来看看这项迁移数据确定方法吧。

本文插图
如上图为基于机器学习的数据迁移系统的结构框图，这个数据迁移系统包括终端110和数据迁移平台140 ，终端通过无线网络或有线网络与数据迁移平台相连，终端安装和运行有支持数据迁移的应用程序。
数据迁移平台可以由一台服务器、多台服务器、云计算平台和虚拟化中心中的任意一种构成，主要是用于为支持数据迁移的应用程序提供后台服务，在数据迁移平台和终端中均可以单独承担数据处理工作，也可以相互配合进行更加高效的组合。
而该发明主要涉及迁移数据，例如这种迁移数据主要是作为服务向终端用户提供并使用的数据。以智能客服场景为例，在云服务器确定出迁移模型，基于该迁移模型向终端迁移与该终端匹配的数据，结合终端的终端侧数据和迁移的数据，通过机器学习对终端的智能客服进行训练。
从而实现针对各个用户的兴趣、习惯以及语言模式等定制出属于用户自己的智能客服，比如，当用户在终端上向智能客服发起对话后，智能客服以用户可能感兴趣的方式、符合当前用户习惯以及符合用户语言模式的方式与用户进行对话。

本文插图
如上图为基于前N个终端的迁移过程数据实现向第N+1个终端迁移数据的示意图，需要迁移的数据存储在云服务器侧，针对于不同终端的需求，从云服务器侧中确定出对应的数据并向终端迁移，在云服务器侧基于已经向终端进行数据迁移的迁移过程数据进行分析，对云服务器上的模型进行训练，使训练后的模型能够针对特定终端迁移相应的数据。
获取已经向N个终端进行数据迁移的迁移过程数据，其中， N的取值范围为大于等于1的正整数，基于该N个迁移过程数据对云服务器的模型进行训练。最终，将训练后的模型应用至服务器向第N+1个终端进行数据迁移过程中。

「专利解密」腾讯基于机器学习的数据迁移方法

推荐阅读

罂粟苗可以像食用普通青菜那样食用么

京东数科招股书背后：“to B”基因明显

DNF|DNF：2天翻2张金牌！希洛克金牌率提升，欧皇非酋差距更大了

产业气象站■支付宝季度三连涨继续领跑整个行业，外媒：中国移动支付全球领先

如何使用腹肌板呢

小鹏汽车怎么样？解锁小鹏G3新颜色享受多彩时光

亚克力浴缸价格走势

试驾车在哪里买可以便宜多少 4s店的试驾车能买吗

专家|悬崖上发现多座楚王墓，崖顶上又发现多间寺庙，专家：两者关系可大了

美国法律专家怎么看TikTok起诉美政府？特朗普政府选择了审核程序政治化

苏东坡|古有苏东坡，今有郭沫若：郭沫若为什么自称比苏轼牛，他配吗？

|与吴君如弟弟离婚6年！江美仪与前婆家人聚会，相处融洽不尴尬

心如温暖之夏|往往喜欢做3件事，福气越来越深厚，一个有福气的人

3DMGAMETB《糖豆人：终极淘汰赛》宣传片演示60人撕逼大战

聚成教育|Excel表格技巧—如何根据单元格大小自动调整文字大小

科技部：科技部：老药磷酸氯喹治疗新冠肺炎有疗效

大便的成分是啥

苹果|“iPhone 13”遭国内厂商提前发售：小刘海、侧边指纹只卖599！

沃尔夫斯堡足球俱乐部|比如进她个100球？，下赛季定个小目标

影院|黑龙江发布公告：非必要不离哈！感染者曾连续三天玩剧本杀