「专利解密」腾讯基于机器学习的数据迁移方法( 二 )


在获取到服务器向多个终端进行数据迁移的迁移过程数据后 , 对所获取的迁移过程数据进行分析 , 确定出每个迁移过程数据的数据迁移性能指标 , 基于数据迁移性能指标数据对服务器中的待训练模型进行训练 , 获得迁移模型 , 通过该迁移模型从服务器侧的通用数据中确定出向目标终端迁移的数据 , 并响应于终端的迁移请求迁移该数据 。
接下来我们具体看看该方案的流程图 。
「专利解密」腾讯基于机器学习的数据迁移方法
本文插图
如上图所示为基于机器学习的迁移数据确定方法的流程图 , 首先 , 计算机设备获取服务器分别向多个终端进行数据迁移的迁移过程数据 , 迁移过程数据包括被迁移的个性化数据以及每个终端的终端侧数据 。
例如 , 在图片识别的应用场景中 , 将猫的图片迁移到狗的图片 , 那么猫的图片与狗的图片之间具有共同特征的数据为眼睛部位的图像数据、鼻子部位的图像数据等 。
其次 , 计算机设备确定每个终端对应的个性化数据和每个终端的终端侧数据之间的相似度 。 在理想的数据迁移情况下 , 被迁移的个性化数据应当与终端侧数据之间具有共同特征的数据 , 因此 , 需要确定出迁移过程数据的迁移性能 , 即被迁移的个性化数据与终端侧数据之间的相似程度越高 , 则表明对应迁移过程数据的迁移性能越好 , 可以将这些数据作为后续模型训练的训练基础 , 对云服务器侧的迁移模型进行训练和优化 。
接着 , 计算机设备基于相似度 , 确定多个终端的数据迁移性能指标 , 计算机设备基于每个终端的数据迁移性能指标对待训练模型进行训练 , 获得迁移模型 。 最终 , 计算机设备响应于终端的迁移请求 , 基于迁移模型确定向终端迁移的数据 。
通过训练后的迁移模型中包含了多个已经训练好的神经网络层 , 将终端的终端侧数据输入至迁移模型中 , 通过多个已经训练好的神经网络层对终端侧数据进行分析 , 分析出终端的特征数据后与云服务器侧的通用数据中进行匹配 。 最终确定出向该终端迁移的数据 , 保证了所迁移的数据是该终端所需求的数据 , 从而实现针对于用户生成定制化的模型 , 满足用户的需求 。
最后我们来看看这里的迁移模型是如何获得的吧 。
「专利解密」腾讯基于机器学习的数据迁移方法
本文插图
如上图所示 , 首先 , 计算机设备将每个终端的数据迁移性能指标与待训练模型中对应的待训练迁移参数进行差异比对 , 确定多个终端的数据迁移性能指标与待训练迁移参数之间的差异程度 。
其次 , 计算机设备对每个差异程度进行最小化 , 获得对应的迁移配置参数 , 例如从之前获得的N个迁移过程数据对服务器中的待训练模型进行训练 。
最终 , 计算机设备将迁移配置参数向待训练模型中对应的待训练参数进行配置 , 获得迁移模型 。 一个通过机器学习而被训练好的迁移模型可以被认为存储了迁移学习技巧 , 即对什么样的用户终端数据 , 应该从服务器端迁移什么样的知识 。
以上就是腾讯发明的基于机器学习的迁移数据确定方法 , 通过获取服务器向多个终端进行数据迁移的迁移过程数据 , 基于机器学习对服务器侧的模型进行训练 , 获得针对于终端进行定制化的迁移模型 , 基于该迁移模型向终端高效迁移终端所需的数据 , 提高了迁移数据的准确性和效率 , 同时节省了大量人力!
关于嘉德
「专利解密」腾讯基于机器学习的数据迁移方法
本文插图
深圳市嘉德知识产权服务有限公司由曾在华为等世界500强企业工作多年的知识产权专家、律师、专利代理人组成 , 熟悉中欧美知识产权法律理论和实务 , 在全球知识产权申请、布局、诉讼、许可谈判、交易、运营、标准专利协同创造、专利池建设、展会知识产权、跨境电商知识产权、知识产权海关保护等方面拥有丰富的经验 。


推荐阅读