DeepTech深科技|一种新方法或让AI模型拥有“联想”力，或能识别从未见过的事物( 二 )

这些图像不是直接从原始数据集中选取的，而是经由一系列的设计和优化后，赋予了这 10 张图像几乎与整个原始数据集相同的信息。
因此，仅仅用这个超精简数据集对人工智能模型进行训练，就可以达到与用 MNIST 所有图像进行训练的模型几乎一致的识别精度。

本文插图

图 | MNIST 数据集样例

本文插图
图 | “蒸馏” 后的 MNIST 精简数据集。以上 10 张图是从 MNIST 所含 6 万张图像中提纯出的，可以用于训练人工智能模型，并且它们在识别手写数字时拥有 94% 的准确性。
伊利亚和导师从中受到启发，并且认为可以在 Tongzhou Wang 的方法上更进一步 —— 既然可以将 6 万张图像压缩到 10 张，那么为什么不能将它们压缩到 5 张或更少呢？一旦实现，就意味着，通过区区几张图象的训练，人工智能模型就能掌握从 0 到 9 这 10 个数字的各种手写数字图片，从而实现前面所说的 N 大于 M 。
伊利亚很快发现，想要达到这个效果的诀窍就是创建混合有多个数字特征的图像，然后为它们打上 “软标签（让一个数据点同时成为多个类别成员的矢量表示）” ，再来用这些样本训练人工智能模型（类似于前文的马 + 犀牛混合体）。
“你可以想象一下数字 3 ，它看起来有点像 8 ，但一点都不像 7 。 ” 伊利亚说。

本文插图

“软标签的目的在于标注这些共同的特征，进而以这种方式增加信息密度和维度。因此，相比于直接告诉模型这个图像是 3 ，我们会说，这个图像有 60% 可能是 3 ， 30% 可能是 8 ， 10% 可能是 0 。 ” 使用这种数据训练出的模型，基本可以达到与常规训练方式一样的精度。
“少于一个” 样本学习的局限性当伊利亚和导师成功地使用软标签在 MNIST 上实现 “少于一个” 样本学习后，他们开始思考这个方法能否用于更广阔的领域。人工智能模型从小样本中可以识别出的类别数量是否存在上限？
答案是否定的。
从理论上来看，使用精心设计的软标签，甚至只用两个示例就可以承载任意数量的类别信息。伊利亚说：“通过两个数据点，你就可以分离出一千个，一万个，甚至是一百万个类别。 ”
伊利亚和导师通过纯数学方式的推导，在论文中证明了这一点。他们使用一种最简单的机器学习算法 ——K-近邻算法（kNN）来表述这一概念，该算法使用图形方法来为对象分类。值得注意的是，他们在 kNN 算法的基础上进行了开发，并将最终的算法称为 SLaPkNN（soft-label prototype kNearest Neighbors）。
在进一步说明之前，有必要以水果分类任务为例，简单说明 kNN 算法的核心逻辑。
假设我们要训练 kNN 模型识别苹果和橙子，你必须先确定每个水果的特征，这里以颜色（X 轴）、重量（Y 轴）为例。这样你就可以将多个苹果和橙子的信息输入 kNN 模型。
kNN 算法会将所有数据点绘制在一张二维图表上，并在苹果和橙子分布点的中间地带绘制边界线。

本文插图

图 | kNN 算法原理。由图可见，坐标轴上分布着红苹果、青苹果和橙子的数据点。当模型需要判定黑色点属于哪种水果时，它会依据蓝色框选区域内的色彩分布，将比例最大的橙色判断为 “邻近” ，进而将黑色点归类为橙子。
为了将 kNN 算法应用于 “少于一个” 样本学习，伊利亚和导师创建了一系列微型的合成数据集，并精心设计了它们的软标签。

DeepTech深科技|一种新方法或让AI模型拥有“联想”力，或能识别从未见过的事物( 二 )

推荐阅读

海南三亚迎来暑期旅游旺季

华润集团|揭秘中国历史最悠久的央企——华润集团到底有多“大”？

心脏房颤老年人心脏房颤应该注意什么？

DeepTech深科技|S和X，美国法务：中国驾驶员使用不当，特斯拉中国召回近5万辆Model

蒋雯丽|马思纯50岁小姨蒋雯丽，曾5夺视后1获影后，今儿女双全惹人羡

爱买车|电动车市场彻底变天？2023年就能买到10万元的国产MINI

『中国质量万里行』警惕！新型“五步法”刷单骗局

贵嫔和贵妃,贵妃如此多娇讲的是什么

科技小辛辛在网易有道做语音算法工程师是一种怎样的体验？

生肖|未来20天，终于和对的人相遇，爱情甜如蜜的4生肖，其中有你吗？

燃气热水器哪个牌子好必看免入坑

72种猫咪品种大全图片及介绍-2｜猫咪品种知多少？

380余个网贷平台被立案侦查涉案资产价值约百亿元

三悦有了新工作|真没想到，这部小众剧能刷爆朋友圈

还记得你用的第一部手机吗？很多人都用过这个品牌，都是回忆啊

街拍|美女街拍：时尚靓丽的小姐姐，简约干练的穿搭，魅力十足

央视|警惕！你的“脸”5毛钱被卖了

当期环比增长是什么意思-环比增长和同比增速是什么意思-

[甜初影视]这几款车不妨看一看，赶超韩系合资，都说国产车“三大件”不行

海洋中最猛的3种鱼最凶猛的鱼