DeepTech深科技|或能识别从未见过的事物,一种新方法或让AI模型拥有“联想”力( 三 )


文章图片
图|上图中 , 有两个实例可以调节机器学习模型(用黑点表示) 。 经典的kNN算法会在两个点和类别之间分界 。 但SLaPkNN算法在两个类别之间创建了一个新的类别(绿色区域) , 它代表着一个新标签 。 这样 , 研究者用N-1个样本实现了N类别 。
通过对类别边界线的复杂编码和样本软标签的调整 , 他们让kNN算法精确画出不同形状的花朵图案 。
DeepTech深科技|或能识别从未见过的事物,一种新方法或让AI模型拥有“联想”力
文章图片
图|作者在论文中炫技 。 图表上的每个彩色区域代表一个不同的类别 , 每个图表侧面的饼图则显示了每个数据点的软标签分布 。
当然 , 凡事总有两面 , 这个方法也有其局限性 。
当伊利亚和导师尝试将“少于一次”样本学习的方法应用到其他更复杂的算法(如深度学习等)时 , 他们发现设计软标签的工作变得异常困难 。
kNN算法具有很好的可解释性和可视性 , 为人们设计标签提供了良好基础 。 但神经网络是复杂且不可穿透的 , 这意味着同样的方法未必可行 。 并且 , 设计用于“凝练”神经网络训练数据的软标签时也有一个主要难点:设计者需要面对庞大的数据集并凝练出有效的内容 。
这一工作目前看来不可能全部通过人工完成 。 伊利亚说 , 他现在正在研究其他方法来设计这些凝练后的合成数据集——无论是手动设计还是使用其他算法进行设计 。
尽管存在诸多挑战 , 但不可否认这篇论文为“少于一次”样本学习提供了理论基础 。 “无疑经过凝练的数据集将带来极大的效率提升 。 ”伊利亚说 。
DeepTech深科技|或能识别从未见过的事物,一种新方法或让AI模型拥有“联想”力
文章图片
图|伊利亚(IliaSucholutsky)
需要从图像或视频帧中识别成千上万个类别的计算机视觉系统(如自动驾驶)、执行情感分析的自然语言处理系统等都将从中受益 。
TongzhouWang对此补充道 , 这篇论文同时也提出了一个非常新颖且重要的目标——如何从小数据集中训练强大的模型 。
从人类的学习经验来看 , 这是能够实现的 , 应用领域也异常宽广 。 从抓捕只有一张照片的犯罪嫌疑人 , 到识别海上航行的敌方舰艇 , 都是典型的小样本场景 。
对于这项成果 , 也有业内人士指出“可能很难实现” 。 一名杜克大学的计算机科学博士生告诉DeepTech:“用很少的样本去生成很多的类 , 是一件非常反直觉的事情 。 虽然他做到了这一点 , 但后续依然需要将各种特征组合成现实中的真实事物 。 ”
该博士生分析称 , 如果把人类的眉、目、鼻、口、耳这五官特征提取出来 , 然后通过伊利亚的方式整合到一起 , 可能可以组成世界上所有存在、不存在的人脸 , 但在训练模型的时候 , 依旧需要让机器知道真正的人脸是怎样的 。
【DeepTech深科技|或能识别从未见过的事物,一种新方法或让AI模型拥有“联想”力】也就是说 , 模型通过伊利亚的方法训练之后 , 还需要再增加一个新的步骤来实现闭环 , 这个新的学习步骤如何实现 , 以及实现的难易程度 , 才是关键所在 。 并且 , 五官的特征也是需要从大量的、有标签的数据中来的 。 但他也承认 , “从这个角度看 , 这篇论文的确提出了一个非常新颖的思路 。 ”
最后 , 伊利亚强调这个研究尚处在早期阶段 , 但他对此充满信心 。
他说 , 每当他向其他研究人员介绍这篇论文时 , 他们的第一反应是说这个想法不可能实现 , 但紧接着他们便意识到事实并非如此 , 它可能无意间触及了一扇通往全新世界的大门 。


推荐阅读