支持向量机计算题 支持向量机算法是一种常见的什么算法


支持向量机计算题 支持向量机算法是一种常见的什么算法

文章插图
介绍
【支持向量机计算题 支持向量机算法是一种常见的什么算法】在我们学习机器算法的时候,可以将机器学习算法视为包含刀枪剑戟斧钺钩叉的一个军械库 。你可以使用各种各样的兵器,但你要明白这些兵器是需要在合适的时间合理的地点使用它们 。作为类比,你可以将“回归算法”想象成能够有效切割数据的剑,但无法处理高度复杂的数据 。相反的是,“支持向量机(SVM)”就像一把锋利的刀,它比较适用于较小的数据集,但在较小的数据集上面,它可以构建更加强大的模型 。
相信在你学习机器学习算法解决分类问题的时候,肯定听说过支持向量机(SVM),在过去的五十年中SVM在随着时间进行演化,并且在分类之外也得到了应用,比如回归、离散值分析、排序 。我相信你在不同的途径中肯定也接触过支持向量机,是不是觉得已经对这个东西有些头痛,认为很多人都会,但是自己好像怎么都不能明白过来它的原理,或者说你已经对自己有关支持向量机的知识已经很有自信了,那么现在你来对地方了,这份技能测试就是专门测试你对于支持向量机的掌握程度已经是否可以应用 。这份测试已经有超过550多人参加了,最后我会放出这些人的分数的分布情况,从而方便你对比一下自己的支持向量机的水平程度 。
技能测试问题(每题1分)
问题背景:1-2
假设你使用的是一个线性SVM分类器,是用来解决存在的2分类问题 。现在你已经获得了以下数据,其中一些点用红色圈起来表示支持向量 。
支持向量机计算题 支持向量机算法是一种常见的什么算法

文章插图
1)如果从数据中删除以下任何一个红点 。决策边界会改变吗?
A)YES B)NO
2)[是或否]如果从数据中删除非红色圆圈点,决策边界会发生变化吗?
A)真 B)假
3)有关于支持向量机的泛化误差是什么意思?
A)超平面与支持向量的距离 B)支持向量机对未知数据的预测精度如何 C)支持向量机中的阈值误差量
4)当C参数设置为无穷大时,以下哪项成立?
A)如果存在最优的超平面,那么则会是完全可以分类数据 B)软边际分类器将分离数据
C)以上都不是
5)硬边缘是什么意思?
A)SVM允许分类中的误差很小 B)SVM允许分类中的误差很大 C)以上都不是
6)训练支持向量机的最小时间复杂度是O(n2) 。根据这一事实,什么尺寸的数据集不是最适合SVM的?
A)大型数据集 B)小型数据集 C)中型数据集 D)大小无关紧要
7)支持向量机的有效性取决于:
A)内核的选择 B)内核的参数 C)软边距的参数C D)以上所有
8)支持向量是最接近决策边界的数据点 。
A)是 B)否
9)支持向量机在以下什么情况中的效果最差:
A)数据是线性可分的 B)数据干净并且可以使用 C)数据有噪音且包含重叠点
10)假设在支持向量机中使用高Gamma值并且使用RBF内核 。这意味着什么?
A)模型考虑甚至远离超平面的点进行建模 B)模型只考虑超平面附近的点进行建模 C)模型不会受到点距离超平面的影响并进行建模 D)没有以上
11)支持向量机中的代价参数表示:
A)要进行的交叉验证的数量 B)要使用的内核 C)模型的分类错误和简单性之间的权衡 D)以上都不是
12)
假设你正在基于数据X进行构建支持向量机模型 。数据X可能容易出错,这意味着你不应该过多地信任任何特定的数据点 。假如现在你想建立一个支持向量机模型,它的二次核函数为2次多项式,它使用松弛变量C作为它的超参数之一 。基于此,请给出以下问题的答案 。
当你使用非常大的C值(C->无穷大)时会发生什么?
注意:对于小C,也可以正确地对所有数据点进行分类
A)对于给定的超参数C,我们仍然可以正确的对数据进行分类 B)对于给定的超参数C,我们不能对数据进行正确的分类 C)不好说 D)以上都不是
13)当使用非常小的C值(C~0)会发生什么?
A)将会发生分类错误 B)数据将被正确的分类 C)不好说 D)以上都不是
14)如果我正在使用我的数据集的所有特征,并且我在训练集上达到100%的准确率,但在验证集上却只达到约70%,我应该注意什么?
A)欠拟合 B)没什么注意的,模型是非常完美的 C)过度拟合
15)以下哪项是支持向量机在现实世界中的实际应用?


推荐阅读