adaboost 做垃圾邮件分类中的弱分类器应该咋写

Adaboost最经典的应用是在人脸识别领域,弱分类器用的是decision tree,更准确说应该是decision stump,即两层的决策树。考虑到文本分类用term做特征比较多,decision stump需要遍历所有term来选择信息增益最大的特征,在这里可能不是最合适。本质上来说,所有的分类模型都可以用来作为做分类器(只有满足PAC定理,但基本都能够满足),但Adaboost的本质要求弱分类器选型要支持样本带权重。
■网友
可以考虑用一些较为复杂的算法作为adaboost的弱分类器,svm是一个较为不错的选择。
■网友
贝叶斯就可以搞定啊!


    推荐阅读