分类问题时同时存在连续特征和离散特征咋办一种方法是把连续特征离散化,还有其它方法吗

看 4.2.4 :http://scikit-learn.org/stable/modules/preprocessing.html
■网友
【分类问题时同时存在连续特征和离散特征咋办一种方法是把连续特征离散化,还有其它方法吗】 看了一眼题目时间...题主应该早就知道答案了吧?
和树有关的模型都可以直接喂离散+连续特征的,也不需要标准化,当然降维还是要的。线性模型和神经网络之类的就不行。

■网友
刚好也遇到了这个问题,说下我的看法模型归根到底岂不是一个函数?它大概不会管你输入的是连续还是离散,只要是数字 能计算就行了可是我们设计模型的时候,其实做了假设,认为数据是有序的如果我们输入的特征不能满足这个假设的话,当然也可以计算,只是不能很好地拟合我们遇到的问题了所以题主的问题应该是,怎么才能让特征更加符合模型要求具体怎么做,参见 @丁颖 给出的方案就好了
■网友
机器学习算法的Python实现 (2):ID3决策树(更)

~~~~~~~~~~~~~~我是分割线~~~~~~~~~~~~~~~

机器学习(周志华)习题解答4.3: Python小白详解ID3决策树的实现
python2.x python3.x都需要导入pandas包
另外 python3下运行时对错误
\u0026#39;dict_keys\u0026#39; object does not support indexing的处理:
list(dict.keys())
因为在python2.x中,dict.keys()返回一个列表,在python3.x中,dict.keys()返回一个dict_keys对象,比起列表,这个对象的行为更像是set,所以不支持索引的
以上。(有点跑题,其实我就是记个笔记 略略略)


    推荐阅读