分类问题时同时存在连续特征和离散特征咋办一种方法是把连续特征离散化,还有其它方法吗
看 4.2.4 :http://scikit-learn.org/stable/modules/preprocessing.html
■网友
【分类问题时同时存在连续特征和离散特征咋办一种方法是把连续特征离散化,还有其它方法吗】 看了一眼题目时间...题主应该早就知道答案了吧?
和树有关的模型都可以直接喂离散+连续特征的,也不需要标准化,当然降维还是要的。线性模型和神经网络之类的就不行。
■网友
刚好也遇到了这个问题,说下我的看法模型归根到底岂不是一个函数?它大概不会管你输入的是连续还是离散,只要是数字 能计算就行了可是我们设计模型的时候,其实做了假设,认为数据是有序的如果我们输入的特征不能满足这个假设的话,当然也可以计算,只是不能很好地拟合我们遇到的问题了所以题主的问题应该是,怎么才能让特征更加符合模型要求具体怎么做,参见 @丁颖 给出的方案就好了
■网友
机器学习算法的Python实现 (2):ID3决策树(更)
~~~~~~~~~~~~~~我是分割线~~~~~~~~~~~~~~~
机器学习(周志华)习题解答4.3: Python小白详解ID3决策树的实现
python2.x python3.x都需要导入pandas包
另外 python3下运行时对错误
\u0026#39;dict_keys\u0026#39; object does not support indexing的处理:
list(dict.keys())
因为在python2.x中,dict.keys()返回一个列表,在python3.x中,dict.keys()返回一个dict_keys对象,比起列表,这个对象的行为更像是set,所以不支持索引的
以上。(有点跑题,其实我就是记个笔记 略略略)
推荐阅读
- 江苏■江苏交控坚持问题导向、瞄准职工需求——找准“病灶”当好“产改先行官”
- 贵州在建骨干水源工程达到465座有效解决工程性区域性缺水问题
- 四川眉山瓦屋山景区就游客投诉、停车难等问题公开道歉
- 杭州已整改城市道路无障碍环境问题12467处
- 垃圾■垃圾分类哪里强?南京全市成绩单亮相!
- 互联网怎样解决“家政服务上门速度慢”的问题
- 中东问题|
- 中国网汽车|购车2个多月、仅行驶8000多公里 宝骏730遭遇7处问题
- |打造垃圾分类管理“姑苏标准”
- |沛县深入开展教育领域突出问题专项整改