决策树怎样对连续性特征进行分段 https://peop

https://people.eecs.berkeley.edu/~russell/classes/cs194/f11/lectures/CS194%20Fall%202011%20Lecture%2008.pdf并不用考虑每一个example, 对第i个feature，首先以feature i 为key sort（feature_i, label_i）然后将label 有变动的地方作为可能的划分点，比如 label 为［1，1，0，0，0，1］只需要考虑两个地方即［1，1］后面和［1，1，0，0，0］后面。对于每一个可能的划分点可以求information gain 让他最大，在求information gain 的时候可以用entropy 也可以用gini。找到一个中文的供参考：机器学习经典算法详解及Python实现
■网友
问题抽象假设训练样本集合D中有n个样本，考察对连续属性a的最佳分段点/划分点。若属性a在这n个样本中有m个不同的取值(m\u0026lt;=n)，对这m个值两两之间取中点，可获得m-1个中点作为候选划分点。选择过程接下来的选择最佳划分点过程和离散属性的虚选择过程类似，以基尼系数或信息增益作为度量，选择使度量值最大的候选划分点作为最佳划分点。
■网友
假设我把这0~5的值分成5份,0~1,1~2,2~3,3~4,4~5,那么，我们就有5个离散化的范围了，对每个分类点计算信息增益，（也就是一共计算五次），取最大的一个作为分段点
■网友
按gini系数或者entropy，和离散变量是一样的。

决策树怎样对连续性特征进行分段

推荐阅读

白泽兽图片?白泽神兽五行属什么?

奥迪R8全新车型中国首秀杀入市场，或触发超跑市场新一轮竞争

「乐枋文化」千万不要正面撞上，吵架时火力全开的星座

占星的少女|也从不主动攻击他人的3个星座，即使内心再生气

【农村小王爱吃鬼】素饺子做法集锦

每日科学■会变更好看？马斯克透露或对电动皮卡外观进行调整

数据安全|李佳琦方回应数据造假:将追究造谣者法律责任

「佳作有约」让你下你就下，信不？说个笑话也生气，开电梯的，我让你上你就上

冬天生姜怎样储存不会烂

和德国老公在中国领了结婚证，如果没领德国的结婚证，对我们有影响吗

NIODay 2020 媒体采访李斌回应了关于蔚来的部分问题

九游网|《元气众生录》宝石攻略职业宝石搭配推荐

【真实真心姐姐】这些坏习惯，容易加快皮肤衰老，夏天

ar导航和普通导航哪个更费流量 ar实景导航收费吗

#余文林整形博士#造一个耳朵，需要取多少条肋软骨？

磊磊趣闻@老丈人说：我家有规矩，吃饭时不能说话，笑话：第一次去nv友家

牛油果的正确吃法图片;牛油果怎么吃最好？

巴菲特的弟弟|沪指30年首次大修订：剔除ST，引入科创板！，股市又一利好!

「防控」广州市各区新型冠状病毒肺炎疫情防控分区分级情况

红尖椒文化|让少奶奶李纨，输给了丫头袭人，贾府中的咄咄怪事：两场宴席