训练集|python机器学习：如何划分训练集和测试集机器学习|模型

今天用一个实例给大家写写在机器学习中如何进行训练集和测试集的划分。
实例操练
首先导入今天要使用的数据集
import pandas as pddf = pd.read_csv("carprices.csv")df.head()

文章图片
这是一个汽车销售的数据集，里面的变量包括汽车里程、使用年限、销售价格。我们今天要做的就是用汽车里程、使用年限来建立一个预测销售价格的机器学习模型。
首先，我们画图看一看数据关系
import matplotlib.pyplot as pltplt.scatter(df['Mileage'],df['Sell Price($)'])plt.scatter(df['Age(yrs)'],df['Sell Price($)'])
运行以上代码可以出2个点图，分别展示汽车里程和销售价格的关系和使用年限和销售价格的关系。

文章图片
使用年限和销售价格的关系散点图

文章图片
汽车里程和销售价格的关系散点图
通过两个散点图，我们可以发现使用线性回归模型进行建模还是比较好的方法，现在我们就要进行训练集和测试集的划分了
训练集用来训练模型，估计参数
测试集用来测试和评估训练出来的模型好坏，不能用于训练模型
划分数据集实操
首先我们要指定数据和数据标签
X = df[['Mileage','Age(yrs)']]y = df['Sell Price($)']
在本例中，数据集为汽车里程和使用年限构成的数据框，标签为汽车价格。
然后我们用train_test_split方法分割数据为训练集和测试集，代码如下
from sklearn.model_selection import train_test_splitX_train, X_test, y_train, y_test = train_test_split(X,y,test_size=0.3)
讲解一下train_test_split的参数：
train_test_split的基本形式如下
X_train,X_test, y_train, y_test =sklearn.model_selection.train_test_split(train_data,train_target,test_size=0.4, random_state=0,stratify=y_train)
其中
train_data：所要划分的样本特征集
train_target：所要划分的样本结果
test_size：样本占比，如果是整数的话就是样本的数量
random_state：是随机数的种子，在需要重复试验的时候，保证得到一组一样的随机数
stratify是为了保持split前类的分布，通常在类分布不平衡的情况下会用到stratify
在我们的例子中，我们只给出了test_size=0.3，所以我们按照7：3划分得到了训练集和测试集，而且这个划分是随机的。我们可以看一看训练数据长啥样
X_trainy_train
以上代码可以分别输出训练集的数据和标签。
建立线性回归模型
from sklearn.linear_model import LinearRegressionclf = LinearRegression()clf.fit(X_train, y_train)
通过以上代码我们便建立了回归模型，运用此模型我们可以进行对X_test的预测
clf.predict(X_test)
然后，我们将模型预测值和实际的y_test值进行对比可以得到模型正确率。
clf.score(X_test, y_test)

文章图片
【训练集|python机器学习：如何划分训练集和测试集】可以看到，我们训练的线性回归模型的正确率达到90%多。

训练集|python机器学习：如何划分训练集和测试集

推荐阅读

【运势】7月起好运会意外降临，旺财旺福，横财大旺，运势亨通的四属相

『诗与星空』定制家具还是定制热点？，皮阿诺

农历三月五月称为什么时候农历的三月五日是什么时候

我国跨境资金流动总体稳定

轻量版|德国零售商上架轻量版 NS《巫师 3：狂猎》：10 月 16 日发货

淡雅娱乐|这时消防员撒了个谎，亲妈抱着5岁儿子要跳楼获救后男孩崩溃大哭

穿心莲药性有哪些

#趋势雷达#阴阳交替互现，明天能再演红周五吗？，A股走势缠绵止步2850点

板栗开口别再用刀切，找1个瓶盖，一秒一个，方法太实用了

【】中山大学副教授上网课被曝不雅聊天记录官方：涉事教师已调离教学岗位

人人|神话传说中，玉皇大帝的前世，身份尊贵，人人都熟悉

经济日报|女排精神为什么总让我们含着泪水

中兴|中兴发布AX11000 Wi-Fi 6E光网：万兆有线+万兆Wi-Fi

如何学会唱歌(初学者学唱歌要怎样才能唱好)

刘海|被种草的有机保湿精华液，这个冬天一起Q弹吧

银行|男子失踪10余天，手机却一直收到提现、消费短信？可能是银行误发

前沿追踪网友：苹果每年花几百亿？，700万元！华为斥巨资弄创新大赛

灭火器有效期为几年？

梦想视角何为无线充电，只是把线插在无线充电底座上，然后把手机放上去？

英国：全球拉响战争预警？美国开始蠢蠢欲动，俄媒：中俄防长已经通话