|利用历史数据做商业预测的全过程( 二 )


如果企业有建设好的信息系统 , 那可以找 IT 部门要这些数据 , 很多企业的 BI 系统中可以直接导出这种数据(可能格式不同 , 可以用 Excel 转换) 。
2. 使用 YModel 建立模型
宽表准备好后 , 就可以用 YModel 来建立模型了 。
YModel 是一款专门为业务人员和没有专业背景的初学者设计的神器 , 操作非常简单, 可以到 http://www.raqsoft.com/ymodel-download 下载 。
(1) 导入数据
点击“New model”
|利用历史数据做商业预测的全过程
本文插图

按钮 , 导入数据(也就是整理好的宽表) , 数据导入的过程中 YModel 会自动检测数据类型 , 并自动计算各种统计量 。
|利用历史数据做商业预测的全过程
本文插图
【|利用历史数据做商业预测的全过程】

在初次导入的时候有时会出现一些错误 , 比如文字是乱码 , 日期格式不对 , 缺失值没有识别 , 只需要回到导入界面配置一下格式 , 再导入就可以了 。 比如下面两张图 , 通过数据预览发现”shop_name”列是乱码 , 这和默认的字符格式不一致 。 因此需要修改一下字符格式的配置 , 文字就可以正常识别了 。
|利用历史数据做商业预测的全过程
本文插图

|利用历史数据做商业预测的全过程
本文插图

(2) 配置预测目标
导入数据后 , 配置预测目标 。 称为目标变量 。
|利用历史数据做商业预测的全过程
本文插图

(3) 建立模型
配置好目标变量 , 点击”Modeling”
|利用历史数据做商业预测的全过程
本文插图

按钮 , 就可以了 。 整个数据预处理和建模过程都是自动进行的不需要人工操作 。
|利用历史数据做商业预测的全过程
本文插图

|利用历史数据做商业预测的全过程
本文插图

大概几分钟到几十分钟(有时会更短 , 看数据量)就能完成模型建立 。 界面会返回每个变量的重要度 , 重要度越大表示该变量越能影响预测目标 。 使用该功能可以帮我们做一些业务分析 , 比如预测目标是销量时 , 可以找到影响销量的一些重要因素 。
|利用历史数据做商业预测的全过程
本文插图

模型建好后 , 系统会写出.pcf 后缀的模型文件 , 用来做预测 。 如果还需要保存建模过程 , 可点击“Save”
|利用历史数据做商业预测的全过程
本文插图

按钮 , 生成.mcf 后缀的建模文件 。 pcf 模型文件中只有模型没有数据 , mcf 文件中含有数据和建模配置信息 。
3. 使用 YModel 预测
点击 YModel 界面左上方的 Scoring”
|利用历史数据做商业预测的全过程
本文插图

按钮 , 打开步骤 2 生成的 pcf 模型文件 , 导入要预测的数据集(这些数据还是用 csv 格式 , 和建模用的变量(csv 中的列)必须一样 , 但是没有预测目标)进行预测 , 比如下图两张表 , 区别就是一个有 y , 一个没有 y 。
|利用历史数据做商业预测的全过程


推荐阅读