|利用历史数据做商业预测的全过程
使用历史数据进行商业预测 , 首先我们要知道什么东西是能够被预测的 , 举几个例子:
- 银行放贷款时 , 希望预测出当前贷款人是否可能违约?
- 保险公司希望预测出客户的理赔风险 , 从而更灵活的制定保费 , 高风险高收费 , 低风险低收费
- 银行有很多种金融产品 , 希望预测出哪些用户会购买哪些产品 , 更精准的进行销售活动
- 工业生产中 , 企业希望预测设备的运行状态 , 减少非计划停车
- 商场超市希望预测出产品的销量 , 可以精准备货 , 降低库存
- 互联网金融信贷业务 , 希望预测出借资金的流动情况 , 合理管理现金流
……
如果我们手头有足够多的历史数据 , 那么这些任务都是可能做到的 。 比如任务 1 , 我们可以从过去多年的贷款信息记录中找出某种规律 , 这些信息包括贷款人的收入水平、负债情况 , 贷款金额、期限、利率以及贷款人的工作职位、居住条件、交通习惯等等 , 特别地 , 必须有过去这笔贷款是否发生过违约的信息 。 这样 , 再碰到新的贷款客户 , 可以根据该客户的各项信息来匹配规律 , 来确定当前客户违约的可能性有多大 。 当然 , 这种预测并不能保证 100% 准确(有很多种办法来评估它的准确率) , 所以如果只有一例目标(比如只有一笔贷款)需要预测时 , 那就没有意义了 。 但通常 , 我们都会有很多例目标需要预测 , 这样即使不是每一例都能预测正确 , 但能保证一定的准确率 , 这仍然是很有意义的 。 对于贷款业务 , 预测出来的高风险客户未必都是真的 , 但准确率只要足够高 , 仍然能够有效的防范风险 。
用历史数据做预测 , 一共 3 个步骤:1 准备历史数据→2 从历史数据中找出规律 , 我们称之为建立模型→3 用建立的模型进行预测 。
1. 准备历史数据
历史数据通常是一张我们俗称的宽表 。 比如下图这样的 Excel 表格:通过用户的一些基本信息来预测其是否会发生违约行为
本文插图
首先 , 宽表中一定要包括我们想预测的事情 , 通常称作预测目标 , 上图中的预测目标就是历史用户的违约行为 , 也就是图中 y 那一列 , yes 表示违约 , no 表示不违约 。 预测目标还可以是一个数值 , 比如产品的销量、售价…… , 或者是预测属于什么种类 , 比如预测产品质量是优、良、合格还是差 。 有时目标在原始数据里就有 , 可以直接使用 , 有时目标还需要人工标注 。
除了预测目标外 , 这里还需要很多信息 , 如表中的用户年龄、工作 , 房产 , 贷款情况…… , 这里的每一列称为变量 , 也就是和贷款人将来是否违约可能会相关的信息 , 原则上能收集到的变量越多越好 。 例如预测客户是否会购买产品 , 可以搜集客户的行为信息 , 购物偏好 , 以及产品的特征信息 , 促销力度等;预测汽车保险理赔风险 , 需要保单数据 , 车辆信息、车主交通习惯以及历史理赔情况等等 , 如果是预测健康险还需要一些被保人的生活习惯 , 身体状况 , 就医看病的信息;预测商场超市的销售情况 , 需要历史的销售订单 , 客户信息 , 商品信息;预测不良产品 , 需要生产的工艺参数 , 环境 , 原料情况等数据 。 总之 , 收集到的相关信息越多 , 预测效果也会越好 。
采集数据时 , 通常会截取某一段时期的历史数据来制作宽表 , 比如我们想预测 7 月份用户的违约情况 , 可以采集 1-6 月份的数据来建立模型 。 数据采集的时间范围并不是固定的 , 可以灵活操作 , 例如也可以是近 1 年或者近 3 个月等等 。
准备好的宽表要保存成 csv 格式 , 第一行是标题 , 后面每一行都是一条历史记录 , 可以用 Excel 把数据另存为 csv 格式 。
推荐阅读
- 中年|近年来,中国快递发货量快速增长,塑料快递包装99%不能有效利用
- 聚韬品牌策划公司|如何准备一个好的商业计划书,10分钟打动投资人?
- “龙”飞船|美国“龙”飞船首次执行常规商业载人航天任务
- 宇航员|SpaceX首次正式商业载人发射升空 搭载4名宇航员
- NASA|SpaceX首次正式商业载人发射升空 美国“太空班车”正式启航
- 价值投资之王|欧普康视:商业和投资圣经都指向这个公司
- 田泽湘谈商业|4982亿!这届“双11”背后,隐藏着2021年新消费趋势
- 阿爆|小微商户异常冻结了怎么办 微信商业版关闭提现怎么解封
- 跨境电商头等舱|亚马逊的商业理念
- 运营商财经网|古城换新装——中国移动北京公司打造首都首条5G+特色商业街区