工业人不要过度强调机器学习

机器学习很重要、最近的发展也很快 , 学术界研究无可厚非 。 但我有一种感觉:工业界人士对机器学习的追捧有点过头了 。 打个比方:生产味精的人可以拿生产味精“当饭吃”;但厨师却不能把味精“当饭吃” 。 对工业人来说 , 迷信机器学习 , 反而不容易看到真正的机会、不利于数字化转型 。
与自动化不同 , 智能化特别强调人的作用 。 对此 , 我曾经把智能化的决策逻辑分成两种:一种是把人的知识变成数字化知识、嵌入到计算机中、让软件去执行;一种是人类在决策的闭环中 , 用数字化、网络化的手段帮助人类决策 。
为什么智能化要强调人的作用 , 或者说强调人机融合?
这是自动化的局限性所决定的 。 比如 , 机器自动执行是要有预案的 。 制定预案 , 就要事先把可能发生的事情想清楚 。 所以 , 自动化往往是针对小型、封闭系统 , 否则问题就会太复杂、无法操作 。 而智能化往往是针对大型、开放系统的 。 在大型开放系统中 , 不确定性强 。 这时 , 不确定性问题是人或者机器用人能理解的逻辑)来处理的 。
智能化的“决策”是用于在线场景的 , 往往与规范化的管理或控制流程结合 。 决策需要知识 。 所以 , “知识获取”是“决策流程”背后的支撑 。 如果把“决策”比作打仗的军队 , “知识获取”就是军队的后勤保障 。
与机器相比 , 人类获取知识的能力明显更强 。 在智能系统中 , “决策”都要强调人的作用 , “知识获取”又怎么能过度强调自动化(机器学习)呢?
现在 , 我们来看看 , 现实中的机器学习到底在做什么?
最成功的机器学习大概就是图像识别了 。 图像识别的本质 , 往往是把人容易掌握让计算机掌握 。 因为人类难以将自己的感性知识代码化 , 所以才需要机器学习 。 类似的 , 阿尔法狗也是把人的感性认识变成计算机的知识 。 从这种意义上讲 , 机器学习并不是在“创造知识” , 而是在“转移知识”:把人的知识转移给机器 。
搜索引擎中 , 也大量使用所谓“机器学习” 。 这种学习的本质是一种人类开发的特殊统计算法 , 人类编写的这些算法才是真正的知识;而机器学习到的知识 , 本质上是“统计结果” 。
人们可能忽略的是:工业界很早之前就现实地采用机器学习了 。 比如 , 在炼钢和轧钢领域 , 机器学习已经用了几十年 。 这些技术早已是现代化钢铁企业的核心技术 。 这些机器学习的本质又是什么呢?在我看起来 , 本质上只是模型参数的调整 。 换句话说 , 并不是发现新的知识 , 而是用数据对知识精细化 。
我觉得:工业界中的参数调整 , 可以看成PDCA持续改进:首先是有了一个相对较好的初始工作点 , 然后在这个工作点附近调整或者逼近 。 每次的学习(调整)本质上都是微调 。 这样 ,“机器学习”的结果是可控的 。
这种做法是有必然性的 。 工业问题一旦到了生产环节 , 就一定会强调可靠性、稳定性(尤其是针对大工业) , 要防止风险的发生 。 所以 , 机器学习的结果一定是可控的、分寸上一定要把握好 。
从生产实践中获得知识 , PDCA才是最基本的方法:先得到一个成功的案例 , 将其作为标准;在下次采用的过程中 , 不断地加以改进 。 笔者认为:在智能化时代 , 工业生产领域的知识学习 , PDCA仍然是主流逻辑 。 这大概就是日本的IVRA结构强调PDCA的原因 。
PDCA的逻辑可以是人来做、可以是机器帮助人来做、也可以是机器自己去做 。 在数字化时代 , 机器帮助人做、机器自己做的比例会增加 。 因为机器的效率比人类高了很多 。 但与智能决策的方式一样:智能化时代的PDCA不能过度强调是机器自动去做 , 要适可而止 。
数字化、网络化时代的优势 , 是PDCA更加容易做 。 容易做的原因是信息优势:发生问题、需要调整时 , 原因容易追溯——数字化、网络化带来的信息优势 , 使得过去难以发现的问题容易发现了 。


推荐阅读