终于有人把数据科学、机器学习和人工智能讲明白了( 四 )


例如今天网上购物的数据可能与您明天或几年后的完全不同 。 汽车制造商可能会开始问 , 什么因素对购买飞行车辆的贡献最大 , 或许不是目前正在日益普及和广泛使用的电动汽车 。
最终 , 数据和从中训练出来的模型会过时 , 该现象被称为模型漂移 。 因此 , 通过不断学习新数据继续获得经验和知识 , 更新任何人工智能应用至关重要 。
终于有人把数据科学、机器学习和人工智能讲明白了
本文插图

05 数据推动人工智能
人工智能、机器学习、大数据、物联网和任何其他形式的分析驱动的解决方案都有一个共同点:数据 。 事实上 , 数据为数字技术的各个方面提供了动力 。
1. 大数据
世界从未像今天这样收集或存储过如此之多的数据 。 此外 , 数据的多样性、容量和生成速率正在以惊人的速度增长 。
大数据领域是关于如何高效地从那些庞大、多样和快速移动的数据集中 , 有效地获取、集成、准备和分析信息 。 但是 , 由于硬件及计算条件的限制 , 从数据集中处理和提取数值可能不具备可行性或不可实现 。
为了应对这些挑战 , 需要创新硬件工具、软件工具和分析技术 。 大数据是用来描述数据集、相关技术和订制工具组合的术语 。
此外 , 如果没有某种形式的伴随性分析(除非数据是货币化的) , 任何类型的数据基本上都没有用途 。 除了前面给出的描述之外 , 人们还用大数据来描述在非常大的数据集上进行的分析 , 这可能包括诸如人工智能和机器学习之类的先进分析技术 。
可以把数据从高层次分为结构化、非结构化和半结构化三类 , 如图4-4所示 。
终于有人把数据科学、机器学习和人工智能讲明白了
本文插图

▲图4-4 数据类型
2. 特定的数据源
有许多特定类型的数据源 , 任何大型公司都有许多数据源在同时使用 。 某些类型的数据可以用于自动化和优化面向客户的产品和服务 , 而其他类型的数据更适合于优化内部应用 。 以下是一份可能的数据源清单 , 我们将逐一讨论:

  • 客户
  • 销售和营销运营
  • 活动和交易
  • 物联网
  • 非结构化
  • 第三方
  • 公共
大多数公司都在使用客户关系管理工具(客户关系管理系统) 。 这些工具用来管理现有和潜在的客户、供应商和服务提供商之间的互动关系 。
此外 , 许多客户关系管理系统工具可以采用本地部署或集成的方式来管理多种渠道的客户营销、通信、目标定位和个性化 。 因此 , 客户关系管理系统工具对于以客户为中心的人工智能应用来说是非常重要的数据源 。
尽管许多公司使用客户关系管理系统工具作为其主要的客户数据库 , 但客户数据平台(CDP)工具(如Agilone) , 通过整合客户行为、参与度和销售方面的数据源 , 创建单一、统一的客户数据库 。 类似于数据仓库 , 客户数据平台(CDP)工具旨在供非技术人员使用 , 用于推动高效分析、洞见收集和目标营销 。
销售数据即使不是公司最重要的数据 , 也应该是比较重要的数据 。 典型的数据源包括那些有实体营业网点的销售点数据、在线购物应用的电子商务数据以及服务销售的应收账款数据 。 许多实体公司也在网上销售产品 , 因此能够同时使用这两种数据源 。
市场营销部门通过多个渠道向客户传达和提供报价 , 并生成相应的基于特定渠道的数据 。 常见的营销数据源包括电子邮件、社交、付费搜索、程序广告、数字媒体参与(如博客、白皮书、网络研讨会、信息图表)和移动应用通知推送 。
运营数据以业务功能和流程为中心 。 示例包括与客户服务、供应链、库存、订购、IT(如网络、日志、服务器)、制造、物流和会计相关的数据 。 运营数据通常最适合用于深入了解公司的内部运营 , 改进甚至自动化流程 , 以实现诸如提高运营效率和降低运营成本等目标 。


推荐阅读