『』AI市场开发人员访谈录

研究背景:中国人工智能市场上 , 基于开源框架的机器学习、深度学习的开发进展 。开发者使用开源框架的经验、教训、走过的坑 , 使用过哪些开源框架 , 放弃了哪些开源框架 , 希望未来的开源技术 , 提供哪些方面的支持?
1. 所在的单位 , 个人职责
所属的行业:
答:科技公司
所在企业规模:
答:15w人 , 2017年营收2500亿人民币
工作职责:您所在的部门?您正在开发什么产品/应用?是否已经商用?跟您一起参与此产品、项目开发的还有哪些团队?
答:人工智能与物联网研究院 。开发智慧家居 , 智能家电产品 , 许多产品已经上市 。一起参加开发的包括硬件、嵌入式、算法、云端、APP、结构、电控、UI、ID等团队 , 也包括外部供应商等合作伙伴 。
2. 您目前正在开发的人工智能应用是?
请描述您所开发的人工智能应用 , 开发这一应用的驱动力 , 业务需求
答:目前主要三部分 , 语音识别(ASR , NLP;包括多麦阵列算法 , 回音抵消 , 降噪去混响 , 声源定位 , 波形成型等) , NLP主要对美的家电产品和控制等关键词做语义理解;图像(人脸识别 , 手势识别 , 食材识别 , 步态识别等)和数据挖掘(产品大数据 , 用户画像 , 智慧客服 , 知识图谱等) 。应用驱动来自集团产品规划与需求 , 智能化家电产品早已是大势所趋 , 但区别过去若干年的盲目追求概念和炒作等做法 , 目前行业更加冷静和务实:1.单纯智能化产品向场景化套系化产品过渡 2. 离线在线的深度融合 3.创立统一开放的生态圈平台
3. 请描述您开发AI应用的流程?是否有合作伙伴与您的团队一起开发?
从算法、模型的选择 , 到框架的使用 , 计算资源的配置 , 基础环境的搭建 , 模型训练以及服务部署的过程
答:从需求出发 , 参考学术界论文成果 , 重点选择行业内科研机构科技公司的成熟算法以及框架 , 主要是开源框架 , 最流行的tensorfolow(google), caffe/caffe2 , Torch/PyTorch(facebook);计算平台包括Navida的CUDA, OpenCL编程API等 。
l 语音主要用HTK,kaldi等软件工具包 , 实现样品训练建模 。
l 计算机视觉采用SSD , CNN , R-FCN等算法 , 基于Tensoflow object detection API开源目标检测检测算法库 , 用来构建 , 训练 , 部署目标检测算法模型 。
l NLP利用NLTK和OpenNLP等开源软件 , 完成分类 , 分词 , 分块 , 词性标注 , 实体识别 , 依存分析 , 语法解析 , 指代消解 , 语义推断等功能 。
计算资源的选择:计算加速方案-GPU/FGPA/ASIC , 内存配置
浪潮AI系列服务器:NF5280M5 , GX4还有F10A FPGA
『』AI市场开发人员访谈录
文章图片

文章图片

GX4
高效并行 , 性能强劲
2U空间支持4块GPU卡 , 4台GX4可搭配1台双路服务器组成 16GPU卡系统 , 实现高效的并行运算处理能力 。
CPU/GPU解耦 , 资源池化
灵活调整GPU拓扑 , 应对不同的用户应用 。
Balanced:适用于公有云服务和小规模模型训练
Common:适用于Deep Learning模型训练
Cascaded:适用于Deep Learning模型训练和P2P性能优化
低延迟 , 高通信
4台GX4组成的16卡系统进行模型训练是 , 数据无需进行网络协议互 换 , 最远距离仅经过1次QPI转换 , 延迟降低50%
『』AI市场开发人员访谈录
文章图片

文章图片

F10A FPGA
产品特性
【『』AI市场开发人员访谈录】◆ 配备Altera Arria 10 FPGA 顶级芯片 , 最高1.5TFlops计算性能 , 提供最佳系统级集成和灵活性设计;


推荐阅读