『』AI市场开发人员访谈录( 二 )


◆ 支持PCIe3.0x8高速接口 , 支持双SFP+ 10GE光口 , 支持双DDR4 SODIMM , 最高支持32GB板载内存;
◆ 支持OpenCL高级语言和编程框架 , 大幅缩短程序开发周期;
◆ 满足更多应用场景 , 即可采用DNRange模式实现数据并行 , 也可采用Pipeline模式实现任务并行;
◆ 完全支持所有低延迟、高强度应用 , 如深度学习、高性能计算、数据采集、高频交易、网络加速和信号处理 。
应用性能
F10A支持OpenCL高级语言开发使其具备良好的易编程性 , 在软件生产力上取得了质的飞跃 。面向多用途领域 ,F10A既可以支持机器学习、视频转码、SDR等计算加速 , 也可以支持压缩/解压缩、加密/解密、擦除码等存储方面的应用 , 同时 , 对网络处理中的带内、带外处理 , 加密和压缩 , 预处理和预过滤等应用也可以提供高 性能的支持 。浪潮与科大讯飞、Intel成功将FPGA芯片应用于智能语 音线上识别领域 , 较CPU性能加速2.871倍 , 而功耗相当于 CPU的15.7% , 性能功耗比提升18倍 。
型号
F10A
芯片
intel? Arria? 10 GX1150
单芯片计算性能
1.366 TFlops (Peak)
板卡规格
半高半长
高速接口
2个SFP+ GE/10GE接口 ,PCIex8 Gen3 , 支持OpenCL
配置Flash
32bit数据接口;1Gbit Flash;
板载DIMM-DDR4 SDRAM
支持2条DDR4 SODIMM , 每条容量4~16GB , 2133Mbps ,72bit位宽 , 支持ECC
板卡供电
由PCIe3.0接口12v供电 , 无需外部供电
板卡功耗
45W(Peak) , 35W(Average)
本地台式服务器:
Ubuntu系统 , CUDA环境 , 以及theano、keras环境
CPU: Intel X99平台 i7 5960K
内存: DDR4 2800 32G(8G*4)
主板: GIGABYTE X99-UD4
显卡: GTX Titan X
硬盘: SSD+普通硬盘
系统和软件
操作系统: Ubuntu 14.04.3 x64
CUDA: 7.5
Anaconda 2.3
Theano 7.0
Keras 2.0
模型训练、推理是在本地、云端、移动端?
训练在本地 , 局域网集群服务器(来来会在云端) , 推理在移动端 。
您的数据类型是图片、语音、文本、视频?
都有 。
您的数据体量是?
看应用 , 语音小几十句 , 多几百句 。图像小的几十张 , 多的话几万张更多 。训练样本池就更多 。
此应用是由您公司的人员完成开发 , 还是引入了外部合作伙伴?都引入了哪些外部合作伙伴?
语音思必驰 , 图像中科院计算所有合作开发算法 。
在此应用开发中 , 企业内部的IT人员跟合作伙伴的分工、合作机制是?
ASR外部 , 语音材料样本数据 。图像数据自备 。
您选择合作伙伴的标准是?
行业口碑 , 成熟度 , 技术领先 , 性价比 。
4. 您为什么选择这一开源框架
贵公司是否有建立自己的框架?您以何种形式使用开源框架?比如仅在训练过程中 , 还是在线服务阶段也部署了基于开源框架的应用?
目前主要在模仿 , 借鉴等尝试阶段 。
您选择这些框架的原因?您考虑的因素有哪些?
您是否认为在这些方面 , 该框架都满足了您的需求?
性能更满足需求 。
希望您思考:您认为该框架的局限性有哪些?您认为这些局限性该如何解决?
哪些框架您已经不再频繁使用?不再使用的原因有哪些?
什么情况下会选择别的框架?
根据您的了解 , 你们的同行 , 也在使用这些框架吗?是
除了当前大众熟知的框架 , 您还了解哪些小众但有价值的框架?
在Github,开源中国网站上有些非热门的框架 , 比如针对FPGA和DSP的开源框架 。OpenMV的开源框架用于机器视觉 。
Accord Framework/AForge.net一个.Net的机器学习和信号处理框架 , 是早前类似一个项目AForge.net的扩展 。顺便说一下 , “信号处理”这里是指一系列对图像和音频的机器学习算法 , 如图片无缝缝合或执行人脸检测 。包含一组视觉处理算法;它作用于图像流(如视频) , 并且可用于实现移动对象的跟踪等功能 。Accord还提供一个从神经网络到决策树系统的机器学习常见库 。


推荐阅读