『』AI市场开发人员访谈录( 七 )


尽管 Java 并不如 C/C++ 快 , 但其比其它语言快得多 。而且我们已经构建一种可以通过加入更多节点来进行加速的分布式系统——不管是用 CPU 或是 GPU 都可以 。也就是说 , 如果你想要更快 , 就加入更多卡吧!
最后 , 我们正在使用 Java 为 DL4J 开发 Numpy 的基本应用(包括 ND-Array) 。我们相信 Java 的许多缺点可以被很快地克服 , 而它的许多优点也还将继续持续一段时间 。
SCALA
在开发 Deeplearning4j 和 ND4J 的过程中 , 我们对 Scala 给予了特别的关注 , 因为我们相信 Scala 有望变成数据科学的主导语言 。使用 Scala API 为 JVM 编写数值计算、向量化和深度学习库能推动该社区向这一目标迈进 。
要真正理解 DL4J 和其它框架之间的差异 , 你必须真正试一试 。
机器学习框架
上面列出的机器学习框架更多是专用框架 , 而非通用机器学习框架 , 当然 , 通用机器学习框架也有很多 , 下面列出几个主要的:
sci-kit learn:Python 的默认开源机器学习框架
Apache Mahout:Apache 上的旗舰机器学习框架 。Mahout 可用来进行分类、聚类和推荐 。
SystemML:IBM 的机器学习框架 , 可用来执行描述性统计、分类、聚类、回归、矩阵分解和生存分析(Survival Analysis) , 而且也包含支持向量机 。
Microsoft DMTK:微软的分布式机器学习工具包 。分布式词嵌入和 LDA 。


推荐阅读