值得与Python结合使用的五个新颖的数据科学工具( 二 )


Snakemake工作流类似GNU make工作流:您用规则定义想要创建的东西 , 这些规则定义了它们接受什么、输出什么以及执行什么命令来做到这一点 。工作流规则可以是多线程的(假设这会给它们带来好处) , 配置数据可以从JSON/YAML文件通过管道导入 。您还可以在工作流中定义函数来转换用于规则中的数据 , 并将在每个步骤采取的操作写入到日志 。
Snakemake作业旨在可移植——它们可以部署到任何Kube.NETes管理的环境中 , 或部署到特定的云环境中 , 比如google Cloud Life Sciences或AWS上的Tibanna 。工作流可以被“冻结” , 以使用一些具体的软件包 , 并且任何成功执行的工作流都可以自动生成单元测试 , 并加以存储 。若是长期存档 , 您可以将工作流存储为打包文件(tarball) 。
原文标题:5 newer data science tools you should be using with Python , 作者:Serdar Yegulalp




推荐阅读