联邦学习开源框架FATE新版本发布!配套引擎EggRoll焕新登场( 二 )


联邦学习开源框架FATE新版本发布!配套引擎EggRoll焕新登场

----联邦学习开源框架FATE新版本发布!配套引擎EggRoll焕新登场//----

FATEBoard:新增Pearson相关性可视化矩阵图 , 支持GLM的stepwise方法、横向Secureboost等可视化输出

FATEBoard是联邦学习建模的可视化工具 , 为终端用户可视化和度量模型训练的全过程 , 能够帮助开发更简单、高效地进行模型探索和模型理解 。 FATEBoard由任务仪表盘、任务可视化、任务管理与日志管理等模块组成 , 支持模型训练过程全流程的跟踪、统计和监控等 , 并为模型运行状态、模型输出、日志追踪等提供了丰富的可视化呈现 。

在FATE1.4版本中 , FATEBoard新增了Pearson相关性的可视化矩阵图 , 可帮助开发者查看guest特征之间 , 以及guest与host特征之间的相关性大小 。 而对GLM(纵向LR、纵向线性回归、纵向poisson回归)的stepwise方法的结果可视化输出的支持 , 则能够帮助开发者准确地观察每一步的模型拟合统计、特征分析、最大似然分析、待进入特征分析等情况 。 对横向Secureboost的可视化树模型输出 , LR、localbaseline在one_vs_rest下的可视化输出的支持 , 也进一步丰富了FATEBoard在更多场景下的适用性 。

最后 , 新版本对FATEBoard的视觉和交互体验上也做了重大提升 , 支持大数据量下图表的可视化 , 优化页面视觉效果及交互细节 。 通过尝试 , 建模人员可以明显感受到FATEBoard的可用性与易用性在这一版本中所呈现的全方位提升 , 必将帮助建模人员更好地理解与分析模型 。

支持EggRoll2.0:稳定性、性能以及用户体验显著提升

作为FATE1.4版本的一个重点 , EggRoll也迎来了巨大提升 , 在稳定性方面 , FATE采用了全新的资源管理组件及session机制 。 从这一版本起 , 即使session出错 , 也只需要一个简单函数调用 , 临时拉起的计算进程即可被清理 。 此外 , 此版本也移除了storageservice , 无需C++/native库的编译 , 开发者从下载代码到运行起来的步骤进一步减少 , 编译与环境依赖也更加简化 , 基本上已可实现开箱即用 。 最后 , 面对在任意网络下传输都会产生的丢包现象 , 新版本也做了适配 , 联邦学习算法在28%的丢包率之下依然可以实现正常运行 。

在性能方面 , 在实践中相信开发者能够感受到 , 运行于Eggroll2的联邦学习算法性能显著提升 , 部分算法甚至可以达到超过10倍的性能提升 , 此外 , Join接口在联邦学习场景下 , 也实现了比pyspark快16倍的速度 , 开发者的计算/建模将更为高效 。

而在用户体验方面 , 新版本已可快速部署 , 只需Maven编译、pip安装依赖、修改配置 , 即可运行 。 此外 , 这一版本也变得更加易于调试 , 新版本中不仅提供了必要的运行上下文信息 , 还将调试的关键系统状态保存在日志文件及数据库中 , 当开发者遇到报错信息时 , 排查将变得更加快捷 。 最后 , 常驻进程在这一版本中也进行了大幅度削减 , 现在的常驻进程仅三个:

ClusterManager(CM):管理集群的物理资源 , 管理session信息

NodeManager(NM):管理一个机器节点上的物理资源


推荐阅读