|PyTorch实现，GitHub4000星：微软开源的CV库

机器之心报道
编辑：魔王、陈萍
本文介绍了微软开源的计算机视觉库，它囊括了计算机视觉领域的最佳实践、代码示例和丰富文档。

本文插图

近年来，计算机视觉领域突飞猛进，在人脸识别、图像理解、搜索、无人机、地图、半自动和自动驾驶方面得到广泛应用。而这些应用的核心部分是视觉识别任务，如图像分类、目标检测和图像相似度。
在各种计算机视觉模型和应用层出不穷的当下，如何把握发展脉络，跟进领域前沿发展呢？微软创建了一个库，提供构建计算机视觉系统的大量示例和最佳实践指导原则。
项目地址：https://github.com/microsoft/computervision-recipes
这个库旨在构建一个全面的集合，涵盖利用了计算机视觉算法、神经架构和系统运行方面近期进展的工具和示例。
该库没有从头开始创建实现，而是基于已有的 SOTA 库发展而来，并围绕加载图像数据、优化和评估模型、扩展至云端构建了额外的工具函数。此外，微软团队表示，希望通过该项目回答计算机视觉领域的常见问题、指出频繁出现的缺陷问题，并展示如何利用云进行模型训练和部署。
该库中所有示例以 Jupyter notebooks 和常见工具函数的形式呈现。所有示例均使用 PyTorch 作为底层深度学习库。
Jupyter notebooks 地址：https://github.com/microsoft/computervision-recipes/blob/master/scenarios
工具函数地址：https://github.com/microsoft/computervision-recipes/blob/master/utils_cv
目标群体
该库的目标群体是具备一定计算机视觉知识背景的数据科学家和机器学习工程师，因为库的内容以 source-only（仅源代码）的形式呈现，支持自定义机器学习建模。这个库提供的工具函数和示例旨在为现实世界的视觉问题提供解决方案加速器。
示例
该库支持不同的计算机视觉场景，如基于单张图像运行，示例如下：

本文插图

或基于视频序列的动作识别等场景，示例如下：

本文插图

场景
该库涵盖常用的计算机视觉场景，包含如下类别：

本文插图

对于每个主要场景（base），该项目均提供使用户高效构建自己模型的工具。这需要使用者完成一些任务，如基于自己的数据微调模型的简单任务，或者难例挖掘甚至模型部署等更复杂的任务。
1. 图像分类任务
该目录提供了构建图像分类系统的示例和最佳实践，旨在让用户能够在自己的数据集上轻松快速地训练高准确率分类器。
这里提供的示例 notebook 具备预置的默认参数，可以很好地处理多个数据集。该目录还提供了有关常见缺陷和最佳实践的大量文档。
此外，该库还展示了如何使用微软的云计算平台 Azure ，加快在大型数据集上的训练速度或将模型部署为 web 服务。

本文插图

2. 图像相似度
该目录提供了构建图像相似度系统的示例和最佳实践，旨在使用户能够基于自己的数据集方便快捷地训练高精度模型。
下图为图像检索示例，其中左图为查询图像，右面为与之最相似的 6 幅图像：

|PyTorch实现，GitHub4000星：微软开源的CV库

推荐阅读

星座小知识分享|实则痴情浓浓的3星座，爱到骨子里，看似相爱不用真心

央视|埃塞首都发生严重火灾财产损失超1200万比尔

“安装完这组彩灯，就回家过年”——探访为

#时尚迪科#颜值依旧抗打，董洁总算换风格了！穿Polo衫配羽毛裙复古感十足

乙烯妹妹|破洞黑色牛仔裤搭配黑色T，可爱不失风度，简单却抓人眼球

第一财经|视频丨拜登宣布胜选，比尔?盖茨、贝索斯等科技圈大佬纷纷发帖祝贺

庞麦郎|庞麦郎自认自己很火走红后不承认农村父母演唱会观众没有保镖多

“小康路上一刻也不能停歇”

大海说军事@2万美军掉头就跑，俄：后院起火了？，18国联军正扑向俄边境

小朋友可以去开冰箱小孩在冰箱旁边玩可以吗

化妆|职场中的女性该如何注意自己的妆容及言行举止

「泡泡网资讯」玩手游选它就对了，90帧运行畅快吃鸡不卡顿

知识百科|都错了! 福州大学2020年分数线出炉, 福大完胜，欠福师大一个211?

@国家药监局点名，这些医疗器械危险

手机中国|Fold 2新渲染图曝光颜值超高或8月初发布，三星Galaxy

央视版水浒传最成功的十个角色, 武松第一, 牛二上榜

硫磺八角二氧化硫超原国标16倍食品犯罪直接按照投毒罪上线判决吧

29年后，释小龙成老板，郝劭文养继女，为何走上不同路？

万象之昼夜观察|美国将改革弹药厂系统

娱到吐槽|直播秀眼睛仍不自然，32岁景甜承认双眼皮整形失败变“悲伤蛙”