趣投稿|数据集轻松按需搜索,这个工具有近2000个图像数据集,可免费获取


杨净 发自 凹非寺量子位 报道 | 公众号 QbitAI
每个研究机器学习项目的人 , 似乎都有这样的痛苦 。 那就是从学术网站、GitHub上寻找到合适的数据集 。
但现在 , 有这样一个网站可以帮你搞定 , 让AI开发变得更加简单易行 。
趣投稿|数据集轻松按需搜索,这个工具有近2000个图像数据集,可免费获取
本文插图

这个项目名叫BIFROST , 一个数据集搜索工具 , 里面共有1899个图像数据集 , 还专门设置分类 , 比如Humans、Geospatial、Autonomous Cars等 。
一键搜索 , 免费获取 , 直接链接到原始数据库 , 帮你快速找到合适的数据集 。 研究团队来自新加坡 , Reddit上17小时热度200+ 。
趣投稿|数据集轻松按需搜索,这个工具有近2000个图像数据集,可免费获取
本文插图

使用说明
话不多说 , 我们就直接来上这个网站来试试~
正如刚才所看到的 , 这个工具是按任务、应用、类别、标签或格式进行分类 。
趣投稿|数据集轻松按需搜索,这个工具有近2000个图像数据集,可免费获取
本文插图

根据「类别」 , 这个网站共分为18类 , 比如Humans、Geospatial、Autonomous Cars、Retail、3D等 。
趣投稿|数据集轻松按需搜索,这个工具有近2000个图像数据集,可免费获取
本文插图

向左滑动 , 选择你需要的类别 , 一键即可出结果 , 我们以3D为例 , 然后就呈现这样的页面 。
趣投稿|数据集轻松按需搜索,这个工具有近2000个图像数据集,可免费获取
本文插图

若以「Humans」为例 , 界面是酱紫的 。
趣投稿|数据集轻松按需搜索,这个工具有近2000个图像数据集,可免费获取
本文插图

我们也看到 , 这是按照精选进行排序 。 除此之外 , 你还可以选择「最新」、「最多标签数」、「数据集大小」、「图片数量最多」这些分类 。
趣投稿|数据集轻松按需搜索,这个工具有近2000个图像数据集,可免费获取
本文插图

除了「快速检索」之外 , 还可以根据开发人员的具体需要来进行搜索 。
趣投稿|数据集轻松按需搜索,这个工具有近2000个图像数据集,可免费获取
本文插图

可以选择这些「限定」:任务类型 , 标签格式 , 最小图像数量 。
其中任务类型主要包括 , 图像分割 , 目标检测、图像分类、姿态估计、视觉推理、3D重建、视频分类 。
标签格式包括 , YOLO、PASCAL、COCO以及Segmentation 。
数据集
以COCO为例 , 这是一个适用于目标检测、图像分割和字幕大型数据集 。
界面是这样的:
趣投稿|数据集轻松按需搜索,这个工具有近2000个图像数据集,可免费获取
本文插图

主要分为图像示例、数据集简介、特性、类别分布四个板块 。
在简介部分 , 可以看到这个数据集的研究团队、一句话介绍 , 以及通过CC4.0协议的部分 , 还直接链接到原始数据库和论文地址 。
CC4.0协议是一种知识共享许可协议 , 是一种允许他人分发作品的公共版权许可 , 还有一种类似的 , MIT协议 。
作者此次选择的近2000个数据集都通过了这两项协议的 。 所以网站并不直接管理这些数据集 , 它只是一个数据集的「搬运工」 。
趣投稿|数据集轻松按需搜索,这个工具有近2000个图像数据集,可免费获取
本文插图

在「类别分布」这一板块 , 首先会提示 , 没有标签、标签过多的图像数量 。
趣投稿|数据集轻松按需搜索,这个工具有近2000个图像数据集,可免费获取
本文插图

然后根据不同的标签类别 , 显示各自的图像数量分布 。

趣投稿|数据集轻松按需搜索,这个工具有近2000个图像数据集,可免费获取
本文插图

这个项目的负责人名叫Charles Wong, 来自新加坡 , 目前是Bifrost的CEO 。
趣投稿|数据集轻松按需搜索,这个工具有近2000个图像数据集,可免费获取
本文插图

本科就读于新加坡科技设计大学 , 曾参与MIT Global Leadership Program 。
接下来 , 他们的工作将主要集中在这几个方面:

  1. 将网站中的每一个数据集都进行全面分析
  2. 改进搜索方式
  3. 实现用户上传和分享自己的数据集
  4. 生成自己的合成数据集

趣投稿|数据集轻松按需搜索,这个工具有近2000个图像数据集,可免费获取
本文插图

「Why is our data better?」
就像在网站上介绍到的那样 , 让你快速、高精度、高准确度地寻找到合适的图像数据集 。
感兴趣的朋友 , 可以戳下方链接去试试哦~
网站地址:https://datasets.bifrost.ai/
参考链接:https://www.reddit.com/r/MachineLearning/comments/i6fsl6/p_we_built_an_easy_way_to_find_image_datasets/
— 完 —
量子位 QbitAI · ***签约
【趣投稿|数据集轻松按需搜索,这个工具有近2000个图像数据集,可免费获取】关注我们 , 第一时间获知前沿科技动态


    推荐阅读