QCon 全球软件开发大会(北京站)门票 9 折倒计时 4 天,点击立减 ¥880 了解详情
写点什么

计算机视觉领域最好用的 5 个开源图像标注工具

2019 年 10 月 04 日

计算机视觉领域最好用的5个开源图像标注工具


本文介绍了 5 个很棒的标注工具,我希望它们能帮助你创建计算机视觉数据集。


如果你是一名计算机视觉领域的数据科学家,你可能也意识到了你需要一个快速而简单的标注工具,其原因至少是以下两个之一:


  • PoC(译者注:Proof of Concept)或研发实验需要创建数据集

  • 保证你的数据质量,这样它就不会影响你的深度学习算法的性能


我深入探究了计算机视觉标注领域,发现它包含了大量令人印象深刻的工具(请看如下三个超级棒的工具清单:清单一清单二清单三,或者查看这个博客)。我花了相当多的时间比较最有前景的(和活跃的)项目,发现其中大部分工具都只能达到如下三个设计目标中的其中一个:


  1. 如果你想在标注行业展开业务,你需要:

  2. 先进的项目管理功能

  3. 足够多的功能,以完成任何标注任务

  4. 提高效率的自动化工具

  5. 如果你属于一家创业公司,你可能需要:

  6. API,或者至少是将标注工具连接到私有 API 的简单方法

  7. 直观的用户体验(UX),使你临时聘用的每个标注人员都可以立即开始工作

  8. 如果你只是为自己工作,你:

  9. 不用关心 API 或者项目管理

  10. 只是想尽快开始标注!


下面是我最喜欢的工具列表,这些工具允许为计算机视觉应用标注包围框(用于物体检测任务)和多边形框(用于分割任务)。


如果你发现这些工具不能正常工作,请尝试在 Chrome 中运行它们。


[可选]计算机视觉标注的简要基础知识


在计算机视觉中,训练算法的数据主要有三种类型:


  1. 图片+分类器训练标签(ResNets

  2. 包围框+检测器标签(YOLOv3,Faster R-CNN……)

  3. 多边形+用于分割应用程序标签(Mask R-CNN



注意分割数据(蓝色)与检测数据(紫色)的差异


正如你很可能已经意识到的,对于 AI 项目来说,成功的最重要的影响因素之一是你可以使用的“优质数据”的数量。我所说的计算机视觉应用的“优质数据”是指:


  • 每个图片/标注都有一个恰当的标签

  • 每个边界框或多边形都紧致地包围着要训练的物体。


即使后一种定义明显缺乏客观性,但我们希望我们的算法能够达到人类的水平。因此,我们需要“人类水平”的标注。


打标公司的最佳开源标注工具


计算机视觉标注工具(CVAT)



计算机视觉标注工具(CVAT)


在推出 OpenCV 近 20 年后,Intel 在计算机视觉领域再次发力,并发布了 CVAT,这是一个非常强大和完整的标注工具。尽管它需要一些时间来学习和掌握,但它包含了大量的功能来标注计算机视觉数据。


优点:


  • 它很容易安装和扩展,因为它是一个运行在 Docker 中的 Web 应用程序

  • 它包含了许多自动化工具(如使用 TensorFlow 物体检测 API 的自动标注、视频插值……)

  • 它允许协同工作管理,这样团队中的不同成员就可以在同一个标注任务上协同工作


缺点:


  • UI 相当复杂。例如,对于初次设置标注任务的用户而言,这可能会非常棘手

  • 一开始用起来不是很直观,可能需要几天的时间来掌握

  • 只能运行于 Chrome,所以如果你担心谷歌……,你必须找到其他变通办法


点击这里查看在线演示


创业公司的最佳开源标注工具


可视化对象标注工具(VoTT)



可视化对象标注工具(VoTT)


VoTT 是由微软开发的,它提供了非常棒的用户体验,这可能会在你标注时为你节省大量的时间和精力。而且,创建项目也很直接,所以你可以不用深入阅读其文档就能使用它。


优点:


  • 代码写得非常好(在 React 中),并且完美地定义了接口,因此获取代码和添加所需的额外功能都很容易

  • 正如我所说的,UX 是完美的,它有一个黑色的主题和一个跟随鼠标的虚线网格,所以很容易知道从哪里开始标注一个边界框。这看起来像是一种额外嘉奖,但是相信我,这对于标注来说真的很重要!

  • 它提出使用深度学习算法来自动检测对象(它附带了在 COCO 数据集上训练的SSD模型)

  • 它是一个 web 应用程序和一个电子应用程序。这使你可以将它作为一个重客户端使用,也可以将它作为 web 浏览器中运行的应用程序来使用


缺点:


  • 要使用 web 应用程序版本,你需要将数据托管在微软的云计算服务 Azure 上(然而,电子版应用程序允许你在硬盘上使用数据,但需要使用 npm 安装程序)

  • 它没有提供一个内置的 API(但是,通过调整代码,使你的私有 API 能够与之通信,这是非常容易的)

  • 你不能给整张图片贴标签:你只被允许绘制带有相关标签的边界框(或多边形)。因此,它不适合创建分类数据库


点击这里查看我们的网页应用程序!


DataTurks



DataTurks 是一家成立于 2018 年的初创公司,提供图片、视频和文字的标注服务。然而,直到最近它才成为开源软件(这可能与沃尔玛在 2019 年 2 月买下了它有关),此前你都必须向其付费。尽管在那之后,他们几乎没有对外发声,而且似乎已经停止了任何开发,但是这个标注工具非常棒,而且现在是免费的!


当你使用它的时候,不用在意任何许可,也不用考虑随处可见的任何非商业用途的限制条款。Dataturks 现在免费啦,而且你可以使用它的所有功能(我已经尝试和测试过了)!


优点:


  • 说起 CVAT,它是一个在 Docker 中运行的 Web 应用程序(查看这里获取 Docker 图像)

  • 允许协作和异步工作:处理相同数据集的两个队友不会得到相同的图像进行标注

  • 提出一种用于创建和获取标注任务的 API


缺点:


  • DataTurks 似乎已经停止了其产品的开发

  • UX 还可以,但是一些小小的调整还可以让它变得更好


点击这里查看在线演示!


仅为你自己服务的最好的开源图像标注工具



MakeSense.ai


Make-Sense


Make-sense 在两个月前刚刚发布(如果你在很久之后才读到我这篇文章,说明下,这个时间是 2019 年 6 月),并且已经拥有了令人难以置信的用户体验。开始启动打标从来没有这么快!进入网站,拖放你的图片,即可开始标注。


优点:


  • 快速,高效,但最重要的是,简单!

  • 很酷的用户体验

  • 至于你上传的图片的隐私问题,不要担心,因为他们说:“【我们】不会存储你的图片,因为我们不会把它们发送到任何地方。”


缺点:


  • 不提供任何项目管理功能

  • 也不提供任何 API


点击这里开始打标!


我希望这篇文章能够帮助你选择一个适合你需要的打标工具,如果你找到了更好的工具,请尽管在评论区告诉我们!


ps:以下是其他一些工具的简短列表,这些工具尽管我没有提到,但是都很酷。


  • VGG VIA,一个非常容易使用的标注器,其由牛津机器人实验室开发。它被编码在单个的 html/js 文件里,所以它很容易进行开发!

  • LabelMe,由麻省理工学院开发的。在这里可以看到一个在线版本,或者在这里可以运行它。

  • Coco-Annotator似乎功能很齐全,但它是最近才出现的(用户身份验证系统、API 接入点)。查看这里的演示(用户名:admin 密码:password)


原文链接:


https://blog.sicara.com/best-open-source-annotation-tools-in-computer-vision-4b9f6a18f911


2019 年 10 月 04 日 11:096782
用户头像

发布了 61 篇内容, 共 18.5 次阅读, 收获喜欢 128 次。

关注

评论

发布
暂无评论
发现更多内容

GO训练营第1周总结

Glowry

关于一致性Hash算法的测试

皮蛋

第九周作业 (作业一)

Geek_83908e

架构师一期

架构师训练营第九周总结

吴传禹

极客大学架构师训练营

请简述 JVM 垃圾回收原理。

博古通今小虾米

架构师训练营第九周作业

吴传禹

极客大学架构师训练营

第九周 性能优化(三)作业

钟杰

极客大学架构师训练营

华为的研发基地“欧洲小镇”

华为 网络 研发中心 欧洲小镇

第五周-作业1

Mr_No爱学习

设计一个秒杀系统,主要的挑战和问题有哪些?核心的架构方案或者思路有哪些?

Jacky.Chen

第九周总结

睁眼看世界

极客大学架构师训练营

架构师训练营第 1 期 -- 第九周学习总结

发酵的死神

极客大学架构师训练营

架构第九周作业

Geek_Gu

极客大学架构师训练营

Week5 一致性Hash

evildracula

学习 架构

架构师训练营第九周总结

月殇

极客大学架构师训练营

技术选型 - 学习总结笔记

Xuenqlve

架构师训练营第五周总结

张浩

JVM

ROOT

与前端训练营的日子 --Week04

SamGo

学习

架构师训练营第 5 周课后练习

菜青虫

极客大学架构师训练营

架构师训练营第一期-第九周课后作业

卖猪肉的大叔

极客大学架构师训练营

第五周作业

hunk

极客大学架构师训练营

一致性Hash算法

jorden wang

架构师训练营第 1 期 week9

张建亮

极客大学架构师训练营

性能优化-数据库,JVM, 秒杀场景

garlic

极客大学架构师训练营

架构师训练营第九周学习总结

Gosling

极客大学架构师训练营

第 8 周 作业

Pyr0man1ac

第五周学习总结

Mr_No爱学习

【JVM】肝了一周,吐血整理出这份超硬核的JVM笔记(升级版)!!

冰河

JVM 性能调优 JVM原理 Java虚拟机

成为架构师 - 架构师训练营第 05 周

陈永龙Vincent

架构师训练营——week09

睁眼看世界

极客大学架构师训练营

边缘计算隔离技术的挑战与实践

边缘计算隔离技术的挑战与实践

计算机视觉领域最好用的5个开源图像标注工具-InfoQ