软件开发架构师

英特尔开源计算机视觉数据标签工具CVAT,加速数据注释

人工智能 8 2019-03-11 11:07

训练深度神经网络需要大量数据。另外,如果数据没有标签,那这些数据就没有多大用处,AI 架构也无用武之地,但处理包含数十万、数百万对象的语料库非常耗时。

为了减轻数据注释器和数据科学家的负担,英特尔开源了一个新源程序——计算机视觉注释工具(CVAT),以加速用来训练计算机视觉算法的视频和图像样本注释。

GitHub 开源地址奉上,感兴趣的同学可以试一试:
https://github.com/opencv/cvat

“为了加速计算机视觉领域的这一过程,[我们] 开发了一个名为 [CVAT] 的程序,”英特尔在一篇博文中写道。 “通常,有很多方法可以注释数据,但使用特殊工具 [如 CVAT] 可能有助于加快这一过程。”

正如 Santa Clara 公司所解释的那样,CVAT 通过 Docker 进行部署,并通过基于浏览器的界面(或者可选地嵌入到 Onepanel 等平台中)进行访问,并具有针对协同工作优化的基于任务的管理系统。(用户创建公共任务以将工作分开。)它支持与对象检测、图像分类和图像分割相关的监督机器学习任务,以及具有四种类型之一的注释:框、多边形、折线和点。

image

使用 CVAT 注释汽车和障碍物。

在 CVAT 中,注释器可以使用大量工具来复制和传播对象、应用过滤器、调整视觉设置,以及通过谷歌的 TensorFlow 框架中的对象检测 API 执行自动注释等。CVAT 会自动执行一些检查(但不是所有检查,有些检查需要手动进行),且可与英特尔的 OpenVino、英伟达的 Cuda 和 ELK(Elasticsearch、Logstash 和 Kibana)分析系统等工具包很好地配合使用。

但是,CVAT 仍在继续完善,英特尔表示,目前仅在 Chrome 上进行了广泛测试,在其他浏览器上可能会不好用,并表示 Chrome 中的沙盒功能 Sandbox 限制了流程周围的环境,包括使用 RAM,这会对工具包的性能产生负面影响。但英特尔承诺将会改进这一点。

“CVAT 是在专业注释和算法团队的支持下开发的,我们想要为这些团队提供最有价值的功能…用户的反馈有助于英特尔确定 CVAT 未来的发展方向,”该公司表示。“我们希望改进工具的用户体验、功能集、稳定性、自动化功能以及与其他服务集成的能力,并鼓励社区成员积极参与 CVAT 的开发。”

在 CVAT 发布几周前,Uber 开源了自动可视化系统(一个基于网络的车辆数据平台),之后,Scale 和 Hive 等样本标签初创公司也筹集了大量的风险投资,并吸引了优步和通用汽车等大厂的关注。

参考链接:https://venturebeat.com/2019/03/05/intel-open-sources-cvat-a-toolkit-for-data-labeling/

image

文章评论