人工智能辅助的数据标记方法-600学习网
600学习网终身会员188,所有资源无秘无压缩-购买会员
本文将与您分享我们在使用人工智能技术自动生成数据标签方面的工作。
在深入研究我们的方法之前,让我们首先了解数据标记是什么。
在机器学习中,数据标记只是识别原始数据(图像.视频.音频文件.文本文件等)的过程,并添加一个或多个有意义且信息丰富的标记以提供上下文,以便机器学习模型可以从中学习和推断。
大多数最先进的机器学习模型高度依赖于大量标记数据的可用姓,这是监控任务中的关键步骤。各种用例都需要数据标签,包括计算机视觉.自然语言处理和语音识别。
传统上,到目前为止,这种繁琐而普通的数据标注过程主要由人类完成。为了帮助人类从零开始尽可能减少数据标记的工作和努力,我们提出了一种自动化算法解决方案,以减少大量的人工工作。
在这里,我们将讨论计算机视觉任务。计算机视觉只是人类视觉(人类视觉)的复杂姓和对周围环境的理解的再现。
计算机视觉任务包括获取.处理.分析和理解数字图像的方法,以及从现实世界中提取高维数据以生成数字或符号信息的方法,例如以决策的形式。在计算机视觉领域,有许多不同的任务。这些任务,例如分类.检测和分割,将不再详细描述。然而,下图提供了这些任务的清晰概述和目标,并给出了上下文中对象的示例-“香蕉”。
示例上下文-标记数据的要求
对于检测对象”香蕉”的监督模型,注释标签被馈送到模型中,以便它可以学习香蕉像素的表示,在上下文中定位它们,然后使用上下文推断不可见/新数据。
实例分割任务旨在检测对象,定位这些对象,并提供其数量.大小和形状信息。
我们使用这样一个高级的实例分段模型-“Mask R-CNN”作为我们框架的核心骨干,但在这里,我们可以根据其需求和目标使用任何其他网络架构。
我们坚持使用掩码R-CNN,因为它可以有效地检测图像中的对象,并为每个对象生成高质量的分割掩码。对于我们检测到的新冠肺炎感染的特定测试案例,感染区域的准确位置至关重要,因此像素级检测在这种情况下更合适。
我们的方法
我们工具的流水线如下图所示,主要由探测器和跟踪器.自动标签模块和I/O模块组成。它用于将机器注释标签输出并保存到磁盘。
步骤1:-像素级分类的目标检测和跟踪
使用定制的弱训练掩码RCNN模型在极少数标记实例(少于10个样本)中检测新冠肺炎感染。
为了标记感染区域,我们使用VGG图像注释器(VIA)图像注释工具。这是一个简单而独立的注释图像.音频和视频软件。
VIA在web浏览器中运行,不需要任何安装或设置。完整的VIA软件可以放在一个单独的HTML页面中,页面大小小于400KB。它在大多数现代web浏览器中作为脱机应用程序运行。VIA是一个完全基于HTML.Javascript和CSS(独立于外部库)的开源项目。
VIA由视觉几何集团(VGG)开发,并根据BSD-2许可证发布,可用于学术项目和商业应用。
检测器用于获取局部掩码.边界框和类。接下来,为了沿着输入视频数据流均匀地跟踪和标记多个感染区域,我们使用中心点跟踪算法。我们的掩码RCNN新冠肺炎检测器的片段如下所示。
第2步:
注意:-我们的工具目前正在进行alpha测试。目前,我们设计的框架基于掩码R-CNN和VIA注释格式。
我们还希望将我们的原型扩展到包括不同的最先进的检测器,例如YOLO和相应的YOLO兼容注释格式。此外,我们计划集成COCO注释格式。值得将所有不同的图像注释集成到我们的框架中,并为设施提供不同的库,例如Torch.TensorFlow.Caffe等。
600学习网 » 人工智能辅助的数据标记方法-600学习网