写点什么

港科大联手思谋新作:Defect Spectrum 数据集重新定义 AI 工业质检

  • 2024-08-16
    北京
  • 本文字数:2049 字

    阅读完需:约 7 分钟

港科大联手思谋新作:Defect Spectrum 数据集重新定义AI工业质检

在“生产制造 - 缺陷检测 - 工艺优化 - 生产制造”的智能制造闭环链条中,基于 AI 的智能缺陷检测扮演着“把关者”的角色。但这个“把关者”长期以来却缺少样本量大、精度高、语义丰富的缺陷数据集。


近日,港科广和专注于智能制造领域的人工智能独角兽思谋科技联合发布了一篇论文,该论文提出了 Defect Spectrum 缺陷数据集及 DefectGen 缺陷生成模型,主攻工业智能检测,可解决模型无法识别的缺陷类别和位置问题,有效提升 10.74% 召回率,降低 33.1% 过杀率。


据悉在去年,该合作团队提出的《Ref-NeuS: Ambiguity-Reduced Neural Implicit Surface Learning for Multi-View Reconstruction with Reflection》被选为 ICCV 最佳论文候选。


Project Page: https://envision-research.github.io/Defect_Spectrum/


Arxiv Page: https://arxiv.org/abs/2310.17316


Github Repo: https://github.com/EnVision-Research/Defect_Spectrum


Dataset Repo: https://huggingface.co/datasets/DefectSpectrum/Defect_Spectrum


突破传统限制,


更贴近落地生产


高质量的数据集对 CV 技术和人工智能的发展起着至关重要的作用。如 ImageNet 不仅推动了算法的创新,还促进产业发展和进步。


在工业界,MVTec、VISION VI、DAGM2007 等数据集帮助视觉学习算法更接近工业生产实际场景,但由于样本量、精度、语义描述的不足,始终限制着 AI 工业检测的发展。


Defect Spectrum 数据集带着突破传统缺陷检测界限的任务而来,为工业缺陷提供了详尽、语义丰富的大规模标注,首次实现了超高精度及丰富语义的工业缺陷检测。


相比其他工业数据集,“Defect Spectrum”数据集提供了 5438 张缺陷样本、125 种缺陷类别,并提供了像素级的细致标签,为每一个缺陷样本提供了精细的语言描述,实现了前所未有的性能突破。



相比其他工业数据集,Defect Spectrum 精准度更高、标注更丰富



Defect Spectrum 与其他数据集的数量、性质对比


从实际的工业生产来看,工厂对缺陷检测的要求细致,需要在控制缺陷件的同时保证收益率。然而,现有缺陷检测数据集常常缺乏应用所需的精确度和语义丰富性,无法良好支持实际生产。


例如,一件衣服的拉链齿出现了错位,虽然缺陷尺寸不大但却影响衣物功能,导致拉链无法正常使用,消费者不得不将其退回工厂进行修复。然而,如果缺陷发生在衣物的面料上,比如轻微的钩丝或颜色略有差异,这时就需要仔细权衡其尺寸和影响。小规模的面料缺陷可被归类在可接受的范围内,允许这些产品通过不同的分销策略销售,比如以打折价格进行销售,在不影响整体质量的同时保有收益。


传统数据集如 MVTEC 和 AeBAD 尽管提供了像素级的标注,但常常局限于 binary mask,无法细致区分缺陷类型和位置。Defect Spectrum 数据集通过与工业界四大基准的合作,重新评估并精细化已有的缺陷标注,对细微的划痕和凹坑进行了更精确的轮廓绘制,且通过专家辅助填补了遗漏的缺陷,确保了标注的全面性和精确性。


通过 Defect Spectrum 数据集这个强大的工具,工厂缺陷检测系统能够迅速识别、立即标记,并采取相关修复策略。


革命性生成模型,专攻缺陷样本不足


港科大和思谋科技研究团队还提出了缺陷生成模型 Defect-Gen,一个两阶段的基于扩散的生成器。



Defect-Gen 两阶段生成流程示意图


Defect-Gen 专门解决当前数据集中缺陷样本不足的问题,通过利用极少量的工业缺陷数据生成图像与像素级缺陷标签,即使在有限的数据集上也能工作,为 AI 在复杂工业环境中的应用开辟了新的可能。


Defect-Gen 具体通过两个关键方法提高图像的多样性和质量:一是使用 Patch 级建模,二是限制感受野。


为弥补 Patch 级建模在表达整个图像结构上的不足,研究团队首先在早期步骤中使用大感受野模型捕捉几何结构,然后在后续步骤中切换到小感受野模型生成局部 Patch,可在保持图像质量的同时,显著提升了生成的多样性。通过调整两个模型的接入点和感受野,模型在保真度和多样性之间实现了良好的平衡。而生成数据同样可以作为数据飞轮的一部分,并加速其运转。


目前,Defect Spectrum 数据集的 5438 张缺陷样本中,有 1920 张由 Defect-Gen 生成。研究团队对应用 Defect-Gen 生成模型的 Defect Spectrum 数据集进行了全面的评估,验证了 Defect Spectrum 在各种工业缺陷检测挑战中的适用性和优越性。



部分缺陷检测网络在 Defect Spectrum 数据集上的测评结果



Defect Spectrum 数据集上的实际评估标准



Defect Spectrum 在实际评估中的优异表现


比起原有的数据集,在 Defect Spectrum 数据集上训练的模型召回率 (recall) 提升 10.74%,过杀率 (False Positive Rate) 降低了 33.1%。


据介绍,Defect Spectrum 数据集的引入可以让缺陷检测系统更加贴近实际生产需求,实现高效、精准的缺陷管理,同时为未来的预测性维护提供了宝贵的数据支持,通过记录每个缺陷的类别和位置,工厂可以不断优化生产流程,改进产品修复方法,最终实现更高的生产效益和产品质量。


目前 Defect Spectrum 数据集已应用于思谋科技缺陷检测视觉模型的预训练中,未来将与 IndustryGPT 等工业大模型融合,深度落地并服务于工业质检业务。


2024-08-16 18:499547

评论

发布
暂无评论
发现更多内容

Dolphinscheduler DAG核心源码剖析

白鲸开源

GitHub 大数据 开源 Apache DolphinScheduler 调度器

【金猿人物展】白鲸开源CEO郭炜:未来数据领域的PK是大模型Transformer vs 大数据Transform

白鲸开源

大数据 数据处理 大模型 Apache SeaTunnel

1000道最新Java面试题,常见大厂面试题及答案汇总

架构师之道

程序员 java面试

通义灵码“打工”1年记:写了10亿行代码,服务上万家企业

阿里巴巴云原生

阿里云 云原生

手把手教你华为鸿蒙开发之第八节

The Wang

HarmonyOS NEXT

面对不同大小的需求,如何评估研发团队各角色的效能水平?

思码逸研发效能

DevOps 研发效能 研发团队 效能管理

(DR 5中文版)Delicious Retouch:人像修图的终极利器,重塑完美容颜

Rose

ChatGPT应用的开发流程

北京木奇移动技术有限公司

软件开发 AI应用 AI智能体

通义灵码“打工”1年记:写了10亿行代码,服务上万家企业

阿里云云效

阿里云 云原生

AI赋能低代码平台的潜力:从自动化到个性化的全面解析

天津汇柏科技有限公司

低代码 AI人工智能

Deep Glow破解版下载 附永久激活码 (AE物理发光特效插件)

Rose

KubeBlocks v0.9.2发布啦!支持容器镜像滚动更新、MySQL支持Jemalloc...快来升级体验更多新功能!

小猿姐

MySQL 数据库 redis 云计算 Kubernetes Serverless

能源投资工程VS智能驾驶,DolphinScheduler如何当好传统行业与前沿科技的桥梁?

白鲸开源

开源 Apache DolphinScheduler 技术活动 干货分享

ps阴影插件shadowify for Mac下载安装教程

Rose

AI与AE实时交互MG动画制作神器AE脚本 Overlord v1.27激活版 Win/Mac

Rose

如何高效深入的阅读Redis的源码?

开心学Java

Java redis 源码 面试 八股文

AI在手机里结出了果

脑极体

AI

Sketch Measure for Mac(sketch标注插件) v2.8.1中文激活版

Rose

AE/PR/OFX/达芬奇视频延时闪屏去闪烁插件 Flicker Free for Mac激活版

Rose

仅需一小时,教你用豆包MarsCode 学会图像物体识别

豆包MarsCode

程序员 AI 开发 代码 识别工具

Milvus 2.5:全文检索上线,标量过滤提速,易用性再突破!

Zilliz

全文检索 Milvus 新版本发布 标量过滤

ChatGPT插件的开发流程

北京木奇移动技术有限公司

AI智能体 chatGPT插件开发 软件外包公司

连锁茶叶商店ERP系统(源码+文档+部署+讲解)

深圳亥时科技

小红书笔记详情 API 接口:获取、应用与收益全解析

科普小能手

API API 接口 小红书笔记接口 小红书API 小红书笔记详情数据采集

测试开发工程师如何打造高效的质量体系

测试人

软件测试

Milvus×OPPO:如何构建更懂你的大模型助手

Zilliz

Embedding OPPO 向量检索 Milvus

如何让硬装设计项目高效推进?从混乱到有序的秘诀

axe

项目管理工具 降本增效 装修项目管理 硬装设计

使用Docker构建集成Supervisor的自定义镜像

代码忍者

手把手教你华为鸿蒙开发之第九节

The Wang

HarmonyOS NEXT

中文汉化版AE插件 optical flares插件(镜头光晕耀斑插件) 附永久许可证

Rose

产品UIUE行动报告

鲸品堂

企业号 2024年12月PK榜

港科大联手思谋新作:Defect Spectrum 数据集重新定义AI工业质检_AI&大模型_褚杏娟_InfoQ精选文章