描绘未知:数据缺乏场景的缺陷检测方案
工业应用中存在较多的缺陷检测需求。针对缺陷检测需求,常见的解决方案有两种:
基于目标正常图像数据的模板匹配;
训练深度学习模型检测目标缺陷。
其中,第2种方式具有更强的鲁棒性和泛化能力。然而由于深度学习模型的准确率跟数据量的大小挂钩,深度学习缺陷检测方案面临着缺乏足够的缺陷样本进行模型训练的问题。
友思特推出 Neuro-T 机器视觉软件平台,通过GAN和无监督学习模型两种不同的手段,以两种不同的方式形成数据缺乏场景的缺陷检测方案。
友思特 Neuro-T 支持八种不同的深度学习模型。
其中,GAN通过少量缺陷样本,训练缺陷生成模型并生成大量缺陷图像,从而解决缺陷数据缺乏的问题;无监督学习模型中的异常分类和异常分割,只需用大量正常的图像数据和少量的缺陷图像进行训练,即可输出检测异常图像的深度学习模型。
模型训练数据包括输入图像的特征和标签/目标值;
训练过程中,模型尝试通过特征和标签之间的联系来学习如何预测/分类。
将图像分类成不同的类别或OK/NG组别
分析图像中检测到的物体形状并圈选
检测图像中物体的类别、数量并定位
检测和识别图像中的字母、数字或符号
旋转图像至合适的方位
学习图像中的缺陷区域并生成虚拟缺陷
模型训练数据只包含输入图像的特征,无标签/目标值;
模型尝试发现数据中的模型或特征关系,而非预测特定的输出。
在大量正常图像和少量缺陷图像上训练以检测异常图像进行分类
在大量正常图像和少量缺陷图像上训练以检测异常图像并定位缺陷位置
生成对抗网络 (Generative Adversarial Network, GAN) 是一种深度学习模型,由生成器 (Generator) 和判别器 (Discriminator) 组成。
生成器网络以随机噪声为输入,通过层层映射和转换逐渐生成逼真的数据样本。判别器网络则被训练用于区分生成器产生的样本与真实样本。两部分通过对抗训练的方式相互博弈,学习数据的分布,使得生成器可以生成逼真的数据样本,而判别器则可以对真实样本和生成的样本进行有效区分。
生成器的目标是最大化判别器无法区分生成样本和真实样本的概率。而判别器的目标是最小化其错误率,即尽可能准确地区分生成样本和真实样本。通过反复迭代优化,生成器和判别器逐渐互相提高,并最终达到一种动态平衡状态。
GAN模型广泛应用于文本、图像、音视频数据生成等场景。
可以使用涂刷的方式选中缺陷区域
也可以用画笔绘制任意多边形圈选缺陷区域
将缺陷图像设置为训练集
将正常图像设置为测试集
将缺陷图像设置为训练集
将正常图像设置为测试集
用于创建缺陷的图像数据
必须跟用于训练GAN模型的数据对应
后续将用这些正常图像生成缺陷图像
应用于比较直观的缺陷
可以使用先前训练的缺陷形状(Stamp)绘制缺陷
也可以使用画刷工具(Brush)自由绘制缺陷
应用于比较抽象的缺陷和批量缺陷图像的生成
可一键实现在所有正常图像上绘制缺陷得到缺陷图像
软件界面可查看生成的批量缺陷图像并导出
(1)与使用Neuro-T训练其他深度学习模型一样的步骤,新建项目 → 新建数据集 → 导入图像数据 → 新建标签集 → 选择标签集对应的深度学习模型类型。
(2)对于异常分类模型:只需类比分类模型,给数据添加正常or异常的标签;对于异常分割模型:给数据添加正常or异常的标签,进一步地,对于异常的图像数据,需要圈选or涂选出异常区域。
(3)训练模型,查看模型检测结果,可以通过设置敏感度阈值(Sensitivity Threshold)来过滤检测出的图像异常部分,从而满足实际的应用需求。
1
1