# 工業製品におけるAI活用欠陥検出:包括的サーベイ、主要な知見と今後の研究課題
**Lutfun Nahar**¹·³、**Mohammad Awrangjeb**¹、**Md. Saiful Islam**²
¹ グリフィス大学 情報通信技術学部、ネイサン、クイーンズランド州 4111、オーストラリア
² ニューカッスル大学 情報物理科学学部、カラハン、2308、ニューサウスウェールズ州、オーストラリア
³ チッタゴン国際イスラム大学、クミラ、チッタゴン 4318、バングラデシュ
**掲載誌**: Advanced Engineering Informatics 69 (2026) 104067
**DOI**: https://doi.org/10.1016/j.aei.2025.104067
**受理**: 2025年2月8日受付、2025年5月22日改訂版受付、2025年11月7日採択、2025年11月18日オンライン公開
---
## キーワード
- 製品欠陥
- 欠陥検査
- 欠陥位置特定
- 機械学習
- 深層学習
---
## 要旨
人工知能(AI)技術、特に機械学習(ML)と深層学習(DL)は、金属、セラミック、ガラス、繊維などの産業における自動欠陥検査にますます活用されている。これらの手法は高品質な画像を処理して欠陥を検出・位置特定する。検査アプローチは、手動および半自動化(古典的ML)から完全自動化(DL)まで多岐にわたり、手動の特徴エンジニアリングを不要にするDLが優先される。DLモデルは一般に教師あり学習または教師なし学習に分類される。教師あり学習モデルは高い精度を実現するが大規模なラベル付きデータセットを必要とし、教師なし学習モデルはラベルなしで動作するが性能が低い傾向がある。半教師あり学習、弱教師あり学習、自己教師あり学習などの新しい代替手法は、データが不足している状況で有望な結果を示している。
本論文では、欠陥の分類、検出、セグメンテーションのためのDLモデルの包括的な分類体系を提示する。分類においては、畳み込みニューラルネットワーク(CNN)、転移学習、ハイブリッドアーキテクチャなどのモデルを論じる。セグメンテーションタスクにおいては、エンコーダ・デコーダモデル、ピラミッドネットワーク、アテンションメカニズムを検討する。欠陥検出においては、特徴抽出を強化するためのピラミッドネットワークとアテンションモジュールとの組み合わせに焦点を当て、YOLOアーキテクチャの進化を検討する。教師なしアプローチとして、生成的敵対ネットワーク(GAN)と拡散モデルを、広範なラベル付きデータセットなしに異常を検出する能力という観点から探求する。トランスフォーマーベースモデル、少数ショット学習、大規模言語モデル(LLM)、基盤モデルなどの新興戦略も網羅する。
最近の進歩にもかかわらず、過信や不適切なキャリブレーションによるモデルの信頼性確保という課題が残る。本論文では、モデルの信頼性、ヒューマン・イン・ザ・ループフレームワーク、産業展開に不可欠な信頼性評価技術について論じることで、この課題に対処する。このレビューは既存アプローチの現状の強みと限界を分析し、継続的な課題を特定し、さまざまな材料と欠陥タイプにまたがるMLおよびDLベースの欠陥検査における将来の方向性を示す。
---
## 目次
1. はじめに
2. 製品の欠陥
- 2.1 欠陥のカテゴリと材料
- 2.2 欠陥の特性
- 2.3 欠陥検査
- 2.4 欠陥撮像
3. 欠陥検出技術の分類
- 3.1 半自動欠陥検出技術
- 3.2 DLベースの自動欠陥検出技術
- 3.3 自動欠陥検出手法のアーキテクチャ
4. 半自動学習を用いた欠陥検出技術の有効性
- 4.1 画像処理ベースの半自動技術
- 4.2 古典的機械学習ベースの技術
- 4.2.1 教師あり学習
- 4.2.2 教師なし学習
- 4.2.3 ハイブリッド手法
5. DLベースの自動欠陥検出の有効性
- 5.1 欠陥分類手法
- 5.2 欠陥セグメンテーション技術
- 5.3 欠陥検出技術
- 5.4 教師なし、半教師あり、その他の学習による欠陥検出
6. その他のネットワーク
- 6.1 トランスフォーマーベースモデル
7. 研究のハイライト
8. 未解決の課題と今後の研究方向
- 8.1 産業環境におけるデータ前処理
- 8.2 深層学習モデル:ネットワーク選択とパラメータチューニングの精緻化
- 8.3 欠陥検出モデル:信頼性と説明可能性の探求
- 8.4 将来の産業応用
9. 結論
---
## 1. はじめに
複雑な工業プロセスにおける製品製造中、機械設計の誤りにより、内部孔、ピット、引っかき傷などの欠陥が製品の表面、エッジ、コーナーに発生し、製品の品質だけでなく性能や価値にも悪影響を及ぼす。欠陥は製品ごとに異なって現れる(鋼の引っかき傷、繊維のブロブ、超硬合金のクリース、ガラスのチッピングなど)。さらに、製品の欠陥は資源の無駄遣い、収益の減少、顧客満足度の低下を招くだけでなく、欠陥特定のための追加コストも発生させる。
製品はインターネット(eBay、Amazon、Gumtree、Facebookマーケットプレイスなど)でも売買される。購入者は製品写真付きの販売者の説明に頼らざるを得ず、購入を決定する際に自信を持てないことがある。独立した評価システムを開発し、購入者の信頼と満足度を高めるために検査報告書を製品広告に添付することができる。欠陥の検出と分類は、製品の製造・生産段階において産業固有の問題として取り扱われる重要なトピックである。
手動による欠陥識別は、専門家が製品を物理的に検査・取り扱うことを必要とする。そのため、コストがかかるだけでなく、検査結果が主観的になる。さらに、物理的な取り扱いにより製品にさらなる欠陥が生じる可能性がある。たとえば、Mitalら(2011年)は産業分野での製品部品に対して物理的な検査手法を使用しているが、この方法は一部のケースでは優れた性能を発揮するものの、検出精度の低さやリアルタイム性能の低さという性能上の問題がある。そのため、この方法は現代の工業生産における品質検査の要件を満たしていない。
したがって、より信頼性が高く効率的な方法論を導入する必要がある。自動欠陥検出の方法論は手動識別に比べて多くの利点がある。時間の節約、総生産コストの削減、物理的な製品取り扱いの排除、製品品質の向上、そして長期にわたる高効率での稼働が可能である。たとえば、マシンビジョン技術は製品の画像を撮影し、コンピュータが画像を検査することを可能にする。画像分析にコンピュータを使用し、意思決定にAIを適用することで、プロセスがより自動化され信頼性が高くなる。最近では、自動化手法が製薬、鋼鉄、繊維などのさまざまな製品で研究されており、主に表面欠陥検出にコンピュータビジョンと画像処理技術を使用している。このように、現代の製造・工業プロセスは、検出精度の向上と人員要件の削減のために、画像処理、コンピュータビジョン、AIベースのシステムと統合されている。
古典的な画像処理とML技術に基づく半自動欠陥検出手法は、手動のパラメータチューニングと特徴エンジニアリングに大きく依存している。画像処理技術(テクスチャ分析など)で抽出した特徴に古典的ML技術(サポートベクターマシンなど)を適用することで欠陥検出性能は向上するが、依然として要求される満足水準には達していない。対照的に、深層学習(DL)モデルは画像から直接学習することで手動の特徴抽出を不要にし、完全な自動化、性能の向上、工業的な欠陥分類と位置特定における幅広い採用を実現している。
さらに、教師ありDLモデルは高い精度のために大規模なラベル付きデータセットを必要とするが、データ収集は労働集約的である。これを軽減するために、研究者はデータ拡張やデータセットの不均衡に対処するための合成アルゴリズムを使用している。これらの取り組みにもかかわらず、ラベリングは時間がかかる。セグメンテーションは欠陥の位置特定に役立つが、ピクセルレベルのアノテーションはコストを増加させる。代替として、教師なしDLはラベルなしデータを使用するが、一部のドメインでは画像の希少性が続いている。Dongら(2026年)は、データ拡張と教師なしセグメンテーションをより少ない未ラベル画像で組み合わせることで有望な結果を示している。
欠陥検出に関する既存のサーベイは主に特定の製品に焦点を当て、主にDL技術の適用について論じているが、欠陥サイズの定量化、欠陥位置の特定、欠陥サイズに基づく画像キャプチャデバイスの活用に関する詳細な説明が欠けている。しかし、これらの側面は包括的な欠陥検出方法論を開発し、さまざまな産業における欠陥分析の精度と効率を向上させるために重要である。本研究は、マシンビジョンを活用した工業製品の欠陥検出開発の現状に焦点を当てている。
**本論文の主な貢献は以下の通りである:**
- 工業製品に見られる異なる欠陥タイプの特性を調査する。
- 工業製品の欠陥検出に適用される半自動化および自動化手法の包括的な概要を提供する。
- 欠陥検出アプリケーションに採用されたDLベースの自動化モデルを分類する。
- 工業製品の品質評価における課題を強調し、潜在的な研究方向をまとめる。
このレビューの目的は、MLとDLを使用したさまざまな物体の欠陥分類と位置特定に関するすべての可能な情報を統合・編纂することである。これを達成するために、Scopus、IEEE、Elsevier、Springer、Google Scholarなどのデータベースから、欠陥検出、故障分類、亀裂識別などのキーワードや同義語を使用して論文を検索した。最終的に約160本の論文が選定された。
---
## 2. 製品の欠陥
現在、MLやDLなどのAIベースの手法は、データ分析と製品品質検査の文脈で急速に発展している。図2は、Googleトレンドのデータに基づき、工業製品の品質検査に関する研究がどのように成長しているかを示している。この傾向を分析すると、産業における欠陥検出が成長分野であり、品質評価が製品の品質水準を検査・維持するために重要な役割を果たしていることがわかる。
半自動化手法は規則的なパターンには有効だが、マイクロ欠陥(金属の亀裂など)には苦労する。対照的に、マシンビジョンはより正確な検出と分類を提供する。しかし、欠陥の形状とサイズの多様性により、すべての欠陥を分類し包括的なデータベースを構築することは困難である。
### 2.1 欠陥のカテゴリと材料
本研究は、金属、セラミック、繊維、紙、木材、超硬合金で作られたいくつかの工業製品に焦点を当て、それらには様々な種類の欠陥が存在する。欠陥の中には特定の製品に固有のものがある。たとえば、亀裂はセラミック、金属、ガラス製品に発生するが、アート紙、布、トレーディングカードなどの製品には発生しない。これらの製品にはほつれ、着色、印刷など固有の欠陥がある。
すべての製品の欠陥を印刷欠陥と非印刷欠陥の2つに分類する(表1参照)。パターンエラー、色の不完全さ、線質の悪さなどの印刷欠陥は印刷製品(ポケモンカード、衣類、アート紙など)に見られる。非印刷欠陥は鋼鉄、ガラス、金属などの他の工業製品に見られる。
**表1: 材料に基づく欠陥カテゴリ**
| 非印刷欠陥 | | 印刷欠陥 | |
|---|---|---|---|
| 欠陥 | 材料・製品 | 欠陥 | 材料・製品 |
| チッピング、亀裂 | ガラス | N/A | N/A |
| 亀裂、ピンホール、スポット、ブロブ、コーナーシャープネス、釉薬、引っかき傷 | セラミック | 印刷エラー、破れ、異物、線質不良 | アート紙 |
| ほつれ、ブロブ、穴、しわ | 布 | 色の不完全さ、パターンエラー、二重印刷 | 布 |
| チッピング、凹み、ほつれ、引っかき傷、コーナーシャープネス | トレーディングカード | スポット、破れ、変色、異物、センタリング | トレーディングカード、アート紙 |
| 形状エラー、チッピング | 木材 | N/A | N/A |
| シャープネス、亀裂、しわ、ピット | 鋼鉄 | N/A | N/A |
| しわ、亀裂 | 超硬合金 | N/A | N/A |
### 2.2 欠陥の特性
欠陥は様々な形状を持ち、人間の知覚に対してさまざまなレベルの影響を与える。欠陥は通常、製品の3つの位置(表面、エッジ、コーナー)に見られる。製品表面の欠陥は規則的な形状(線、パターンなど)を持つことがあるが、エッジやコーナーの欠陥はランダムな形状を持つことが多い。
欠陥は前述の製品位置でさまざまな理由から発生する。たとえば、亀裂は製品の移動によってエッジやコーナーに発生することがあり、製品への高圧力によって製造中に表面に発生することもある。一部の欠陥(腐食、汚染など)は、不利な気象条件や化学物質の漏出により表面に発生することがある。
### 2.3 欠陥検査
欠陥検査は製品の様々な属性をチェックし、規定の基準を満たすことを確認するという点で重要な役割を果たす。欠陥検査は製造段階と使用中の2つのレベルで実施できる。製造中に発生する欠陥は、会社が製品を市場に出す前に品質評価を行う際に検査できる。製品が使用中の場合、その状態を評価するために欠陥検査を実施できる。
欠陥推定(サイズ、数量など)も製造段階と使用中の両方で推定される属性である。製品品質をより深くチェックするには、欠陥サイズの数量と長さを測定する必要がある。
### 2.4 欠陥撮像
高品質な画像の維持において重要な役割を果たす重要な製品特徴を取得し、予期しない特徴(影や不適切な照明環境によるものなど)を排除することが不可欠である。製品の高品質な画像を得るには、良好な光学照明プラットフォームを備えた適切な画像取得ハードウェア(カメラ、スキャナーなど)が必要である。
画像取得ハードウェアは、製品特性、欠陥タイプと大きさ(小、非常に小さいなど)、デバイス特性(倍率、解像度)に基づいて選択される。
**主な画像キャプチャデバイス:**
- **走査型電子顕微鏡(SEM)**: 半導体製品の欠陥検出に使用。最大300万倍という非常に高い倍率を提供し、非常に小さい、通常は肉眼では見えない欠陥を検出・分析できる。
- **デジタル顕微鏡**: 34〜1,100倍の倍率範囲で様々な製品の画像を撮影できる。
- **デジタルカメラ**: 小、中、大の欠陥を持つすべての材料に使用される。
- **フォトメトリックステレオ**: 深い欠陥(亀裂など)の深さ測定に使用され、65〜110mmの径を持つ部品を検出できる。
---
## 3. 欠陥検出技術の分類
欠陥検査手法に関する文献は大きく3つに分類できる:(i) 手動、(ii) 古典的画像処理とMLベースの半自動化、(iii) DLベースの自動化。
**表5: 欠陥検査手法の比較**
| 手法 | 利点 | 欠点 |
|---|---|---|
| 手動 | 多様な欠陥を識別できる | 時間がかかる、主観的、実験セットアップが必要、コスト高、不一致、人手が必要 |
| 古典的画像処理と機械学習 | 人為的エラーと時間を削減 | 特徴選択と抽出に熟練した作業が必要、アルゴリズムのパラメータが限定的、精度が低い |
| 深層学習 | 自動的に特徴を抽出、人手の削減と高い検出精度 | 大規模なデータセットが必要、キャリブレーションが不十分 |
### 3.1 半自動欠陥検出技術
半自動欠陥検出は4つの主要なステップからなる:データ取得、前処理、特徴抽出、分類。データはセクション2.4で説明した撮像セットアップを介してキャプチャされ、ノイズフィルタリングによって強化される。次に統計的、構造的、フィルタ、またはモデルベースの手法を使用して特徴を抽出し、学習ベースの分類(SVM、KNNなど)が続く。
### 3.2 DLベースの自動欠陥検出技術
DLベースの欠陥検出は分類と位置特定の2つに分かれる。分類モデルは計算コストを削減するために事前学習済み重み(ImageNetなど)を使用してゼロから、または転移学習を通じてトレーニングされる。位置特定アプローチは欠陥タイプによって異なり、エンコーダ・デコーダ、ピラミッド、アテンション、YOLOベースのネットワークが含まれる。
**主要なDLモデルの概要:**
- **教師あり学習**: 欠陥の分類と位置特定において、大規模なラベル付きトレーニングデータセットがあれば高い精度を達成できる。
- **教師なし学習**: ラベル付きデータなしに欠陥検出の課題に対応。オートエンコーダ(AE)やGANが一般的なアプローチ。
- **半教師あり・自己教師あり・弱教師あり学習**: アノテーションコストを削減しながら競争力のある性能を維持。
- **CNNベースネットワーク**: 入力画像から高レベルの特徴を抽出するために設計された複数の層から構成。
- **エンコーダ・デコーダネットワーク**: 欠陥セグメンテーションに利用される(U-Netなど)。
- **ピラミッドネットワーク**: マルチスケール分析のためのネットワーク。
- **アテンションベースネットワーク**: 重要な入力要素に選択的に焦点を当てる。
- **YOLOベースネットワーク**: リアルタイム物体検出(一段階検出器)。
- **その他のネットワーク**: トランスフォーマー、基盤モデル、LLM。
### 3.3 自動欠陥検出手法のアーキテクチャ
自動欠陥検出システムの典型的なアーキテクチャでは、製品がコンベヤーベルト上を適切な照明の下で移動し、産業用カメラセットが様々な角度から画像データを取得して産業用コンピュータに保存する。視覚システム処理はコンピュータ上で行われ、現代のマシンビジョンモデルがキャプチャされた画像を分析して製品の欠陥を特定する。欠陥が検出された場合、システムはコンベヤーベルトから製品を取り除く。
---
## 4. 半自動学習を用いた欠陥検出技術の有効性
マシンビジョンは工業製品の品質検査において一般的なアプローチであり、高度なコンピュータビジョンアルゴリズムと撮像技術を活用して、手動の補助を減らした、またはなしで効率的な検査を行う。
### 4.1 画像処理ベースの半自動技術
画像処理技術は、欠陥が背景から視覚的に区別できる場合に、通常の表面パターンからの逸脱を識別することで欠陥を検出する。一般的な手法にはエッジベース、ウェーブレットベース、特徴ベースのアプローチが含まれる。
主な結果:
- Parentiら:Cannyエッジ検出で超硬合金の10〜50μmの欠陥を検出
- Bukiedaら:Otsu閾値処理でガラスの亀裂を80%、暗点を60%の精度で識別
- LuとChen:ウェーブレットベースのセグメンテーションで金属表面の亀裂を99%の精度で検出
- Liuら:LBPとELMの組み合わせで冷間圧延鋼帯の欠陥検出に95%の精度
### 4.2 古典的機械学習ベースの技術
#### 4.2.1 教師あり学習
教師あり学習はラベル付きデータを使用した欠陥分類に一般的に使用される。
- **SVM**: レーザー溶接、銅帯検査、鋼鉄欠陥分類に強い性能
- **KNN**: グレーレベル共起行列特徴を使用した布欠陥検出で96%の精度
- **ランダムフォレスト**: タイヤ欠陥検出で96%の精度
- **ナイーブベイズ**: 鋼鉄表面欠陥分類で98%以上の精度
#### 4.2.2 教師なし学習
- **K-Means**: 半導体材料、布、機械故障診断に適用(布の欠陥検出で95%の精度)
- **自己組織化マップ(SOM)**: 木材表面欠陥検出に使用
#### 4.2.3 ハイブリッド手法
ハイブリッド手法は2つ以上のML技術を統合して欠陥検出と分類の性能を向上させる。
- SOMとSVMの組み合わせでウェーハの欠陥パターン検出
- 遺伝的アルゴリズムとSVMの組み合わせでアルミニウムの欠陥検出
- KNNとCNNの組み合わせでウェーハの未知クラス欠陥識別
---
## 5. DLベースの自動欠陥検出の有効性
DLはAI分野において欠陥の分類と位置特定において急速に進歩している。このセクションでは、欠陥検査におけるDLの使用を批判的に検討する。
### 5.1 欠陥分類手法
#### 5.1.1 教師あり学習(CNNベース手法)
教師ありCNNは欠陥の分類と位置特定の両方において一般的な手法として考えられている。
- LEDチップ(95%精度)、バッテリーのレーザー溶接(99.87%精度)、布(95〜98.1%精度)などに適用
- Parkら:携帯電話スクリーンカバーの引っかき傷検出で99%の精度(16,800枚のラベル付き画像)
- Dorafshan ら:コンクリートの亀裂検出で99%の精度
- Ouyangら:布の欠陥を98%の精度で検出
#### 5.1.2 教師あり学習(転移学習ベースモデル)
- Konovalenkoら:14種類のニューラルネットワークモデルを比較し、DenseNetとResNetが深さ50層で最良の汎化性能を示す
- Singhら:ResNet-101で特徴を抽出しSVMで分類、鋼鉄欠陥検出の計算量を削減
- Liuら:VGG16を修正して複雑な繊維欠陥の認識を改善、98.1%の精度
#### 5.1.3 ハイブリッドモデル
- LiとZhang:Gaborフィルタとニューラルネットワークを組み合わせ、布の非印刷欠陥を98.6%の精度で検出
- Dharmawanら:アンサンブルDL技術で99.03%の精度
- Zhouら:Double-VGGNetで鋼鉄とガラスの欠陥検出に99.44%と99.49%の精度
#### 5.1.4 教師なし学習
- GAN(Generative Adversarial Network):高次元データセットでの欠陥検出の効率化
- CycleGAN:欠陥ピクセルのアノテーションとU-Netモデルのトレーニング
- オートエンコーダベース:ウェーハ欠陥検出で97%精度、プラスチック部品の表面検査で98% AUC
#### 5.1.5 考察
教師あり学習アプローチが主流だが、教師なし学習はラベリングとアノテーションの労力を大幅に削減する。教師なしモデルの主な欠点は、教師あり学習と比較して精度と信頼性が低いことである。
### 5.2 欠陥セグメンテーション技術
#### 5.2.1 エンコーダ・デコーダベースの教師ありセグメンテーション
- **FCN(全畳み込みネットワーク)**: 効果的な学習のために最初に提案された
- **U-Net**: 生物医学画像セグメンテーションのために提案され、多くの研究で使用
- **改良U-Net**: ポリシリコンウェーハの欠陥セグメンテーションに適用
- Drass ら:U-Net + Xceptionでガラスエッジ亀裂を99%の精度で検出
主な実績:
- Liu ら:布の欠陥検出に99.6%の精度
- Bai ら:鋼鉄欠陥セグメンテーションで89.11% IoU
- Cao ら:多層特徴モジュールを使用したピクセルワイドセグメンテーションで0.85 mIoU
#### 5.2.2 ピラミッドネットワークベースの教師ありセグメンテーション
マルチスケール特徴の使用により結果を向上させる。低スケールからのリッチなコンテキスト情報と最大スケールからの高解像度を取得する。
- Lin ら:ResNet-34をバックボーンとし、小さく低コントラストな欠陥を識別(IoU:DAGM: 86.33%、PCB: 95.31%)
- Meng ら:空間的注意を持つセマンティックセグメンテーションネットワーク(IoU: 61.97%、精度: 99.51%)
#### 5.2.3 アテンションベースの教師ありセグメンテーション
- Wang ら:CSPdarkNet53-SAと空間アテンションを使用した半導体の微小欠陥検出(mAP: 78.47%)
- Liu ら:適応セグメンテーションネットワーク(AP: 91.47%、IoU: 89.52%、精度: 99.25%)
- Yang ら:溶接欠陥検出のためのアテンションベースセグメンテーションネットワーク(Dice係数: 0.854)
#### 5.2.4 教師なし学習による欠陥セグメンテーション(GANベース)
- Niu ら:CycleGANと欠陥アテンションモジュールを組み合わせた弱教師あり欠陥識別手法(AP: 99.24%、IoU: 59.43%)
- Kim ら:半導体製造データにピクセルGANベースモデルを適用
- Xu ら:GANベースの拡張で布欠陥検出の精度を大幅改善
#### 5.2.5 考察
エンコーダ・デコーダベースのネットワークが文献の中で最も高い割合を占め、U-NetはFCNよりもセグメンテーションネットワークとして優れていることが示されている。
### 5.3 欠陥検出技術
欠陥検出は通常、一段階手法(SSD、YOLOなど)と二段階手法(Faster R-CNNなど)に分類される。
#### 5.3.1 ピラミッドネットワークとYOLO
- **YOLOv4**: 空間ピラミッドプーリング構造を使用した布の小欠陥マッピング(mAP: 98%)
- **YOLOv5**: 木材欠陥でmAP 84.2%(トランスフォーマーモジュール統合)
- **YOLOv8**: 布の欠陥検出でmAP 97.4%
- **改良YOLOv8**: 鋼鉄の動的座標アテンションと多スケールブロックを使用
主要な発見:
- YOLOv8はYOLOv5より不規則な表面環境で精度が高い
- 小さく低コントラストの欠陥の検出には依然として課題がある
#### 5.3.2 アテンションベースモデルとYOLO
研究者はYOLOモデルとアテンションメカニズムを統合し、特に多スケール特徴融合によって小さな欠陥の認識を向上させている。
- Pan ら:YOLOv5+ECAアテンションでセラミック表面欠陥(ベースモデル比4.5%向上)
- Mao ら:動的ヘッドYOLOv5でガラス欠陥検出(mAP: 95%)
- Li ら:グローバルとローカルアテンションを持つ多解像度モジュール(精度: 99.50%)
### 5.4 教師なし、半教師あり、その他の学習による欠陥検出
#### 5.4.1 GANベースモデル
- Zhang ら:マルチスケール進行型GANで欠陥データ合成(mAP: 95%)
- Ou ら:StyleGAN3ベースのデータ拡張でセラミック欠陥サンプルを生成
- Yang ら:周波数シフト畳み込みオートエンコーダを用いた教師なしアプローチ(mAP: 95.19%)
#### 5.4.2 拡散ベースモデル
拡散モデルはデータ不足への対処と堅牢性の改善において、工業的欠陥検出と拡張の強力なツールとして浮上している。
- MED-AGNeT:条件付き拡散モジュールとアテンションベース検出を組み合わせ
- Tang ら:タイムステップ適応ノイズ除去を使用した布欠陥位置特定の強化
- DiffAD(MVTec-AD):AUROC 98.3%
#### 5.4.3 半教師あり学習
- Lei ら:ポアソンノイズで拡張されたハイブリッドU-Net(mAP: 98.22%)
- Song ら:CycleGANベースのドメイン転送と疑似ラベリング(mAP@0.5: 96.1%)
- DifferNet:正常サンプルのみから学習する正規化フローモデル(AUROC: 97.7%まで)
#### 5.4.4 自己教師あり学習(SSL)
- CutPaste(Li ら):パッチ置換による合成異常生成(MVTec ADで95.2% AUC)
- Zabin ら:SimCLRフレームワークで97.78%の精度(NEUデータセット)
- Xu ら:SEDDモデルで98.4% AUC
#### 5.4.5 弱教師あり学習
- Wu ら:画像レベルのアノテーションを利用したシャムネットワーク
- DefectGAN:ピクセルレベルのグラウンドトゥルースなしで81.05% IoU
- Huang ら:ネストU-Net++で99.9% AUC(MVTec)
#### 5.4.6 考察
ピラミッドネットワークと比較して、アテンションベースのネットワークは欠陥情報取得において優位性がある。教師あり手法では、セグメンテーションネットワークと同様に、検出ネットワークも大量のラベル付きデータを必要とする。半教師あり・自己教師あり手法は、限られたデータや不完全なラベリングを活用する点でより柔軟である。
---
## 6. その他のネットワーク
### 6.1 トランスフォーマーベースモデル
トランスフォーマーベースモデルは、長距離依存関係とグローバルなコンテキスト特徴を効果的に捉えることで、工業的欠陥検出に革命をもたらしている。ViT(Vision Transformer)、Swinトランスフォーマー、DETRなどのモデルが、鋼鉄、PCB、繊維の欠陥検査においてセグメンテーション、分類、検出タスクで強力な性能を示している。
主な研究:
- RT-DETR with CBAM:印刷布で58.8% AP
- MS-DETR with HiLo Attention:PCBで96.9% mAP
- LSwin Transformer:鋼鉄でmAP@0.5: 81.2%
- Memory-Augmented ViT:鋼鉄で97.22%の精度
**基盤モデルとLLM:**
SAM、CLIP、GPTなどの基盤モデルとLLMは、強力な汎化能力とゼロ・少数ショット学習への対応力により、工業的欠陥検出の有望なツールとして浮上している。
- PA-SAM:SAMの改良版で効率的な微調整と自動プロンプト生成
- AnomalyGPT:開放セット検出と多ターン対話(AUC: 95.3%)
- GPT-4:反復プロンプティングによる工業故障診断(精度: 95%)
---
## 7. 研究のハイライト
DLベース手法は主に欠陥の分類・セグメンテーション・検出に使用されている。
**統計的分析の主な知見:**
- 自動化手法(DL)が支配的(141論文)、半自動化手法は27論文のみ
- 教師あり学習が支配的(約101研究)、教師なし学習は25論文
- 自己教師あり、半教師あり、弱教師あり学習はそれぞれ20論文未満と少ない
- 検出と位置特定(セグメンテーション44本、検出57本)が合計101論文、分類は34研究
**DLモデルの分布:**
- 欠陥分類:CNNベースが37%で最多
- セグメンテーション:エンコーダ・デコーダが39%で支配的
- 検出:アテンション機構付きYOLOモデルが主流
**発展の傾向:**
- 2012〜2016年:古典的ML・画像処理が主流
- 2017年以降:CNN・転移学習が急速に採用
- 2019年頃:エンコーダ・デコーダが人気上昇
- 最近:GAN、トランスフォーマー、半教師あり・弱教師あり学習が注目
---
## 8. 未解決の課題と今後の研究方向
### 8.1 産業環境におけるデータ前処理
データセット収集における主な課題:
- **データクリーニング**: 産業から画像を収集する際、不均一な照明やカメラノイズなどの制限がある。ぼかし、不明確な欠陥、ノイズなどの問題に対処する前処理が必要。
- **データラベリング**: 大量の人手を必要とする。特に一部のドメインでは産業がデータを機密扱いにしているため、データプライバシーによる課題が大きい。自己教師あり学習(SSL)はデータセットラベリングの課題への解決策として提案されている。
### 8.2 深層学習モデル:ネットワーク選択とパラメータチューニングの精緻化
提起された研究課題:
**RQ1:小規模データセットでDLモデルを効果的に活用するには?**
工業環境での自動欠陥検出における根本的な課題は、適切にラベル付けされたサンプルに比べて欠陥データの希少性である。これを軽減するために、正則化、早期停止、シフト・フリップ・ズームを含むデータ拡張などの技術が適用される。
**RQ2:特定のタスクで最適な性能のためにどのハイパーパラメータをチューニングする必要があるか?**
適切なネットワークアーキテクチャの選択と層数、ストライド、フィルターサイズ、バッチサイズ、最適化器と学習率の調整などのハイパーパラメータの微調整は、データセットサイズや検出精度などの要因によって影響を受ける重要なステップである。
### 8.3 欠陥検出モデル:信頼性と説明可能性の探求
提起された研究課題:
**RQ3:ブラックボックスモデル(DLなど)の決定において信頼性をどのように確保するか?**
**(a) 説明可能なAIによるモデルの信頼性:**
CNNの説明可能性はブラックボックスの性質により困難である。説明可能なAI(XAI)の研究が、AIシステムの信頼性と透明性を高めるために進んでいる。顕著性マップ、Grad-CAMなどのXAI手法がCNNの決定を解明するために探求されている。
**(b) DLベースモデルの不確実性推定:**
不確実性定量化(UQ)は計算リソース面での限界と、トポロジーと最適化プロセスの変更を必要とする。Abbaszadeh Shahriらは、最適化プロセスを変更せずに不確実性を評価できるARDCW(自動ランダム非活性化接続重み)という新しい解決策を提案している。
**(c) DNNの信頼性を高めるためのキャリブレーション技術:**
DNNは過信という問題を抱えていることが多い。この課題に対処するために、温度スケーリング、ベータキャリブレーション、プラットスケーリング、アイソトニック回帰、行列スケーリング、ベクトルスケーリングなどのさまざまな確率的・測定ベースの手法が提案されている。
**RQ4:モデルを再トレーニングするためにどれほどのデータが必要か?**
HITLA(ヒューマン・イン・ザ・ループ分析)は、人間の専門知識と知識をDCNNに統合することでDLベースモデルの出力を洗練・評価する。HITLAでは、アクティブラーニング、反復再トレーニング、信頼スコアリングなどのアプローチが含まれる。
### 8.3.3 学習時間、推論、精度と継続的モニタリングの課題
DLベースモデルの産業的欠陥検出への展開において最も重要な課題の一つは、推論速度とトレーニング時間のバランスである。
- 高度なモデル(改良YOLOv8など)は最大98.36% mAPを達成するが、エッジデバイスや高速生産ラインなどの低レイテンシ設定での使用を制限する大きな計算リソースを必要とする
- 継続的なモニタリングと人間のフィードバックが新しいデータでのモデル性能評価に不可欠
- 転移学習と継続学習の組み込みが、現実世界の欠陥検出システムで堅牢で応答性の高いモデルを維持するための鍵
### 8.4 将来の産業応用
研究が最も盛んな分野:
- **布**:14〜18論文(NEU-DET、DAGM、TILDAなどのベンチマークが推進)
- **鋼鉄**:12〜15論文
- **木材**:10〜12論文
- **金属、セラミック、ガラス**:5〜6論文
- **コンクリート、プラスチック、バッテリー、PCB**:2〜3論文
**探求が不十分な分野:**
- アート紙(1論文のみ)とトレーディングカード(3論文)が深刻に未開拓
- これらの分野にはベンチマークデータセットがなく、深層学習の進歩を妨げている
**トレーディングカード品質評価の基準:**
- コーナー欠陥:カード角の不規則性・損傷
- エッジ欠陥:摩耗・凹みによるエッジの不完全さ
- 表面欠陥:引っかき傷、傷、マーキング
- センタリング測定
**布の欠陥検出:**
繊維製造の品質保証において重要な役割を果たす。テキスタイル工場では、肉眼による人間の集中的な品質検査を自動検査システムに置き換えることへの需要が高まっている。
---
## 9. 結論
AIとDL技術の最近の進歩により、欠陥検出における工業製品への成功した応用が生まれている。産業シナリオの特殊性と様々な種類の材料により、欠陥検出問題を解決するための適切なDLモデルを見つけることは非常に困難である。
本論文は150以上の科学的貢献を研究することで、欠陥検出と分類の方法論の包括的な研究を提供している。
**主な知見:**
1. **手動方法**は人間の判断と事前の実験セットアップに完全に依存
2. **半自動化アプローチ**には限界があり、異なる材料のさまざまな種類の欠陥を識別できない
3. **MLとDL**はあらゆる材料のあらゆる種類の欠陥を検出できるとして人気を得ている
4. **古典的ML手法**はDL手法より効率が低いことが多く、DL技術の主な課題は大規模なトレーニングデータセットへの依存
5. **エンコーダ・デコーダネットワーク**がセグメンテーションで最も顕著な技術
6. **アテンションメカニズムを持つYOLOモデル**が検出タスクで支配的
7. **LLM、基盤モデル、少数ショット学習、トランスフォーマーベース手法**などの新興アプローチが最近の文献で注目を集めている
最終的に、自動化検査の需要は学術界と産業界の両方で引き続き高まることが予測される。
---
## 著者貢献声明
- **Lutfun Nahar**: 可視化、ソフトウェア、調査、データキュレーション、原稿執筆、検証、方法論、形式分析、概念化
- **Mohammad Awrangjeb**: 方法論、資金獲得、概念化、監督、形式分析、可視化、レビュー・編集、検証、プロジェクト管理、調査
- **Md. Saiful Islam**: 検証、プロジェクト管理、調査、形式分析、可視化、方法論、資金獲得、概念化、レビュー・編集、監督
---
## 競合利益の宣言
Lutfun Naharは、Media8 Pty. Ltd.から財政的支援を受けたことを報告している。
---
## データ可用性
本論文で説明された研究にはデータは使用されていない。
---
## 主要参考文献(抜粋)
1. Peng, Y. ら, レーザースペックルせん断干渉に基づく内部欠陥の深さ測定, Opt. Laser Technol. 92 (2017) 69–73.
2. Rao, X. ら, 電気放電ダイヤモンド研削によって誘発された反応焼結炭化ケイ素の表面・表面下損傷, Int. J. Mach. Tools Manuf. 154 (2020) 103564.
5. Pernkopf, F., ベイジアンネットワーク分類器を使用した生鋼ブロックの表面欠陥検出, Pattern Anal. Appl. 7 (2004) 333–342.
21. Shanmugamani, R. ら, コンピュータビジョンと機械学習を使用した銃身表面欠陥の検出と分類, Measurement 60 (2015) 222–230.
74. Ronneberger, O. ら, U-net: 生物医学画像セグメンテーションのための畳み込みネットワーク, MICCAI 2015, pp. 234–241.
75. Lin, T.Y. ら, 物体検出のための特徴ピラミッドネットワーク, CVPR 2017, pp. 936–944.
80. Redmon, J. ら, YOLO: 統一されたリアルタイム物体検出, CVPR 2016, pp. 779–788.
82. Ren, S. ら, Faster R-CNN: 領域提案ネットワークによるリアルタイム物体検出, IEEE TPAMI 39 (2015) 1137–1149.
*(完全な参考文献リストは原論文を参照してください)*
---
## 著者略歴
**Lutfun Nahar** は2010年と2011年にチッタゴン大学でコンピュータ科学・工学の学士(優等)と修士を取得した。2013年にチッタゴン国際イスラム大学に入職し、2017年から2022年まで助教授として勤務。現在、オーストラリアのグリフィス大学情報通信技術学部でディープオブジェクト品質評価の博士課程に在籍中。研究分野は機械学習、画像処理、人工知能。
**Mohammad Awrangjeb** はオーストラリアのグリフィス大学情報通信技術学部の上級講師。2008年にオーストラリアのモナッシュ大学でコンピュータ科学の博士号を取得。研究分野はリモートセンシングデータからの物体抽出とモデリング、マルチメディアセキュリティと画像処理、リモートセンシングデータの融合。
**Md. Saiful Islam**(IEEE上級会員)はオーストラリアのニューカッスル大学情報物理科学学部の上級講師。2014年2月にオーストラリアのスウィンバーン工科大学でコンピュータ科学・ソフトウェア工学の博士号を取得。研究分野はデータ管理、人工知能、ビッグデータ、セキュリティアナリティクス。
---
*本翻訳は原論文「AI-enabled defect detection in industrial products: A comprehensive survey, key insights and future research challenges」(Advanced Engineering Informatics 69 (2026) 104067)の全文日本語訳です。*
*© 2025 The Authors. Published by Elsevier Ltd. CC BY license (http://creativecommons.org/licenses/by/4.0/).*





