DUICUO

10個のオープンソース産業検査データセットの集大成

1. 天池アルミニウムプロファイルの表面欠陥データセット

コンペティションデータセットには、実際の製造工程で発生した欠陥のあるアルミニウムプロファイルの監視画像10,000枚が含まれており、各画像には1つ以上の欠陥が含まれています。機械学習用に提供されるサンプル画像により、画像に含まれる欠陥の種類が明確に識別されます。

2. Kylbergテクスチャデータセット

実際の生地生産工程では、様々な要因により、シミ、穴、糸くずなどの欠陥が発生する可能性があります。製品の品質を確保するためには、生地の欠陥検査が不可欠です。生地の欠陥検査は、繊維産業における生産・品質管理の重要な部分です。現在、手作業による検査は主観的な要因の影響を受けやすく、一貫性に欠けています。さらに、強い光の下で長時間作業を行うことは、検査員の視力に大きな影響を及ぼします。

布地の欠陥は多種多様で、その形状も多様であり、観察と識別が困難なため、インテリジェントな布地欠陥検出は長年にわたり業界を悩ませてきた技術的なボトルネックとなってきました。このデータは、繊維産業で使用される布地の様々な重要な欠陥を網羅しており、各画像には1つ以上の欠陥が含まれています。データには無地と柄物の両方が含まれており、無地の布地の画像は約8,000枚、柄物の布地の画像は約12,000枚です。

3. ノースイースタン大学ストリップ鋼表面欠陥データセット

このデータセットには、介在物、傷、凹んだ酸化スケール、ひび割れ、孔食、パッチの6種類の欠陥それぞれについて、300枚の画像が含まれています。画像のサイズは200×200ピクセルです。データセットには分類と物体検出の両方のコンポーネントが含まれていますが、物体検出のアノテーションには若干の誤りがあるため、ご注意ください。

4. セベルスタルストリップ欠陥データセット

このデータセットは、鋼板の表面欠陥を4種類収録しています。トレーニングセットには12,568枚の画像が含まれ、テストセットには5,506枚の画像が含まれています。画像サイズは1600×256です。

5. UCIストリップ欠陥データセット

このデータセットには、7種類の鋼板欠陥が含まれています。画像データの代わりに、機械学習プロジェクトに使用できる鋼板欠陥の特徴データポイントが28個含まれています。7種類の鋼板欠陥とは、装飾、Z傷、K傷、シミ、汚れ、凹凸、その他の欠陥です。

6. DAGM 2007データセット

このデータセットは、主にテクスチャ背景における様々な欠陥を対象としており、弱教師あり学習データとして機能します。データセットは10個で構成され、最初の6個は学習データセット、最後の4個はテストデータセットです。各データセットには、1,000枚の「欠陥なし」画像と150枚の「欠陥あり」画像がグレースケール8ビットPNG形式で保存されています。各データセットは、異なるテクスチャモデルと欠陥モデルによって生成されています。「欠陥なし」画像は欠陥のない背景テクスチャを示し、「欠陥なし」画像は背景テクスチャ上にラベル付けされた欠陥を1つだけ示しています。すべてのデータセットは、ランダムに等サイズの学習用サブセットとテスト用サブセットに分割されています。弱ラベルは楕円で表され、大まかに欠陥領域を示します。

7. 磁気タイル欠陥データセット

中国科学院自動化研究所の研究グループが収集したデータセットは、論文「磁性タイル表面欠陥の顕著性」のデータセットです。このデータセットには、6つの一般的な磁性タイル欠陥の画像が含まれており、セマンティックセグメンテーションによる注釈が付与されています。

8. RSDDs レール表面欠陥データセット

RSDDsデータセットには2種類のデータセットが含まれています。1つ目は、高速車線から撮影されたタイプIのRSDDsデータセットで、67枚の難解な画像が含まれています。2つ目は、一般/重量輸送車線から撮影されたタイプIIのRSDDsデータセットで、128枚の難解な画像が含まれています。

両方のデータセットの各画像には少なくとも 1 つの欠陥が含まれており、背景は複雑でノイズが多いです。

RSDD データセット内のこれらの欠陥は、軌道表面検査の分野における複数の専門的な人間観察者によってフラグが付けられています。

9. KTH-TIPSテクスチャ画像データセット

KTH-TIPSは、様々な照明、角度、スケールで撮影された様々な表面テクスチャの画像を含むテクスチャ画像データセットです。データセットには、サンドペーパー、アルミホイル、フォーム、スポンジ、コーデュロイ、リネン、綿、黒パン、オレンジピール、ビスケットの10のカテゴリが含まれています。

10. プリント基板(PCB)欠陥データセット

これは北京大学が公開した合成 PCB データセットで、検出、分類、登録タスク用の 1386 枚の画像と 6 種類の欠陥 (穴の欠落、ネズミの噛み跡、開回路、短絡、漂遊配線、偽銅) が含まれています。