IoT異常検知：予期せぬ事態を予測するためのデータサイエンス（後編）

データ分析 2020.2.12

著者：Rosaria Silipo (KNIME)

原文：https://www.knime.com/blog/anomaly-detection-techniques-defining-normal

【手法解説】IoTの異常動作を検知するアルゴリズム｜オートエンコーダと機械学習による故障予知（後編）

本記事は後編です。異常検知の基本的な考え方や製造業における課題については、前編：IoT異常検知入門をご覧ください。

「正常データ」のみで疑わしい異常動作を識別する

異常検知の課題に対する解決策は、長年にわたって数多く提案されてきました。
様々な手法に取り組む前に、大前提を再認識しましょう。それは、「異常が発生していない状態（正常）のトレーニングセットしか手元にない」という状況で、いかにして疑わしい事象や動作を特定するか、という点です。

ここでは、「正常」なイベントのみで構成されるデータセットを用いた、3つの主要なアプローチを解説します。

1. 統計的アプローチ（管理図など）

最も基本的かつ高速な手法です。トレーニングセットで計算された統計的分布の範囲外にあるものはすべて「異常動作」と見なされます。

代表的な例は「管理図（Control Chart）」です。
各特徴量の平均および標準偏差を計算し、「平均値 ± k × 標準偏差（σ）」をしきい値として定義します。係数「k」は通常1.5～3.0の間で設定します。

運用時にこのしきい値を超えたデータポイントは、異常イベントの候補となります。
この手法は実装が簡単で計算コストも低いですが、単純な閾値監視に近いモデルであるため、データの複雑な相関関係に潜む「微妙な異常」は見逃してしまう可能性があります。

2. クラスタリング（教師なし学習）

異常データ（ラベル）が全くない場合、「クラスタリング」が有効な選択肢となります。

このアルゴリズムは、正常なトレーニングデータからいくつかの「クラスター（データの塊）」を作成します。
運用時に、新しいデータポイントと既存クラスター間の距離が計算され、その距離が所定のしきい値を超える場合、そのデータは「どのグループにも属さない異質なもの＝異常」と判断されます。

距離測定や集約ルールに応じて、k-means法やDBSCANなど様々なアルゴリズムが利用可能です。
ただし、一般的なクラスタリングは時間的な順序を考慮しないため、時系列データの変化（トレンドや周期性）を捉えるには工夫が必要です。

3. 教師あり機械学習とオートエンコーダ

通常、「教師あり学習」には「正常」と「異常」両方のラベルが必要ですが、工夫次第で異常検知にも適用可能です。
特に、正常データのみで学習を行い、運用時に「予測とのズレ」を評価するアプローチが主流であり、製造業の故障予知でもよく用いられます。

アプローチA：オートエンコーダ（Autoencoder）

ディープラーニングを用いた強力な手法です。
オートエンコーダは、「入力されたデータを一度圧縮し、出力層で元のデータを再現（復元）する」ようにトレーニングされます。

正常データ：モデルが学習済みのため、綺麗に再現されます（入力と出力の差が小さい）。
異常データ：モデルが見たことのないパターンのため、うまく再現できません（入力と出力の差＝再構成誤差が大きくなる）。

この「再構成誤差」をしきい値と比較することで、異常を検知します。
多変量データの複雑な関係性を捉えるのに適しており、静的なデータだけでなく、センサーデータのスナップショット分析にも極めて有効です。

アプローチB：時系列予測アルゴリズム

過去のデータから「次の瞬間の値」を予測するモデルを作成します（ARIMAモデルやLSTMなど）。

モデルは、「正常」な状態であれば「次はこうなるはずだ」という予測を出します。
しかし、機械が異常な挙動（振動の変化など）をし始めると、予測値と実際の値に大きな乖離が生じます。
この予測誤差（Residual）をモニタリングすることで、予期せぬ異常動作の発生をいち早く捉えることができます。

▼ KNIMEで「異常検知」を自動化・ノーコード実装しませんか？

データ分析プラットフォーム「KNIME」を使えば、オートエンコーダやクラスタリングといった高度な実装も、Pythonなどのコードを書くことなく、ノード（アイコン）をつなぐだけで完了します。
さらにKNIME Business Hubを活用すれば、作成した異常検知モデルをサーバー上で定期実行し、異常発生時に現場担当者へ自動通知するシステムもシームレスに構築可能です。

関連ワークフロー：Anomaly Detectionサンプル集 (KNIME Hub)
お問い合わせ：自社のIoTデータでのPoCや導入相談はこちら

ブログ

IoT異常検知：予期せぬ事態を予測するためのデータサイエンス（後編）

【手法解説】IoTの異常動作を検知するアルゴリズム｜オートエンコーダと機械学習による故障予知（後編）

「正常データ」のみで疑わしい異常動作を識別する

1. 統計的アプローチ（管理図など）

2. クラスタリング（教師なし学習）

3. 教師あり機械学習とオートエンコーダ

アプローチA：オートエンコーダ（Autoencoder）

アプローチB：時系列予測アルゴリズム

▼ KNIMEで「異常検知」を自動化・ノーコード実装しませんか？

KNIME は無料でダウンロードが可能です。
ぜひお試しください。

ブログ

IoT異常検知：予期せぬ事態を予測するためのデータサイエンス（後編）

【手法解説】IoTの異常動作を検知するアルゴリズム｜オートエンコーダと機械学習による故障予知（後編）

「正常データ」のみで疑わしい異常動作を識別する

1. 統計的アプローチ（管理図など）

2. クラスタリング（教師なし学習）

3. 教師あり機械学習とオートエンコーダ

アプローチA：オートエンコーダ（Autoencoder）

アプローチB：時系列予測アルゴリズム

▼ KNIMEで「異常検知」を自動化・ノーコード実装しませんか？

KNIME は無料でダウンロードが可能です。 ぜひお試しください。

KNIME は無料でダウンロードが可能です。
ぜひお試しください。