著者:Rosaria Silipo (KNIME)
原文:https://www.knime.com/blog/iot-anomaly-detection-101-data-science-to-predict-the-unexpected
データサイエンスおよび、人工知能(AI)技術は、長年にわたって次のような様々な種類のイベントを予測または、検出するために適用されてきました。
“機械学習のユースケース” でWeb検索を行うと、さまざまなデータドメインでイベントグループを検出したり予測する機械学習(ML)アルゴリズムを解説するページが検出されます。
一般的に機械学習ベースのアプリケーションを成功させるための鍵は、十分なトレーニングを行うことです。
トレーニング中の機械学習モデルには、各イベントグループについてトレーニングするのに十分な数の使用可能な例が必要です。
これは、データサイエンスプロジェクトの重要なポイントの1つです。
機械学習アルゴリズムを適用した場合、部品の劣化を予測したり、サイバーセキュリティの侵害を検出することができます。
データサイエンス手法は「IoT」や「サイバーセキュリティ」の分野で既に実績があります。たとえば、「IoT」での機械学習の典型的な使用法は需要予測です。
事前に数値を把握しておくと計画が立てやすくなります。
ヘルスケア分野でも 「IoT」 でデータサイエンスを利用することが一般的です。
バイタルサインを監視するアプリやデバイスが多くあり、リアルタイムに大量のデータを取得して健康状態の評価に使用することができます。
「IoT」のもう1つの一般的な利用法は「故障予測」です。機械の部品がメンテナンスを必要とするかどうか、いつ必要になるかを予測することは、最適なメンテナンススケジュールを計画することができ、機械の寿命を延ばすことができます。
一般的に機械部品が非常に精巧で高価であることを考えると、これはとても大きなメリットです。この方法は、データセットが利用可能な場合に効果的であり、データセットにラベルが付いている場合にはさらに効果的です。
ラベル付きデータは、イベントを記述する数値の各ベクトルが、特定のイベント・クラスに事前に割り当てられていることを意味します。
「異常検知」はデータサイエンスの専門分野です。異常とは極めてまれな事象で過去データや現在の知識では想定できてないイベントです。データサイエンスにおいて解決に導くのが最も難しいユースケースの一つです。
「異常検知」の難しいところは、事例がなく事前に予測もできないイベントを探すことです。絶望的に思えるかもしれませんが、この状態は珍しい事ではありません。
これらはラベル付きデータ例に基づいた従来のデータサイエンスアプローチは適用できません。この問題の解決策は、事例から学習する通常のアルゴリズムの応用です。
IoTデータの場合、信号の時系列は機械コンポーネント上またはその周辺に最適に配置されたセンサーから生成されます。時系列データは時間の経過に伴う変数の値のシーケンスです。変数はオブジェクトの機械的特性を表し、一つ以上のセンサーを介して測定されます。
通常、機械部品は正常に機能しており破損例はほぼゼロです。これは、故障が発生して機械全体を危険にさらす前に廃棄・交換されることが多いためです。メカニカルチェーンで重要な役割を果たす機器の場合は特に当てはまります。
「IoT」で重要なのことは、実際に発生する前に障害の可能性を予測することです。そうすることで他の部品を危険にさらすことなく、ライフサイクル全体を通してメカニカル部品を使用できます。故障の兆候を予測するこのタスクは「故障予測」における「異常検知」呼ばれます。
詳細はこちらを参照してください。
このサイトでは、クッキー (cookie)などの技術を使用して取得したアクセス情報等のユーザ情報を取得しております。
この表示を閉じる場合、プライバシーポリシーに同意いただきますよう、お願いいたします。