著者:Vladimír Löffler,Barbora Stetinova
原文:https://www.knime.com/blog/data-science-in-the-automotive-industry
ドイツのとある自動車会社では、データサイエンスがうまく活用されています。
機械学習ソリューションを活用することで、データドリブンのプランニングと自動化されたデータ処理を可能にし、時間とリソースを節約して、従業員がより付加価値の高い活動に集中できるようにしています。
私たちは、自動車のロックシステムを製造する自動車会社で働いていますが、この業界でデータサイエンスを適用した経験を報告できることを大変嬉しく思います。
本社はドイツのデュッセルドルフ近郊にありますが、1992年にチェコ共和国に新工場を設立し、財務、IT、研究開発、販売などのサービスを提供しています。
私たちは、2018年にITチームの役割の中でデータサイエンスを構築し始めました。
最初のタスクは、機械学習の適用に焦点を当てました。
次項より、具体的に事例を紹介します。
目次
チェコ工場の元CEOは、キャパシティの問題を解決する必要がありました。
同社はキャパシティプランニングに問題を抱えていました。
オペレーターの数が足りないこともあれば、マネージャーの数が多すぎることに気づき、何名かが帰らなければならないこともありました。
これは、チェコ工場にいる約1500人のオペレーターの計画が、マネージャーの経験に基づいて手作業で行われていたためでした。
CEOは、オペレーターの生産能力をデータに基づいて合理的に判断できるようにする必要があると考えたのです。
製造部門の担当者と数回のミーティングを行った後、私たちはオペレーターの数に影響を与える特徴を特定しました。
例えば、売上高、ダウンタイム、病気、従業員の離職率などがあります。
これらの特徴と、3年間の各月のオペレーター数を比較しました。
データサイエンスのプロセスにKNIME Analytics Platformを使用し、重回帰を適用して生産時のオペレーターの数を予測する新しいモデルを学習しました。
予測ツールでモデルをテストしたところ、高い精度を示すR2が92%という結果が得られました。
図1:KNIMEワークフローでの線形回帰による生産時の作業者数の予測
予測を検証するために、新年度の実際の作業者数に加えて、売上高の計画値やその他多くの機能を持つ4カ月分のデータをすでに入手していました。
学習したモデルを適用したところ、96%以上の精度を得ることができました。
このデータサイエンス・ソリューションにより、当社はオペレーターの生産能力を効果的に計画できるようになりました。
計画と意思決定はデータに基づいて行われ、オペレーターの実際の数と必要な数の間に大きなギャップが生じないことが保証されます。
※VAT:Value Added Tax(付加価値税)
自動車業界では、製品ごとに一度だけ注文が出され、それが数年にわたって製造されます。
この一度限りの注文の生成は、生産された部品の国、受け取った部品の国、異なる在庫や物流センターのある国など、様々なパラメータに基づいて行われます。
注文には、VAT コードが自動的に割り当てられます。
このコードは、VAT の値を % で示しています。
しかし、時間の経過とともにパラメータ(国など)が変更されることがありますが、システムのVATコードはそれに応じて更新されません。
このため、VATが正しくないケースがあり、機関に支払うVATの金額も正しくないことがありました。
最終的にはペナルティーを支払うことになります。
ここでは、データサイエンスを適用することで、このプロセスをより正確にする方法を見てみましょう。
データサイエンスを導入する前は、1人の経理担当者が毎月3日かけてVATコードを手作業で確認し、必要に応じて修正していました。
この経理担当者の時間を節約し、残業代の支払いを避けるために、私たちは機械学習モデルを適用し、1年前の学習データ(10万件の観測データ)に基づいて、毎月のVATコードを予測しました。
私たちのソリューションは、VATコードを予測するだけでなく、実際のVATコードと予測されたものを比較するために適用されました。
機械学習アルゴリズムのモデル化には、分類問題に用いる決定木を用いることにしました。
図2:KNIMEのワークフローにおける分類問題の決定木
このモデルの精度は当初80%程度でした。
一方で、過去のデータの中に、一度も修正されていない誤ったVATコードを持つ1,000件以上のデータを発見しました。
これらのVATコードを入力テーブルで手動で修正し、最終的に90%の精度を達成しました。
現在、このワークフローは毎月新しいデータで実行され、注文パラメータに基づいてVATコードを予測し、システムに設定された実際のVATコードと予測されたものを比較の上、修正が必要な場合は修正して運用しています。
このデータサイエンス・ソリューションにより、当社は時間を節約し、金融機関とのトラブルや、誤ったVATの納付額に対するペナルティの支払いを回避することができます。
KNIME Analytics Platformは、データを分析し、状況の予測、データの分類、結果の可視化などの機械学習技術を生み出す素晴らしいツールです。また、データ分析の自動化にも非常に役立ちます。
私たちの経験によると、データ操作のための自動化されたワークフローは、自動車業界の企業のリソースを大幅に削減し、そのリソースをより付加価値の高い活動に使用することができます。
COVID-19パンデミックは新たな課題をもたらしましたが、データ処理も例外ではありませんでした。
2020年春は、ほとんどの企業にとって、仕事の原則の変更、労働時間の短縮、そして国庫補助を意味していました。
国庫補助の分野では、産業に対する国庫補助を計算するために、新しいタイプの労働単位を報告する必要性が生じました。
人事部は特別な表を作成し、マネージャーは様々な国家支援モデルの下での従業員の存在を週単位で報告しなければなりませんでした。
この表は急いで作成されたもので、誰も標準化を考えていなかったのです。
その結果、最初の1週間で、何千行ものテーブルが40個、人事部に集まりました。
2人の同僚がこれらの表を8時間かけて処理しました。
テーブルの標準化、マージ、修正、最終報告書への変更には、人事部の専門家による16時間の有資格作業が必要でした。
「Covidレポート」の全プロセスには数週間かかるという事実から、人事部はIT専門家に助けを求めました。
簡単な分析の後、KNIME Analytics Platformを使ったソリューションが設計されました。
レポート処理時間が16時間から45分に短縮
Excelテーブルのデータを標準化してマージし、データの例外やエラーを処理し、勤怠データベースの2つのコントロールテーブルにリンクするワークフローのプロトタイプを作成するのに要した時間は、わずか6時間でした。
さらに、デバッグと検証に2時間を要しましたが、最終的なワークフローのスピードテストでは、レポートの総処理時間は約45分でした。
その後、このワークフローは6ヶ月間、月に4〜6回使用されました。
経験値の増加に伴い、ワークフローの最適化に成功し、処理データ量が毎週増加したにもかかわらず、自動化されたワークフローの実行時間を20分まで短縮することができました。
データ処理の自動化という分野におけるKNIME Analytics Platformの強みにより、当社は半年間で40~50人日を削減することができました。
これは素晴らしい結果だと思います。
自動車業界では、SAPは一般的に使用されているエンタープライズERPシステムです。
豊富なレポート機能と自動化機能を備えています。
しかし、SAPからのデータを定期的にダウンロードし、修正し、他のデータ(サプライヤー、顧客、当局などからのデータ)と組み合わせ、評価していないわけではありません。
これは通常、Microsoft Excelを使って行われます。
従業員はSAPでレポートを実行し、必要なデータをフィルタリングして、MicroSoft Excelシートに保存します。
ここで、手動によるデータ操作と必要な分析が行われます。
SAP ERPから直接データをアップロードする方法は、制限されています。
ここでもKNIME Analytics Platformが役に立ちます。
このプラットフォームは、SAP ERPからのデータを自動化ワークフローで使用するためのいくつかの方法を提供します。
オプション1:Theobald Xtract Universal
KNIME 4.2の時点で、「SAP Reader(Theobald)」ノードを使用することが可能で、これはTheobald Softwareの素晴らしいソリューションと連携しています。
Xtract Universalコンソールで、必要なテーブルへの結合を準備し、その結果をSAP Reader (Theobald) ノードで使用します。
ノードは必要なデータを返し、あなたは自動化ワークフロー内でそれを扱うことができます。
図3:自動車業界におけるデータサイエンス SAP TCURRテーブルからの現在の為替レートの抽出
オプション2: Webサービスを使用したSAPからのデータ抽出
このオプションは、SAPのWebサービスを利用します。
基本的には、SAPでRFC関数を用意し、それを使ってWebサービスプロバイダを作成します。
次に、KNIME ワークフローで「POST Request」ノードを使用し、SAP Web Service の通信パラメータを設定します。
適切に設定されたノードは、SAPを呼び出してデータを要求し、XML形式でKNIMEワークフローに返します。
その後、「XPath」ノードを使用してXMLメッセージをテーブル形式に変更します。
また、XMLからJSONへの変換を行い、さらにテーブルに加工することもできます。
図4:リリースを待つ発注書の数を監視するために使用されるSAP Webサービス
オプション3:Pythonソースノードから呼び出されるRFC関数を使用してSAPからデータを抽出する
このソリューションには、SAP NW SDKとSAP Logonのローカルインストール、および「KNIME Python Integration」 extensionのインストールが必要です。
これらのツールをインストールするために必要な労力は、本当に価値のあるものです。
Pythonスクリプトを使用すると、SAPのあらゆるRFC関数を使用して、自動化ワークフローのためにSAPからデータを取得することができます。
図5:SAPのテーブルMARA – 品目マスターデータからデータを取得するPythonコード
機械学習とデータ処理の自動化は、自動車業界の企業に競争上の優位性と大幅なコスト削減をもたらすだけでなく、人々がより大きな付加価値を持つ興味深い仕事に集中させてくれます。
機械学習ソリューションだけでなく、データのダウンロード、結合、標準化、分類、評価、修正などの反復的な作業も、KNIME Analytics Platformのような自動化ツールで効率的に処理することができます。
私たちが作成したワークフローのうち、2つのワークフローをご自身でお試しいただけます。
これらのワークフローはKNIME Hubで公開されており、ダウンロードして試し、ご自身の要件に合わせて調整することができます。
なお、ワークフローの中では、機密情報は「xxx」に置き換えられており、前提条件の設定方法についてはワークフローの中で説明しています。
Web Service Call ワークフローのダウンロードはこちら
Python SAP RFC Call ワークフローのダウンロードはこちら
このサイトでは、クッキー (cookie)などの技術を使用して取得したアクセス情報等のユーザ情報を取得しております。
この表示を閉じる場合、プライバシーポリシーに同意いただきますよう、お願いいたします。