様々な業界で活用されている事例を紹介いたします。
安全データシート(SDS)は、化学品メーカーが化学品の危険性情報を化学品取扱者に伝えるための標準化された文書です。一般的に、化学物質の特性、健康および環境への危険性、保護手段、および化学物質の保管、取り扱い、および輸送のための安全上の注意事項が含まれています。
化学物質取扱者は、関心のあるセクションを読むことによってこれらから情報を抽出しますが、健康・安全・環境管理者が適切なリスク管理計画を策定するために、社内で使用されているすべての化学物質に関する情報を収集する必要がある場合、この「マニュアル」ワークフローは有効ではありません。KNIMEワークフローは、何千ものSDSからハザード情報を自動的に抽出することを可能にします。
様々なソース、顧客、プロバイダーからのSDSが収集されます。ユーザーは、単一のPDF、PDFのライブラリ、またはPDFを含むフォルダのいずれかをアップロードし、更新を要求されたすべてのフレーズのリストを含むExcelファイルをKNIMEワークフローにアップロードします。
Text miningノードは、各ファイルを構成するすべての文を抽出するために、Tika Parserの結果に適用されます。文字列や正規表現操作を使ったすべての文は、Chemical Abstracts Service (CAS)番号、製品名、すべてのリスクフレーズを検索して分析されます。
トライ&キャッチ構文は、入力ファイルの大きなバリエーションに対応しています。結果は、ファイル名、製品名、各ドキュメントで検索されたすべてのCAS番号、および検索されたすべてのフレーズを報告し、定義されたユーザーリストと照合されます。
オープンソースのKNIME Analytics Platformは、このタスクを高速化するだけでなく、ヒューマンエラーのリスクを低減します。Tika Parserノードは各ファイルからのメタ情報の取得を可能にし、try/catch errors構造はワークフローエラーを効果的に回避し、Javaスニペットの正規表現コードはPDFからCAS番号を分離します。
この活用事例は、KNIME社の信頼できるパートナーであるS-IN Soluzioni Informatiche社が執筆しました。
このサイトでは、クッキー (cookie)などの技術を使用して取得したアクセス情報等のユーザ情報を取得しております。
この表示を閉じる場合、プライバシーポリシーに同意いただきますよう、お願いいたします。