先日、KNIME Analytics Platformがバージョンアップされました!
本記事では、バージョンアップで追加された新機能や改善点を紹介いたします。
最新バージョンのKNIME Analytics Platform 5.3 はこちらからダウンロードいただけます。
※「self-extracting archive」または、「zip archive」形式のファイルを選択いただくことで、同一環境に複数のKNIME Analytics Platformをご利用いただけます。
KNIMEの目標は、データとAIにおける最新の進歩を誰もが利用できるようにするオープンソースプラットフォームを構築することです。
KNIME Analytics Platform 5.3のリリースでは、デバッグを容易にする新しいワークフローモニター、より速いナビゲーションのための改訂されたホームタブ、スプレッドシートの数式のような方法でテキストや数値を扱うための新しい式ノードなど、ユーザーから要望の多かった多くの機能を提供することで、コミュニティへのコミットメントを強化し続けています。
我々はまた、GenAIの実装が多くの組織にとって最優先事項となっていることも知っています。。しかし、安全管理とGenAIの価値の迅速な把握の適切なバランスを見つけることは困難です。出力品質、データプライバシー、コンプライアンスなどのリスク管理に関する継続的な不確実性により、多くの企業や個人がGenAIの拡張に慎重になっています。
このリリースは、データチームが最新のGenAIテクノロジーで安全に作業できるよう支援する新機能で、これらの懸念のいくつかに対処します。これらの機能は、GenAIのリスクを低減しながら、GenAIの採用を促進し、GenAIプロジェクトをパイロットから本番へと移行させることができます。新機能は、GenAIやその先を含む最新技術の採用を支援するKNIMEのコミットメントを反映しています。
以下は、このリリースに含まれる各主要アップデートの詳細です。
目次
KNIME Analytics PlatformのUIは、各リリースと同様、コミュニティからのフィードバックに基づいて改良を続けています。
データのビジュアライゼーションが、ノードモニターを通してユーザーインターフェースに直接表示されるようになりました。これにより、新しいウィンドウを開く代わりに、ノードが選択されたときにボトムパネルですぐにデータを視覚化され、確認することができます。
ワークフローをデバッグする明確な方法を持つことは、コミュニティから頻繁に要求される機能です。KNIME Analytics Platform 5.3の新しいワークフローモニターは、リアルタイムのエラーや警告をサイドパネルに表示することで、ワークフローをより速く簡単にデバッグすることができます。
ワークフローモニターは、エラーや警告のあるノード、コンポーネント、メタノードをハイライト表示し、対応する矢印ボタンをクリックしてエラーの原因となるノードに直接移動することができます。
ワークフローモニタは、ノードやワークフローの実行またはリセット後に自動的にステータスを更新し、ワークフローやノード構成の修正が成功したかどうかをリアルタイムで表示します。
左側にナビゲーション、右側に対応するコンテンツが表示されるホームタブのレイアウトが変更され、最近使用したワークフロー、ローカルスペース、KNIME Community Hub、KNIME Business Hubにより簡単にアクセスできるようになりました。さらに、KNIME Analytics Platform内で直接プライベートHubスペースを作成できるようになりました。
改善されたスペースエクスプローラーは、KNIME Analytics Platformでの作業をより速く、より良くするために設計されています。アプリのヘッダーを右クリックすることで、ワークフローやコンポーネント内のソース先を表示・選択することができ、新しい「+Create new workflow」ボタンを使用すれば、即座にワークフローを作成することができます。シンプルな入力フィルターにより、スペースエクスプローラーの現在のレベルに表示されているアイテムを簡単にフィルターできます。
新しいホットキーのサポートにより、キーボードショートカットでワークフローを完全に操作できるようになりました。キーボードでノードをすばやく選択、接続したり、注釈やノードの位置を変更することで、ワークフローをすばやく構築できるようになりました。これらのショートカットの概要は、「ヘルプ」メニューでご覧いただけます。
さらに、メニューボタンでインターフェイスを拡大・縮小できるので、さまざまなデバイスや画面サイズ、特に視力の弱い方にも最適な使い勝手を保証します。
大量のデータを扱う場合、最大1,000列までスムーズにスクロールして表示できるようになり、テーブルビューのパフォーマンスが向上しました。
Column Filterウィジェット、Multiple Selectionウィジェット、Nominal Row Filterウィジェットなどの選択ウィジェットに検索機能が追加され、手動でスクロールする必要がなくなり、探している正しい値を簡単に見つけることができるようになりました。
Row FilterやJoinerなどの多くのノードに、最新のウェブ対応設定ダイアログが追加されました。これらのダイアログはすっきりとした外観になり、行フィルタやスプリッタノードで複数の選択条件をサポートするなど、追加機能を提供します。
このリリースでモダンなダイアログに更新されたノードのリストは以下の通りです
ユーザーはワークフローとコンポーネントの説明をリッチコンテンツエディターで編集できるようになりました。これらのリッチテキスト説明はKNIME Community HubとKNIME Business Hubにも表示されます。
新しい多目的Expressionノードを使用すると、スプレッドシートの数式を扱うように数値やテキストを扱うことができます。このノードは、文字列操作、数式、ルールエンジン、ルールベースの行フィルター、列式など、テキストや数値を扱うKNIMEの様々なノードを、複数の設定オプションを持つ1つのノードに統合するための第一歩です。
新しいExpressionノードはString ManipulationとMath Formulaノードの機能を提供し、テキストを修正したり計算を実行することができます。また、このノードにはAIアシスタントが付属しており、シンプルなチャットインターフェイスを通じてカスタムデータ操作の実行を支援します。
改良された式の編集エクスペリエンスには、オートコンプリート、ドラッグアンドドロップ式の構築、包括的な関数のドキュメンテーションなどの機能が含まれています。さらに、以前は列式ノードに限られていた、評価中の前後の行へのアクセスをサポートするようになりました。
Expressionノードを使い始めるには、このサンプル・ワークフローをご覧ください。
新しいText Chunkerノードは、長いテキストを管理しやすいチャンクに分割します。検索拡張世代(RAG)のために大量のテキストデータを扱う場合、Text Chunkerノードを使用することで、時間のかかるドキュメントの分割を1つのステップで置き換えることができます。
こちらは、Text Chunkerノードでテキスト分割を開始するための、すぐに使えるワークフローです。
新しいHugging Face Text Embedding Inference Connectorノードは、KNIMEワークフロー内での高度なテキスト埋め込み使用を簡素化します。このノードで、ローカルやリモートのHugging Faceテキスト埋め込み推論サーバーに接続し、意味検索や特徴抽出のようなタスクのための幅広いオープンソースの埋め込みモデルにアクセスすることができます。
また、保護されたHugging Face Inference Endpointsに簡単に接続し、Text Embedding InferenceとText Generation Inferenceノードを介して、実験のために多くのGenAIモデルを素早くスピンアップすることができます。
KNIME Analytics Platform 5.3では、OpenAI Chat Model Fine-Tunerノードが導入され、タスク固有のトレーニングデータを使用して、KNIME内で直接OpenAIモデルを微調整できるようになりました。プロンプトエンジニアリングや検索支援生成(RAG)メソッドでは不十分な場合、より正確な応答を得るためにファインチューニングで大規模言語モデル(LLM)を調整することができます。
このサンプルワークフローを使って、OpenAIモデルのファインチューニングを始めましょう。
KNIME Analytics Platform 5.3には、最新のモデルフォーマットをサポートするGPT4Allノードの更新も含まれており、Llama 3などのローカルLLMの最新の進歩との互換性を確保しています。これにより、ローカルマシン上で最新のモデルを使用することができます。
こちらのサンプルワークフローで、Llama3での作業方法をご覧ください。
新しいKNIME Presidio Extensionは、外部のLLMプロバイダーとデータを共有する際に、個人を特定できる情報(PII)を保護するのに役立ちます。この拡張機能は、テキストデータ内の名前、電話番号、クレジットカード番号などの機密情報を検出し、匿名化することができ、GenAI使用におけるデータプライバシーとコンプライアンスに関する懸念に対応します。
こちらは、データの匿名化を始めるのに役立ついくつかのサンプルワークフローです。
新しいKNIME Giskard拡張機能により、ユーザーはGiskardライブラリを使用してエンドツーエンドの機械学習モデルの品質をチェックすることができます。エンドツーエンドの機械学習ワークフローの問題を発見し、より信頼性の高いデプロイメントのためにロバストネスとバイアスを評価するのに役立ちます。
Giskardエクステンションを使用してモデルの品質を評価するワークフローのブループリントをご覧ください。
Databricksユーザーは、KNIMEでDatabricks Unity File System integrationを使用し、Databricksカタログ内でファイルを管理できるようになりました。ユーザーは、KNIMEワークフロー内で直接ファイルの読み取り、書き込み、リスト表示などを行うことができます。
このサンプルワークフローで始めましょう。
KNIME Analytics Platform 5.3では、Google Ads APIと統合する新しいエクステンションも導入しました。この拡張機能により、マーケティングアナリストはGoogle Adsアカウントから情報を抽出し、最も効果的なキーワードなどの洞察を得て、パフォーマンスマーケティング戦略を改善することができます。
Google Ads統合を使用したワークフローのブループリントをご覧ください。
ユーザーからの要望により導入された新しい Variable Filter ノードは、ワークフロー内の変数を削除するのに役立ちます。このノードは、ワークフロー内に存在する変数を識別し、不要な変数を削除するのに役立ちます。これは、多くの変数を持つ長いワークフロー、特にいくつかの変数がワークフローの特定の部分にのみ関連し、後のステージに関連しない場合に特に便利です。このノードを使用することで、ワークフローをよりよく整理し、変数が実際に必要な場所で使用されるようにすることができます。
このサンプルワークフローで、変数のフィルタリングを開始します。
更新された Email Sender (Labs) ノードでは、レポートを直接メールに埋め込むことができるため、同僚やエンドユーザーに洞察を送信するプロセスがスピードアップします。また、選択した列に基づいて電子メールにファイルを添付できるため、ノードのパラメータ化が大幅に簡素化されました。
Email Senderノードを使用したサンプルワークフローをご覧ください。
ワークフローは、特に中規模から大規模のデータセットの場合、個々のノードの実行時間が改善されます。これらのノードには、ソーター、行アグリゲーター、フィルタリングノードなどの多くの前処理ノードが含まれます。
Parallel Chunkノードのランタイムは、Columnar Backendと組み合わせて使用される場合、入力データのパーティショニングが「実行と分割」ではなく、単一のアトミック操作で行われるようになったため、大幅に改善されました。
基礎となるフレームワーク(Eclipse)が新しいバージョンに更新され、KNIME Extensionsを社内で使用しているコミュニティの貢献者やお客様にとって特に重要です。Apache Spark、Hadoop、様々なデータベースドライバ、Excelファイル処理用ライブラリ(Apache POI)など、多くの統合とライブラリが最新の安定バージョンに更新されました。詳細なリスト、非推奨の通知、その他のリリースノートについては、以下のリンクを参照してください。一部のドライバとライブラリのアップグレードは以下の通りです
このリリースでは、以下の機能がサポートされなくなります
KNIME Analytics Platform 5.3のダウンロードはこちらから。
このサイトでは、クッキー (cookie)などの技術を使用して取得したアクセス情報等のユーザ情報を取得しております。
この表示を閉じる場合、プライバシーポリシーに同意いただきますよう、お願いいたします。