ブログ follow us in feedly

最新情報をお届けします。

KNIME Analytics Platform 5.3の新機能 ~GenAIやGPT4関連アップデート、UI改善他~

  • 2024.7.12
  • 原文:https://www.knime.com/blog/whats-new-knime-analytics-platform-53

     

    日本語の導入ガイドはこちら

     

    KNIMEの目標は、データとAIにおける最新の進歩を誰もが利用できるようにするオープンソースプラットフォームを構築することです。

    KNIME Analytics Platform 5.3のリリースでは、デバッグを容易にする新しいワークフローモニター、より速いナビゲーションのための改訂されたホームタブ、スプレッドシートの数式のような方法でテキストや数値を扱うための新しい式ノードなど、ユーザーから要望の多かった多くの機能を提供することで、コミュニティへのコミットメントを強化し続けています。

    我々はまた、GenAIの実装が多くの組織にとって最優先事項となっていることも知っています。。しかし、安全管理とGenAIの価値の迅速な把握の適切なバランスを見つけることは困難です。出力品質、データプライバシー、コンプライアンスなどのリスク管理に関する継続的な不確実性により、多くの企業や個人がGenAIの拡張に慎重になっています。

    このリリースは、データチームが最新のGenAIテクノロジーで安全に作業できるよう支援する新機能で、これらの懸念のいくつかに対処します。これらの機能は、GenAIのリスクを低減しながら、GenAIの採用を促進し、GenAIプロジェクトをパイロットから本番へと移行させることができます。新機能は、GenAIやその先を含む最新技術の採用を支援するKNIMEのコミットメントを反映しています。

    以下は、このリリースに含まれる各主要アップデートの詳細です。

     

    より簡単なナビゲーション、より迅速なデバッグ、キーボードショートカットなど、より直感的なUIを実現

    KNIME Analytics PlatformのUIは、各リリースと同様、コミュニティからのフィードバックに基づいて改良を続けています。

    ノードモニターで直接データを可視化

    データのビジュアライゼーションが、ノードモニターを通してユーザーインターフェースに直接表示されるようになりました。これにより、新しいウィンドウを開く代わりに、ノードが選択されたときにボトムパネルですぐにデータを視覚化され、確認することができます。

     

    ワークフローモニターによるデバッグの高速化

    ワークフローをデバッグする明確な方法を持つことは、コミュニティから頻繁に要求される機能です。KNIME Analytics Platform 5.3の新しいワークフローモニターは、リアルタイムのエラーや警告をサイドパネルに表示することで、ワークフローをより速く簡単にデバッグすることができます。

    ワークフローモニターは、エラーや警告のあるノード、コンポーネント、メタノードをハイライト表示し、対応する矢印ボタンをクリックしてエラーの原因となるノードに直接移動することができます。

    ワークフローモニタは、ノードやワークフローの実行またはリセット後に自動的にステータスを更新し、ワークフローやノード構成の修正が成功したかどうかをリアルタイムで表示します。

     

    強化されたホームタブとスペースエクスプローラーでより簡単なナビゲーション

    左側にナビゲーション、右側に対応するコンテンツが表示されるホームタブのレイアウトが変更され、最近使用したワークフロー、ローカルスペース、KNIME Community Hub、KNIME Business Hubにより簡単にアクセスできるようになりました。さらに、KNIME Analytics Platform内で直接プライベートHubスペースを作成できるようになりました。

    改善されたスペースエクスプローラーは、KNIME Analytics Platformでの作業をより速く、より良くするために設計されています。アプリのヘッダーを右クリックすることで、ワークフローやコンポーネント内のソース先を表示・選択することができ、新しい「+Create new workflow」ボタンを使用すれば、即座にワークフローを作成することができます。シンプルな入力フィルターにより、スペースエクスプローラーの現在のレベルに表示されているアイテムを簡単にフィルターできます。

     

    ホットキーによるアクセシビリティの向上

    新しいホットキーのサポートにより、キーボードショートカットでワークフローを完全に操作できるようになりました。キーボードでノードをすばやく選択、接続したり、注釈やノードの位置を変更することで、ワークフローをすばやく構築できるようになりました。これらのショートカットの概要は、「ヘルプ」メニューでご覧いただけます。

    さらに、メニューボタンでインターフェイスを拡大・縮小できるので、さまざまなデバイスや画面サイズ、特に視力の弱い方にも最適な使い勝手を保証します。

     

    テーブルビューのパフォーマンス向上

    大量のデータを扱う場合、最大1,000列までスムーズにスクロールして表示できるようになり、テーブルビューのパフォーマンスが向上しました。

    検索機能付きウィジェット

    Column Filterウィジェット、Multiple Selectionウィジェット、Nominal Row Filterウィジェットなどの選択ウィジェットに検索機能が追加され、手動でスクロールする必要がなくなり、探している正しい値を簡単に見つけることができるようになりました。

     

    モダンなダイアログを備えたノードの増加

    Row FilterやJoinerなどの多くのノードに、最新のウェブ対応設定ダイアログが追加されました。これらのダイアログはすっきりとした外観になり、行フィルタやスプリッタノードで複数の選択条件をサポートするなど、追加機能を提供します。

     

     

    このリリースでモダンなダイアログに更新されたノードのリストは以下の通りです

    • Chunk Loop Start
    • Column Resorter
    • Date&Time Part Extractor
    • Group Loop Start
    • Joiner
    • Nominal Value Row Filter
    • Normalizer
    • Row Filter
    • RowID
    • Row Sorter
    • Number Rounder
    • String Splitter (Regex)
    • Value Counter

     

    ワークフローとコンポーネントの説明のためのリッチコンテンツエディタ

    ユーザーはワークフローとコンポーネントの説明をリッチコンテンツエディターで編集できるようになりました。これらのリッチテキスト説明はKNIME Community HubとKNIME Business Hubにも表示されます。

     

     

    新しいExpressionノードを使ったデータ操作とオプションのAIアシスト

    新しい多目的Expressionノードを使用すると、スプレッドシートの数式を扱うように数値やテキストを扱うことができます。このノードは、文字列操作、数式、ルールエンジン、ルールベースの行フィルター、列式など、テキストや数値を扱うKNIMEの様々なノードを、複数の設定オプションを持つ1つのノードに統合するための第一歩です。

    新しいExpressionノードはString ManipulationとMath Formulaノードの機能を提供し、テキストを修正したり計算を実行することができます。また、このノードにはAIアシスタントが付属しており、シンプルなチャットインターフェイスを通じてカスタムデータ操作の実行を支援します。

    改良された式の編集エクスペリエンスには、オートコンプリート、ドラッグアンドドロップ式の構築、包括的な関数のドキュメンテーションなどの機能が含まれています。さらに、以前は列式ノードに限られていた、評価中の前後の行へのアクセスをサポートするようになりました。

    Expressionノードを使い始めるには、このサンプル・ワークフローをご覧ください。

     

    最新のGenAIの進歩へのアクセスの拡大

    膨大なテキストの取り扱いを簡素化

    新しいText Chunkerノードは、長いテキストを管理しやすいチャンクに分割します。検索拡張世代(RAG)のために大量のテキストデータを扱う場合、Text Chunkerノードを使用することで、時間のかかるドキュメントの分割を1つのステップで置き換えることができます。

    こちらは、Text Chunkerノードでテキスト分割を開始するための、すぐに使えるワークフローです。

     

    Hugging Face上の幅広いオープンソース埋め込みモデルへのアクセス

    新しいHugging Face Text Embedding Inference Connectorノードは、KNIMEワークフロー内での高度なテキスト埋め込み使用を簡素化します。このノードで、ローカルやリモートのHugging Faceテキスト埋め込み推論サーバーに接続し、意味検索や特徴抽出のようなタスクのための幅広いオープンソースの埋め込みモデルにアクセスすることができます。

    また、保護されたHugging Face Inference Endpointsに簡単に接続し、Text Embedding InferenceとText Generation Inferenceノードを介して、実験のために多くのGenAIモデルを素早くスピンアップすることができます。

     

    OpenAIモデルを微調整し、より適切なレスポンスを実現

    KNIME Analytics Platform 5.3では、OpenAI Chat Model Fine-Tunerノードが導入され、タスク固有のトレーニングデータを使用して、KNIME内で直接OpenAIモデルを微調整できるようになりました。プロンプトエンジニアリングや検索支援生成(RAG)メソッドでは不十分な場合、より正確な応答を得るためにファインチューニングで大規模言語モデル(LLM)を調整することができます。

    このサンプルワークフローを使って、OpenAIモデルのファインチューニングを始めましょう。

     

    最新の進歩をサポートするGPT4Allのアップデート

    KNIME Analytics Platform 5.3には、最新のモデルフォーマットをサポートするGPT4Allノードの更新も含まれており、Llama 3などのローカルLLMの最新の進歩との互換性を確保しています。これにより、ローカルマシン上で最新のモデルを使用することができます。

    こちらのサンプルワークフローで、Llama3での作業方法をご覧ください。

     

    Microsoft Presidioを使用したLLMプロバイダーとのデータ共有の匿名化

    新しいKNIME Presidio Extensionは、外部のLLMプロバイダーとデータを共有する際に、個人を特定できる情報(PII)を保護するのに役立ちます。この拡張機能は、テキストデータ内の名前、電話番号、クレジットカード番号などの機密情報を検出し、匿名化することができ、GenAI使用におけるデータプライバシーとコンプライアンスに関する懸念に対応します。

    こちらは、データの匿名化を始めるのに役立ついくつかのサンプルワークフローです。

     

    モデルの品質を評価するGiskard拡張機能

    新しいKNIME Giskard拡張機能により、ユーザーはGiskardライブラリを使用してエンドツーエンドの機械学習モデルの品質をチェックすることができます。エンドツーエンドの機械学習ワークフローの問題を発見し、より信頼性の高いデプロイメントのためにロバストネスとバイアスを評価するのに役立ちます。

    Giskardエクステンションを使用してモデルの品質を評価するワークフローのブループリントをご覧ください。

     

    その他の注目すべき機能強化

    エンタープライズ統合

    Databricksユーザーは、KNIMEでDatabricks Unity File System integrationを使用し、Databricksカタログ内でファイルを管理できるようになりました。ユーザーは、KNIMEワークフロー内で直接ファイルの読み取り、書き込み、リスト表示などを行うことができます。

    このサンプルワークフローで始めましょう。

     

    マーケティング分析のためのGoogle Ads統合

    KNIME Analytics Platform 5.3では、Google Ads APIと統合する新しいエクステンションも導入しました。この拡張機能により、マーケティングアナリストはGoogle Adsアカウントから情報を抽出し、最も効果的なキーワードなどの洞察を得て、パフォーマンスマーケティング戦略を改善することができます。

    Google Ads統合を使用したワークフローのブループリントをご覧ください。

    新しい変数フィルターノード

    ユーザーからの要望により導入された新しい Variable Filter ノードは、ワークフロー内の変数を削除するのに役立ちます。このノードは、ワークフロー内に存在する変数を識別し、不要な変数を削除するのに役立ちます。これは、多くの変数を持つ長いワークフロー、特にいくつかの変数がワークフローの特定の部分にのみ関連し、後のステージに関連しない場合に特に便利です。このノードを使用することで、ワークフローをよりよく整理し、変数が実際に必要な場所で使用されるようにすることができます。

    このサンプルワークフローで、変数のフィルタリングを開始します。

     

    Email Sender ノード

    更新された Email Sender (Labs) ノードでは、レポートを直接メールに埋め込むことができるため、同僚やエンドユーザーに洞察を送信するプロセスがスピードアップします。また、選択した列に基づいて電子メールにファイルを添付できるため、ノードのパラメータ化が大幅に簡素化されました。

    Email Senderノードを使用したサンプルワークフローをご覧ください。

     

    ワークフローの実行とランタイムの改善

    ワークフローは、特に中規模から大規模のデータセットの場合、個々のノードの実行時間が改善されます。これらのノードには、ソーター、行アグリゲーター、フィルタリングノードなどの多くの前処理ノードが含まれます。

    Parallel Chunkノードのランタイムは、Columnar Backendと組み合わせて使用される場合、入力データのパーティショニングが「実行と分割」ではなく、単一のアトミック操作で行われるようになったため、大幅に改善されました。

     

    インフラの更新とアップグレード

    基礎となるフレームワーク(Eclipse)が新しいバージョンに更新され、KNIME Extensionsを社内で使用しているコミュニティの貢献者やお客様にとって特に重要です。Apache Spark、Hadoop、様々なデータベースドライバ、Excelファイル処理用ライブラリ(Apache POI)など、多くの統合とライブラリが最新の安定バージョンに更新されました。詳細なリスト、非推奨の通知、その他のリリースノートについては、以下のリンクを参照してください。一部のドライバとライブラリのアップグレードは以下の通りです

    • Spark 3.5をサポート。
    • Hive 3.xのような様々なデータベースドライバーの更新。
    • ビッグデータエクステンションは、Hadoop 3.xをサポートするようになりました。お使いの環境によっては、Hadoopライブラリのアップデートにより、KNIME Analytics Platform内のHadoop設定の変更が必要になる場合があります。
    • MongoDBライブラリがバージョン5.1.1に更新され、MongoDBの最新バージョンをサポートするようになりました。

     

    このリリースでは、以下の機能がサポートされなくなります

    • Spark 3.4以降のH2O Sparkling Waterはサポートされません。Spark 3.3以前で動作している既存のワークフローは、新しいSparkling Waterレガシープラグインをインストールすれば引き続き動作します。
    • Hive 2以前への接続のサポートは終了します。回避策として、独自のHive 2ドライバを登録することができます。セキュリティ問題を引き起こす可能性のある古いデータベースドライバを使用している場合は、プラットフォーム内で通知されます。

     

    詳細はリリースノート変更履歴をご覧ください。

     

    KNIME Analytics Platform 5.3のダウンロードはこちらから。

     

    日本語の導入ガイドはこちら

     

    KNIME は無料でダウンロードが可能です。
    ぜひお試しください。

    セミナー
    お申込み
    お見積り依頼 紹介資料ダウンロード お問い合わせ

    このサイトでは、クッキー (cookie)などの技術を使用して取得したアクセス情報等のユーザ情報を取得しております。
    この表示を閉じる場合、プライバシーポリシーに同意いただきますよう、お願いいたします。