先日、KNIME Analytics Platformがバージョンアップされました!
本記事では、バージョンアップで追加された新機能や改善点を紹介いたします。
KNIME Analytics Platform 4.7 はこちらからダウンロードできます。
※ご利用中のバージョンによっては、新規にアプリをインストールする必要があります。
ハイライト
・モダンなUI/UXへの強化
・地理空間分析
・KNIMEとPythonの統合性向上
・新しい Python View ノード
・新しい可視化ノード
注目の改善点
・KNIME Python Extension 開発の強化 (Labs)
・より効率的な接続/ファイル操作
・ワークフローの場所に依存しない複数ワークフローの接続
・新しいユーティリティ・ノード
・Apple Silicon Processor向けKNIMEネイティブビルド
KNIME は、使いやすさとオンボーディングのしやすさがスキルアップに不可欠であることを認識し、ユーザーエクスペリエンスの向上に大きく投資してきました。その効果として、前回のバージョンアップ時に KNIME Modern UI Preview のプラグインを実装いたしましたが、今回のバージョンアップにおけるKNIME Modern UI Preview の強化ポイントは以下の通りです。
・ワークフロータブバーにより、複数のワークフローを複数のタブで操作可能に(例:あるワークフローから別のワークフローへのノードのコピー&ペースト)
・コンポーネントやメタノードと同様に、ポートを「+」アイコンにドロップするだけでダイナミックポートをネイティブノードに直接追加できるように
・ポートをノードからドラッグアウトすると、ワークフローコーチデータに基づき、最もよく使用される12個のノードを推奨するようになり、オンボーディングとユーザビリティが向上した。目的のノードを選択すると、直接接続される。ワークフローコーチは、匿名のKNIME使用データに基づいて、どのノードをいつ、どのような順番で使用するかを推奨
・基本的なフィルタリング、基本的な検索、列のサイズ変更のためのテーブルビュー。レイジーローディングと仮想スクロールにより、大きなテーブルでもパフォーマンスの高いスクロールが可能に
この新しいGeospatial Extensionは、KNIME内で地理空間分析を実行する能力を提供します。最初のバージョンでは、点、線、多角形、およびそれらのコレクションのような最も一般的なベクトルデータ型をサポートする予定です。これは、ハーバード大学の地理分析センターとKNIMEによる共同開発で、地理空間とKNIMEのトップレベルの開発専門知識を結集したものです。これは信頼できるコミュニティの貢献であり、私たちはさらなる改良を続けていきます。
主な機能は以下の通りです。
・ShapeファイルやGeoJSONファイルなど、さまざまな地理空間ファイルの読み込みと書き込み
・多角形の面積の計算、距離の計算、空間結合の実行、その他の空間操作などの空間計算の実行
・点を線に変換したり、2 つの異なるデータセットの投影を調和させたりする空間変換ノード
・KNIME Data Apps に含めることができるインタラクティブ ビュー用の組み込みの視覚化ノード、およびプレゼンテーションやレポート用の豊富に構成可能な静的マップ
・Open Street Map や米国国勢調査データなどの公開データに簡単にアクセスするためのノード
※このExtensionをさらに成長させるためには、いつものように皆様のフィードバックが非常に重要です。KNIME ForumまたはGithubを通じて、お気軽にご連絡ください。Geospatial Analytics Extensionに加え、KNIME Community Hubで最も一般的な地理空間ユースケースのための多くのワークフローを公開しますので、地理空間エキスパートでない人も含め、誰もがすぐに利用することが可能です。
KNIME Analytics Platform 4.7 で、Pythonとの統合性が向上し、開発環境が整いました。その最も顕著な改善は、KNIMEとPython間のより速いデータ転送、より良いPython API、そしてPythonを自分でインストールしなくても始められるバンドルされたPython環境です。
スクリプト機能の面では、このリリースは以下をもたらします。
・スクリプト API とサポート形式の強化(特に日付と時刻の形式と化学タイプ)
・分子、フィンガープリント、反応に対する RowID の取り扱いと RDKit のサポートが改善
・Pandas, PyArrow, scikit-learnの最新バージョンの出荷とOpenPyxlの追加
・カスタムConda環境作成の簡素化、Condaパッケージはこちら
・M1 Mac のネイティブ Python ビルドのサポート
従来の「KNIME Python Integration」は「KNIME Python 2 Integration (legacy)」となり、今後はPython 2.7のサポートが必要な場合のみ使用するようになりましたので、ご注意ください。同様に、「KNIME Python Integration (Labs)」は「KNIME Python Integration」に変わり、Labsというサフィックスがなくなりました。Nodesページも同様です。更新されたドキュメントはこちらとこちらをご覧ください。
新しいPythonの統合により、インタラクティブなプロットを可能にするHTMLベースのビューをサポートする新しいPython Viewノードも提供します。これは、選択したデータポイントを同期させることによって、他のプロットと相互作用することもできます。Python Viewノードを使用したワークフローのサンプルはこちらをご覧ください。
以下のような改善により、より簡単にPythonでKNIMEノードを開発することができるようになりました。
・他の機能やKNIME Analytics Platformのバージョンへの依存を管理する
・純粋なPythonノードの非推奨を可能にする
・バンドルされたConda環境でのpipパッケージのサポート
・新しいEnumパラメータ
・ノードパラメータのバージョニングサポート(Docs参照)
・ノードディスクリプションのマークダウン
サンプルワークフローについては、このブログ記事をご覧ください。また、詳細については、Snowflake Extension Guideをご覧ください。
Box Plot、Density Plot、Heatmap、Histogram、Pie chart、Stacked area chart、Statisticsという7つの新しい可視化ノードが追加されました。これらの新しい可視化ノードを使用するサンプルワークフローをいくつか紹介します。
Box Plot
Density Plot
Histogram
Pie Chart
Stacked Area Chart
Statistics ノード
新しい DB Row Manipulator ノードでは、ユーザーが独自の SQL 文を記述して、データベース内のデータを効率的に操作することができます。カスタム SQL 文の一般的な使用例は、データベースに送信する前に地理空間データなどのデータをキャストすることです。
その他にも以下の機能が追加されました。
・自動的に生成される SQL 文を最適化し、SAP HANA などのデータベースの実行性能を向上
・データベースのメタデータブラウザを改良し、標準的なテーブルやビューだけでなく、外部テーブルなどデータベース固有のものも表示できるように
・Microsoft AuthenticationノードにAzure ADアプリケーションおよびサービスプリンシパルのサポートを追加
・SAP Reader (Theobald Software) がアップデートされ、Xtract Universal の新しい専用 KNIME デスティネーションがサポート
複雑なソリューションを構築するには、しばしば複数のKNIMEワークフローが必要であり、APIを介してこれらのワークフローを接続するには、別のワークフローから1つのワークフローを呼び出す機能が鍵となります。このリリースでは、あるワークフローを別のワークフローから呼び出すための様々なノードが、ワークフロー自体が存在する場所 (KNIME サーバー、KNIME ビジネス ハブ、またはローカル ワークスペース) に関係なく、同じ使用コンセプトに従うよう調整されました。
KNIMEワークフローを介した汎用REST APIを定義するために、Container Input (Raw HTTP)とContainer Output (Raw HTTP)の2つのノードが追加されました。これらは、JSONベースのREST APIを越えて、アプリケーション領域を拡大します。例えば、ウェブページ上の動的コンテンツを定義するワークフロー、ファイルや画像などの追加データフォーマットの消費と生成、他のシステムに統合するためのWebHooksとしてのワークフローの展開などです。
SorterとTop K Selectorノードには、文字列を英数字でソートするオプションが追加されており、より自然なデータのソートをサポートします。多くの場合、データは “Row1” < “Row2” < “Row10″ のように数字で列挙されます。また、旧来の辞書式ソートでは、”Row10” < “Row2 “のように比較されます。このソート順は、従来のKNIME workbenchと最新のUIプレビューの両方で、ノードのアウトポートでデータを検査する際にも適用されます。
Row To Column Headerは、データ行を抽出し、列ヘッダに変換する新しいノードです。例えば、Excelシートからデータを読み込んだ場合に、ヘッダー情報が「データ内の」どこかに隠されていることがよくあります。この新しいノードは、簡単な型変換を含めて、その手助けをします。
KNIME Analytics Platform 4.7 は、Apple SiliconプロセッサM1およびM2用のネイティブ製品ビルドも利用できるようになりました。Intelチップまたは新世代のプロセッサでエミュレートされたIntel専用モデルと比較して、これらは優れたパフォーマンスを提供し、より反応の良いユーザーインターフェイスとはるかに優れた実行性能を提供します。Apple Silicon モデルのユーザーは、このアーキテクチャでの新規インストールを検討する必要があります。
このサイトでは、クッキー (cookie)などの技術を使用して取得したアクセス情報等のユーザ情報を取得しております。
この表示を閉じる場合、プライバシーポリシーに同意いただきますよう、お願いいたします。