Databricks は、Delta Lake 3.0 のユニバーサル形式でオープン データ レイクハウスへの取り組みを強化します from venturebeat.com


企業がデータ レイクハウスの利用を倍増させる中、データと AI 企業の Databricks は、自社のレイクハウス製品にデータとテーブルを保存するための基盤として機能するオープンソース フレームワークである Delta Lake への移行を進めています。
第一世代の Apache Hive が最初に台頭した後、Delta Lake、Apache Iceberg、Apache Hudi という 3 つのオープン テーブル形式がデータ エコシステムの大部分を支配してきました。
Databricks によれば、Delta Lake 3.0 のリリースにより、もう妥協する必要はなくなりました。
同社は、Detla 内で Iceberg と Hudi の自動サポートを提供する Universal Format (UniForm) を追加し、エコシステム間の相互運用性を向上させ、他の場所で生成されたデータを Delta Lake に取り込むことを可能にします。
UniForm を使用すると、Delta Lake に保存されたデータを Iceberg や Hudi と同じように読み取ることができます。
「Delta Lake 3.0 により、Databricks はこれらの形式間のメタデータの統合を提供しながら、より広範なコネクタ クエリ ツールのエコシステムへのアクセスを拡大します」と Gartner のデータ管理および分析担当副社長の Adam Ronthal 氏は VentureBeat に語った。

コメント

タイトルとURLをコピーしました