Datafoldは、データ検証チェックを実行するためのオープンソースの差分ツールを起動します from venturebeat.com


ニューヨークに本社を置くデータ信頼性企業Datafoldは、企業がデータベースを比較し、データの整合性を検証するためのチェックを実行するのに役立つオープンソースの差分ツールを立ち上げました。
救助のためのデータ差分
「data-diff」と呼ばれるこのソリューションは、アルゴリズムを使用して、データウェアハウスにロードされたデータがソースまたは抽出ポイントのデータと一致するかどうかをアクティブに検証します。
これ以前は、データエンジニアリングチームは、不一致の可能性を排除し、同期ツールを介して複製されたデータの100%の整合性を確保するために、手動の1回限りのチェックとその場しのぎの差分ツールを使用した時間のかかる調査に依存する必要がありました。
コードへの変更が、データパイプライン全体で生成されたデータにどのように影響するかを分析します。
「オープンソースのdata-diffは、データベース間の差分機能を追加します。これにより、対象となるユースケースを、変換のみのテスト(T of ELT)から、データプラットフォーム全体でのデータレプリケーションの検証(EL of ELT)に拡張します」とCEOは付け加えました。

コメント

タイトルとURLをコピーしました