全社で利用できるセルフサービスBIシステムを構築:Ubieが実現した大規模なデータ信頼性

A conversation with:
石川 有
Principal Data Architect
Ubieは、世界中でAI症状チェックツールを提供しているヘルスケア・テクノロジー企業で、月間アクティブユーザー数が1,000万人を超えています。Ubieのウェブベースの症状チェックツールは、700万人を超える患者がより良い医療判断を行うための支援を提供しており、そのSaaSソリューションは1,500を超える医療提供者から信頼されています。
Industry
医療業界
Location
東京
Employees
201-500
Ubie が Lightdash を使って、最新のデータガバナンス基盤をどのように構築したか。
80%
Lightdashを使用する従業員
600+
毎月、彼らのdbtリポジトリにプルリクエストを送信する

Ubie について

Ubie は「テクノロジーで人々を適切な医療に案内する」をミッションに、一般消費者と医療機関の双方へ AI ベースの症状チェッカーを提供しています。

日本発の急成長ヘルステック企業として、データは製品開発、マーケティング、オペレーションの意思決定はもちろんのこと、より大きなヘルスケアミッションを支える核として不可欠な基盤となっています。しかし、組織の拡大に伴い、データが適切に管理され、一貫性を保ち、セルフサービスで利用できる状態を維持するためのガバナンスの確立が大きな課題となりました。

「当社の成長に伴い、データガバナンスが追いつかなくなりました。可視性、一貫性、信頼性を確保するためのBI基盤の構築が急務でした。」

Ubieは、多くの企業が直面する複雑な課題に直面しました。それはデータへのアクセスコントロールの柔軟性を持たせつつも、統制を失わないためにはどうすれば良いのか、という問いでした。

データガバナンスの壁:規模拡大に伴う複雑性

BIツールを利用する人がごく少数であれば、ベストエフォートと共通認識のもとでシステムを運用し続けることが可能です。しかし、数十のチームと数百のダッシュボードが関与する段階になると、小さな問題がシステム全体に波及し、大きな課題となります。

Ubieの場合、dbtのコードベースが数千のモデルに及ぶ上、国やプロダクトを越えてチームを支援しているため、これらの問題は日常的な障害となっていました。メトリクスの定義がチーム間でばらつき、ビジネスロジックが複数のツールで重複し、データモデルの変更によってダッシュボードが機能しなくなる事態も発生しました。非技術系のユーザーが自力でデータを活用することが難しく、機密データのアクセス管理を安全かつ効率的に行うことが、ますます困難になっていました。

彼らが求めていたのは、一貫性を確保し、エラーを早期に検知し、法規制を守り安全に管理できるシステムでした。

UbieがBIガバナンスに求めたもの

急成長を遂げるデータリテラシーの高い企業(非常に小さなデータチームを抱える)を支援するため、Ubieは次のようなガバナンスモデルが必要でした:

  • 定義の重複を避け、ロジックを一元的に標準化する
  • セキュリティを確保しつつ、チーム、地域、雇用形態を横断してアクセスを拡張する
  • 日本と米国の医療分野における規制遵守を満たす
  • ビジネス判断に影響が出る前にエラーを早期に検知する
  • SQLの知識がなくても、誰もが自信を持ってデータを探索できる
  • ソフトウェア開発のように、バージョン管理、自動化、開発者ツールが組み込まれた形で機能する
  • すべてのデータアクセス変更の監査ログを提供し、既存の承認ワークフローと連携できる

その時、彼らはLightdashを発見しました。

Lightdashで実現するスケーラブルなガバナンス

UbieはMetabase、Looker、Presetを含む複数のBIツールを調査しました。しかし、Lightdashはすぐにその優位性を示しました。

従来のBIツールがデータウェアハウスとは独立して構築されるのに対し、Lightdashはdbtプロジェクトと直接統合されます。これにより、ガバナンスのアプローチが根本的に異なります。ビジネスロジックはdbtを利用して一度定義すれば、BI層で再実装することなく、あらゆる場所で再利用できるのです。

dbt連携の優位性

dbtを使用してデータウェアハウスを構造化することで、いわゆるメダリオンアーキテクチャを構築できます。このアプローチでは、rawデータから始まり、クリーニングとフィルタリングを経て、最終的に誰もが信頼できるビジネス用のデータセットを作成する、階層的な構造でデータを整理します。

dbtでこのメダリオンアーキテクチャを実装することで、Ubieは分析の基盤となる信頼性が高くテスト済みのビジネスデータ層を構築しました。Lightdashのディメンションとメトリクス層は、この基盤の上に完璧にフィットし、保守可能で信頼性の高い包括的なメトリクス層の構築を可能にしました。

このアプローチにより、Ubieは強力な組み合わせを実現しています。dbtの強力なデータ変換機能とLightdashの明確なメトリクス定義フレームワークが連携します。その結果、データ変換、ビジネスロジック、データのプレゼンテーション層が調和して機能する統合システムが実現し、従来のBI環境で課題となっていた不一致や重複したロジックを排除できました。

AI活用への優位性

Ubieは、Lightdashのビジネスデータ整理アプローチに大きな可能性を感じました。Lightdashでメトリクスとディメンションを明確に定義すると、AIは、これまで不可能だった方法でビジネスロジックを理解し、活用できるようになります。

なぜこれが重要なのでしょうか?ほとんどのBIツールは、データの一貫性において課題を抱えています。異なるチームが同じメトリクスに対してわずかに異なる計算方法を用い、異なるレポートを作成してしまうことがあります。AIがこれらの不一致な定義からSQLを生成しようとすると、混乱が生じ、誤った結果を導き出す可能性があります。また誤った結果であるかどうかを検証するのも困難です。.Lightdashは、すべてのビジネスロジックの唯一の信頼できるディメンションとメトリックスを Single Source of Truth として提供することで、この問題を解決します。ディメンションやメトリクスはdbtのコードの一部として一元的に管理され、バージョン管理されます。AIがSQLを生成する際も、これらの信頼性が高く一貫した定義に基づいて処理するため、信頼できる分析結果を得ることができます。

Ubieにとって、これは堅牢な基盤の上にシステムを構築していることを意味します。AIの機能が進化しても、求められるガバナンスと信頼性を損なうことなく、新しい機能を導入できます。

スケーラブルなガバナンス機能の提供

これらの利点に加え、Lightdashはスケーラブルなガバナンスを深くサポートしている点でも際立っていました:

  • メトリクスとしてコード:すべてのビジネスロジックはdbt上で実装されています。重複や不一致はありません。
  • CI/CD検証:すべてのdbtの変更は、lightdash validateを使用してLightdashダッシュボードに対して自動的に検証され、即座にエラーを検出します。
  • ロールと属性に基づくアクセス制御: スペース、プロジェクト、地域や雇用状況などの個々の属性レベルまでデータアクセス制御ができます。
  • スペース: チャートとダッシュボードはチームやトピックごとにスペースに整理され、アクセスと情報の管理が格段に容易になります。
  • 無制限のユーザー数: Lightdashはユーザーごとの料金体系ではないため、すべてのチームメンバーがセルフサービス分析を利用できます。

このガバナンス定義、開発ワークフロー、そしてプログラムによる制御の組み合わせが、安全にスケールするための明確な指針となりました。

技術的な機能だけでなく、Lightdashチームの迅速なイテレーションとコミュニティとの協業に対するコミットメントも、Ubieにとって特に価値あるものでした。

「迅速なリリースサイクルと手厚いサポートは、Lightdash がエンタープライズニーズを真に理解するチームであることを示しています。チームの対応力とコミュニティが要望する機能の実装への姿勢は、すべてのユーザーに利益をもたらす協業環境を築けました。」

Ubieにおけるガバナンスの実践

Lightdashのプロジェクト構造は、明確で構造化された階層を採用しており、Ubieがデータアクセスコントロールを容易に管理できるよう設計されています。組織として定めたポリシーは一貫性を持って適用され、プロジェクトレベルでは製品や機能ごとにさらに細分化され、スペースレベルではダッシュボードのきめ細やかな制御が可能です

Infrastructure as Codeで実現するガバナンス

Ubieのガバナンスアプローチは、従来のBI管理の枠をはるかに超えています。彼らは、既存の承認ワークフローやGitHubのプルリクエストとシームレスに統合される独自のTerraformプロバイダー(https://github.com/ubie-oss/terraform-provider-lightdash) を開発しました。このInfrastructure as Codeのアプローチにより、すべてのデータアクセス変更が追跡、レビューされ、監査可能な状態が保たれます。これは、医療分野におけるガイドラインや法規制によるコンプライアンス要件を満たすために,求められるものです。

Terraformプロバイダーは、ロールの割り当て、スペースの作成、権限管理を自動化するため、ガバナンスに関する決定はコードレビューされ、バージョン管理され、再現可能な状態が維持されます。このAPIファーストのアプローチにより、日本と米国で事業を展開する際に直面する厳格な規制要件を満たす、体系的なデータアクセス制御が実現されています。

ガバナンスを開発ワークフローに組み込む

最も重要な点は、Ubieがこれらのガバナンスツールを開発プロセスに組み込んだことです。すべてのdbtプルリクエストは、lightdash validateを使用してLightdashダッシュボードに対して自動的にテストされます。何かが破損した場合、デプロイプロセスの中で即座にエラーを検知することができます。この継続的な検証により、基盤となるデータモデルの変更が、下流のダッシュボードに予期せぬ影響を与えないことが保証されます。これはデータ信頼性を確保するための重要な保護措置です。

結果

かつてガバナンスは制約要因と見なされがちでしたが、Lightdashの導入により、それはビジネスを加速させる要因へと変貌しました。

  • 従業員の80%がLightdashを利用しています。
  • 月間600件を超えるプルリクエストがdbtリポジトリに送信されており、これはUbieで最も活発なリポジトリの一つです。
  • チーム間の分析が容易になりました。各チームは互いのディメンションやメトリクスを再利用できるため、同じ作業を繰り返す必要がなくなったからです。
  • セルフサービスが急速に拡大しました。非技術系のユーザーもSQLの知識や継続的なサポートを必要とせず、自信を持ってチャートを作成できるようになったからです。

そして最も重要な点として、ガバナンスは彼らの動きを遅らせるどころか、Lightdashを利用することでむしろより迅速に動くための礎となりました。

「以前は、ビジネスチームが分析結果を待つのに数日かかっていました。今では、適切なロジックが適用されていることを理解した上で、ビジネス部門の方でも自信を持ってデータを活用できるようになりました。」

まとめ

ガバナンスはしばしば制約と見なされ、後付けで導入されるものと考えられがちです。しかしUbieでは、それが真のセルフサービスを実現するための鍵となりました。

Ubieのアプローチは、適切なツールとマインドセットがあれば、ガバナンスをワークフローの初期段階から組み込むことが可能であることを示しています。無秩序なダッシュボードの乱立や重複したロジック、情報提供のボトルネックは必要ありません。

必要なのは適切な基盤だけです——そしてUbieにとって、それがLightdashです。

「私たちはLightdashを単なるBIツールとして捉えているわけではありません。AI駆動の未来に対応したdbtプロジェクトの上に構築された、重要なガバナンス層として扱っています。ガバナンスからコミュニティとの協業までを包括するこのアプローチこそが、全社的に利用できるスケーラブルな分析基盤を実現する要因です。」