<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/">
  <channel>
    <title>OpenMetadata on Froglog</title>
    <link>https://soonraah.github.io/tags/openmetadata/</link>
    <description>Recent content in OpenMetadata on Froglog</description>
    <image>
      <title>Froglog</title>
      <url>https://soonraah.github.io/image/brand/soonraah_full.png</url>
      <link>https://soonraah.github.io/image/brand/soonraah_full.png</link>
    </image>
    <generator>Hugo</generator>
    <language>ja</language>
    <lastBuildDate>Mon, 11 May 2026 07:30:00 +0900</lastBuildDate>
    <atom:link href="https://soonraah.github.io/tags/openmetadata/index.xml" rel="self" type="application/rss+xml" />
    <item>
      <title>ふつうのデータ基盤移行 - Part 6. メタデータ編</title>
      <link>https://soonraah.github.io/posts/ordinary-data-platform-migration-part-6/</link>
      <pubDate>Mon, 11 May 2026 07:30:00 +0900</pubDate>
      <guid>https://soonraah.github.io/posts/ordinary-data-platform-migration-part-6/</guid>
      <description>&lt;h2 id=&#34;このポストについて&#34;&gt;このポストについて&lt;/h2&gt;
&lt;p&gt;データ基盤移行について書いていくシリーズです。&lt;br&gt;
シリーズ一覧は&lt;a href=&#34;https://soonraah.github.io/tags/%E3%81%B5%E3%81%A4%E3%81%86%E3%81%AE%E3%83%87%E3%83%BC%E3%82%BF%E5%9F%BA%E7%9B%A4%E7%A7%BB%E8%A1%8C/&#34;&gt;こちら&lt;/a&gt;から。&lt;/p&gt;
&lt;p&gt;前回 &lt;a href=&#34;https://soonraah.github.io/posts/ordinary-data-platform-migration-part-5/&#34;&gt;Part 5. IaC と CI/CD 編&lt;/a&gt;では Terraform による IaC とそれに基づく GitHub Actions による CI/CD について書きました。&lt;br&gt;
今回はみんな大好きメタデータです。&lt;br&gt;
メタデータとはなんぞやという方は&lt;a href=&#34;https://soonraah.github.io/posts/dmbok-chapter-12/&#34;&gt;こちらの記事&lt;/a&gt;も御覧ください。&lt;/p&gt;
&lt;h2 id=&#34;スコープ&#34;&gt;スコープ&lt;/h2&gt;
&lt;p&gt;実は今回のデータ基盤の移行のその前から OpenMetadata によるメタデータ管理を始めていました。&lt;br&gt;
その導入、およびそこからの Databricks への移行について紹介します。&lt;/p&gt;
&lt;p&gt;DMBOK2 によるとメタデータは3種に分類され、&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;ビジネスメタデータ&lt;/li&gt;
&lt;li&gt;テクニカルメタデータ&lt;/li&gt;
&lt;li&gt;オペレーショナルメタデータ&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;がありますが、ここでは主にビジネスメタデータについて扱います。&lt;br&gt;
あまり新規性のある話にはなりませんが、ケーススタディとしてご参考になれば。&lt;/p&gt;
&lt;h2 id=&#34;メタデータ管理の導入&#34;&gt;メタデータ管理の導入&lt;/h2&gt;
&lt;p&gt;私の所属する組織がどのようにメタデータを導入していったか、大まかな流れは次のようになっています。&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;暗黒時代&lt;/li&gt;
&lt;li&gt;OpenMetadata の導入&lt;/li&gt;
&lt;li&gt;Databricks への移行&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;それぞれのフェーズについて述べていきます。&lt;/p&gt;
&lt;h3 id=&#34;1-暗黒時代-2022年&#34;&gt;1. 暗黒時代 (2022年〜)&lt;/h3&gt;
&lt;p&gt;「メタデータ？ナニソレオイシイノ？」という状況がスタート地点です。&lt;/p&gt;
&lt;p&gt;私が今の組織にデータエンジニアとして join した直後はまだ組織内で「メタデータ」という言葉が認知されておらず、「ビジネスメタデータがなくて不便」という課題すらも認識されていませんでした。&lt;br&gt;
とはいえ join の直後、データ基盤のデータを眺めてみてもこれらが何なのか人に聞かないとわかりません。&lt;br&gt;
table や column の命名がわかりやすいものになっていない &lt;sup id=&#34;fnref:1&#34;&gt;&lt;a href=&#34;#fn:1&#34; class=&#34;footnote-ref&#34; role=&#34;doc-noteref&#34;&gt;1&lt;/a&gt;&lt;/sup&gt; ことが、データ理解しにくさに輪をかけている状況でした。&lt;/p&gt;
&lt;p&gt;この時点ではこの記事のタイトルにもあるデータ基盤移行はまだ始まっておらず、旧データ基盤を使っていました。&lt;br&gt;
旧データ基盤では Athena や Glue Job でデータを処理しています。&lt;br&gt;
したがって Glue Data Catalog にビジネスメタデータを置けないかと検討しましたが、難しそうだなという結論になりました。&lt;br&gt;
たしか当時は日本語が扱えないとかだったような。(うろ覚え)&lt;/p&gt;</description>
    </item>
  </channel>
</rss>
