2025  7

12月  1

Claude Code から Databricks の managed MCP server を使う

2025年12月8日 · soonraah

10月  1

Claude Code を使い dbt model を Test-First で開発する

2025年10月14日 · soonraah

9月  1

ふつうのデータ基盤移行 - Part 5. IaC と CI/CD 編

2025年9月18日 · soonraah

8月  1

データエンジニアから見るクラウド FinOps

2025年8月12日 · soonraah

6月  2

ふつうのデータ基盤移行 - Part 4. AI ワークフローで移行作業効率化編

2025年6月18日 · soonraah

ふつうのデータ基盤移行 - Part 3. アーキテクチャ編

2025年6月11日 · soonraah

3月  1

読書メモ: LangChainとLangGraphによるRAG・AIエージェント[実践]入門

2025年3月2日 · soonraah

2024  8

12月  2

ふつうのデータ基盤移行 - Part 2. 技術選定編

2024年12月16日 · soonraah

ふつうのデータ基盤移行 - Part 1. 戦略策定編

2024年12月1日 · soonraah

11月  1

読書メモ: DMBOK2 第13章 データ品質

2024年11月18日 · soonraah

5月  1

Data Contract CLI から考える Data Contracts ファーストのデータパイプラインの未来

2024年5月9日 · soonraah

4月  1

読書メモ: DMBOK2 第8章 データ統合と相互運用性

2024年4月4日 · soonraah

3月  1

読書メモ: DMBOK2 第6章 データストレージとオペレーション

2024年3月17日 · soonraah

1月  2

読書メモ: DMBOK2 第5章 データモデリングとデザイン

2024年1月21日 · soonraah

読書メモ: DMBOK2 第4章 データアーキテクチャ

2024年1月6日 · soonraah

2023  10

12月  5

読書メモ: DMBOK2 第15章 データマネジメント成熟度アセスメント

2023年12月30日 · soonraah

現実の CSV ファイルのデータを BigQuery に load する仕組みを作るという泥臭い作業を dlt でやってみる

2023年12月20日 · soonraah

dlt 入門 - ELT の Extract と Load を担う data load tool

2023年12月18日 · soonraah

読書メモ: DMBOK2 第12章 メタデータ管理

2023年12月9日 · soonraah

CDC + Apache Iceberg で Amazon Athena にデータを取り込む

2023年12月3日 · soonraah

11月  2

読書メモ: DMBOK2 第3章 データガバナンス

2023年11月19日 · soonraah

読書メモ: DMBOK2 第1章 データマネジメント

2023年11月13日 · soonraah

5月  2

near real time で更新される Apache Iceberg の table のメンテナンス

2023年5月28日 · soonraah

Apache Iceberg の table を near real time で更新する

2023年5月11日 · soonraah

4月  1

Data Contract について調べた

2023年4月8日 · soonraah

2022  2

12月  1

Glue Schema Registry の導入を断念した話

2022年12月13日 · soonraah

6月  1

「データレイク」と「データレイク層」

2022年6月21日 · soonraah

2021  3

7月  1

成熟フェーズの事業におけるデータサイエンティスト

2021年7月12日 · soonraah

2月  1

Apache Flink の Backpressure の仕組みについて調べた

2021年2月28日 · soonraah

1月  1

データレイク関連の OSS - Delta Lake, Apache Hudi, Apache Kudu

2021年1月26日 · soonraah

2020  12

12月  2

いまさらながらのデータレイク

2020年12月31日 · soonraah

Apache Flink の DataStream API 利用時の CSV ファイル読み込み

2020年12月1日 · soonraah

11月  2

機械学習の精度と利益と倫理とイシューと

2020年11月12日 · soonraah

ストリーム処理システムに求められる機能性、および Apache Flink におけるその対応

2020年11月7日 · soonraah

9月  1

バッチ処理おじさんがストリーム処理のシステムを開発するにあたって調べたこと

2020年9月6日 · soonraah

8月  5

A/B テストの運用が重くてつらいという話

2020年8月23日 · soonraah

Apache Flink の Temporary Table Function を用いた stream data と static data の join

2020年8月16日 · soonraah

Apache Flink の Broadcast State Pattern を用いた stream data と static data の join

2020年8月6日 · soonraah

あまり大きな Pull Request を作ってほしくない

2020年8月3日 · soonraah

勉強会メモ: Spark Meetup Tokyo #3 Online

2020年8月1日 · soonraah

7月  2

Spark DataFrame クエリの弱い分離レベル

2020年7月19日 · soonraah

Apache Spark 3.0.0 について調べた

2020年7月12日 · soonraah