Claude Code から Databricks の managed MCP server を使う
2025年12月8日 · soonraah
Claude Code を使い dbt model を Test-First で開発する
2025年10月14日 · soonraah
ふつうのデータ基盤移行 - Part 5. IaC と CI/CD 編
2025年9月18日 · soonraah
データエンジニアから見るクラウド FinOps
2025年8月12日 · soonraah
ふつうのデータ基盤移行 - Part 4. AI ワークフローで移行作業効率化編
2025年6月18日 · soonraah
ふつうのデータ基盤移行 - Part 3. アーキテクチャ編
2025年6月11日 · soonraah
読書メモ: LangChainとLangGraphによるRAG・AIエージェント[実践]入門
2025年3月2日 · soonraah
ふつうのデータ基盤移行 - Part 2. 技術選定編
2024年12月16日 · soonraah
ふつうのデータ基盤移行 - Part 1. 戦略策定編
2024年12月1日 · soonraah
読書メモ: DMBOK2 第13章 データ品質
2024年11月18日 · soonraah
Data Contract CLI から考える Data Contracts ファーストのデータパイプラインの未来
2024年5月9日 · soonraah
読書メモ: DMBOK2 第8章 データ統合と相互運用性
2024年4月4日 · soonraah
読書メモ: DMBOK2 第6章 データストレージとオペレーション
2024年3月17日 · soonraah
読書メモ: DMBOK2 第5章 データモデリングとデザイン
2024年1月21日 · soonraah
読書メモ: DMBOK2 第4章 データアーキテクチャ
2024年1月6日 · soonraah
読書メモ: DMBOK2 第15章 データマネジメント成熟度アセスメント
2023年12月30日 · soonraah
現実の CSV ファイルのデータを BigQuery に load する仕組みを作るという泥臭い作業を dlt でやってみる
2023年12月20日 · soonraah
dlt 入門 - ELT の Extract と Load を担う data load tool
2023年12月18日 · soonraah
読書メモ: DMBOK2 第12章 メタデータ管理
2023年12月9日 · soonraah
CDC + Apache Iceberg で Amazon Athena にデータを取り込む
2023年12月3日 · soonraah
読書メモ: DMBOK2 第3章 データガバナンス
2023年11月19日 · soonraah
読書メモ: DMBOK2 第1章 データマネジメント
2023年11月13日 · soonraah
near real time で更新される Apache Iceberg の table のメンテナンス
2023年5月28日 · soonraah
Apache Iceberg の table を near real time で更新する
2023年5月11日 · soonraah
Data Contract について調べた
2023年4月8日 · soonraah
Glue Schema Registry の導入を断念した話
2022年12月13日 · soonraah
「データレイク」と「データレイク層」
2022年6月21日 · soonraah
成熟フェーズの事業におけるデータサイエンティスト
2021年7月12日 · soonraah
Apache Flink の Backpressure の仕組みについて調べた
2021年2月28日 · soonraah
データレイク関連の OSS - Delta Lake, Apache Hudi, Apache Kudu
2021年1月26日 · soonraah
いまさらながらのデータレイク
2020年12月31日 · soonraah
Apache Flink の DataStream API 利用時の CSV ファイル読み込み
2020年12月1日 · soonraah
機械学習の精度と利益と倫理とイシューと
2020年11月12日 · soonraah
ストリーム処理システムに求められる機能性、および Apache Flink におけるその対応
2020年11月7日 · soonraah
バッチ処理おじさんがストリーム処理のシステムを開発するにあたって調べたこと
2020年9月6日 · soonraah
A/B テストの運用が重くてつらいという話
2020年8月23日 · soonraah
Apache Flink の Temporary Table Function を用いた stream data と static data の join
2020年8月16日 · soonraah
Apache Flink の Broadcast State Pattern を用いた stream data と static data の join
2020年8月6日 · soonraah
あまり大きな Pull Request を作ってほしくない
2020年8月3日 · soonraah
勉強会メモ: Spark Meetup Tokyo #3 Online
2020年8月1日 · soonraah
Spark DataFrame クエリの弱い分離レベル
2020年7月19日 · soonraah
Apache Spark 3.0.0 について調べた
2020年7月12日 · soonraah