【PythonとSparkで始めるデータマネジメント入門】 ビッグデータレイクのための統合メタデータ管理入門



【PythonとSparkで始めるデータマネジメント入門】 ビッグデータレイクのための統合メタデータ管理入門

Rating 4.25 out of 5 (14 ratings in Udemy)


What you'll learn
  • データレイク(データ基盤)のデータ分析に含まれる多くのアクティビティのうちの一つメタデータについて学べます
  • データの沼化を防ぐためのメタデータ管理について学びます
  • メタデータ算出や取得のためのPython(PySpark)ブログラムを学びます
  • メタデータの算出や取得だけにとどまらず、メタデータの活用方法について学びます
  • 小さなデータレイクから大きなデータレイクにおいてデータを管理する感覚を学びます
  • アクセスログの整形方法をデータエンジニアリングを通して学びます
  • よくある関数の羅列ではなく、実際の現場で考えているメタデータ管理の内容を学べます

Description

現役のデータエンジニアがレクチャーします!


AIや機械学習を行う際に最も時間のかかる作業は、データの準備とそれらの管理です。これらの作業のことをデータエンジニアリングと呼びます。実に80%以上の時間をデータエンジニアリング(データサイエンスのための前処理やメタデータ管理)に割いてる …

Duration 2 Hours 58 Minutes
Paid

Self paced

Beginner Level

Japanese

99

Rating 4.25 out of 5 (14 ratings in Udemy)

Go to the Course
We have partnered with providers to bring you collection of courses, When you buy through links on our site, we may earn an affiliate commission from provider.