データの準備
データ分析実務スキル検定PM級を受験するにあたって、問題集や過去問だけでなくワードを覚えていくために一問一答を作りながら公式テキストを勉強すれば一石二鳥!と思い立ち上げました。
是非ご参考にしてください。
使い方はこちら↓
使用している本は唯一の公式テキストとなっている
「データ分析実務スキル検定 公式テキスト」です。試験範囲をすべてカバーしているものでデータ分析実務スキル検定PM級を受ける方必須のバイブルとなります。
データ品質とは
データの品質を表すこと3つ
正確さ、新しさ、目的と機能の適合性
探索的データ分析(EDA)によってデータを理解する
EDAに含まれる作業のステップ1
データの概観:データ数を確認、変数の数を確認
EDAに含まれる作業のステップ2
データの基礎集計:年齢や性別による層別、基本統計量の計算
EDAに含まれる作業のステップ3
データ理解のための可視化:散布図やヒストグラムによる可視化
EDAに含まれる作業のステップ4
簡単な分析:スモールサンプルの回帰分析
売上や身長のようた量を表すデータ
量的データ
曜日や店舗名等の質を表すデータ
質的データ(カテゴリカルデータ)
EDAのプロセスにおける可視化は~と呼ばれている
発見のための可視化
データの前処理
データの前処理はデータ分析作業全体の~割の時間を要するといわれている
8割
外れ値や誤記入などのデータを除外する作業
データクレンジング
男性を1にしたり、女性を0にしたり年齢の項目から年代を作ったりする作業のこと
データ加工
欠損データを含む行全体を除外すること
リストワイズ削除
欠損データを含む列(変数)全体を除外すること
ペアワイズ削除
第1章 | CBASへようこそ |
第2章 | ビジネス課題とKPIツリー |
第3章 | データ分析の活用とプロジェクト |
第4章 | データの準備 |
第5章 | リサーチとレポーティング |
第6章 | 予測モデルを使ったデータ分析 |
第7章 | データ可視化の基本 |
第8章 | 統計学の基本 |
第9章 | 統計手法の基本 |
第10章(未) | 機械学習の基本 |
第11章(未) | Excelでできるデータ分析 |
第12章 | SQLの基本 |
第13章(未) | Pythonの基本 |
第14章(未) | Rの基本 |
コメント