2週間で統計検定3級に受かったので諸々まとめ
はじめに
先日統計検定3級を受験し、無事合格してきました。結城智久(@TomohisaYuuki)です。
どのような勉強をしたのかなどまとめておきます。参考になれば幸いです。
受験の動機
2019/5〜2020/3の約1年間、勤務先のデータ分析専門部署に異動してデータ分析の実務研修を受けていました。
今月から元のSE部署に戻ったのですが、しばらく業務ではデータ分析に携わる機会が無いとのこと…なので、せっかく学んだことを忘れないためにpythonやデータ分析の勉強は趣味がてら個人的に継続していくことに。
その勉強の一環としてわかりやすく資格を取ろうと思い、データ分析に関連する資格を調べると以下のものが見つかりました。
- 情報処理関連:基本情報処理技術者、応用情報処理技術者
- DB関連:データベーススペシャリスト、OSS-DB技術者認定試験
- Python関連:Python 3 エンジニア認定基礎試験
- 統計関連:統計検定
- AI関連:ディープラーニング検定(G検定、E資格)
この中で基本情報・応用情報・データベーススペシャリストは取得済み。
残ったものの中で
- すぐに受験できる
- そこまで費用がかからなさそう
- 社内資格取得の際の加点対象資格に指定されている
ということから、統計検定を受験することにしました。
かなり無謀ですが、上期中に準1級を取ることを目標に以下のスケジュールで受験を進めていこうと考えています。準1級は毎年6月しか受験機会がないので、それまでにCBTで3級、2級を取る流れです。
受験日 | 受験級 | 受験形式 | 勉強期間 |
2020/4頭 | 3級 | CBT | 0.5ヶ月 |
2020/5頭 | 2級 | CBT | 1ヶ月 |
2020/6/21*1 | 準1級 | 紙媒体 | 1ヶ月 |
2020/11/22 | 1級 | 紙媒体 | 5ヶ月 |
僕のスペック
- 数学・統計:苦手だけどなんとなく知ってるようなことは多い
中学から数学は苦手で、高校はやんごとなき事情により理系コースを選択するも成績は壊滅。
大学は経済学部に通うも2年次必修の統計学を落とし続け、4年次に試験直前に公式を丸暗記してやっと取れた程度。
- データ分析:1年弱実務実務を経験、ただし高度な前処理やモデル構築は未経験
社会人7年目。SIerでSEやってます。
システム開発のPMチームで3年→上流提案チームで2年→データ分析実務を1年程度経験。データ分析では高度な手法は使っておらず、四分位範囲・回帰分析・相関分析と決定木を組み合わせた異常値検知モデルを作成した程度。
というように「まるっきり何も知らない」というわけではない状態からのスタートでした。
公式テキストの目次を眺めてみたら「確率」「確率変数と確率分布」「統計的な推測」あたりは難しそうだけど、それ以外はどうにかなりそうだ、という感触です。
勉強方法
勉強は以下の通り行いました。トータル約14日・40時間弱費やしたようです。
- 公式テキスト「統計検定3級対応 データの分析」を読む【約6日:12時間】
- 公式テキストで躓いたあたり(6章:確率のあたり)で「完全独習 統計学入門」にシフトして読み終える【約4日:12時間】
- 公式テキストに戻って読み終える【約2日:6時間】
- 過去問「日本統計学会公式認定 統計検定 3級・4級 公式問題集(2017〜2019)」を解いて間違えたところを復習する【約1日:6時間/3回分】
- 過去問に含まれていない範囲を公式テキストの章末問題で復習する【約1日:3時間】
公式テキストについて
公式テキストは説明が長くてわかりづらく、また淡々としているので読み進めるのはなかなか苦痛です。
僕の場合、想定通り「確率」「確率変数と確率分布」で理解が追いつかなくなり、章末問題が全く解けなくなりました…
(あと眠気に襲われて読み進められなくなりました)
なので、もっとわかりやすく楽しく読める本はないかと探し、評判が良さそうだった「完全独習 統計学入門」を読むことにしました。
最初からこちらを読んでいればよかった…と思えるほど分かりやすくて、一気に理解が深まりました。語り口が軽快で図解も多く、おすすめです。
過去問について
過去問は直近のものから3回分やりました、が、2020/4から統計検定3級の試験範囲が変わっています!(出題範囲に「相関と回帰」「確率分布」「統計的な推測」が加わっているそうです。*2)
最新の過去問(2017〜2019)には新出題範囲が含まれていないので、その部分だけ公式テキストの章末問題を再度解き直して復習しました。
(試験前日に気づいて死ぬかと思った。道理で過去問簡単に感じたわけだ。)
受験結果
87 / 100 (合格評価得点:65)で合格しました。
全30問で、正解率の内訳は以下の通りです。
- データの種類・標本調査・実験・統計グラフ:100%
- データの代表値・散らばり・回帰:100%
- 確率・確率分布・統計的な推測:52%
やっぱり苦手だったうえに過去問がなくて対策が不十分だった確率・確率分布・統計的な推測の正答率が低かったです。
この範囲は上の級を取得するのに必須な知識のはずなので、改めて勉強しないと…
おわりに
とりあえず合格するだけなら2週間程度(2〜3時間/日)の勉強でどうにかなりました。(勉強時間は通勤片道1.5時間を活用)
ちゃんと理解して演習も十分やるためには、余裕を持って1ヶ月ぐらい時間があったほうがいいのかな、と思います。
あと確率・確率分布・統計的な推測など自分で計算する問題はどれだけ事前に演習問題を解いておけるかが大事です。現状だと公式テキストの章末問題を解くしか方法がないので、なにか良い教材があれば追記します。
*1:新型インフルエンザ等対策特別措置法に基づく緊急事態宣言の発令に伴い、試験中止。受験スケジュールは再考します。
*2:統計検定 3級|統計検定:Japan Statistical Society Certificate
「新出題範囲対応教材・例題集」を参照