名前がない人のブログなんだ

ここに名前を入力してください。

【統計検定1級】統計検定1級の「統計数理」科目に合格した

 

時は2019年11月24日0時,統計検定の当日,大学にある24時間空いているセイコーマートで参考書を広げる男がーーこの男は一体?ーー

 こんにちは,ななし(@nanametal_)です.今回は統計検定1級(統計数理)に科目合格したので使用した参考書や対策期間と当日の様子について書いてみます.なお統計応用はお試し受験として理工学選択をした(例年確率分布からの出題が多く,他の選択区分である人文科学,社会科学,医薬生物学より範囲が狭く,数理統計学の知識でごり押しがしやすいといわれている)のですが,今年の理工学は以下の画像のように,数理統計学の範囲外である実験計画法やら分散分析やら時系列モデル(?)やらのオンパレードでしたので,結果はお察しです.(人文科学か社会科学選択すればよかった.)

また,私は統計学の背後にある数学的な裏付けの部分を勉強するのが好きで「趣味としての統計学」と位置づけ,「資格を取るために」とか「専門だから」というわけではないまま勉強していて直前期を除いて特別試験対策をすることはなかったので,最初は「統計数理」のみの受験でいいかなぁと思っていました.しかし「統計応用とセットなら1科目5,000円で受験できるよ!」とWebに書いてあったので,統計学会の策略に見事ハマってしまいました.(君はITマーケティングができるフレンズなんだね!)

f:id:sanagitosanagy:20191216171011j:plain

 

忙しい人のための簡単なまとめ

・統計検定1級[統計数理]に科目合格した.

・使用した主な参考書は

「現代数理統計学」(著: 竹村彰通)

「現代数理統計学の基礎」(著: 久保川達也)

統計学」(著: 久保川達也,国友直人)

統計学」(著: 馬場敬之)

の4冊と公式の過去問です.

今回は使用した参考書を時系列で書きたいと思います!編入学とは違うもう一つの自分の物語でもあるので,ちょっとだけ自分のことも書かせてください.

 

もくじ

 

大学1年生と統計学との出会い(2015年)

 私が初めて統計学に触れたのは,東京学芸大学にいたころに受講した後期開講の「心理統計法Ⅰ」という講義でした.その授業では尖度や歪度,不偏分散などを学んだのですが「どうして不偏分散はデータ数から1を引くの?」といった問いに答えていくようなタイプの講義ではなく,とにかく心理学を学んだり研究するために必要なツールとしての統計学を学びExcel等のソフトを使って分析できるようにするというスタイルでしたので,途中で受講を放棄してしまいました.よって統計学の基礎はほとんど身につかず,単位も落としてしまうという状態になってしまいました.しかし統計学自体はすごく面白そうだなと思ったので,少しは知識を身に着けておいたほうがいいのかな,と思い「統計学が最強の学問である」を読みました.(溢れ出るミーハー感)

統計学が最強の学問である

統計学が最強の学問である

 

 分散をなぜ絶対値を使って定義しないのか,といったことも書かれていて面白い本でした.この本を読んだのは4年前だし,せっかく購入したのに大学のロッカーに入れていたら無くなっていて,今手元になくてこれくらいしかレビューが書けない.最近はシリーズになっていて面白そうですよね,これ.

 

大学2年生とはじめての(数理)統計学学習(2016年)

 そんなミーハーだった自分がきちんと統計学を勉強しようと思ったきっかけが,大学2年生の時に初めて存在を知った編入学試験でした.入試でミクロ経済学マクロ経済学だけではなく統計学も出題される大学があるのですが,当時はその大学を受験してみたいなぁと思っていたので統計学の勉強を始めました.使用した参考書はおなじみマセマシリーズの「統計学」です.

この本はなかなか良かったのですが,後半でいきなりχ^2分布の確率密度関数の導出やF分布の確率密度関数の導出を扱っていたので初学者の私にとっては「これ何の役に経つんだろう...?」となっていた記憶があります.当時はこの本は難しいし,『確率・統計』の予備知識を持っている人が読み進めるべき本なのでは...?と思いました.のちにマセマから大学基礎数学編の「確率・統計学」が新たに出版されたのを見るとやっぱりな,と思いました.(自分が勉強していた当時はこの基礎数学編の統計学が存在してなかった気がする.)

 また,自分は高校では文科系のコースに所属していたのでいきなりテイラーやらマクローリンが出てきたときはビビりました.大学数学の知識を埋めながら勉強していたのですが,大学数学を独学でこなすのはなかなかに大変で線形代数学も当時は勉強していなかったため,2つの変数変換あたりは「なんかヤコビアンっていうのがあって斜めに掛け算して引けばいいんだな?」くらいの認識しかありませんでした.(のちに2×2の行列式であることを知る.) 

 

大学3年生と数学との闘い(2017年)

 独学での大学数学の理解に限界を感じていたので,きちんと勉強しようと思い数学科で開講されていた微分積分学線形代数学を受講しました.また,確率・統計なる大学2年生向けの授業も数学科のコースで開講されていたので併せて取りました.ですがこの確率・統計の講義,なんとマセマシリーズの「統計学」の内容よりも簡単でびっくりしてしまいました.χ^2分布やらF分布やらの導出はやらなかったのです.というわけで前年の復習みたいな感じになってしまい,新しい知識はあまり得られなかったので結局B3の間は純粋数学(微積やら線形やら)の勉強で終わってしまったような気がします.また,確率・統計の講義で使用していた参考書は「基礎統計学」という本です.

基礎統計学

基礎統計学

 

この本で推測や検定の例題や演習問題を解くと,何となく統計学をマスターしたような感覚になって「もしかして自分って『最強』なのでは??」とか思い始めるようになりました.また(この頃になってようやく)統計検定という資格があることも知り,統計検定2級くらいならすぐにでも合格するのでは??とか舐めていたので,統計検定2級対応の参考書を買いました.(確か2級は大学の教養程度の統計学と書いてあった気がするので,当時はきっと「それならもう余裕じゃん」となっていたのだと思います.)

日本統計学会公式認定 統計検定 2級 公式問題集[2014〜2016年]

日本統計学会公式認定 統計検定 2級 公式問題集[2014〜2016年]

 

ですがこの本の中を見て,「あ...れ...全然知らないことが多すぎるんだけど...えっ...」となりました.というのも自分が勉強していたのは統計学の中でも「数理統計学」の方面であって,欠測値をどうするだとかサンプルデータはどうやって集める(層別抽出とかのあたり?)だとかの話は全く分からなかったのです.結局その年の統計検定2級の受験は断念しました.

 また,編入学試験の結果が良好だった(し,お金もなかった)ため,結局統計学を使う大学の受験はしなかったのですが,結局上記の本を読んだだけで対策らしい対策はできず,経済学の勉強に追われていたことと数学の勉強で1年費やしてしまいました.

 

2度目の大学3年生と回帰分析(2018年)

 北海道大学経済学部へ3年次編入学しました.もともとは教育学部心理科にいたので大きな進路変更だと思います.経済学部は統計学の授業も充実しているのですが,どうも数学を使う事をセーブしているみたいで,後期に初めて統計系の講義である計量経済学を取ったのですが,あまりわくわくしませんでした.しかし,講義の後半は回帰分析の話が大半で最小2乗推定量は最良線形不偏推定量になっているとかいうガウス・マルコフの定理やら面白そうなのがいっぱい出てきたので満足できたかなとは思っています.講義の教科書は「入門 計量経済学」でした.

入門計量経済学―Excelによる実証分析へのガイド (経済学叢書Introductory)

入門計量経済学―Excelによる実証分析へのガイド (経済学叢書Introductory)

 

私はこの本を購入しなかったのですが,授業はこの本に大体沿っていたみたいです.編入後の大学3年生の時は1年間で72単位取得しなければならなかったので,その他の科目の圧(特に経営系のレポートなど)がすごくて統計に関するものはこれくらいしか勉強できませんでした.しかし本屋で統計検定の参考書を覗いてみると,1級に解いたことがあるような問題がいくつか出題されていたのです.「これはもう少し勉強すれば1級も夢じゃない...?」となりました.その年の申し込み期限は1週間前に過ぎてしまっていたので,1年後の試験(今回)に向けて再び統計学の勉強を始めることにしました.

 

荒れ狂う大学4年と乱れまくりの学習計画(2019年)

 3編生はとにかく忙しい.多分忙しい.自分が怠惰だからかもしれないけれど忙しい.というわけで当然独学の統計学学習は進むはずもなかったので,講義をペースメーカーにして勉強しました.数理統計学が学べる講義と重回帰分析が学べる講義の2つを履修したのですが,1つが当たりでした.(なお自分が当たりだと思っていた講義は周りの学生からは鬼と評されていた.)確率分布の和の計算から始まって,標本平均と標本分散が独立であることの証明や非心分布論,コクランの定理などを扱ってくれました.(講義の後半はクラスタリングをやったり主成分分析をしたり.)正直コクランの定理をきちんと理解したか?と言われると怪しいのですが,なんとか単位は取りました.

 また,院試が推薦タイプで早期に終えることができ,夏休みはある程度自由に過ごすことができたので,統計検定の勉強を再開しました.前期に熱意ある先生のもとで数理統計学を勉強できたので,独学用に用意していた本があるのですが「読める...本がらくらく読めるぞ...!!」となっていました.

f:id:sanagitosanagy:20191216171221p:plain

以下この時期に読んだ統計検定1級[統計数理]のために使用していた参考書です.

 

1. 現代数理統計学の基礎

現代数理統計学の基礎 (共立講座 数学の魅力)

現代数理統計学の基礎 (共立講座 数学の魅力)

 

 統計検定1級を受験される方であれば「またこれかよ」となっていると思いますが,私もそういったブログを参考にしていたのでとりあえずはこの本を軸に勉強を勧めました. しかし本文(理論)の方はいろいろ説明が省略されている気がしますし,測度論やルベーグ積分が未修の私にとっては,5.3.3節の「収束に関する諸概念」,5.5.2節ー5.5.4節,6.3.3節ー6.4.1節あたりは「ちょっと何言ってるかわからないですね...」となりました(完全なる実力不足).いつか測度論とかルベーグを学んで確率論もきちんと理解してみたい...

 そして学習していて一番つらかったのが数式の見づらさです...紙面の節約のためなのか数式が Var(X) = (m + 1)/(m + 3) - (m + 1) ^2 / (m + 2) ^2のように分数が書かれるのでできれば縦に書いていただけたら...なんて思いました.なんなら \sqrt{n} (Y/n - p)  \sqrt{n} (Y/(n - p))と見違えていたために問題がいつまで経っても解けない...ということも経験しました.

 (もう少し分厚くてもいいので,説明に紙面を割いたり数式をみやすくしていただけたらなぁと思いました.)

 しかし,章末の演習問題には解答がついていて(解答はWebページに掲載されていてちょくちょく更新されている.)後半の章の問題は解説もかなり丁寧に作られているので問題と解説の方に3,000円以上の価値がある気がします.問題がいっぱい載っていたのでたくさんチャレンジできて楽しかったです.ですが解説を見てもわからない問題が存在していて(2章の問5とか.),「統計検定1級合格のため」と割り切るときには過去問と照らし合わせながら出そうな問題を絞って解くのが良いのかな,と思いました.微分積分学線形代数学の予備知識がないと詰む感じになっていて,測度論や確率論の知識があれば全部理解できるといった作りになっていると思います.この本の対象がB3,4-M1らしく,数学科の学生はB4までにはルベーグやら確率論を勉強するので「そういうことなんだな」って思いました.(フーリエ変換は数学科ってやるんですかね...特性関数のとこでフーリエ変換...?ってなりました.)

 ペース配分は以下の通りです.受験の決意は2018/10なのに2019/1にやっと「現代数理統計学の基礎」購入.2019/2までで2章まで読みました.(大体1か月に1章のペースで読めば間に合うかなぁという甘い見通しを立てていました.)そこからは少し挫折して2019/7まで放置プレイしていましたが,夏休みを利用して2019/8-2019/10の間で一気に3-7章を読みました.ただし確率論が絡んでくるところは証明を飛ばして結果だけ覚えてました。9章は重回帰とマローズのCp基準まで読み,行間を埋めるのにちょっと苦労しました.対称でかつべき等な行列の性質を事前に知っているといいかもです.11章は棄却・受容法まで読みました.好きな乱数発生方法は確率積分法(逆関数法)です.正規乱数のボックス・ミュラー変換の演習問題は初見の時泣きながら解きました.演習問題は3,7章を除いて,どれも掲載されている問題のうち6割から8割くらい(おそらく)を解きました.

 

2. 現代数理統計学

現代数理統計学 (創文社現代経済学選書)

現代数理統計学 (創文社現代経済学選書)

 

  この本は1であげた「現代数理統計学の基礎」に書かれている内容がわかりにくかった時に補助的に使いました.私は「現代数理統計学の基礎」の5.4節「順序統計量」の部分の「 P(X_{(j)} \leq x_i) = P(Y \geq j)なる関係に着目すると」という記述の意味が理解できなかったため,順序統計量の話はこの竹村本で(たぶん)理解しました.また,十分統計量や統計的決定理論もこの本を参考にしました.分厚い本ですがその分日本語による説明も豊富なので,理論はこちらで演習は久保川本で,と分ければよかったかなぁと思っています.

 また,1,2と2つの本を読んでいて思ったのですが,誰かフィッシャー情報量の定義がどうやって作られたのか,その「気持ち」を教えてくれるような本を教えてください...フィッシャーさんはどうして, I_{n}( \theta)  = E \left [ \{ \frac{d}{d \theta} \log f_X(X | \theta) \}^2 \right ] という定義を考えたのですか...なかなか載ってなくて...

 

3. 統計学

統計学

統計学

 

 久保川先生と国友先生の書いた本で,「現代数理統計学の基礎」よりやさしい本です.時系列データの章だったり,尖度・歪度統計量だったり,ローレンツ曲線を扱っていたりして面白い本で,前述した「基礎統計学」よりもこちらで勉強したほうが幅広く知識を身につけられたのかなと思います.私は「現代数理統計学の基礎」の7章で,「詳しくは久保川・国友の『統計学』を見てね」と書いてある部分があった時に,初めて手に取ってみました.この本もまた,章末に練習問題が載っていて解答もきちんとついているのでオススメです.

 

4. KAKOMON

日本統計学会公式認定 統計検定 1級・準1級 公式問題集[2016〜2017年]

日本統計学会公式認定 統計検定 1級・準1級 公式問題集[2016〜2017年]

 

 過去問です.2018年のものはネットで見れます.時間は測らずに解きました.

 

5. 21世紀の統計科学

数理・計算の統計科学 (21世紀の統計科学)

数理・計算の統計科学 (21世紀の統計科学)

 

 スターリングの公式の証明のためにすこし.

 

6. マンガでわかるベイズ統計学

マンガでわかるベイズ統計学

マンガでわかるベイズ統計学

 

 ちなみにマンガを用いてもわからないものはわからない.あとこのシリーズの因子分析編は筆者が女の人を見下しているような書き方がされているように感じたので個人的にはあまり好きではないです

 

7. 入門確率過程

入門確率過程

入門確率過程

 

 機械学習やらクラスタリングやらはあまり興味がわかなかったので統計応用はお試し受験しました.確率過程の授業をとって,取れるところ確実にとって受かれば万々歳かなって思っていたので,授業で使う教科書であるこの本を買ったのですがマルコフ過程やらポアソン過程は載ってないそうです.その授業は結局履修放棄した.

 

8. 史上最強図解 これならわかる!ベイズ統計学

史上最強図解 これならわかる!ベイズ統計学

史上最強図解 これならわかる!ベイズ統計学

 

ベイズ統計は考え方といった基本的なところを理解できていなかったので簡単な本を1日で一気に読みました.なかなかわかりやすくて面白かったです.迷惑メール判定の話好きです.

 

あとは読んでみたい本です.

読んでみたい本

数理統計学 (数学シリーズ)

数理統計学 (数学シリーズ)

 

有名な本ですよね.

 

統計学入門 (基礎統計学?)

統計学入門 (基礎統計学?)

 

みんな読んでる通称赤本...どんな本なんだろう...

 

これも気になります.(ざっと読んでみたらなんか難しそうだった)

 

卒論でPythonを使っているので読んでみたいけどまだ手に取ったことのない本.怖そう.

 

まとめ

(きちんと整理してみると,大学2年の時の数理統計学と大学4年の夏くらいしか勉強の時間とれてないんだなぁ...となった.)

 

当日の様子

 この日あたりは生活が乱れまくっていたので,何を思ったのか1年に1度しかない試験を徹夜で乗り切ろうとしていました.幸い受験会場が自分の大学だったので,0時に会場入りしているやる気のある受験生もなかなかいないな(???)と思いましたよね.

 

 ここが今日の受験会場.6月の統計検定は会場が人文社会棟の大きい教室でしたので,普段使っている教室で受験できるなんてラッキーと思っていたら,全く行ったことのない地球環境科学院での受験でしたので驚きました.試験10日前にきちんと下見をする受験生でしたよね↓

当日は男の人ばっかりで女の人は数えられるくらいでした.そもそも受験生が少なく,全受験生が同じ教室に居ましたが,3級や2級の受験生が大半でした.1級の受験生は25人程度で,「現代数理統計学の基礎」を持っていた人がいて,アッこの人仲間だ!ってなりました.

 

そして午前の90分間で統計数理が終了.第1問目から積率母関数ではなく確率母関数で導出せよとかいう「わかるはずなのに頻出じゃないから対策していない」問題で死ぬ.その後も計算ミスやら90分の時間のなさにやられて実力が全く出せずに詰む.統計数理の落ちを覚悟する.

 

そして午後,ワンチャン狙いの統計応用(理工学)

  

その後自分で解答やらなにやらを作っていたので

ものすごく疲れました.この次の日はゼミで進捗報告があったので,かなりきつめな2日間でした.しかし,25日のエンカや11/26-29日の関西旅行という楽しみがあったので,頑張ることができました.改めてこの時期に会ってくれたナマケモノくん(@d7GNkbdVZ6Q0Ldd),しゅうこさん,いなか(@inakagurashy),もふ(@kiki_nnnn3),たまごやきさん(@teihen_gyakuten),Nさん(@hennyuugaku),むむくん(@6___6__m_m)本当にありがとうございました!

 

おわり.