誰にも見つかってはいけないブログ

あなたにだけは見つかりたくなかった

博士課程-1日目

現在22時半。危うく更新するのを忘れるところだった。

 

明日は4月1日,新年度の始まりである。さらに,昼前に新しい元号の発表があるらしい。そんな世間のキラキラムードとは異なり,僕は先生から振られた仕事が上手く進んでおらず,研究室に行きたくない気持ちでいっぱいだ。元号が発表されるまでにベッドから出られるだろうか。

 

元号についてのツイートでは,これが一番好きだった。

 

 

今日は朝起きて洗濯をし,昼からベイズ統計の勉強会に参加した。今日の内容はHMC(Hamiltonian Monte Carlo)というMCMCの一種についてだった。Rで実装して,なぜそうなるかの説明は次章に回すという,Statistical Rethinkingお得意のパターンだった。

 

勉強会の後,MCMCによるシミュレーションを使うメリットは何かという話になった。「実測値→モデリング→シミュレーション→推測値と実測値を比較し,近似していたらハッピー」みたいな流れなんだろうけど,「実測値→モデリング」の時点で,モデルには信頼区間ベイズの場合は信用区間)があるので,実測値とどの程度フィッティングしているかはわかるのでは?というものだ。シミュレーションをすると,発表スライドや論文に「シミュレーションの結果,こうこうこういうことがわかりました」と何か書けるのだろうか?

 

途中,「複数のモデルを比較するのに役立つのでは?」という意見が出たが,AICとかBICをもとに複数のモデルを比較すればシミュレーションなんて必要ないわけで。

 

最終的に,「モデルの変数(パラメータ?)をいじってシミュレートすることで,実験していない状況を扱える」という意見が出て,それに賛同した。合ってるかどうかは知らん。

 

もしこれしかメリットが無いのであれば,僕は(現時点では)MCMCを使わないかな〜〜と思った。まあ実際にシミュレーション有りきで実験を考えて,データを取って,分析してシミュレーションして…という一連の作業をやってみたいことには判断できませんな。ベイズもそう。道のりは長いなあ。

 

ベイズの勉強会で毎回話題に出るのが,「で,これは僕(たち)がやっている実験の分析にどう使えるの?」というものだ。毎回「実際にベイズで分析を行う前提で実験を考えてやってみないとわからないね」という結論に至るのだが,同期曰く『ベイズ統計で実践モデリング-認知モデルのトレーニング』という本(通称『コワい人本』あるいは『赤い人本』)を読むといいらしい。犬4匹本と並行して勉強会開くしかないな。

https://www.amazon.co.jp/ベイズ統計で実践モデリング-認知モデルのトレーニング-マイケル・D-リー/dp/4762829978

 

こっちもいいかも。豊田先生だし。stanだし。

https://www.amazon.co.jp/はじめての-統計データ分析-―ベイズ的%E3%80%88ポストp値時代〉の統計学―-豊田-秀樹/dp/4254122144

 

 

2群間の平均値比較(頻度主義におけるt検定)も,ベイズでそれっぽくできるよね。と思って説明しようとしたら上手く言語化できなかった。つらい。両群の分布の山がどの程度重なっているかを(目視で(!?))判断すればいいの?μ?σ?ベイズファクター?なにそれ?

 

以下のサイトが参考になりそうだったので,ちょっと今から読んでみる。

ajhjhaf.hatenablog.com

 

頑張ろ。