2024-11-01から1ヶ月間の記事一覧

多重代入法の理論と実装と検証(統計的な欠損値補完)

はじめに 多重代入法の理論 多重代入法の発展理論 Joint Modeling(JM) Joint Modeling(JM)実装と検証 Fully Conditional Specification(FCS) FCSの実装と検証 MCMCアプローチ MCMCアプローチの実装と検証 IterativeImputerの理論 IterativeImputerの実…

GAM(一般加法モデル)による時系列モデリング(主に広告効果のモデリングに関して:MMM亜種)

はじめに 時系列におけるGAM GAM実装してみた(検証) 広告効果の文脈に焦点を当てて これまでの話をGAMで実装してみる MMMとの比較 最後に はじめに 最近GAMを用いて時系列モデリングをしたので、その経験を基に理論的な解説をしていきたいと思います。時系…

セミパラメトリック手法の1種GAM(一般化法モデル)の理論

はじめに GAM(一般化法モデル)の理論 セミパラメトリック手法 GAM 最後に はじめに 最近私は、因果推論と並んでセミパラメトリック手法にとても興味関心を持っています。解釈したい部分はパラメトリックに、それ以外の部分はノンパラメトリックにというう…

IPWと多重代入法を用いた欠損値ありデータに対する傾向スコアマッチング

はじめに IPWと多重代入法を用いた欠損ありデータに対する傾向スコアマッチングの理論 実際に実装してみた 最後に はじめに 最近、欠損値ありデータでの傾向スコアマッチングを実装する機会があったので、見聞きはしていたIPWと多重代入法を用いた傾向スコア…

k-meansのクラスター数の決定に情報量規準(BIC)を使用するのはどうか?(結論いいのではないか?)

はじめに なぜ適切だと思うのか 完全に余談(混合ガウスモデルとk-meansの関係性に関して) 最後に はじめに 以前こんな記事を読みました tjo.hatenablog.com 私も尊敬しているTJOさんの記事ですね、内容的にはエルボー法はよくないよね、BICとかのほうがい…

クラスタリングにおいて各変数の寄与度を算出する方法の理論と実装

はじめに 寄与度の算出方法 分散比 F値 シルエット係数 実装 最後に はじめに クラスタリングにおいて、どの変数が効いているのかを見たい的なことを思ったことはありませんか?正直私はなかったです。ですが、ビジネス側の人から寄与度的なものがあると嬉し…

k-meansにおいて欠損値を含むデータをそのまま使用できるようにする方法

はじめに どうやってやるのか ユークリッド距離バージョン 実装コード コサイン類似度バージョン 実装コード 最後に はじめに クラスタリングしたいけど、データの属性情報に欠損がありすぎて、クラスタリングにその変数が使えない!みたいな現象に出会った…

BSTSモデル(Bayesian Structural Time Series model)の理論(Causal Impactで使用されているものです)

最初に BSTSモデル 基本構造 トレンド成分の詳細 スパイクスラブ分布 BSTSモデルは状態空間モデルの一種です 概念的な説明 付録(stanがわかる方向けに) 最後に 最初に 今回は、Causal Impactの内部で使用されている、BSTSモデルに関して説明していきたいと…

ベイジアンネットワークの理論と実装

はじめに ベイジアンネットワーク 概要 理論 モデル手順 スコアベースの手法 制約ベースの手法 パラメータ学習 静的ベイジアンネットワーク実装 動的ベイジアンネットワーク (DBN) 構造方程式モデル(SEM)の実装 最後に はじめに 前回のLiNGAMの記事に引き…

DIDにおける傾向スコアを用いて平行トレンドを満たす方法の実装編

はじめに 実装編 最後に はじめに 以前DIDにおいて傾向スコアを使用して、平行トレンド仮定を満たす方法という記事を書きましたね、その実装に関しては、理論さえ分かってしまえば簡単なのですが、書く記事の題材が思い浮かばなかったので、今回はその記事の…

介入のタイミングが異なる場合のDID

はじめに 実装編 最後に はじめに 大分前に、私の初めての記事として、介入のタイミングが異なる場合のDIDの論文に関しての解説記事を書きました。最近の私の記事では、コードも基本的に付属しているので、理論だけしか説明してなかった記事に関しても、実装…

ベイジアンA/Bテストの理論と実装

はじめに ベイジアンネットワークの理論 通常のA/Bテストとの違い 実際にやってみた 最後に はじめに XでベイジアンA/Bテストを実装した記事を書こうという話をしたので、今回この記事を書くことになりました。 私自身、ベイジアンA/Bテストを知ったのは、本…

混合確率分布クラスタリングモデルの理論と実装

はじめに 混合確率分布モデルの理論 モデルの概要 メリット・デメリット 前提と仮定 どんな変数にはどの確率分布を? カテゴリカル変数用の分布 多項分布 ベルヌーイ分布 連続値変数用の分布 正規分布 ガンマ分布 混合モデルの理論 パラメータの推定アプロー…