と。

その時の気分で統計学をやっている

分断時系列デザインの推定方法を検討したが思ったように行かなかった話

この記事は

R言語アドベントカレンダー14日目の記事です。

昨日は以下のような記事を書きました。

socinuit.hatenablog.com

ここでも書いた通り、分断時系列デザインという分析デザインがありまして、
A/Bテストを含む実験が難しい状況でなんとか介入効果を推定するために、時系列データを使ってうまいことできないか、という取り組みを紹介しました。
不連続回帰デザインの特殊な場合とも解釈でき、一部の領域の学術研究でも利用場面がある、そこそこ便利そうな分析アプローチで、
日本語での記事も出ているという話まではしました。

この記事の中で「時系列データでの回帰モデルは、誤差項が系列相関を持っていたり、目的変数の時系列と相関していたりする事が考えられるので、単純なOLSはまずいのでは」
という懸念を持ちました。Rで検証してみようと思います。

githubはこちら

github.com

いやーGithub Copilotは便利ですね。
基礎となる分析アイデアと回帰式とシミュレーションデザインを提示したら一晩とかからず実装してくれました。

続きを読む

分断時系列デザインを考える

この記事は

この記事は統計・機械学習の数理 Advent Calendar 2025の13日めの記事です。

どの記事も「数理」に踏み込んでいるものの私の記事は多分そこまで数理には踏み込まず、方法論にとどまっている点は私の実力不足です。 許してとは言いませんが、休日の記事なのでユルく見ていってください。

続きを読む

今年買った統計学の本を流し読みして消化した気になる

この記事は統計・機械学習の数理Advent Calendar21日めの記事です。

正直数理的な要素を詰める時間が全く取れず、それでもなにか記事を書かなければという使命感から、今年読んだ本の紹介をすることにしてお茶を濁そうと思います。

かねてより本は割と取捨選択をするタイプで、図書館や書店でよくよく吟味してから買うのですが、なんだかんだ統計学の書籍はノールック購入してしまうのは未だに癖として抜けません。 今回に至っては本当に今年購入したのかすら定かではありませんが、記憶と出版年から「多分今年買ったんだと思います」という積読本を選び取り、今年のうちに流し読みだけでもしておこう、という雑な記事になります。

どれも良い本です。モチベーションのある人は是非買ってみてください。

続きを読む

好きなRパッケージが`{psych}`と`{lme4}`という話

この記事はR言語 Advent Calendar15日目の記事です。

私は卒論、修論、炎上案件は全部Rで切り抜けてきてい程度にはRを触れていて、かれこれ10年はRと暮らしています。
そうしていると当然、様々なパッケージに出会うものでして、Rユーザは好きなパッケージを述べることがアイサツ代わりになるので*1、今年のアドカレはそういう話をしようかなと思います。

昨今はtidyversetidymodelsといったパッケージ「群」が注目されています。
これらはRの良くも悪くもカオスなデータ分析のフォーマットに一貫した思想を持ってメンテナンスされています。 逆に言うと、これら以外のパッケージは、各領域の問題・関心に応じて異なります。 何よりR言語は「統計解析に特化した言語」であるはずなので、それはそれは多様な解析手法が実装されています。ただそこそこ残念なことに「統計解析」のパッケージに関してはそこまで注目されないのが、深層学習や大規模言語モデルが注目されるアルゴリズムになっている現代のデータ分析市場における、少しさみしいところです *2

仕事が修羅場だし、忙しくてなに書こうかなんともわからないし、どうせn番煎じで、漸近的には内容のない記事になるのですが、せっかくなので世話になったり、シンプルに好きな統計解析パッケージを2つ紹介しようかなと思いました。 数理的な話は統計・機械学習の数理Advent Calendarで書いてほしいし、何かを書きます。

*1:そんなこともない

*2:これらの発展は人類に大きく寄与するものである確信はありますし、測定できるデータの種類と量が増えたことで、 数理統計学が発展した時代の制約の一部が取り払われたことは間違いはないと思います。 これらを認めたうえで、私はこの趨勢が、個人的に、気に食わないというだけです。

続きを読む

『データ駆動型回帰分析』を読む(お気持ち理解編)

背景

調子に乗りました。

著者に反応を受けたら、そりゃやらないといかん

というわけで『計量経済学』でも有名な末石直也先生が2024年4月に出版された 『データ駆動型回帰分析』を購入してから5ヶ月、途中休職を挟んだもののだいぶぶん投げっぱなしだったので、改めて読みます。

www.nippyo.co.jp

続きを読む

【翻訳】マーケティング・ミックス・モデリングの批判的レビュー - 誇大広告から現実へ (後編)

はじめに

前編はこちら

Acknowledgements

この記事はmc51氏のブログ記事A critical review of Marketing Mix Modeling — From hype to realityを翻訳して紹介します。

記事執筆者の許可を得ています。Thank you!

凡例

  • 各種画像は元記事をそのまま引用していますが、なにせ「うわこれは翻訳しないといけない」という衝動が先で、その中身はGoogle翻訳超依存です。
    • 原文の主張を逸脱はしないように最大限考慮しながら、元記事のユーモア(あるいは皮肉)を日本側に寄せるために一部意訳をしている部分があります。
  • 原著は主張の根拠として脚注が充実していますが、便宜上インラインのリンクも代用します。具体の引用文がある場合や執筆者のコメントは脚注で表現します。
  • 前後編に分けてお届けします
    • 前編では統計学的な批判、後半は実務的な批判と結論を述べます。
続きを読む

【翻訳】マーケティング・ミックス・モデリングの批判的レビュー - 誇大広告から現実へ (前編)

はじめに

Acknowledgements

この記事はmc51氏のブログ記事A critical review of Marketing Mix Modeling — From hype to realityを翻訳して紹介します。

記事執筆者の許可を得ています。Thank you!

凡例

  • 各種画像は元記事をそのまま引用していますが、なにせ「うわこれは翻訳しないといけない」という衝動が先で、その中身はGoogle翻訳超依存です。
    • 原文の主張を逸脱はしないように最大限考慮しながら、元記事のユーモア(あるいは皮肉)を日本側に寄せるために一部意訳をしている部分があります。
  • 原著は主張の根拠として脚注が充実していますが、便宜上インラインのリンクも代用します。具体の引用文がある場合や執筆者のコメントは脚注で表現します。
  • 前後編に分けてお届けします
    • 前編では統計学的な批判、後半は実務的な批判と結論を述べます。
続きを読む