多項ロジットモデル、条件付きロジットモデル

  • ????????????????????

ロジットモデル・ファミリーに関するメモです。添字は次の意味とします。

  • i=1,2,…,I 個人
  • j=1,2,…,J カテゴリー(選択肢)

Quantitative models in marketing research の pp.77 にはこんな記述がある(抄訳):

一般にマーケティングの際には大きく3タイプに分類される説明変数に出会う.
1つ目は個人の間で異なり,選択肢の間では同一な変数だ.例えば,年齢,収入,性別などがそうだ.これは \(X_i\) と記述する.
2つ目は個人の間で異なり,さらに選択肢の間でも異なるような変数だ.個人 i にとっての特定の購入機会における商品 j の価格などが例として考えられる.これは \(W_{ij}\) などと記述される.
3つ目は個人の間では同じだが,選択肢の間で異なるような変数だ.これは1パッケージあたり何個詰めか,などの例が考えられる.これは \(Z_j\) と書くことにする.

大雑把に言えばこの3つはデモグラフィック,シチュエーション,製品スペックに対応していると理解すればよさそう。

自動車購入の例

もうすこし具体的に自動車の購入について考えてみる。トヨタのクラウンとホンダのフィットの二種類から選択するという状況を考えてみる[1]

タイプ1の変数は、上でもあげたとおり、年齢、性別、収入などでしょう。年配の人や高所得者はクラウンを選びやすいし、女性はフィットを選びやすい。

タイプ2の変数はこの場合で言えばディーラーまでの近さなどがあるでしょうか。この変数は(住所が異なれば)個人ごとに異なるし、製品ごとにも異なる(トヨタとホンダのディーラーの場所が異なるため)。

タイプ3の変数は燃費、価格などのスペックに相当。意思決定主体に依存しない客観的な商品属性です。

多項ロジットモデル

いわゆる多項ロジットモデルは上の変数のうち,タイプ1である \(X_i\) のみを使う。
\begin{align*}
P(y_i=j | X_i)\propto \exp(\beta_{0,j}+\beta_j’x_i) \qquad j=1,2,…,J
\end{align*}
K を説明変数の次元とすれば,推定すべき変数の個数は (J-1)(K+1) になる。

条件付きロジットモデル

多項ロジットモデルと混同しやすい条件付きロジットモデルは,上であげた “Quantitative models in marketing research” によれば、タイプ2の \(W_{ij}\) を使うらしい。
\begin{align*}
P(y_i=j | \{W_{ij}\}_{j=1}^J)\propto \exp(\beta_{0,j}+\gamma’w_{ij}) \qquad j=1,2,…,J
\end{align*}
このへんは自分の理解とは違っていて,混乱してしまう。上で言うところのタイプ3を使うものを条件付きロジットという,と理解していた[2]。さらに \(\gamma\) は j に依存しないの?とか思ってみたり。

最も一般的な形式

まあ,結局はもっとも一般的な式として以下のようになる,と書いてある。
\begin{align*}
P(y_i=j | X_i, \{W_{ij}\}_{j=1}^J, \{Z_j\}_{j=1}^J)\propto \exp(\beta_{0,j}+\beta_j’x_i+\gamma_{j}’w_{ij}+\alpha’z_j)
\end{align*}
ここではなぜか \(\gamma\) の j 添字がついている。とにかく,この最後の式で理解すればよい,と理解した次第。これをもとに混合ロジットなり、GEVなりに拡張していけばOK、のハズ。

離散選択モデルに関するこのブログ内の記事はこちら
[タグ : DiscreteChoiceModel]

はてなブックマーク - 多項ロジットモデル、条件付きロジットモデル
Pocket

  1. [1] あまり現実的な選択肢集合とは言えないかもしれませんが…(笑
  2. [2] これを条件付きロジットの定義としている本もあったと記憶しているのだけど…定義がまちまちなんでしょうか?