ネスティッドロジットモデルとIIA特性

離散選択モデルに関するこのブログ内の記事はこちら
[タグ : DiscreteChoiceModel]

以前、ロジットモデルとログサム変数についてのエントリーを書きました(その1その2)。このエントリーではネスティッドロジットモデル (入れ子型ロジットモデル, Nested logit model, NLM)について書いてみようと思います。NLM について考えるためには「そもそもなぜロジットモデルじゃいけないの?」ということを理解しなければいけませんが、これは巷でも言われているとおり、IIA 特性というロジットモデルの問題点について理解する必要があります。

選択肢の類似性

例題を使って考えてみましょう。

ある小さな町のオフィス街には牛丼屋しかありません。ランチの選択肢としては「牛丼」「弁当持参」の二つの選択肢しかなく、半分の人は牛丼を、残りの半分の人は弁当を持参していました。そんなある日、この小さな町のオフィス街に新しい牛丼屋が誕生しました。働いている人たちは「別の店作ってくれよ」と思いましたが、こればかりはどうしようもありません。さて、新しい牛丼屋ができた後のランチの選択の割合はどのように変化したでしょうか?

さて、常識的に考えると、この問題の答えは弁当持参の人があいかわらず半数近くで、「牛丼」というカテゴリーでレッドオーシャン(激しい競争)になる、と考えるのが妥当でしょう。典型的な回答は

牛丼屋A:25%, 牛丼屋B:25%, 弁当持参:50%

となるでしょう。新しい牛丼屋の味が気に入った弁当持参の人たちがいるとするならば、多少は牛丼に流れるので

牛丼屋A:26%, 牛丼屋B:26%, 弁当持参:48%

という回答もアリでしょう。選択肢が三つになったのだから

牛丼屋A:33.3%, 牛丼屋B:33.3%, 弁当持参:33.3%

という回答も考えられますが、普通、この回答はどこかおかしい、と考えるでしょう。これがおかしい、と思うのは上の状況では私たちは「選択肢の類似性」を暗黙的に仮定していたからなのです。ようするに「今まで弁当持参していた人は牛丼屋がもうひとつできたぐらいで行動を変えたりしない」ということですね。

IIA特性

さて、ロジットモデルのIIA特性について考えてみましょう。ロジットモデルは
\begin{align*}U_i=V_i+\varepsilon\end{align*}
という確率的な効用を仮定して、この U_i が最大になる選択肢を選択する、というモデルです。\(V_i\) は非確率的に決まる効用の項で \(\varepsilon\) は独立な Gumbel 分布に従う確率変数です。このとき、選択肢 i が選択される確率 \(P_i\) は
\begin{align*}P_i=\frac{\exp(V_i)}{\sum_i\exp(V_i)}\end{align*}と計算されます。

ロジットモデルで仮定されている選択のメカニズムをすこしアルゴリズム的に書くならば、Aさんは選択の際に Gumbel 分布から選択肢の数だけの乱数を「独立に」発生させて、それをもとに効用 \(U_i\) の値を計算する、という感じでしょうか。さて、上の例題の各選択肢の \(V_i\) を決めなければなりません。通常、マーケティングなどでは
\begin{align*}V_i=\beta_{\text{price}}\times\text{(price)}+\beta_{\text{taste}}\times\text{(taste)}\end{align*}
などとしてパラメータ推定を行います。
この例題では選択確率が50%ずつなので、効用の値は同じである、ということがわかります。簡単のために \(V_i\) の値は牛丼、弁当持参ともに 1 であるとしましょう。

新しく参入してきた牛丼屋Bももともとあった牛丼屋Aとほとんど条件が同じならば効用の値はやはり 1 になるでしょう。しかし、三つの選択肢の効用がすべて 1 の場合、選択確率は

牛丼屋A:33.3%, 牛丼屋B:33.3%, 弁当持参:33.3%

となってしまいます。先ほど、
これはおかしい!と考えた回答になってしまいました。これがロジットモデルの IIA特性(Independence from Irrelevant Alternatives:無関係の選択肢からの独立)です。新しい牛丼屋Bができると、牛丼屋Aからも弁当持参の人からも等しく牛丼屋Bへシェアが移動してしまう、という問題点です。

少し蛇足かもしれませんが、今度は牛丼屋の方の効用を調節して

牛丼屋A:25%, 牛丼屋B:25%, 弁当持参:50%

を実現することを考えてみましょう。
このとき、各選択肢の効用は

牛丼屋A:0.3, 牛丼屋B:0.3, 弁当持参:1

となります。当然、この効用を使えば、はじめの二つの選択肢の場合(50% ずつの場合)を説明することができなくなってしまいます。

GEVモデルとネスティッドロジットモデル

この問題を解決するためにはロジットモデルの枠組みから外へ出ないと解決しません。ロジットモデルが IIA 特性というある種の独立性を持っていたので、ある種の依存関係を持たせればよいのではないか、ということになります。この「依存関係」というものが上で言及した「選択肢の類似性」です。選択肢の類似性というものは
\begin{align*}U_i=V_i+\varepsilon\end{align*}の誤差項の相関によって考慮することができます。
さきほどのランチの例で言えば、牛丼屋A, B の誤差項の値が正の相関を持っている(牛丼屋Aの効用が大きい人はやはり牛丼屋Bの効用も大きい傾向にある)。

このような一般的な相関を考慮する最も一般的な枠組みがGEVモデルです。GEVモデルについてはこのエントリーでは割愛します。GEVモデルの特殊形がネスティッドロジットモデルです。

ネスティッドロジットモデルでは選択肢を木構造でグルーピングし、同じグループに含まれる選択肢は選択に正の相関がある、とするようなモデルです。ランチの例でいれば牛丼屋A, B を同じ「牛丼」というグループと考えることでロジットモデルの IIA 特性を緩和しよう、という考え方です。

今回はこの辺で終わりにします。ネスティッドロジットモデルといいながらほとんどIIAの話になってしまいました。時間のあるときにネスティッドロジットモデルについてもう少し詳しく書いてみようと思います。

離散選択モデルに関するこのブログ内の記事はこちら
[タグ : DiscreteChoiceModel]