サンクコストと時間非整合性
「サンクコスト効果はどうして起きるのだろうか?その背後にあるメカニズムとは―――?」
1. 時間整合性
時間整合性(time consistency)という言葉がある。
これは、ある時点での最適計画が、その後の時点においても最適な計画になっている状態のことである。分かりやすく言えば、次のようなことだ。
新宿にいる人が今から北千住に向かうときに「電車で行くことが最適である」と考えて、それを実行したとしよう。
このとき時間整合性があるとは、電車が上野あたりに着いた時点において今後の最適移動計画を再考したとしても、このまま電車で北千住まで行くことが最適であると判断を下す事を言う。
逆に、再考の結果、電車を降りてタクシーにでも乗ることが最適になるときは、この人の移動には時間非整合性があったということになる。
(この時間整合性は動的計画法における最適性原理の概念そのものであり、非常に重要な役割を果たしている。)
2. 時間整合性が成り立たない場合
一見すると、この時間整合性は非常に直感的であり、全ての計画において成り立つ性質であるかのようにも思えるが、これが実際そうでもなかったりする。
どういう時に時間整合性が成り立たないかというと、一言で言ってしまえば、
「将来の行動が、現在または過去の評価額(効用やリターン)を変える場合」
である。
過去や現在の行動が将来のリターンを変えることはしばしばあるので、こちらは想像は容易だろう。
しかし、"将来の行動が過去のリターンに影響を与える"というのは、なかなか想像し難いかもしれない。
何故なら普通は、過去のリターンというものは既に過去に受け取ったものであり、どう将来に行動しようが、少なくとも「受け取った事実」は変わりようがないからだ。
例えば、昨日パチンコで10万円負けたとすると(負のリターン)、その10万円負けたという事実は、将来どう行動しようが変わりようがない訳で、ただの"サンクコスト"になっている。
2-1. 直感的説明
将来の行動が過去のリターンを変えるというのは直感的な説明は難しいが、あえて試みるとすると、次のようなケースに成り立つと思われる。
それは、「これは過去のリターンを再評価できる」ような場合である。
これは、リターンがお金の場合には到底無理な話だ。何故なら、先ほども言ったとおり、過去に受け取った(あるいは失った)金額というものは変えようがないからだ。
しかし、リターンがお金ではない場合ならどうだろうか。つまり個人の主観的な満足度(効用)である場合だ。
我々はしばしば、自分の過去の行動に対して、悔いたり嘆いたり、あるいは貴重な体験であったと評価を下すことがある。
しかし、その過去の評価というものは、後々の人生の歩み方によって多少なりとも変わってくるはずだ。
過去の辛く苦しい嫌な体験が実は自分の人生で貴重なものだったのだと再評価することもあるし、あるいは人生最良の時間と思っていた過去のある時期が、実はひとりでぬか喜びしていただけだったと気づかされることもある。
2-2. わかりやすい?例
言葉で議論すると漠然としているので、数字を用いて説明をしよう。
いま、医者になるために必死で勉強を重ねている人がいるとする。
しかし、この人はある日ミュージシャンに感化されて、急に音楽の道に進みたくなった。いわば人生の岐路である。
このまま医者になれば今後50のリターンが受け取れ、音楽家になれば100のリターンが受け取れるとする。
当然、"今後のリターンだけを考えれば"、この人は音楽家になることが最適である。
サンクコストの理論から言えば、「今まで医者になるために費やしてきたお金や労力はサンクコストなのだから、現時点から見て最適な計画を組むのがベストですよ」という事なので、それに従えばこの人は音楽の道に進むべきである、という結論でお終いになる。
しかし、音楽家の道を振っ切って医者として生きることを選び、死ぬ間際に自分の人生全体を評価したとしよう。
このときこの人は、医者になるために勉強を重ねていた過去の期間を、辛かったけど良い体験だったと評価し、過去の期間のリターンを70と評価したとする。
また音楽家になった場合、医者になるために勉強していた過去の期間は「人生の暗黒時代」だったという評価を下し、リターンは0としよう。
(確かに今後音楽家になろうが医者になろうが今まで必死こいて勉強してきたことには変わりはないのだが、それが無駄になったのかならなかったのか、主観的な評価が変わってくるということ。)
そうすると人生トータルでのリターンは、70+50>0+100となり、医者になった場合の方が高くなる。
つまり、人生の岐路の時点では音楽家になることが望ましいのだが(その後のリターンだけを考えれば)、一方で人生の最初の時点では医者になることが望ましかったことになり、時間非整合性の性質が現れた。
ここで大事なのは、後に最適計画を再計算するときに、"その時点以降のリターン"を最大にするように行動を選ぶから時間非整合性が生じる、というである。
このとき、現在の行動が過去のリターンに与える影響が考慮されずに現在の行動が選ばれる訳だ。いわば異時点間外部性(Intertemporal Externality)なるものが発生している。
3. 具体例とサンクコスト
群馬の八ッ場ダムが話題になっているが、あれこそ時間非整合性の例なのかも知れない。
過去において自民党政権が八ッ場ダムを造るのが最適だと思ってここまでやってきたが、政権が民主党に変わったことで最適計画の練り直しが行われ、今後のリターンを考えると計画を中止した方が良いという流れになっている訳なのだから。
もちろん、今後の収益や費用対効果だけを考えれば、建設を中止するのが望ましいのだろう。今までの投資はサンクコストなのだから。
しかし現地住民にとっては、今後建設を進めるか中止するかによって、過去の評価が変わってくるのである。現在時点からの利得を最大化するのか、それとも過去の時点からの利得を最大化するのか、それが問題である。
民主党政権が最大にしようとしているのは今後のリターンである一方、現地住民が見ているのは今後のだけでなく過去のリターンも含めた全体的なリターンを見ている。ここに両者の食い違いが発生しているのだ。
そのため、いくらサンクコスト理論を訴えようが、あまり効果はないのかも知れない。
あまり厳密な議論は避けているので、色々ツッコミ所はあるかと思いますがご容赦を。
経済学が大好きな人は、こちら↓もやってみて下さい。
Exercise
3期間を生きる個人を考える。この個人は、自らの効用が最大になるように、初期資産W1をそれぞれ3期間に渡って支出する。
効用関数はU=U1+αU2+βU3である。U1,U2,U3はそれぞれの期の効用を表しており、α,βは割引率である。
ここで、それぞれの期の支出額をe1,e2,e3としよう。
このとき、各期の効用は、U1=In(e1e2e3), U2=In(e2e3), U3=In(e3)である。(1,2期の効用の式が将来の支出に依存していることに注目)
また、制約式としてはWt+1=Wt−etが成り立つ。このとき明らかにW4=0であり、またe1+e2+e3=W1が成り立つ。
(i) この個人の、1期目における最適支出計画(e1,e2,e3)を求めなさい
(ii) 個人は(i)で求めたe1の通りに1期目に支出を行ったとする。このとき、今後の効用αU2+βU3を最大にするように最適計画の再考をしたとすると、そのときの(e2,e3)はどうなるか求めなさい。
(iii) (i)で求めた(e2,e3)と、(ii)で求めた(e2,e3)を比較しなさい。また再考によって効用Uは増加したか減少したか答えなさい。
関連:サンクコストのお話