pondělí 7. září 2009

Paradox dvou obálek

Tohle je můj oblíbený pravděpodobnostní paradox.
 
Představte si, že jste pozváni do televizní soutěže, kde můžete vyhrát peníze. Absolvovali jste nějakou obligátní kvalifikaci, sestávající z odpovídání na otázky typu jaké je hlavní město Trinidadu a Tobaga či kdo zabil Albrechta z Valdštejna, a postoupili jste do finále, kde se bude rozhodovat o výši vaší výhry. Moderátor před vás položí dvě obálky, a sdělí vám, že uvnitř jsou šeky na výherní částku. Také vám sdělí, že z těchto dvou částek je ta vyšší dvojnásobkem té nižší. Nesdělí vám ale už, o jak vysoké částky se jedná.
 
Podle pravidel si teď musíte vybrat právě jednu z obálek. Poté ji máte právo otevřít a podívat se, o jakou částku se jedná. Nebude-li se vám částka líbit, můžete obálku vrátit a vzít tu druhou, ovšem tato volba je již definitivní. (Jistě že nemáte povoleno se vrátit k první obálce poté, co shledáte, že v druhé je menší výhra. V takovém případě by byla celá šaškárna s obálkami zbytečná.)
 
V takovéto situaci je přirozené zamyslet se nad optimální strategií, což je přesně to místo, kde se objevuje paradox. Na první pohled totiž existují dva neslučitelné přístupy, jejichž logika je zdánlivě neprůstřelná. Poněvadž ale vedou k odlišným odpovědím, aspoň jeden z nich musí nutně obsahovat chybu.
 
Člověk elementárně obeznámený s teorií pravděpodobnosti, nazvěme ho X, si může říct následující: "Otevřu obálku, a vidím, že se v ní nachází částka N Kč. Nevím, jestli je to ta větší částka nebo ta menší. Můžu ale přiřadit pravděpodobnosti, a rozumné je předpokládat, že obě možnosti jsou stejně pravděpodobné, s p=1/2. V druhé obálce je proto s poloviční pravděpodobností částka N/2 a se stejnou pravděpodobností částka 2N. Očekávaná střední hodnota peněz schovaných v druhé obálce je proto 5N/4, zatímco střední hodnota peněz obsažená v první obálce je jednoduše N. Vyplatí se proto vzít druhou obálku.
 
Na což reaguje člověk Y vybavený zdravým rozumem: "Tak moment. Co je to za blbost? Obě obálky jsou si rovny. Neexistuje žádná věc, která by narušovala souměrnost situace. Sice nevidím, co konkrétně je na tvojí sofistice špatně, ale je mi jasné, že kdybys na začátku vybral druhou obálku a otevřel ji, tvoje úvaha by tě vedla k tomu, že je lepší vzít tu první. Což je vnitřně nekonsistentní."
 
X odpoví: "To jsou jenom řeči. Moje úvaha obsahuje přesný výpočet, proti tomu není možno nic namítat."
 
Y: "Taky umím trochu zacházet s pravděpodobností. Než otevřeš zvolenou obálku, je poloviční pravděpodobnost, že první obálka obsahuje N Kč a druhá 2N, a poloviční pravděpodobnost, že druhá obsahuje N zatímco první 2N. Střední hodnota pro obě obálky je proto stejná, a to 3N/2. Jak by to sakra mohlo být jinak?"
 
X se zamyslí a po chvíli reaguje: "Třeba máme oba pravdu. Kdybych se do obálky nepodíval, tak by bylo jedno, kterou vzít. Ale jakmile se do jedné podívám a zjistím částku, bude lepší vzít tu druhou."
 
Y protestuje: "To je přece absurdní. Ano, umím si představit, že otevřením obálky získám informaci, díky jejíž znalosti budu moct zvolit lepší strategii. Ale v tomhle případě... vždyť ty tu informaci nijak nepoužiješ! Nezávisle na tom, jakou částku ve zvolené obálce najdeš, vždy bude pro tebe lepší vzít tu druhou. Protože tě vlastně nezajímá, kolik je N, nemusel bys ji vůbec otvírat. A když ji neotevřeš a nepodíváš se..."
 
Pro vykreslení povahy paradoxu to prozatím stačí. Než se podíváme na jeho řešení, věnuji pár řádek diskusi "řešení", která mohou čtenáře napadnout a na první pohled vytvářejí zdání řešení, ač přitom paradox neřeší. Čtenář, který chce o paradoxu nějakou dobu sám přemýšlet a vyřešit si jej samostatně, nechť pokračuje ve čtení následujícího textu až poté, co tak učiní.
 
Jedna z úvah, která se může objevit, je následující: pokud generuji nižší částku náhodně na určitý počet desetinných míst, a tu vyšší získám vynásobením té nižší dvěma, bude vyšší částka mít na konci vždy sudou číslici. Tak bychom otevřením obálky získali užitečnou informaci a mohli bychom uzpůsobit svoji strategii, třeba tak, že v případě sudé poslední číslice si obálku ponecháme, a v případě liché poslední číslice vyměníme. Tomuto "řešení" ale lze předejít celkem snadno. Organizátor soutěže nenapíše částku číslem, ale bude ji reprezentovat úsečkou, jejíž délka se přepočte na částku podle předem oznámeného klíče. Soutěžící tak přijde o možost šťourat se v posledních číslicích.
 
Trochu zrádnější je nasadit zbraně, které přináší ekonomie, v tomto případě zákon klesajícího mezního užitku. Tento zákon říká, že užitek, tedy subjektivně vnímaná hodnota, kterou pociťujeme z vlastnictví jednotky zboží, v našem případě peněz, klesá s tím, kolik onoho zboží již vlastníme. Tisíc korun je velká částka, je-li vaše bankovní konto prázdné, je to ovšem zanedbatelná záležitost, máte-li na kontě pět milionů. Dle stejné logiky nemají dva miliony pro člověka dvojnásobnou cenu oproti jednomu milionu, ale o něco nižší. Pokud známe částku ve vybrané obálce, a ta je N Kč, pak sice střední zisk z druhé obálky je 1,25N, ale, pokračuje tato argumentace, rozhodnutí o výměně by mělo záviset ne na získané částce, nýbrž na získaném užitku. Řekněme, že najdeme v obálce 1000 Kč, a nechť je náš užitek z této částky 10 u, kde u je jednotka užitku, ať už to znamená cokoli. Díky zákonu klesajícího mezního užitku musí být užitek z 500 korun větší než 5 u, a užitek z 2000 korun menší než 20 u. Klidně tyto užitky mohou být třeba 6 u a 13 u. Střední užitek z výměny pak bude 9,5 u, takže se nevyplatí měnit.
 
Předchozí "řešení" sice vnáší do problému subjektivní pohled na hodnotu peněz, který s problémem samotným zjevně nijak zásadně nesouvisí, a vůbec problém spíš zatemňuje, než aby jej řešilo, ale upozorňuju na něj proto, že v případě, kdy se nedaří najít skutečné řešení, člověk občas vezme zavděk lecčíms, a nakonec řeči o mezním užitku nezní až zas tak špatně. Chceme-li však vidět, že tohle skutečně není řešení, jako obvykle můžeme problém přeformulovat, tak že zachováme jeho charakteristické rysy, ale učiníme ho imunnějším vůči zatemnění. V tomto případě může pomoct, změní-li se poměr částek v obálkách. U poměru 2:1 můžeme ještě váhat: vyplatí se vsadit 500 korun proti výhře 1500 Kč, jsou-li šance na výhru fifty-fifty? Je to sice ziskové, ale pokud nutně potřebujeme pětistovku, lépe neriskovat. Na druhou stranu, pokud bude poměr 100:1, nebude asi váhat nikdo. Kdy se vám naskytne šance koupit za 100 Kč los mající poloviční šanci vyhrát milion? Základní rysy problému se přitom nemění.
 
Navíc lze paradox formulovat tak, že jakékoli úvahy o hodnotě peněz budou vyloučeny. Stačí místo toho, aby hráč získal částku nalezenou ve vybrané obálce, mít pevnou výhru, o kterou soupeří více hráčů. V obálkách pak nejsou částky, ale náhodná čísla udávající počet bodů, pořád v zájemném poměru 2:1 (nebo jiném zvoleném poměru). Každý hráč má svoji dvojici obálek se svými náhodnými čísly. Výhru získá ten, kdo bude mít více bodů. Můžeme uvažovat i více kol s pokaždé nově nagenerovanými obálkami a sčítáním bodů za jednotlivá kola, aby se co nejvíc eliminovala náhoda a vynikla dobře zvolená strategie. Při takové formulaci problému je již o dost těžší uhnout. Paradox je potřeba vyřešit.
 
Ačkoli jsem tvrdil, že úvahy o poslední cifře nepovažuji za řešení, snad bych k nim neměl být tak příkrý. Byl to totiž tento typ úvah, který mě k řešení dovedl. V případě podobných paradoxů bývá často užitečné rozmyslet si, jak by šlo popisovaný myšlenkový experiment uskutečnit. A v tomto případě se narazí na zásadní problém v okamžiku, kdy přijde na řadu otázka, jak generovat ony náhodné částky uvnitř. Nejdřív jsem přemýšlel o tom, jestli je rozdíl mezi tím, generujeme-li náhodně menší částku a větší pak získáme násobením dvěma, a tím, generujeme-li náhodně součet a rozdělíme jej následně v poměru 2:1. Potom jsem si ovšem uvědomil celkem triviální fakt, že ať už se dělení do dvou částek děje jakkoli, potřebujeme k tomu pravděpodobnostní rozdělení. A skrytý háček je ve formulaci paradoxu. Ta tiše předpokládá, že rozdělení je rovnoměrné. Kdyby nebylo, výše částky nalezená v otevřené obálce by ovlivňovala pravděpodobnost, že tato obálka je tou hodnotnější.
 
Rovnoměrné rozdělení na intervalu (0, ∞) samozřejmě neexistuje.
 
Můžeme proto paradox s klidným svědomím zahodit? V jistém smyslu ano. Zdánlivou paradoxnost lze vysvětlit tím, že se předpokládá neexistující rovnoměrné rozdělení na nekonečném intervalu. Přesto tu ale zůstává nezodpovězená otázka: Jaká je tedy optimální strategie v soutěži se dvěma obálkami, speciálně pokud hráč nedostane informace o použitém generátoru náhodných čísel? Tato otázka je zajímavá sama o sobě a v některém z příštích příspěvků se k ní vrátím.

Žádné komentáře:

Okomentovat