čtvrtek 24. září 2009

Paradox dvou obálek: optimální strategie

Když jsem rozebíral paradox dvou obálek, uzavřel jsem "případ" odmítnutím existence rovnoměrného rozdělení na intervalu (0, ∞). Byl to totiž nevyslovený předpoklad, že "náhodné číslo" znamená "číslo s rovnoměrným rozdělením", který vedl k paradoxním závěrům. "No dobře", řekne si ale čtenář, "pořád se ale zdá, že je co řešit. Jednak by mě zajímalo, jak konkrétně postupovat, když mi někdo zadá nerovnoměrné rozdělení. A potom, co když mi to nikdo neřekne? Pokud nevím, jaké je rozdělení náhodné veličiny, je rozumné přepokládat rovnoměrné. Neexistuje-li rovnoměrné rozdělení, jaké jiné mám předpokládat, nevím-li nic o povaze náhody, která zkoumaný proces řídí?" V tomto příspěvku se budu šťourat v odpovědi na první otázku, tj. jak postupovat, je-li rozdělení známo. Druhé otázkce bude věnován následující příspěvek.

Abychom se vyhnuli nejasnostem, které často formulace podobných paradoxů provázejí, zformuluji pro jistotu problém ještě jednou a pořádně:

Soutěžící přijde do loterie, ve které dostane 2 obálky, o nichž ví, že v jedné je dvakrát tolik peněz, než ve druhé. Má možnost jednu z obálek otevřít a podívat se na částku uvnitř, a na základě této informace si vybrat, zda si ponechá otevřenou obálku, nebo ji vrátí a vezme tu druhou. Jaká je optimální strategie?

Jelikož soutěžící neví předem, o jaké částky jde, ať už byly tyto částky určeny jakkoli, může se na ně dívat jako na náhodné. Bez újmy na obecnosti proto můžeme předpokládat, že částky skutečně jsou náhodné. Teď je akorát nutno specifikovat, co náhodnost znamená [1]. Řekněme pro konkrétnost, že proces přiřazení částek do jednotlivých obálek probíhá následovně: Nejdřív vylosujeme celkovou částku pomocí generátoru náhodných čísel s rozdělením ρ a tuto částku rozdělíme na tři části. Pak si hodíme desetikorunou, a padne-li lev, dáme dvě části do první obálky a jednu část do druhé; padne-li Brno, dvě části přijdou do druhé obálky.

Jestliže X zná ρ, je odpověď na otázku volby optimálního postupu jednoznačná. Ze znalosti ρ a částky nalezené v otevřené obálce spočítáme střední zisk z druhé obálky, porovnáme s částkou v první obálce, a bereme to větší. Když v otevřené obálce najdeme y peněz, je klíčové je stanovit, jaká je pravděpodobnost, že y je ze dvou částek ta vyšší. Věc je navíc komplikovaná tím, že používáme spojité veličiny a musíme si tak dát pozor na to, že s hustotami se občas manipuluje jinak, než s prostými pravděpodobnostmi. Nicméně:

Víme, že pokud částka v otevřené obálce leží mezi y a y + dy, buď celková částka leží v intervalu (3y, 3y + 3dy), nebo v intervalu (3y/2, 3y/2 + 3/2 dy). Pravděpodobnost, že celková částka bude ležet v intervalu (3y, 3y + 3dy) je (pokud dy je infinitesimálně malé)
p = 3ρ(3y)dy.
Pravděpodobnost, že zároveň s tím bude v otevřené obálce částka ležící mezi y a y + dy, je nutně p/2 (je stejně pravděpodobné, v závislosti na tom, jak padla desetikoruna, že částka v otevřené obálce leží v intervalu (2y, 2y + 2dy)). Pravděpodobnost, že celková částka bude ležet v intervalu (3y/2, 3y/2 + 3/2 dy) je analogicky  
q = 3/2 ρ(3y/2)dy.
Pravděpodobnost, že zároveň s tím bude v otevřené obálce částka ležící mezi y a y + dy, je zase nutně q/2.

Zajímá nás, kolik je pravděpodobnost toho, že celková částka leží mezi 3y a 3(y + dy), za předpokladu, že částka v otevřené obálce leží v (y, y + dy) - to jest, že otevřená obálka je ta s menším obnosem. Pravděpodobnost jevu A za předpokladu, že pozorujeme jev B, označená P(A|B), je zjevně rovna
P(A|B) = P(A a zároveň B)/P(B) [2].
Vyjde nám tedy, že pravděpodobnost, že jsme otevřeli obálku s menší částkou, je
p/(p + q) = ρ(3y) / (ρ(3y) + ρ(3y/2)/2).
Určení středního zisku při výměně obálek je pak přímočaré.

Ilustruji postup na dvou konkrétních rozděleních. V prvním případě vezměme rozdělení, které je rovnoměrné na intervalu (0, Č), kde Č je nějaká maximální částka. Takové získáme třeba tak, že na kalkulačce stiskneme tlačítko RND generující rovnoměrně rozdělená náhodná čísla od nuly do jedné, a hodnotu na displeji vynásobíme Č. Bude tedy
ρ(x) = 1pro x < Č a ρ(x) = 0 pro x > Č.
Bude-li y, tj. obnos v otevřené obálce, menší než Č/3, je pravděpodobnost, že otevřená obálka je ta horší, rovna 2/3. Střední výnos z druhé obálky je proto 2/3 . 2y + 1/3 . y/2 = 1,583 y. V takovém případě se určitě vyplatí měnit. Je-li však y větší než Č/3, pak máme s jistotou tu lepší obálku a je výhodné si ji ponechat.

Druhá ilustrace je případ exponenciálního rozdělení
ρ(x)= Q exp (-Qx),
které můžeme simulovat třeba tak, že stiskneme na kalkulačce RND, z výsledku uděláme přirozený logaritmus a vydělíme jej konstantou -Q. Pravděpodobnost, že částka y, kterou jsme nalezli, je ta menší, získáme dosazením do našeho vzorce, a vyjde
p(y) = exp(-3Qy) / (exp(-3Qy) + exp(-3Qy/2)/2).
Graf ukazuje tuto funkci pro různé hodnoty Q:
 

 
Výtěžek z druhé obálky je 2p(y) + 1/2.(1-p(y)), což je vykresleno v druhém grafu fialovými čarami odpovídajícími hodnotám Q=1 až 5 (od nejvrchnější); modrá čára je samotné y, to jest výnos z první obálky Pokud je fialová čára pro dané y nad modrou čarou, vyplatí se obálku měnit, pokud je nahoře modrá, ponecháme si otevřenou obálku:
 

 
Například pro Q = 1 je mez y = 0,924. Je-li nalezená částka nižší, je lepší měnit, je-li vyšší, lépe si ponechat, co už máme.
 
Celý dnešní příspěvek byl pouze otrockým počítáním s pravděpodobnostmi. Zajímavější je druhá otázka z dnešního úvodu: tedy jak postupovat, neznáme-li pravděpodobností rozdělení. O tom ale až příště.

Poznámky:
1. Přesná specifikace povahy losování nás uchrání před zmatením podobným tomu při Bertrandovu paradoxu.
2. Spojkou a zároveň nahrazuji operátor konjunkce, který chybí ve znakové sadě.

Žádné komentáře:

Okomentovat