轉貼:征婚選擇的最佳策略
原文網址在 http://blog.sciencenet.cn/blog-826653-644618.html
結論:對于n個依次來臨的機會,首先了解一下[n/e]個,然后將后面遇到的與前面所有見到的相比,如果更好就接受,否則等下一個,這是對待這類問題的最佳策略。這里e=2.71828…,[n/e]是n/e的整數部分。
假如有n個美女逐個介紹與你約會,每個見面時,如果你選了她就沒機會見到后面可能更好的;如果讓她走了,也許后面都不如她,追悔莫及也無法挽回。問怎么選結果最好?
在生活中也有類似的情況。比如說相親談朋友,選項目,選秀投票,或者有幾個工作的機會。現實的情況都不容你腳踩幾條船來比較,只能是一個個的來,錯過就不好回頭了。這都和上面的例子面臨著相同的問題。這問題看起來漫無頭緒,對于任何一種策略,都可以舉出一個具體的出場順序,使得你得到最差的后果。
實踐中人們多是這樣做的:直接選第一個那叫盲目沒有比較,除了一見鐘情的外,總得看過k個才甘心,待到后面候選人不多時就急了,只要比前面都見過的好,就是她了,要是全不滿意到了最后一個,好壞都是她了。機會和美女都是隨機出現的,那就問你到底要Pass幾個炮灰才開始認真比較?這是n個隨機序列中求k值,使得選到美女數學期望最高的問題。這個期望是選到了k以后第一個好過前面所有的那美女,或不得不接受最后那個,對這兩種情況的數學期望值。
這個問題我考慮過,雖然思路不難,但隨著n的數目增加,計算的復雜性增加的很快。前幾天在科學網上看到“談戀愛的技巧也能用數學模型表達?兼談管理科學研究”博文里面轉載了一個數學計算,其思路讓我贊嘆,雖然他把問題簡化成選中最好那一個的概率問題,而不是得到最高的期望值問題。但他的結果十分地簡潔和普遍,計算的結果和我計算的幾個情況也吻合。這是個很漂亮的結果也很有應用價值,可惜博文沒有給出原文的出處。珠玉在前,我本不想再現丑了,就在那博文后跟了幾句贊詞和替他解答。后來有網友來追問,又見許多跟帖對那研究的意義頗有微詞,我想還是寫個帖子解釋一下。
那博文中轉載那篇文章的思路和表達都十分簡潔,后面的兩個結論都顯示出作者靈活應用數學的功力。我對此十分贊賞。跟貼中對那文章的批評多集中在復雜現實中的適用性問題。那是另一方面的訴求。
讀論文和好文章,我更傾向于理解和欣賞作者的巧思而不是挑剔戲劇性說法的疵瑕。其實借用一些理想情況夸張性的應用在闡述理論的論文并不少見。2012年諾貝爾經濟獎的核心Gale-Shapley算法,就是以穩定婚姻設計的求偶規則為題的【1】。當然婚姻實踐要比算法的假設條件復雜的多也難以應用。科技工作者對抽象數學模型的局限和應用應該是個常識,所以用不著將注意力集中在這方面的說法而忽略了對核心思想的欣賞。
在這里我也替作者解答一下跟帖對式子中的k/(i-1)/n項的疑問。作者假定在這n個人中有一個最佳的人選A,隨機時A在任何一個位置的概率都是1/n,自然A出現在第i個位置的概率也是這個數。為了保證A有機會被選上,前面i-1個人中最好的那個B必須在前k個人中,不然B入選了就輪不到A了,這個情況的概率是k/(i-1)。把這兩者概率綜合起來,就是從第k+1個開始比較,剛好在第i個時選中A的概率k/(i-1)/n。P(k)是把所有可能i的概率都加起來。再后面就是n充分大時的逼近公式。整個思路和推導十分漂亮。
這個數學模型是針對選中這n個人中A的最大概率問題。更靠近現實的提法是看過前面k個以后,被選中的人不一定是A但是美女的期望值E(k)最高。這個問題復雜點,我想用比較簡單的4個美女的例子來直觀地說明思路。
將這4個美女從1到4打分,四位1,2,3,4分的美女按隨機順序出場,閉著眼睛選一個,平均是2.5分。你的期望是在2,3分美女之間。E(0)=2.5.
如果Pass第一個,后面出場的再和她比較,更好的就是她,否則等下一個,第一個出來的有四種情況:
她是1分美女,后面哪個出來都比她強,自然第二位出來就迷倒了,這第二位2,3,4都有可能,平均是3分;
她是2分美女,后面3,4分的出來比她強,誰先到就是誰,3,4平均是3.5分;
她是3分美女,后面還有個4分美女,跑不了4分;
她是4分美女,這再往后看的都失望,只能是最后一個了。1,2,3都有可能,平均2分。
這四種情況機會都是一樣的,所以把這四種平均得分再平均,總的期望是(3+3.5+4+2)/4=3.1。這美女指數比盲選高了一點,可以期望3分美女強一點。E(1)=3.1.
再看Pass兩個又如何,Pass的是1分和2分,記為(1,2),后面剩下3分和4分,記為【3,4】,這一共有6種情況:
(1,2)【3,4】,同上面的道理分析,平均等分3.5;
(1,3)【2,4】,會等到4;
(2,3)【1,4】,會等到4;
(1,4)【2,3】,撿了最后一個,平均為2.5;
(2,4)【1,3】,撿了最后一個,平均為2;
(3,4)【1,2】,撿了最后一個,平均為1.5;
這六種情況機會均等,總的期望是(3.5+4+4+2.5+2+1.5)/6=2.9,比盲選的強比Pass第一個的差。E(2)=2.9.
Pass 3個剩下只有一個,這和盲選一個樣,2.5。E(3)=2.5.
綜合這幾種情況E(1)=3.1最大。所以在只有四位美女情況,拿第一個當炮灰,從第二個開始比較最明智,可以期望3.1分的美人,比平均分2.5高。可以看出總數多時,先Pass的人數也可以多一點,這期望美女指數E(k)隨著炮灰人數k先增加,然后再減少。
n位美女可以用相同的思路,用排列組合計算數學期望值可以得出一般的式子E(k)。這個一般公式約減的工作量會大一點。我沒有完成最優k值的計算公式。但是應該不難用計算機逐個計算E(k)后比較來取的。
我在紙上算出n為2、3、4時,最優的k分別是0、1、1。這個結果和 [n/e]的數值是一樣的。雖然求最大概率和求最大數學期望不是同一個問題,而且后者還和賦值有關。但是前者是一個很好的簡化模型有著很簡潔的結果。
結論:對于n個依次來臨的機會,首先了解一下[n/e]個,然后將后面遇到的與前面所有見到的相比,如果更好就接受,否則等下一個,這是對待這類問題的最佳策略。這里e=2.71828…,[n/e]是n/e的整數部分。
【參考文獻】
【1】 D. Gale and L. S. Shapley: "College Admissions and the Stability of Marriage", American Mathematical Monthly 69, 9-14, 1962 http://www.econ.ucsb.edu/~tedb/Courses/Ec100C/galeshapley.pdf
【2】 談戀愛的技巧也能用數學模型表達?兼談管理科學研究
http://blog.sciencenet.cn/home.php?mod=space&uid=200071&do=blog&id=643493#quickcommentform_643493
posted on 2012-12-20 15:15 時空地圖-TimeGIS-com 閱讀(436) 評論(0) 收藏 舉報
浙公網安備 33010602011771號