ทฤษฎีเกมส์ ตอนที่ 3

ถึงแม้จะมีหลายคนบอกว่าเนื้อเรื่องในภาพยนต์อาจไม่ ตรงกับความเป็นจริงไปบ้าง แต่อย่างไรก็ยังเป็นหนังที่ดี ให้ความประทับใจ เสมอไม่ว่าจะดูกี่ครั้งนะครับ เป็นอัติชีวประวัติชีวิตที่น่าสนใจ จริงๆ.....Prof. Nash
-------------------------------------------------------------------------------------------



จาก
คอลัมน์ ระดมสมอง  โดย เพสซิมิสต์  ประชาชาติธุรกิจ  วันที่ 27 กุมภาพันธ์ พ.ศ. 2549 ปีที่ 29 ฉบับที่ 3770 (2970)


ปัจจุบันมีข่าวร้ายๆ เกี่ยวกับการเมืองและมีความเป็นห่วงเกี่ยวกับผลกระทบ ต่อเศรษฐกิจมากอยู่แล้ว ผมจึงขอเขียนเรื่องที่ให้แง่คิด และมุมมอง ใหม่ๆ เกี่ยวกับทฤษฎีเกม ซึ่งผมได้มาจากการไปเข้าร่วมฟังปาฐกถาพิเศษ ของ Prof Ariel Rubinstein แห่ง TelAviv University ซึ่งจัดขึ้นโดยโครงการ ปริญญาเอกสาขาเศรษฐศาสตร์มหาวิทยาลัยหอการค้าไทย และศูนย์วิจัย มหาวิทยาลัย ชิคาโก เมื่อ 22 กุมภาพันธ์นี้


เราคงจะจำได้ว่า ประวัติของนาย John Nash ผู้ซึ่งได้รับรางวัลโนเบลทาง เศรษฐศาสตร์เมื่อปี 1994 นั้น ถูกนำไปทำเป็นภาพยนตร์ เรื่อง A Beautiful Mind นำแสดง โดย Russell Crowe และ Jennifer Connelly ซึ่ง Prof Ariel Rubinstein คุย ให้ฟังว่า ภาพยนตร์ดังกล่าวนั้นคลาดเคลื่อนจากความเป็นจริงในหลาย ตอน เช่น ฉากวันงานฉลองการรับรางวัลของ Prof Nash นั้น อาจารย์ของคณะ คณิตศาสตร์ไม่ได้ต่างเดินเข้าไปหา Prof Nash และมอบปากกาให้คนละด้ามแต่ อย่างใด ตรงกันข้ามมีการกล่าวสดุดีและดื่มแชมเปญร่วมกันอย่างง่ายๆ และหลัง จากนั้น ก็มีอาการเงียบ ไม่รู้ว่าจะพูดอะไรกันอีก จนกระทั่งต่างคนต่างก็แยก ย้ายกลับไป


อีกฉากหนึ่ง ซึ่ง Prof Nash เห็นผู้หญิงสาวสวยผมบลอนด์เดินเข้ามาใน ผับ (pub) ดลใจให้คิดขึ้นได้ว่า แนวคิดของ Adam Smith บิดาแห่ง เศรษฐศาสตร์ ว่ามนุษย์นั้นจะต้องคำนึงถึงผลประโยชน์ของตนเป็นหลักนั้นไม่ถูก ต้อง สิ่งที่ถูกต้อง คือ จะต้องคำนึงถึงผลประโยชน์ของส่วนรวมและส่วนตัว พร้อมกันไป กล่าวคือ หนุ่มๆ จะต้องไม่แย่งกันเข้าจีบสาวสวยผมบลอนด์ แต่ต่าง คนต่างต้องจีบสาวที่สวยน้อยกว่า ทุกๆ คนจึงจะประสบผลสำเร็จ ซึ่งเรื่อง นี้ Prof Rubinstein ยืนยันว่า ไม่ได้มีอะไรที่เกี่ยวข้องกับทฤษฎีเกม ของ Prof Nash แต่อย่างใด เป็นเพียงจินตนาการของฮอลลีวูดทั้งสิ้น


ทฤษฎีเกมที่จะต้องนำมาใช้ในกรณีดังกล่าว เป็นทฤษฎีที่คิดค้นขึ้นมาก่อนหน้า แล้ว ซึ่งเรียกว่า Prisoner"s Dilemma และเป็นที่รู้จักกันดีในหมู่ของนัก เรียนเศรษฐศาสตร์และมักจะถูกนำไปใช้ในการแยกการสอบสวนผู้ต้องหา ซึ่งเข้าใจ ได้จากตารางข้างล่างนี้



สมมติว่าโจร 2 คนร่วมกันขโมยของในบ้านหลังหนึ่ง แล้วนำสินทรัพย์ที่ขโมยมาไป ซ่อนเอาไว้ แต่ต่อมาถูกจับกุมได้ ตำรวจจึงจับไปแยกสอบสวนโจรทั้งสองคน ซึ่ง หากโจรทั้งสองคนปากแข็ง และไม่ทรยศต่อกัน โจรทั้งสองก็จะถูกจำคุก เพียง 2 ปี ในฐานะบุกรุก (D) ซึ่งเป็นโทษเบา และเป็นแนวทางที่เป็นประโยชน์ กับทั้งสองมากที่สุด อย่างไรก็ดี ต่างคนต่างจะต้องระแวงว่า อีกคนหนึ่งจะ ยอมสารภาพกับตำรวจและทรยศกับตนหรือไม่ เช่น กรณีที่โจร ก.ยอมสารภาพ และ โจร ข.ไม่สารภาพ โจร ก.ก็จะติดคุกเพียง 1 ปี แต่โจร ข.จะโดนโทษหนักคือติด คุก 10 ปี (B) ในทำนองเดียวกัน หากโจร ข.สารภาพ แต่โจร ก.ปากแข็ง โจร ก.ก็ จะได้รับโทษจำคุก 10 ปี และโจร ข. 1 ปี (C) กล่าวโดยสรุป คือ การสอบสวนแยก กัน มักจะทำให้ตำรวจสามารถกดดันให้โจรทั้งสองคนสารภาพได้ และต้องจำคุกไปคน ละ 5 ปี (A) ทั้งๆ ที่หากโจรทั้งสองยึดมั่นที่จะร่วมมือกันแล้ว ก็จะต้องจำ คุกกันคนละ 2 ปีเท่านั้น ซึ่ง Prof Rubinstein ชี้ให้เห็น ว่า ทฤษฎี prisoner"s dilemma นี้ ใกล้เคียงกับปัญหาการจีบผู้หญิงผมบลอนด์ มากกว่า แต่ไม่ได้เป็นทฤษฎีที่ John Nash คิดค้นขึ้นมาจนได้รับรางวัลโนเบล ในที่สุด


John Nash นั้น ถือได้ว่าเป็นอัจฉริยะจริงๆ เพราะเขาจบปริญญาเอกขณะที่อายุ เพียง 22 ปี ในปี ค.ศ.1950 และวิทยานิพนธ์ของเขานั้น มีความยาว เพียง 27 หน้า และวิทยานิพนธ์ดังกล่าว คือสาเหตุที่ทำให้เขาได้รับรางวัล โนเบลเมื่อปี 1994 อาจารย์ของ Nash สมัยที่เรียนจบปริญญาตรี เขียน Letter of Recommendation สั้นๆ เพียงประโยคเดียว (แต่ทำให้เขาได้ เรียนต่อและจบปริญญาเอกที่ Princeton) คือ "This man is a genius"


แต่ก็เป็นอย่างที่เราได้เห็นจาก ภาพยนตร์ A Beautiful Mind ว่า Nash นั้น เป็นโรคจิตที่เรียก ว่า paranoid schizophrenia นานกว่า 30 ปี ทำให้เขาเขียนบทความทางวิชาการ ครั้งสุดท้ายเมื่อปี 1958 ในช่วงที่เขามีอาการของโรคอย่างหนัก นั้น มหาวิทยาลัย Princeton ยินยอมที่จะให้เขาเดินไปเดินมาอยู่ที่โรงอาหาร ของมหาวิทยาลัย และให้เขาสามารถใช้คอมพิวเตอร์ได้ แต่ที่น่าแปลกคือการยืน ยันของภรรยาของเขาไม่ให้นำตัวเขาเข้าไปกักตัวในโรงพยาบาลนั้นในที่สุด ทำให้ อาการของเขาดีขึ้น และในที่สุดคณะกรรมการโนเบลก็กล้าที่จะให้รางวัลกับ เขา ซึ่งเป็นการแสดงออกว่าการเป็นโรคประสาทนั้น ไม่ควรที่จะตัดสิทธิในการ ได้รับรางวัลโนเบลแต่อย่างใด


กลับมาคุยกันในเชิงวิชาการว่า ทฤษฎีเกมนั้น มีความสำคัญอย่างไร คำตอบแบบ พื้นฐานก็คือแบบจำลองปกติ ของนักเศรษฐศาสตร์นั้น จะตั้งสมมติฐานว่าตลาดจะมี ผู้ซื้อและผู้ขายจำนวนหลายหมื่น หลายแสนราย แต่ละคนจึงมีความสำคัญน้อย และ การกระทำของคนคนหนึ่งจะไม่กระทบต่อการกระทำของคนอีกคนหนึ่ง นอกจากนั้น ใน กรณีดังกล่าวจุดดุลยภาพ (equilibrium) ของตลาด จะมีจุดเดียว และค้นพบได้ ง่าย และการพิสูจน์ว่าดุลยภาพดังกล่าวมีเสถียรภาพก็จะเป็นเรื่องที่พิสูจน์ ง่ายเช่นกัน



แต่ทฤษฎีเกมนั้น เป็นการวิเคราะห์กรณีซึ่งมี "ผู้เล่น" น้อยราย ดัง นั้น พฤติกรรมของผู้เล่นคนหนึ่งย่อมจะส่งผลต่อผู้เล่นคนอื่นๆ ดังนั้น ผู้ เล่นแต่ละคนจะต้องคาดการณ์ว่าผู้เล่นคนอื่นๆ จะทำอะไร ซึ่งมีความเป็นไปได้ หลายประการ และเมื่อทราบแล้ว หรือคาดการณ์แล้ว ผู้เล่นคนอื่นๆ ก็จะมีการตอบ สนองที่แตกต่างกันออกไป กล่าวคือ จุดดุลยภาพอาจมีหลายจุด หรืออาจไม่มี เลย ดังนั้น การแสวงหาในเชิงทฤษฎีว่ามีจุดดุลยภาพหรือไม่ และเป็นจุดดุลยภาพ หรือไม่ ย่อมจะเป็นเรื่องที่พิสูจน์ได้ยากยิ่งในเชิงวิชาการ และจะต้องใช้ คณิตศาสตร์ระดับสูงในการแสวงหาคำตอบดังกล่าว



ในช่วงแรกของการคิดค้นทฤษฎีเกมนั้น จะเน้นถึงการช่วงชิงแก่งแย่งของฝ่าย ต่างๆ ซึ่งสะท้อนว่า หากกลุ่มหนึ่งกลุ่มใดได้ประโยชน์มากขึ้น อีกกลุ่มหนึ่ง ก็ย่อมจะต้องสูญเสียประโยชน์หรือในภาษาวิชาการ คือเป็น Zero sum game นั่น เอง แต่ทฤษฎีของ Nash มีความสำคัญ เพราะ Nash สามารถพิสูจน์ได้ว่าการแก่ง แย่งช่วงชิงระหว่างกันนั้น สามารถแสวงหาจุดดุลยภาพที่มีเสถียรภาพได้ ซึ่ง เป็นจุดริเริ่มของการนำเอาทฤษฎีของ Nash ไปใช้ในการวิเคราะห์การเจรจาต่อรอง ระหว่างนายจ้างกับลูกจ้าง หรือแม้กระทั่งการคาดการณ์กลยุทธ์ของฝ่ายตรงกัน ข้าม ดังนั้น นักเศรษฐศาสตร์ส่วนใหญ่จึงจะเคยได้ศึกษาเกี่ยวกับทฤษฎี ของ Nash โดยเฉพาะคำว่า Nash equilibrium นั้น จะเป็นคำที่คุ้นหูคุ้นตา มาก แต่ก็ไม่ใช่ว่า Nash equilibrium หรือจุดดุลยภาพที่ได้มาจากทฤษฎี ของ Nash นั้น จะสะท้อนความเป็นจริงเสมอไป เช่น Prof Rubinstein ตั้งโจทย์ ให้คน 2 คน เลือกตัวเลขตัวหนึ่งระหว่าง 180 ถึง 300 โดยมีเงื่อนไขว่า คนที่ เลือกตัวเลขต่ำกว่า จะได้เงินเท่ากับจำนวนของตัวเลขที่เลือกบวกกับ อีก 5 บาท โดยชัยชนะ คือการได้เงินมากกว่าคู่แข่ง จะเห็นได้ว่า การ เลือก 300 จะไม่ใช่คำตอบที่ถูกต้อง เพราะหากคู่แข่งของเรา เลือก 299 เขาก็ จะได้เงินทั้งสิ้น 299 + 5 = 304 ในกรณีนี้ Nash equilibrium จะอยู่ ที่ 180 กล่าวคือทั้งสองคนจะเลือกตัวเลขต่ำสุดเพราะจะไม่มีใครเสียเปรียบ ใคร (เพราะจะได้เงินเท่ากัน)


แต่ Prof Rubinstein ได้ขอให้ผู้ที่เข้าฟังปาฐกถาของเขาใน 8 ประเทศ รวมทั้ง ประเทศไทยตอบโจทย์ดังกล่าวข้างต้น และพบว่าคำตอบไม่ได้อยู่ที่ 180 แต่ เฉลี่ยแล้วจะอยู่ที่ 250-280 โดยในกรณีของคนไทย มีค่าเฉลี่ยของคำตอบ ที่ 250 และคำตอบที่พบบ่อยที่สุดคือ 300 กล่าวคือ คนส่วนใหญ่มักจะใช้ สัญชาตญาณมากกว่า และมีเพียง 30% เท่านั้นที่ตอบตามการคาดการณ์ของทฤษฎี



อีกเกมหนึ่งตั้งโจทย์ว่า มีโรงแรมเรียงอยู่บนชายหาด 7 โรงแรม โดยเรียงลำดับ เบอร์ 1 ถึง 7 และมีการประมูลให้เปิดร้านกาแฟ 2 ร้าน โดยมีสมมุติฐานว่า คน จะมาดื่มกาแฟในร้านที่ใกล้มากที่สุด (ยี่ห้อกาแฟไม่สำคัญ) ในกรณีดัง กล่าว Nash equilibrium คือร้านกาแฟทั้งสองร้านก็จะตั้งที่โรงแรม เบอร์ 4 ซึ่งอยู่กึ่งกลางพอดี และทั้งสองก็จะได้ส่วนแบ่งตลาดเท่ากัน แต่หาก เพิ่มจำนวนร้านกาแฟเป็น 3 ร้าน คำตอบที่ถูกต้องตาม Nash equilibrium ไม่ใช่ การที่ทั้ง 3 ร้าน ตั้งอยู่ที่โรงแรมเบอร์ 4 (เพราะแต่ละร้านกาแฟจะได้ส่วน แบ่งตลาดเท่ากันคือ 33%) จุดเปิดร้านกาแฟที่เหมาะสม หากเชื่อว่ามีคนจะเปิด ร้านกาแฟที่โรงแรม 4 อย่างแน่นอน คือการไปตั้งร้านกาแฟที่โรงแรม 3 และ โรงแรม 5 เพราะโรงแรม 3 จะได้ลูกค้าโรงแรม 1, 2, 3 ส่วนร้านกาแฟที่ โรงแรม 5 จะได้ลูกค้าที่โรงแรม 5, 6, 7 กล่าวคือ คนควรจะ เลือก 3 กับ 5 มากกว่า 4 แต่คนส่วนใหญ่ก็ยังเลือก 4 อยู่ดี เกี่ยวกับเรื่อง นี้ Prof Rubinstein ให้ข้อสังเกตว่า มนุษย์มีแนวโน้มที่จะเดินสายกลางซึ่ง มีคนไปใช้วิเคราะห์การเมืองว่านักการเมืองนั้น แม้ว่าจะสังกัดพรรคต่างกัน แต่ก็จะพยายามเสนอนโยบายสายกลางเหมือนๆ กัน เพราะรู้ว่าการเสนอนโยบายดัง กล่าวมักจะเรียกคะแนนเสียงได้มากที่สุด



อีกเกมหนึ่งตั้งโจทย์ว่า มีเงินอยู่ 100 บาท และให้เราแบ่งเงินนี้ให้กับอีก คนหนึ่งในจำนวนใดก็ได้ แต่มีเงื่อนไขว่า หากคนนั้นไม่ยอมรับเงินดัง กล่าว ทั้งสองคนก็จะไม่ได้เงินสักบาทเดียว Nash equilibrium คือ เราจะ สามารถเสนอเงินให้คนนั้น 0-1 บาท ก็พอ เพราะเขายอมจะรับเงินจำนวนใดก็ได้ที่ มากกว่าศูนย์เล็กน้อย เนื่องจากจะทำให้เราได้ประโยชน์มากกว่าไม่ได้รับเงิน เลย แต่จากผลการสอบถามของ Prof Rubinstein ใน 8 ประเทศ พบว่าเงินที่แบ่งให้ นั้นเฉลี่ยเท่ากับ 40-48 บาท โดยคนไทยให้เงินมากที่สุดคือ 48 บาท ส่วนหนึ่ง อาจเป็นเพราะหวังว่าอีกฝ่ายหนึ่ง จะไม่ยอมรับเงินทำให้เราอดได้เงินไป ด้วย แต่ทั้งนี้ไม่ใช่ว่าทฤษฎีของ Nash จะผิด เพราะเงินจำนวนน้อยจะทำให้คน ที่ขี้อิจฉายอมทิ้งเงิน เพียงเพราะไม่ต้องการเสียเปรียบใคร แต่หากเปลี่ยน จำนวนเงินให้เป็น 500 ล้านบาท ก็น่าจะเชื่อได้ว่าหากเราเสนอให้อีกคนหนึ่ง ได้เงิน 10 ล้านบาท เขาคงจะรับเอาไว้ แม้ว่าจะเสียเปรียบเราที่ได้เงิน ถึง 490 ล้านบาท


เกมสุดท้ายที่ผมจะนำมาพูดถึงคือ ถ้าสมมุติว่ามีสนามรบอยู่ 6 สนามเท่า กัน โจทย์คือให้วางกำลังในแต่ละสนามรบ โดยหากฝ่ายใครมีทหารมากกว่าฝ่ายนั้น ก็จะชนะ และผู้ที่จะรบชนะในสนามรบมากกว่าจะเป็นฝ่ายชนะ จะเห็นได้ว่าหากต่าง ฝ่ายต่างวางกำลังสนามรบละ 20 นายเท่ากัน ก็จะไม่มีฝ่ายใดได้รับชัยชนะในสนาม รบได้เลย ผลปรากฏว่ากลยุทธ์ที่กระจายกำลังทหารในแต่ละสนามรบตามลำดับดัง นี้ 1 คนที่สนามรบ 1, 31 คน ที่สนามรบ 2, 31 คนที่สนามรบ 3, 25 คน ที่สนาม รบ 4, 31 คน ที่สนามรบ 5 และ 1 คนที่สนามรบ 6 เป็นกลยุทธ์ที่ให้ชัยชนะสูง สุด ในการใช้คอมพิวเตอร์แข่งขันในลักษณะที่ให้ทุกคนได้แข่งขัน กัน (Round Robin) การทดลองนี้แสดงให้เห็นว่า มนุษย์มีความต้องการที่จะเข้า มาอยู่ที่ตลาดกลาง และอาจมีประโยชน์ในการวางแผนรบทางการทหารอีกด้วย


หวังว่าบทความนี้จะเป็นประโยชน์ สามารถนำไปปรับใช้กับการตัดสินใจในกรณี ต่างๆ ทั้งธุรกิจและการใช้ชีวิตประจำวัน และช่วยให้พักสมองจากปัญหาการเมือง ที่ตึงเครียดในปัจจุบันได้บ้างครับ

โพสต์ยอดนิยมจากบล็อกนี้

ปัญหาและเฉลยวิชาธรรม นักธรรมชั้นตรี สอบในสนามหลวง วันอังคาร ที่ ๒๙ กันยายน พ.ศ.๒๕๕๒

I miss you all กับ I miss all of you ต่างกันอย่างไร

ปัญหาและเฉลยวิชาอนุพุทธประวัติ นักธรรมชั้นโท สอบในสนามหลวง วันอาทิตย์ ที่ ๒๐ พฤศจิกายน พ.ศ. ๒๕๔๘