ทฤษฎีเกมส์ ตอนที่ 1
ทฤษฎีเกม (อังกฤษ: Game theory) เป็นสาขาของคณิตศาสตร์ประยุกต์ที่ ศึกษาเกี่ยวกับสถานการณ์ขัดแย้งที่มีผู้เล่นหลายฝ่าย ที่แต่ละฝ่ายพยายามแสวงหาผลตอบแทนให้ได้มากที่สุด แม้ว่าทฤษฎีเกมมีรากฐานการศึกษาเกี่ยวข้องกับการละเล่นหลายชนิด เช่นหมากรุก ทิก-แทก-โท และโปเกอร์ อันเป็นที่มาของชื่อ[ต้องการอ้างอิง] แต่แบบจำลองนี้ยังเกี่ยวข้องกับสถานการณ์ขัดแย้งในหลายสาขาเช่นสังคมวิทยา เศรษฐศาสตร์ รัฐศาสตร์ การทหาร รวมถึงชีววิทยา
ผู้เริ่มศึกษาทฤษฎีเกมในระยะแรกคือ จอห์น ฟอน นอยมันน์ และออสการ์ มอร์เกินสเติร์น โดยได้ตีพิมพ์ตำรา Theory of Games and Economic Behavior ใน พ.ศ. 2487 ต่อมา จอห์น แนชได้พัฒนาการศึกษาในด้านนี้และได้รับรางวัลโนเบลสาขาเศรษฐศาสตร์จากการนำทฤษฎีเกมไปประยุกต์ใช้ในด้านเศรษฐศาสตร์
ใน พ.ศ. 2493 จอห์น แนชได้ พัฒนาการศึกษาในด้านทฤษฎีเกมในด้านต่าง ๆ จำนวนมาก เช่น การศึกษาถึงตำแหน่งที่ดีที่สุดของเกมที่ทุกคนพอใจในตำแหน่งนี้ เรียกว่า "จุดสมดุลของแนช" นักเศรษฐศาสตร์ได้นำแนวคิดนี้ไปช่วยในการวิเคราะห์ในหลาย ๆ เรื่อง เช่น การประมูล การแข่งขันของผู้ผลิตสินค้า ทำให้จอห์น แนช ได้รับรางวัลโนเบลสาขาเศรษฐศาสตร์ ร่วมกับจอห์น ฮาร์ซานยิ และ ไรน์ฮาร์ด เซลเทน ในปี พ.ศ. 2537 ในฐานะที่เป็นผู้นำหลักทฤษฎีเกมไปประยุกต์ใช้ในด้านเศรษฐศาสตร์ และได้มีการสร้างภาพยนตร์เกี่ยวกับชีวประวัติของเขาเรื่อง A Beautiful Mind โดย ซิลเวีย นาซาร์ ใน พ.ศ. 2544
หลังจากนั้น ได้มีการศึกษาทฤษฎีเกมในวงกว้างมากขึ้น และได้มีการนำทฤษฎีเกมไปประยุกต์ใช้ในด้านสังคมวิทยา รัฐศาสตร์ และชีววิทยา
ปัจจุบัน ทฤษฎีเกมได้มีการพัฒนาขึ้นเรื่อย ๆ อย่างต่อเนื่อง ในปี พ.ศ. 2548 โทมัส เชลลิง และ โรเบิร์ต ออมันน์ ได้รับรางวัลโนเบลสาขาเศรษฐศาสตร์จากผลงานด้านทฤษฎีเกม โดยการสร้างแบบจำลองไดนามิกที่เกี่ยวข้องกับทฤษฎีเกมประยุกต์ และได้พัฒนาแนวคิดต่าง ๆ ให้ครอบคลุมมากขึ้น
สำหรับเกมในภาพ มีผู้เล่นสองคน ผู้เล่น 1 ตัดสินใจเลือกก่อนระหว่าง ทางเลือก F และทางเลือก U จากนั้นผู้เล่น 2 ซึ่งทราบถึงการตัดสินใจของผู้เล่น 1 ตัดสินใจเลือกระหว่าง ทางเลือก A และทางเลือก R โดยมีผลตอบแทนที่ได้แสดงไว้ด้านล่าง เช่น ถ้าผู้เล่น 1 เลือก U และผู้เล่น 2 เลือก A ผลตอบแทนที่ได้คือ ผู้เล่น 1 ได้ 8 และผู้เล่น 2 ได้ 2
เกมหลายชนิด เช่น หมากรุก ทิก-แทก-โท ก็ถือว่าเป็นเกมรูปแบบครอบคลุม จึงสามารถหาวิธีที่ดีที่สุดในการเล่นเกมเหล่านี้ได้ โดยการใช้แผนภาพต้นไม้
เกมรูปแบบปกติ เป็นเกมที่ผู้เล่นไม่ทราบถึงการตัดสินใจของผู้เล่นคนอื่น นิยมเขียนแสดงเกมในรูปแบบตาราง ซึ่งมักจะใช้ในกรณีที่มีผู้เล่น 2 คน โดยผู้เล่นคนหนึ่งจะแทนการตัดสินใจด้วยแถวต่าง ๆ และผู้เล่นอีกคนหนึ่งแทนการตัดสินใจด้วยคอลัมน์ต่าง ๆ
สำหรับเกมในภาพ ผู้เล่น 1 มีทางเลือก 2 ทาง คือ บน และ ล่าง ส่วนผู้เล่น 2 มีทางเลือก 2 ทาง คือ ซ้าย และ ขวา จุดตัดของแถวและคอลัมน์จะแสดงถึงผลตอบแทนที่ผู้เล่นทั้งสองได้รับ เช่น ถ้าผู้เล่น 1 เลือก บน และผู้เล่น 2 เลือก ซ้าย ผลตอบแทนที่ได้คือ ผู้เล่น 1 ได้ 4 และผู้เล่น 2 ได้ 3
เกมสมมาตรเป็นเกมที่ผลตอบแทนที่ได้รับขึ้นกับการตัดสินใจของตนเองและคน อื่นเท่านั้น โดยไม่ขึ้นกับว่าใครจะเป็นผู้เล่นเกมนี้ จึงมีกลยุทธในการเล่นที่เหมือนกันสำหรับผู้เล่นทุกคน เกมที่มีผู้เล่น 2 คนและทางเลือก 2 ทางที่มีชื่อเสียงจำนวนมากจัดอยุ่ในประเภทนี้ เช่น เกมความลำบากใจของนักโทษ เกมไก่ตื่น และเกมความร่วมใจ
เกมไม่สมมาตรจะมีกลยุทธในการเล่นที่แตกต่างกันออกไปสำหรับผู้เล่นแต่ละคน เช่นเกมในภาพถือว่าเป็นเกมไม่สมมาตร ถึงแม้กลยุทธในการเล่นที่ดีที่สุดจะเป็นกลยุทธเดียวกันก็ตาม
เกมผลรวมศูนย์เป็นกรณีเฉพาะของเกมผลรวมคงที่ ซึ่งเป็นเกมในลักษณะที่ผลรวมของผลตอบแทนที่ได้ของผู้เล่นจะเป็นค่าคงที่ เช่น การแบ่งปันผลกำไร หรือเกมที่มีผู้ชนะและผู้แพ้ เช่น หมากรุก หมากล้อม ก็ถือว่าเป็นเกมผลรวมศูนย์เช่นกัน ในการเขียนเกมในรูปแบบตารางที่มีผู้เล่นสองคนจึงสามารถละไว้โดยเขียนเพียงผล ตอบแทนของผู้เล่นเพียงคนเดียวได้ และกลยุทธในการตัดสินใจให้ได้ผลตอบแทนมากที่สุดจะเป็นวิธีเดียวกับที่ทำให้ ฝ่ายตรงข้ามได้ผลตอบแทนน้อยที่สุด
เกมส่วนมากที่นักทฤษฎีเกมศึกษามักจะเป็นเกมผลรวมไม่เป็นศูนย์ เนื่องจากในความเป็นจริง ผลลัพธ์ที่ได้ไม่จำเป็นต้องคงที่เสมอไป ขึ้นอยู่กับแนวทางการตัดสินใจของแต่ละฝ่าย ดังนั้น การได้รับผลตอบแทนมากที่สุดจึงไม่จำเป็นต้องทำให้ฝ่ายตรงข้ามได้ผลตอบแทน น้อยที่สุด
จะเห็นว่ากลยุทธเด่นของผู้เล่นทั้งสองฝ่ายคือการรับสารภาพ เพราะไม่ว่าผู้เล่นอีกฝ่ายจะตัดสินใจอย่างไร ก็จะได้ผลตอบแทนที่ดีกว่าเสมอ แต่เมื่อทั้งสองฝ่ายเลือกทางเลือกนี้ กลับไม่ให้ผลตอบแทนที่ดีที่สุด ถึงแม้ผู้เล่นจะทราบว่าผลตอบแทนที่ดีที่สุดจะเกิดขึ้นเมื่อทั้งสองฝ่ายไม่ รับสารภาพ แต่ทั้งคู่อาจไม่กล้าทำเพราะไม่ไว้ใจอีกฝ่ายว่าจะรับสารภาพหรือไม่ จึงทำให้ทั้งสองฝ่ายต้องได้รับผลตอบแทนที่ต่ำลง และจุด (-10, -10) ก็เป็นจุดสมดุลของแนชในเกมนี้ เพราะผู้เล่นทั้งสองฝ่ายไม่สามารถเปลี่ยนไปเลือกทางเลือกอื่นที่ได้ผลตอบแทน ดีกว่านี้
จะเห็นว่าเกมในรูปแบบนี้ไม่มีกลยุทธเด่น และมีจุดสมดุลของแนชสองจุดคือ (-1, +1) และ (+1, -1) แต่วิธีทางจิตวิทยาสำหรับผู้เล่นเกมนี้คือ พยายามส่งสัญญาณให้ผู้เล่นฝ่ายตรงข้ามเห็นว่า ตนจะไม่หักหลบอย่างแน่นอน ซึ่งจะทำให้ผู้เล่นฝ่ายตรงข้ามต้องยอมหักหลบไปเอง มิฉะนั้นจะเสียผลตอบแทนอย่างมาก
จะเห็นว่าเกมในรูปแบบนี้ไม่มีกลยุทธเด่น และมีจุดสมดุลของแนชสองจุดคือ (+10, +10) และ (+3, +3) ซึ่งการที่ผู้เล่นทั้งสองจะได้ผลตอบแทนสูงสุดนั้น จะต้องอาศัยความร่วมมือร่วมใจกัน คือเลือกล่ากวางทั้งคู่ ซึ่งผู้เล่นจะต้องมีความไว้วางใจผู้เล่นอีกฝ่ายด้วย
ผู้เริ่มศึกษาทฤษฎีเกมในระยะแรกคือ จอห์น ฟอน นอยมันน์ และออสการ์ มอร์เกินสเติร์น โดยได้ตีพิมพ์ตำรา Theory of Games and Economic Behavior ใน พ.ศ. 2487 ต่อมา จอห์น แนชได้พัฒนาการศึกษาในด้านนี้และได้รับรางวัลโนเบลสาขาเศรษฐศาสตร์จากการนำทฤษฎีเกมไปประยุกต์ใช้ในด้านเศรษฐศาสตร์
ประวัติ
ใน พ.ศ. 2256 เจมส์ เวลด์เกรฟ ได้ทำการวิเคราะห์หากลยุทธที่ดีที่สุดในการเล่นเกมไพ่ชนิดหนึ่งที่มีผู้เล่นสองคน เรียกว่า le Her โดยใช้หลักการคล้ายกับทฤษฎีเกม และ แอนโทนี ออกัสติน คอร์นอต์ ได้ตีพิมพ์ผลงานเรื่อง Researches into the Mathematical Principles of the Theory of Wealth ใน พ.ศ. 2381 ซึ่งเป็นกรณีทั่วไปของการศึกษาของเจมส์ แต่ทฤษฎีเกมได้มีการศึกษาเป็นสาขาเฉพาะครั้งแรกโดย จอห์น ฟอน นอยมันน์ โดยได้เริ่มตีพิมพ์ผลงานด้านนี้มาตั้งแต่ พ.ศ. 2473 และได้ตีพิมพ์ตำรา Theory of Games and Economic Behavior ที่เขียนร่วมกับ ออสการ์ มอร์เกินสเติร์น ใน พ.ศ. 2487 ที่มีเนื้อหาเกี่ยวกับวิธีการหา "กลยุทธเด่น" ซึ่งเป็นทางเลือกที่ดีที่สุดสำหรับเกมผลรวมศูนย์ที่มีผู้เล่นสองคน ตำรานี้นับว่าเป็นการวางรากฐานของทฤษฎีเกมทั้งทางด้านคณิตศาสตร์และ เศรษฐศาสตร์อย่างมั่นคง จึงถือได้ว่า จอห์น ฟอน นอยมันน์ เป็นผู้ให้กำเนิดทฤษฎีเกม[ต้องการอ้างอิง]ใน พ.ศ. 2493 จอห์น แนชได้ พัฒนาการศึกษาในด้านทฤษฎีเกมในด้านต่าง ๆ จำนวนมาก เช่น การศึกษาถึงตำแหน่งที่ดีที่สุดของเกมที่ทุกคนพอใจในตำแหน่งนี้ เรียกว่า "จุดสมดุลของแนช" นักเศรษฐศาสตร์ได้นำแนวคิดนี้ไปช่วยในการวิเคราะห์ในหลาย ๆ เรื่อง เช่น การประมูล การแข่งขันของผู้ผลิตสินค้า ทำให้จอห์น แนช ได้รับรางวัลโนเบลสาขาเศรษฐศาสตร์ ร่วมกับจอห์น ฮาร์ซานยิ และ ไรน์ฮาร์ด เซลเทน ในปี พ.ศ. 2537 ในฐานะที่เป็นผู้นำหลักทฤษฎีเกมไปประยุกต์ใช้ในด้านเศรษฐศาสตร์ และได้มีการสร้างภาพยนตร์เกี่ยวกับชีวประวัติของเขาเรื่อง A Beautiful Mind โดย ซิลเวีย นาซาร์ ใน พ.ศ. 2544
หลังจากนั้น ได้มีการศึกษาทฤษฎีเกมในวงกว้างมากขึ้น และได้มีการนำทฤษฎีเกมไปประยุกต์ใช้ในด้านสังคมวิทยา รัฐศาสตร์ และชีววิทยา
ปัจจุบัน ทฤษฎีเกมได้มีการพัฒนาขึ้นเรื่อย ๆ อย่างต่อเนื่อง ในปี พ.ศ. 2548 โทมัส เชลลิง และ โรเบิร์ต ออมันน์ ได้รับรางวัลโนเบลสาขาเศรษฐศาสตร์จากผลงานด้านทฤษฎีเกม โดยการสร้างแบบจำลองไดนามิกที่เกี่ยวข้องกับทฤษฎีเกมประยุกต์ และได้พัฒนาแนวคิดต่าง ๆ ให้ครอบคลุมมากขึ้น
รูปแบบของเกม
เกมที่ทฤษฎีเกมศึกษาประกอบด้วยผู้เล่นจำนวนหนึ่ง และทางเลือกสำหรับผู้เล่นแต่ละคน ซึ่งแต่ละทางเลือกมีผลตอบแทนที่แตกต่างกัน[แก้] เกมรูปแบบครอบคลุม
เกมรูปแบบครอบคลุม เป็นเกมที่ผู้เล่นแต่ละคนตัดสินใจเลือกทางเลือกต่าง ๆ ตามลำดับ โดยผู้เล่นจะทราบถึงการตัดสินใจของผู้เล่นอีกฝ่ายในตาก่อนหน้า สามารถเขียนเกมประเภทนี้ได้ในรูปแผนภาพต้นไม้ โดยตั้งต้นที่จุดเริ่มแรก และจบที่จุดสิ้นสุดของเกม ซึ่งสามารถมีได้หลายจุด มีการใช้จุดยอดแทนสถานะที่มีทางเลือกในการตัดสินใจของผู้เล่น และใช้เส้นแทนทางเลือกของผู้เล่นในตาถัดไปสำหรับเกมในภาพ มีผู้เล่นสองคน ผู้เล่น 1 ตัดสินใจเลือกก่อนระหว่าง ทางเลือก F และทางเลือก U จากนั้นผู้เล่น 2 ซึ่งทราบถึงการตัดสินใจของผู้เล่น 1 ตัดสินใจเลือกระหว่าง ทางเลือก A และทางเลือก R โดยมีผลตอบแทนที่ได้แสดงไว้ด้านล่าง เช่น ถ้าผู้เล่น 1 เลือก U และผู้เล่น 2 เลือก A ผลตอบแทนที่ได้คือ ผู้เล่น 1 ได้ 8 และผู้เล่น 2 ได้ 2
เกมหลายชนิด เช่น หมากรุก ทิก-แทก-โท ก็ถือว่าเป็นเกมรูปแบบครอบคลุม จึงสามารถหาวิธีที่ดีที่สุดในการเล่นเกมเหล่านี้ได้ โดยการใช้แผนภาพต้นไม้
เกมรูปแบบปกติ
ผู้เล่น 2 เลือก ซ้าย | ผู้เล่น 2 เลือก ขวา | |
ผู้เล่น 1 เลือก บน | 4, 3 | –1, –1 |
ผู้เล่น 1 เลือก ล่าง | 0, 0 | 3, 4 |
ตารางแสดงเกมที่มีผู้เล่น 2 คน และมี 2 ทางเลือก |
สำหรับเกมในภาพ ผู้เล่น 1 มีทางเลือก 2 ทาง คือ บน และ ล่าง ส่วนผู้เล่น 2 มีทางเลือก 2 ทาง คือ ซ้าย และ ขวา จุดตัดของแถวและคอลัมน์จะแสดงถึงผลตอบแทนที่ผู้เล่นทั้งสองได้รับ เช่น ถ้าผู้เล่น 1 เลือก บน และผู้เล่น 2 เลือก ซ้าย ผลตอบแทนที่ได้คือ ผู้เล่น 1 ได้ 4 และผู้เล่น 2 ได้ 3
ชนิดของเกม
เกมร่วมมือ และเกมไม่ร่วมมือ
เกมร่วมมือเป็นเกมที่ผู้เล่นแต่ละฝ่ายสามารถตกลงกันได้เพื่อให้ได้รับผล ตอบแทนรวมที่ดีที่สุด โดยจะถือว่าผู้เล่นที่ร่วมมือกันจะเป็นผู้เล่นฝ่ายเดียวกันและจะปฏิบัติตาม ข้อตกลงที่ได้ตกลงกันไว้ ซึ่งแตกต่างจากเกมไม่ร่วมมือที่ผู้เล่นแต่ละฝ่ายไม่สามารถตกลงผลตอบแทนกัน ได้เลย จะต้องตัดสินใจโดยใช้ผลตอบแทนของตนเป็นหลักเท่านั้นเกมสมมาตร และเกมไม่สมมาตร
E | F | |
E | 1, 2 | 0, 0 |
F | 0, 0 | 1, 2 |
เกมไม่สมมาตร |
เกมไม่สมมาตรจะมีกลยุทธในการเล่นที่แตกต่างกันออกไปสำหรับผู้เล่นแต่ละคน เช่นเกมในภาพถือว่าเป็นเกมไม่สมมาตร ถึงแม้กลยุทธในการเล่นที่ดีที่สุดจะเป็นกลยุทธเดียวกันก็ตาม
เกมผลรวมศูนย์ และเกมผลรวมไม่เป็นศูนย์
A | B | |
A | –1, 1 | 3, –3 |
B | 0, 0 | –2, 2 |
เกมผลรวมศูนย์ |
เกมส่วนมากที่นักทฤษฎีเกมศึกษามักจะเป็นเกมผลรวมไม่เป็นศูนย์ เนื่องจากในความเป็นจริง ผลลัพธ์ที่ได้ไม่จำเป็นต้องคงที่เสมอไป ขึ้นอยู่กับแนวทางการตัดสินใจของแต่ละฝ่าย ดังนั้น การได้รับผลตอบแทนมากที่สุดจึงไม่จำเป็นต้องทำให้ฝ่ายตรงข้ามได้ผลตอบแทน น้อยที่สุด
ตัวอย่างเกมที่มีชื่อเสียง
เกมความลำบากใจของนักโทษ
เกมความลำบากใจของนักโทษ (Prisoner's dilemma) เป็นเกมที่มีผู้เล่น 2 คนและทางเลือก 2 ทาง แนวคิดของเกมนี้ได้สร้างขึ้นโดย เมอร์ริล ฟลูด และ เมลวิน เดรชเชอร์ ใน พ.ศ. 2493 โดยมีลักษณะเป็นเกมที่ผู้เล่นทั้งสองฝ่ายพยายามเลือกทางเลือกที่ได้ผลตอบแทน มากที่สุด แต่กลับทำให้ผลตอบแทนรวมที่ได้ต่ำลง มีสถานการณ์ดังนี้- คนร้ายสองคนคือ A และ B ถูกตำรวจจับและถูกแยกไปสอบปากคำทีละคน ตำรวจไม่สามารถดำเนินคดีกับคนร้ายทั้งสองได้ทันทีเพราะไม่มีพยาน คนร้ายแต่ละคนมีทางเลือกสองทางคือ รับสารภาพ และไม่รับสารภาพ ถ้าคนร้ายคนหนึ่งรับสารภาพแต่อีกคนไม่รับ ตำรวจจะกันคนที่รับสารภาพไว้เป็นพยานและปล่อยตัวไป และจะส่งฟ้องคนที่ไม่รับสารภาพซึ่งมีโทษจำคุก 20 ปี ถ้าทั้งสองคนรับสารภาพ จะได้รับการลดโทษเหลือจำคุกคนละ 10 ปี แต่ถ้าทั้งสองคนไม่รับสารภาพ ตำรวจจะสามารถส่งฟ้องได้เพียงข้อหาเล็กน้อยเท่านั้นซึ่งมีโทษจำคุก 1 ปี
รับสารภาพ | ไม่รับสารภาพ | |
---|---|---|
รับสารภาพ | -10, -10 | 0, -20 |
ไม่รับสารภาพ | -20, 0 | -1, -1 |
เกมไก่ตื่น
เกมไก่ตื่น (Chicken) เป็นเกมที่มีผู้เล่น 2 คนและทางเลือก 2 ทาง มีสถานการณ์ดังนี้- ผู้เล่นสองคนขับรถด้วยความเร็วสูงเข้าหากัน ฝ่ายที่หักหลบรถก่อนจะเป็นผู้แพ้ แต่ถ้าผู้เล่นทั้งสองฝ่ายไม่หักหลบรถ รถจะชนกันและจะทำให้ผู้เล่นทั้งสองฝ่ายเกิดความเสียหายอย่างมาก
หลบ | ไม่หลบ | |
---|---|---|
หลบ | 0, 0 | -1, +1 |
ไม่หลบ | +1, -1 | -10, -10 |
เกมแห่งความร่วมมือ
เกมแห่งความร่วมมือ (Stag hunt) เป็นเกมที่มีผู้เล่น 2 คนและทางเลือก 2 ทาง ซึ่งเป็นทางเลือกระหว่างทางที่ปลอดภัยกับการให้ความร่วมมือกับอีกฝ่าย มีสถานการณ์ดังนี้- ผู้เล่นสองคนต้องการเลือกล่าสัตว์ชนิดหนึ่งระหว่างกวางกับกระต่าย ซึ่งกวางมีราคาดีกว่ากระต่ายมาก แต่ก็ล่าบากกว่าเช่นกัน จำเป็นต้องใช้สองคนร่วมมือกันจึงจะล่าได้ ในขณะที่กระต่ายมีราคาต่ำแต่ล่าได้ง่าย สามารถล่าได้โดยใช้เพียงคนเดียว
ล่ากวาง | ล่ากระต่าย | |
---|---|---|
ล่ากวาง | +10, +10 | 0, +3 |
ล่ากระต่าย | +3, 0 | +3, +3 |