มั่วด้วยสถิติ

โลกในยุคข้อมูลข่าวสารนั้น นอกจากข่าวสารที่เป็นจริงที่เราได้รับรู้ผ่านสื่อมากมายแล้ว ยังมีข่าวสารที่ทำหรือพยายามทำให้เรารู้สึกว่ามันเป็นข่าวสารที่จริงทั้งที่ มันเป็นข่าวสารที่ “มั่ว” โดยแรงจูงใจนั้นอาจจะเพื่อเป็นการทำให้คนทั่วไปเชื่อในข้อมูลนั้นเพื่อผล ประโยชน์ของคนที่ปล่อยข่าวนั้นออกมา หรือบางทีก็เพื่อที่จะช่วยเพิ่มน้ำหนักให้กับความน่าเชื่อถือของคนที่พูด วิธีที่มีการใช้มากที่สุดก็คือการอ้าง “สถิติ” ซึ่งอิงกับวิชาการที่มีการศึกษามาเป็นอย่างดี

แน่นอน สถิตินั้น ถ้าทำอย่างถูกต้องทั้งในทางทฤษฎีและปฏิบัติและด้วยความเป็นมืออาชีพร้อย เปอร์เซ็นต์ ความถูกต้องและน่าเชื่อถือก็จะเป็นไปตามทฤษฎี โอกาสผิดพลาดจากความเป็นจริงก็น้อยมาก อย่างไรก็ตาม “สถิติ” จำนวนมากที่มีการศึกษาและเผยแพร่ออกมาในปัจจุบันนั้น เป็นสถิติมั่วที่คนทำทำขึ้นมาอย่างไม่มีคุณภาพหรือทำขึ้นมาเพื่อผลประโยชน์ ที่แอบแฝงบางอย่างเช่นผลทางการเมือง เป็นต้น ลองมาดูว่าเขา “มั่วด้วยสถิติ” แบบไหนบ้าง

เรื่องแรกก็คือ สิ่งที่เรามักได้รับการบอกกล่าวตลอดเวลาว่า การดูหมอหรือพยากรณ์ชะตาชีวิตนั้นเป็น “ศาสตร์ทางสถิติ” ซึ่งโดยนัยก็คือ สิ่งที่หมอดูพยากรณ์ออกมานั้นไม่ใช่ว่าจะต้องถูกต้องร้อยเปอร์เซ็นต์ แต่เปอร์เซ็นต์ความแม่นนั้นก็ต้องสูง เพราะ “สถิติ” เขาบอกว่าเป็นอย่างนั้น แต่ข้อเท็จจริงก็คือ ไม่เคยมีการทำสถิติอะไรทั้งนั้น ว่าที่จริงตำราหมอดูมีมานานมากแล้วก่อนที่โลกนี้จะรู้จักกับวิชาสถิติด้วย ซ้ำ หลังจากที่มีการค้นพบวิชาสถิติก็ไม่เคยมีการ “ชำระ” หรือทบทวนวิชาโหรโดยการศึกษาตัวอย่างข้อมูลด้วยหลักการทางสถิติ ดังนั้น คนที่อ้างว่าโหราศาสตร์เป็นเรื่องของสถิติจึงน่าจะเป็นการอ้างที่ “มั่ว” น่าจะเป็นการอ้างเพื่อที่จะสร้างความน่าเชื่อถือของการพยากรณ์ให้กับคนที่ ยังมีข้อสงสัยว่าวิชาโหรมีรากฐานมาจากอะไร อย่างไรก็ตาม นี่ไม่ได้หมายความว่าโหราศาสตร์เป็นเรื่องไม่จริง เพียงแต่ต้องรู้ว่า โหราศาสตร์นั้น ไม่ใช่ศาสตร์ทางสถิติอย่างที่เราเข้าใจกันในหมู่นักวิชาการสมัยใหม่

ความผิดพลาดหรือความไม่ถูกต้องหรือไม่จริงของข้อสรุปจากการศึกษาทางสถิติ นั้น ไม่ว่าจะตั้งใจหรือไม่ตั้งใจก็ตาม มักมาจากเรื่องใหญ่ ๆ สามสี่เรื่องดังต่อไปนี้

เรื่องแรกก็คือ จำนวนตัวอย่างที่ใช้สำรวจ นั่นก็คือ จำนวนที่สุ่มหรือเลือกมานั้นอาจจะมีจำนวนที่น้อยเกินไป มันไม่สามารถแทนจำนวนทั้งหมดได้ นี่เป็นกรณีที่ทำกันแบบง่าย ๆ แล้วก็ใช้อ้างอิงว่าเป็นสถิติ ที่จริงในทางสถิติเองนั้น เขาจะต้องบอกถึงระดับความน่าเชื่อถือด้วยว่า ข้อสรุปที่พบนั้นมีความ “น่าเชื่อถือ” กี่เปอร์เซ็นต์ แต่คนที่ทำก็คงไม่ต้องการบอกหรือไม่ได้ใช้หลักทางสถิติจริง ๆ สิ่งที่เขาต้องการก็คือ เขาต้องการผลสรุปนั้นเพื่อที่จะไปพูดให้คนฟังได้อย่างน่าเชื่อถือ ตัวอย่างง่าย ๆ ก็คือ เรื่องของ January Effect ที่บอกว่าหุ้นในเดือนมกราคมมักจะขึ้น นี่เป็นเรื่องที่เคยเกิดขึ้นในอเมริกาและมีการศึกษาทางสถิติจริง แต่ในเมืองไทยนั้น ตลาดบ้านเราเพิ่งก่อตั้งมา 30 กว่าปี ตัวอย่างยังมีน้อย ผมจึงไม่แน่ใจว่า January Effect นั้น มีจริงหรือไม่ “ทางสถิติ” แต่ความเชื่อก็คือ ไม่มี

จำนวนตัวอย่างเป็นเรื่องหนึ่ง แต่สิ่งที่ผมคิดว่าน่าห่วงว่าจะ “มั่ว” มากกว่าก็คือ การสุ่มเลือกตัวอย่าง เพราะข้อมูลนั้น ถ้าจะเป็นตัวแทนของทั้งหมดได้ มันต้องกระจายไปในคนทุกกลุ่ม แต่เพื่อที่จะหาตัวอย่างง่าย คนที่ไปสุ่มหาตัวอย่างก็มักจะทำแบบง่าย ๆ เช่นใช้การโทรศัพท์ไปตามบ้านในช่วงเวลาทำงาน แบบนี้เราก็มักจะเจอกับแม่บ้านซึ่งอาจจะไม่ใช่ตัวแทนที่เราต้องการถ้าเรา อยากจะถามเขาในเรื่องที่เกี่ยวข้องกับพนักงานที่ทำงานในสำนักงานมากกว่า บางทีคนที่ทำการศึกษาก็เข้าใจถึงข้อจำกัดของการใช้โทรศัพท์ ดังนั้น เขาก็จะจ้างพนักงานทำแบบสำรวจให้ไปสัมภาษณ์สอบถามถึงตัวแบบสุ่มเลย แต่นี่ก็อาจมีปัญหาไม่น้อยเหมือนกัน เพราะพนักงานทำแบบสำรวจก็มักจะเอาง่ายไว้ก่อนโดยการไปเดินตามสวนสาธารณะซึ่ง จะสามารถหาคนกรอกแบบสอบถามได้เร็วและสะดวกมาก แต่ข้อเสียก็คือ คนที่เดินหรือออกกำลังกายตามสวนนั้น อาจจะไม่ใช่ตัวแทนของคนทั่วไปในเรื่องที่กำลังถูกสอบถามอยู่

ถัดจากเรื่องของตัวอย่างก็มาถึงเรื่องของคำถามที่ใช้ถาม นี่ก็เป็นเรื่องที่ทำให้ได้คำตอบผิดเพี้ยนได้ง่าย ๆ เพราะคำถามหลาย ๆ คำสามารถชักจูงหรือ “บีบ” ให้คนตอบต้องตอบในทางที่เห็นด้วยหรือไม่เห็นด้วยทั้ง ๆ ที่เจ้าตัวอาจจะมีความเห็นอีกด้านหนึ่ง เช่น ไปถามว่า “ท่านเห็นด้วยที่จะมีคณะทำงานที่ประกอบด้วยคนที่น่าเชื่อถือมาปรับปรุง กฎหมายเรื่องสิ่งแวดล้อมที่ก่อให้เกิดมลพิษหรือไม่” คำตอบนั้นผมคิดว่าแน่นอนว่าจะต้องเห็นด้วยเกือบร้อยเปอร์เซ็นต์ เพราะถ้าตอบว่าไม่เห็นด้วย คนตอบก็จะกลายเป็นคนไม่ดีที่ไม่เห็นแก่ส่วนรวม ดังนั้น ในหลาย ๆ กรณีโดยเฉพาะที่เป็นการสำรวจทางสถิติเกี่ยวกับการเมือง เราจึงมักพบว่ามีสำนักหรือคนทำโพลหลายคนที่สำรวจพบความนิยมของประชาชนต่อ พรรคหรือคนการเมืองที่ได้ผลขัดแย้งกัน บางทีนี่อาจจะเป็นเรื่องของคำถามที่ใช้ ว่ากันว่าผลการสำรวจความคิดเห็นนั้นสามารถเขียนคำตอบล่วงหน้าได้เลยโดยใช้ เท็คนิคในการตั้งคำถาม และนี่ก็เป็นที่มาว่าสำนักหรือคนทำโพลนั้นมี “ค่าย”

สุดท้ายก็คือ ถึงแม้ว่าการทำสำรวจทางสถิติจะถูกต้องทุกอย่าง แต่ผลที่ได้จากโพลก็อาจจะผิดก็ได้ เหตุผลก็คือ คนตอบแบบสอบถามอย่างหนึ่ง แต่เวลาไปทำจริงทำอีกอย่างหนึ่ง เช่น มีคนเคยทำแบบสำรวจกลุ่มผู้ชายทำงานว่า “คุณชอบอ่านหนังสือนิตยสารอะไรมากที่สุดเรียงลำดับไป 5 อันดับ” ปรากฏว่าหนังสือแนวธรรมะติดอันดับต้น ๆ และหนังสือแนว “ปลุกใจเสือป่า” ไม่ติดอันดับ แต่ข้อเท็จจริงในตลาดก็คือ หนังสือแนวปลุกใจเสือป่าขายดีกว่าหนังสือแนวธรรมะมาก

และทั้งหมดนั้นก็เป็นเพียงตัวอย่างที่ชี้ให้เห็นว่า เวลาที่เรารับฟังข่าวสารต่าง ๆ นั้น เราจำเป็นต้อง “กรอง” ว่าข่าวไหนน่าจะจริง ข่าวไหนอาจจะไม่จริง โดยเฉพาะที่เป็นข้อมูลที่อ้าง “การสำรวจทางสถิติ” และเป็นข่าวที่มีคนได้ประโยชน์ชัดเจน เหนือสิ่งอื่นใด การเป็น VI นั้น จะต้องไม่เชื่อใครง่าย ๆ แม้ว่าจะมีสถิติอ้างอิง

โพสต์ยอดนิยมจากบล็อกนี้

ปัญหาและเฉลยธรรม นักธรรมชั้นโท สอบในสนามหลวง พ.ศ. ๒๕๔๓ วันพฤหัสบดี ที่ ๑๖ พฤศจิกายน พ.ศ. ๒๕๔๓

ปัญหาและเฉลยวินัยบัญญัติ นักธรรมชั้นเอก สอบในสนามหลวง พ.ศ. ๒๕๔๓ วันเสาร์ ที่ ๑๘ พฤศจิกายน พ.ศ. ๒๕๔๓

ปัญหาและเฉลยวิชาธรรม นักธรรมชั้นโท สอบในสนามหลวง วันเสาร์ ที่ ๑๙ พฤศจิกายน พ.ศ. ๒๕๔๘