มั่วด้วยสถิติ

โลกในยุคข้อมูลข่าวสารนั้น นอกจากข่าวสารที่เป็นจริงที่เราได้รับรู้ผ่านสื่อมากมายแล้ว ยังมีข่าวสารที่ทำหรือพยายามทำให้เรารู้สึกว่ามันเป็นข่าวสารที่จริงทั้งที่ มันเป็นข่าวสารที่ “มั่ว” โดยแรงจูงใจนั้นอาจจะเพื่อเป็นการทำให้คนทั่วไปเชื่อในข้อมูลนั้นเพื่อผล ประโยชน์ของคนที่ปล่อยข่าวนั้นออกมา หรือบางทีก็เพื่อที่จะช่วยเพิ่มน้ำหนักให้กับความน่าเชื่อถือของคนที่พูด วิธีที่มีการใช้มากที่สุดก็คือการอ้าง “สถิติ” ซึ่งอิงกับวิชาการที่มีการศึกษามาเป็นอย่างดี

แน่นอน สถิตินั้น ถ้าทำอย่างถูกต้องทั้งในทางทฤษฎีและปฏิบัติและด้วยความเป็นมืออาชีพร้อย เปอร์เซ็นต์ ความถูกต้องและน่าเชื่อถือก็จะเป็นไปตามทฤษฎี โอกาสผิดพลาดจากความเป็นจริงก็น้อยมาก อย่างไรก็ตาม “สถิติ” จำนวนมากที่มีการศึกษาและเผยแพร่ออกมาในปัจจุบันนั้น เป็นสถิติมั่วที่คนทำทำขึ้นมาอย่างไม่มีคุณภาพหรือทำขึ้นมาเพื่อผลประโยชน์ ที่แอบแฝงบางอย่างเช่นผลทางการเมือง เป็นต้น ลองมาดูว่าเขา “มั่วด้วยสถิติ” แบบไหนบ้าง

เรื่องแรกก็คือ สิ่งที่เรามักได้รับการบอกกล่าวตลอดเวลาว่า การดูหมอหรือพยากรณ์ชะตาชีวิตนั้นเป็น “ศาสตร์ทางสถิติ” ซึ่งโดยนัยก็คือ สิ่งที่หมอดูพยากรณ์ออกมานั้นไม่ใช่ว่าจะต้องถูกต้องร้อยเปอร์เซ็นต์ แต่เปอร์เซ็นต์ความแม่นนั้นก็ต้องสูง เพราะ “สถิติ” เขาบอกว่าเป็นอย่างนั้น แต่ข้อเท็จจริงก็คือ ไม่เคยมีการทำสถิติอะไรทั้งนั้น ว่าที่จริงตำราหมอดูมีมานานมากแล้วก่อนที่โลกนี้จะรู้จักกับวิชาสถิติด้วย ซ้ำ หลังจากที่มีการค้นพบวิชาสถิติก็ไม่เคยมีการ “ชำระ” หรือทบทวนวิชาโหรโดยการศึกษาตัวอย่างข้อมูลด้วยหลักการทางสถิติ ดังนั้น คนที่อ้างว่าโหราศาสตร์เป็นเรื่องของสถิติจึงน่าจะเป็นการอ้างที่ “มั่ว” น่าจะเป็นการอ้างเพื่อที่จะสร้างความน่าเชื่อถือของการพยากรณ์ให้กับคนที่ ยังมีข้อสงสัยว่าวิชาโหรมีรากฐานมาจากอะไร อย่างไรก็ตาม นี่ไม่ได้หมายความว่าโหราศาสตร์เป็นเรื่องไม่จริง เพียงแต่ต้องรู้ว่า โหราศาสตร์นั้น ไม่ใช่ศาสตร์ทางสถิติอย่างที่เราเข้าใจกันในหมู่นักวิชาการสมัยใหม่

ความผิดพลาดหรือความไม่ถูกต้องหรือไม่จริงของข้อสรุปจากการศึกษาทางสถิติ นั้น ไม่ว่าจะตั้งใจหรือไม่ตั้งใจก็ตาม มักมาจากเรื่องใหญ่ ๆ สามสี่เรื่องดังต่อไปนี้

เรื่องแรกก็คือ จำนวนตัวอย่างที่ใช้สำรวจ นั่นก็คือ จำนวนที่สุ่มหรือเลือกมานั้นอาจจะมีจำนวนที่น้อยเกินไป มันไม่สามารถแทนจำนวนทั้งหมดได้ นี่เป็นกรณีที่ทำกันแบบง่าย ๆ แล้วก็ใช้อ้างอิงว่าเป็นสถิติ ที่จริงในทางสถิติเองนั้น เขาจะต้องบอกถึงระดับความน่าเชื่อถือด้วยว่า ข้อสรุปที่พบนั้นมีความ “น่าเชื่อถือ” กี่เปอร์เซ็นต์ แต่คนที่ทำก็คงไม่ต้องการบอกหรือไม่ได้ใช้หลักทางสถิติจริง ๆ สิ่งที่เขาต้องการก็คือ เขาต้องการผลสรุปนั้นเพื่อที่จะไปพูดให้คนฟังได้อย่างน่าเชื่อถือ ตัวอย่างง่าย ๆ ก็คือ เรื่องของ January Effect ที่บอกว่าหุ้นในเดือนมกราคมมักจะขึ้น นี่เป็นเรื่องที่เคยเกิดขึ้นในอเมริกาและมีการศึกษาทางสถิติจริง แต่ในเมืองไทยนั้น ตลาดบ้านเราเพิ่งก่อตั้งมา 30 กว่าปี ตัวอย่างยังมีน้อย ผมจึงไม่แน่ใจว่า January Effect นั้น มีจริงหรือไม่ “ทางสถิติ” แต่ความเชื่อก็คือ ไม่มี

จำนวนตัวอย่างเป็นเรื่องหนึ่ง แต่สิ่งที่ผมคิดว่าน่าห่วงว่าจะ “มั่ว” มากกว่าก็คือ การสุ่มเลือกตัวอย่าง เพราะข้อมูลนั้น ถ้าจะเป็นตัวแทนของทั้งหมดได้ มันต้องกระจายไปในคนทุกกลุ่ม แต่เพื่อที่จะหาตัวอย่างง่าย คนที่ไปสุ่มหาตัวอย่างก็มักจะทำแบบง่าย ๆ เช่นใช้การโทรศัพท์ไปตามบ้านในช่วงเวลาทำงาน แบบนี้เราก็มักจะเจอกับแม่บ้านซึ่งอาจจะไม่ใช่ตัวแทนที่เราต้องการถ้าเรา อยากจะถามเขาในเรื่องที่เกี่ยวข้องกับพนักงานที่ทำงานในสำนักงานมากกว่า บางทีคนที่ทำการศึกษาก็เข้าใจถึงข้อจำกัดของการใช้โทรศัพท์ ดังนั้น เขาก็จะจ้างพนักงานทำแบบสำรวจให้ไปสัมภาษณ์สอบถามถึงตัวแบบสุ่มเลย แต่นี่ก็อาจมีปัญหาไม่น้อยเหมือนกัน เพราะพนักงานทำแบบสำรวจก็มักจะเอาง่ายไว้ก่อนโดยการไปเดินตามสวนสาธารณะซึ่ง จะสามารถหาคนกรอกแบบสอบถามได้เร็วและสะดวกมาก แต่ข้อเสียก็คือ คนที่เดินหรือออกกำลังกายตามสวนนั้น อาจจะไม่ใช่ตัวแทนของคนทั่วไปในเรื่องที่กำลังถูกสอบถามอยู่

ถัดจากเรื่องของตัวอย่างก็มาถึงเรื่องของคำถามที่ใช้ถาม นี่ก็เป็นเรื่องที่ทำให้ได้คำตอบผิดเพี้ยนได้ง่าย ๆ เพราะคำถามหลาย ๆ คำสามารถชักจูงหรือ “บีบ” ให้คนตอบต้องตอบในทางที่เห็นด้วยหรือไม่เห็นด้วยทั้ง ๆ ที่เจ้าตัวอาจจะมีความเห็นอีกด้านหนึ่ง เช่น ไปถามว่า “ท่านเห็นด้วยที่จะมีคณะทำงานที่ประกอบด้วยคนที่น่าเชื่อถือมาปรับปรุง กฎหมายเรื่องสิ่งแวดล้อมที่ก่อให้เกิดมลพิษหรือไม่” คำตอบนั้นผมคิดว่าแน่นอนว่าจะต้องเห็นด้วยเกือบร้อยเปอร์เซ็นต์ เพราะถ้าตอบว่าไม่เห็นด้วย คนตอบก็จะกลายเป็นคนไม่ดีที่ไม่เห็นแก่ส่วนรวม ดังนั้น ในหลาย ๆ กรณีโดยเฉพาะที่เป็นการสำรวจทางสถิติเกี่ยวกับการเมือง เราจึงมักพบว่ามีสำนักหรือคนทำโพลหลายคนที่สำรวจพบความนิยมของประชาชนต่อ พรรคหรือคนการเมืองที่ได้ผลขัดแย้งกัน บางทีนี่อาจจะเป็นเรื่องของคำถามที่ใช้ ว่ากันว่าผลการสำรวจความคิดเห็นนั้นสามารถเขียนคำตอบล่วงหน้าได้เลยโดยใช้ เท็คนิคในการตั้งคำถาม และนี่ก็เป็นที่มาว่าสำนักหรือคนทำโพลนั้นมี “ค่าย”

สุดท้ายก็คือ ถึงแม้ว่าการทำสำรวจทางสถิติจะถูกต้องทุกอย่าง แต่ผลที่ได้จากโพลก็อาจจะผิดก็ได้ เหตุผลก็คือ คนตอบแบบสอบถามอย่างหนึ่ง แต่เวลาไปทำจริงทำอีกอย่างหนึ่ง เช่น มีคนเคยทำแบบสำรวจกลุ่มผู้ชายทำงานว่า “คุณชอบอ่านหนังสือนิตยสารอะไรมากที่สุดเรียงลำดับไป 5 อันดับ” ปรากฏว่าหนังสือแนวธรรมะติดอันดับต้น ๆ และหนังสือแนว “ปลุกใจเสือป่า” ไม่ติดอันดับ แต่ข้อเท็จจริงในตลาดก็คือ หนังสือแนวปลุกใจเสือป่าขายดีกว่าหนังสือแนวธรรมะมาก

และทั้งหมดนั้นก็เป็นเพียงตัวอย่างที่ชี้ให้เห็นว่า เวลาที่เรารับฟังข่าวสารต่าง ๆ นั้น เราจำเป็นต้อง “กรอง” ว่าข่าวไหนน่าจะจริง ข่าวไหนอาจจะไม่จริง โดยเฉพาะที่เป็นข้อมูลที่อ้าง “การสำรวจทางสถิติ” และเป็นข่าวที่มีคนได้ประโยชน์ชัดเจน เหนือสิ่งอื่นใด การเป็น VI นั้น จะต้องไม่เชื่อใครง่าย ๆ แม้ว่าจะมีสถิติอ้างอิง

ค้นหาบล็อกนี้

Whiteboard

มั่วด้วยสถิติ

โพสต์ยอดนิยมจากบล็อกนี้

ปัญหาและเฉลยธรรม นักธรรมชั้นโท สอบในสนามหลวง พ.ศ. ๒๕๔๓ วันพฤหัสบดี ที่ ๑๖ พฤศจิกายน พ.ศ. ๒๕๔๓

I miss you all กับ I miss all of you ต่างกันอย่างไร

ปัญหาและเฉลยวินัยบัญญัติ นักธรรมชั้นเอก สอบในสนามหลวง พ.ศ. ๒๕๔๓ วันเสาร์ ที่ ๑๘ พฤศจิกายน พ.ศ. ๒๕๔๓