HACK#30 Google Groups


คุณสามารถที่จะสืบค้นกลุ่มข่าว Usenet ทั้งจากปัจจุบันหรือในอดีตด้วยการใช้ Google Groups
Usenet Groups เป็นกลุ่มที่รวมตัวกันเพื่ออภิปรายเรื่องราวต่างๆมากมายแยกออกได้เป็นนับแสน Topic ด้วยการใช้ตัวหนังสือเป็นหลัก (text-based) และถือกำเนิดขึ้นมาก่อนเครือข่าย World Wide Web เสียอีก แต่ขณะนี้คุณสามารถที่จะสืบค้นหรือค้นคว้าเรื่องราวเหล่านี้ได้ด้วย Google Group (http://groups.google.com/) แล้ว ซึ่งเป็นการเชื่อมโยงการสืบค้นที่แตกต่างไปจากการสืบค้นเว็บเพจธรรมดาๆ เพราะข้อความทั้งหมดจะถูกแบ่งออกเป็นกลุ่มๆหรือ Topic และ Topic เหล่านั้นจะถูกแบ่งย่อยออกไปเป็น Topic ย่อยๆอีกทีหนึ่ง ซึ่งถือเป็นการจัดหมวดหมู่แบบมีลำดับชั้น (hierarchies) หรือมีโครงสร้างในลักษณะต้นไม้ (tree)
การ เก็บข้อมูลของ Google Groups เริ่มตั้งแต่ปี ค.ศ. 1981 จนถึงปัจจุบันนี้ โดยได้เก็บข้อความต่างๆเอาไว้แล้วกว่า 200 ล้านข้อความ ดังนี้จึงถือเป็นแหล่งเก็บข้อมูลที่ใหญ่มากและได้รวบรวมเอาเนื้อหาที่มีการ อภิปรายกันไว้หลายทศวรรษด้วยกัน หากคุณติดขัดในเรื่องเกี่ยวกับเกมของคอมพิวเตอร์ในยุคเก่าๆ หรือต้องการความช่วยเหลือในด้านข้อมูลเกี่ยวกับจักรเย็บผ้าที่ซื้อมาตั้งแต่ ปี พ.ศ. 2525 คุณอาจพบคำตอบที่นี่เป็นเป็นได้
นอก จากนี้ Google Groups ยังให้คุณได้มีส่วนร่วมในการอภิปรายที่อยู่ใน Usenet ด้วย นี่เป็นคุณสมบัติที่เป็นประโยชน์ดีทีเดียว เพราะไม่ใช่ว่าทุก ISP จะยอมให้คุณได้เข้าไปใน Usenet แล้วในขณะนี้ (แม้กระทั่งเจ้าที่มีจำนวนกลุ่มข่าวจำกัดด้วย) คุณสามารถเข้าไปดูในส่วนของ FAQ ของ Google Groups (http://groups.google.com/googlegroups/posting-faq.html)* เพื่อ ดูถึงวิธีที่จะฝากข้อความในแหล่งข่าว โดยที่คุณจะต้องเริ่มด้วยการหาดูว่าคุณต้องการฝากข้อความไว้ที่กลุ่มข่าวไหน และนั่นหมายถึงคุณจะต้องใช้การลำดับกลุ่มข้อมูลด้วย
* หมายเหตุ Link อาจมีการเปลี่ยนแปลง หรืออาจจะไม่มีแล้ว
สิบวินาทีกับการลำดับกลุ่มข้อมูล
การ จัดลำดับกลุ่มข้อมูลมีทั้งการแบ่งแยกตามพื้นที่ (regional) และแยกย่อยๆลงไป (hierarchy) แต่ที่แบ่งไว้เป็นหมวดหลักก็คือ alt, big, comp, humanities, misc, news, rec, sci, soc และ talk การตั้งกลุ่มส่วนใหญ่มักจะเกิดจากกระบวนการโหวต และจะถูกใส่เข้าไปอยู่ใน Topic ที่เหมาะสมที่สุด

การสืบค้นจากกลุ่ม
จาก หน้าแรกของ Google Groups คุณจะสามารถสืบค้นไปตามรายการของกลุ่มด้วยการเลือกลำดับกลุ่มข้อมูลที่อยู่ ในหน้าแรก คุณจะเห็นว่ามีการแบ่งเป็นกลุ่มย่อย และกลุ่มย่อยของกลุ่มย่อยไล่ลงไปเรื่อยๆ ยกตัวอย่าง เช่น ในลำดับกลุ่มข้อมูล comp (ย่อจาก computers) คุณจะเห็นกลุ่มย่อย comp.sys หรือ computer systems ภายใต้กลุ่มย่อยนี้จะมีอีก 75 กลุ่ม และมีกลุ่มย่อยที่เป็น comp.sys.mac ซึ่งเป็นสาขาของลำดับกลุ่มข้อมูลที่เกี่ยวกับคอมพิวเตอร์แม็คอินทอช ซึ่งจะแบ่งแยกย่อยลงไปอีก 24 กลุ่ม และมีอยู่ Topic หนึ่งที่ชื่อว่า comp.sys.mac.hardware ซึ่งยังมีกลุ่มย่อยลงไปอีกสามกลุ่ม ดังนั้นเมื่อคุณได้เจาะลึกลงไปถึงกลุ่มย่อยที่คุณต้องการแล้ว Google Groups จะแสดงรายการที่มีการโพสต์เอาไว้ โดยเรียงลำดับรายการล่าสุดขึ้นมาก่อน
วิธี การนี้ใช้ได้ดีในกรณีที่คุณต้องการตรวจดูข้อมูลอย่างช้าๆ (มีข้อมูลไม่มาก) หรือได้ผลสืบค้นขนาดปานกลาง แต่เมื่อคุณต้องอ่านข้อมูลจำนวนมากๆ คุณอาจจะต้องใช้ Search Engine ของ Google Group เอง ซึ่งจะมีการสืบค้นในหน้าแรกคล้ายกับการสืบค้นของ Google ปกติ สิ่งเดียวที่คุณจะรู้สึกว่าแตกต่าง ก็คือ แถบคำสั่งของ Google Groups และผลการสืบค้นแต่ละรายการ จะมีชื่อกลุ่มและวันที่ลงประกาศ (posting date) แสดงอยู่ด้วย
ทว่าการสืบค้นขั้นสูง (http://groups.google.com/advanced-group-search) จะแตกต่างกันไปเลย เพราะคุณสามารถที่จะจำกัดการสืบค้นไปที่กลุ่มข่าวหรือ Topic ที่อยู่ในกลุ่มข่าว ยกตัวอย่างเช่น คุณอาจจะสืบค้นในกลุ่ม comp และกลุ่มที่อยู่ภายใต้กลุ่ม comp อีกทั้งหมดได้ โดยใช้คำสั่ง Comp* หรือสืบค้นเฉพาะกลุ่มย่อยลงไปเช่น comp.robotics.mise นอกจากคุณจะจำกัดให้ข้อความที่ต้องการอยู่ในกลุ่มใด (restrict by group) แล้ว คุณยังสามารถจำกัดโดยยึดผู้เขียนข้อความ (restrict by author) เป็นหลัก หรือจะเป็นจำกัดด้วยหมายเลขข้อความ (restrict by message ID) ก็ได้
  • Tip: แน่นอนว่าคุณสามารถเลือกตัวเลือกใดๆในหน้าเว็บเพจของการค้นหาขั้นสูง (Advanced Groups Search) ผ่านทาง URL (Hack # 9) ได้
สิ่ง ที่แตกต่างมากที่สุดระหว่าง Google Group และการสืบค้น Google แบบปกติ (regular search) ก็คือการสืบค้นด้วยวันที่ (date-range search) เป็นที่รู้กันว่าในการสืบค้นเว็บเพจปกติ การค้นหาโดยใช้วันที่นั้นแทบจะไม่ได้ผลที่ตรงเลย เพราะวันที่ในที่นี้จะหมายถึงวันที่ที่เว็บเพจนั้นถูกเพิ่มเข้าไปใน Google Index แต่ไม่ใช่วันที่ที่สร้างเว็บเพจขึ้นมา และโดยที่ข้อความใน Google Groups ถูกประทับไว้ด้วยวันที่ที่มันถูกลงประกาศไว้ในกลุ่มข่าว ดังนั้นการสืบค้นจากวันที่ใน Google Groups นั้นจะถูกต้องและเป็นตัวบ่งบอกว่าเมื่อใดที่เนื้อหานี้ถูกสร้างขึ้นมา และนับว่าโชคดีที่วันที่ที่ใช้นั้นเป็นวันที่แบบ Grogorian Date มากกว่าการสืบค้นด้วย Julian Date (Hack #1)
Google Groups และซินแท็กซ์พิเศษ
คุณ อาจจะสืบค้นเพื่อให้ได้ผลลัพธ์ที่แม่นยำขึ้นได้จากการสืบค้นแบบ Google Groups ขั้นสูง ดังนั้นจึงต้องมีซินแท็กซ์พิเศษของ Google Groups เช่นเดียวกับการสืบค้นปกติ
  • Tip: Google Groups เป็นข้อมูลการอภิปรายแบบกลุ่มที่มีการเก็บสำเนาเอาไว้เสมอ ดังนั้นเมื่อคุณต้องการสืบค้นเรื่องอะไรก็ตาม คุณย่อมประสบความสำเร็จมากกว่า หากคุณสืบค้นเรื่องราวที่ไม่จำเป็นต้องเป็นภาษาทางการมากนัก
intitle:
จะสืบค้นคำที่คุณต้องการจาก Topic เรื่องที่ได้ลงประกาศไว้ เช่น
intitle:rocketry
group:
ซิ นแท็กซ์นี้จะจำกัดการสืบค้นของคุณไปที่กลุ่มที่คุณระบุไว้ และอาจใช้เครื่องหมาย * (wildcard) เพื่อขยายขอบเขตที่ต้องการได้ ซินแท็กซ์ group: นั้น จะนับรวมอักขระทุกตัวที่บ่งบอกถึงกลุ่มเฉพาะที่ต้องการ เช่น rec.humor* หรือ rec.humor.* (จะมีความหมายเท่ากัน) จะให้ผลลัพธ์จากกลุ่ม rec.humor เช่นเดียวกับกลุ่ม rec.humor.funny หรือ rec.humor.jewish และอื่นๆ เช่น
group:rec.humor*
group:alt*
group:comp.lang.perl.misc
author
จะ ใช้สำหรับระบุชื่อผู้ร่วมอภิปรายข้อมูลที่ได้ลงประกาศไว้ ซึ่งอาจจะใช้ชื่อเต็มหรือบางส่วนของชื่อ หรือแม้แต่จะใช้ E-mail Address ก็ได้ เช่น
author:fred
author:fred flintstone
author:flintstone@bedrock.gov
การใช้งานซินแท็กซ์ร่วมกันใน Google Groups ซินแท็กซ์ใน Google Groups นั้นสามารถนำมาใช้งานร่วมกัน (Hack #8) ได้ง่ายกว่าซินแท็กซ์สืบค้นในเว็บเพจปกติ เพราะคุณสามารถที่จะใช้งานซินแท็กซ์ใดๆก็ได้ใน Google Groups ดังตัวอย่างต่อไปนี้
intitle:literature group:humanities* author:john
intitle:hardware group:comp.sys.ibm* pda
สิ่งที่พบได้ทั่วไปในขณะทำการสืบค้น มีอยู่มากมายหลายวิธีที่คุณจะสามารถ “เสาะแสวง” เพื่อให้ได้มาซึ่งข้อมูลสำหรับการวิเคราะห์วิจัยของคุณจาก Google Groups แต่จงจำไว้ว่า คุณไม่ควรปักใจเชื่อในข้อมูลที่คุณได้มาเต็มร้อยเปอร์เซนต์ เพราะ Usenet ก็คือข้อความที่คนเป็นแสนๆคนส่งผ่านกันไปมา เพราะฉะนั้นมันก็ไม่แตกต่างไปจากเครือข่ายเว็บทั่วๆไปนั่นเอง
การช่วยเหลือเกี่ยวกับเทคนิค (tech support) คุณคงเคยใช้วินโดว์และได้เคยประสบปัญหาว่าคุณกำลังใช้งานโปรแกรมบางโปรแกรม ที่คุณเองก็ไม่รู้จัก และคุณก็คงจะไม่ใคร่สบายใจนักใช่หรือไม่ หากคุณเคยสงสัยว่า HIDSERV มีความหมายว่าอย่างไรกันแน่ Google Groups จะช่วยบอกคุณได้ โดยคุณเพียงแต่สืบค้นคำว่า HIDSERV จาก Google Groups คุณก็จะเห็นว่ายังมีคนอีกเป็นจำนวนมากที่มีปัญหาเช่นเดียวกับคุณมาก่อนแล้ว และคำถามนี้ก็เคยมีคนตอบเอาไว้แล้ว
นอก จากนี้เรายังพบว่าในบางครั้ง Google Groups สามารถตอบคำถามได้ดีกว่าเว็บไซต์ของบริษัทผู้ผลิตเองเสียอีก ยกตัวอย่างเช่น เรากำลังพยายามติดตั้งอุปกรณ์สำหรับเครื่องบินเล็กให้เพื่อนคนหนึ่งอยู่ อุปกรณ์ที่ว่าก็เช่น จอยสติ๊ก วาล์วบังคับน้ำมันเครื่อง และปีกหางเสือของเครื่องบิน แต่เว็บไซต์ของบริษัทผู้ผลิตไม่สามารถตอบเราได้ว่า ทำไมเครื่องจึงไม่ทำงาน แต่เมื่อเราพยายามอธิบายปัญหาอย่างดีที่สุดเท่าที่จะทำได้ใน Google Groups โดยใช้ชื่อของอุปกรณ์และชื่อยี่ห้อของผู้ผลิต แม้ว่ามันจะไม่ง่ายนัก แต่สุดท้ายแล้วเราก็ได้คำตอบในที่สุด
ใน บางครั้งปัญหาที่คุณมีนั้นอาจจะไม่ร้ายแรงอะไรนัก เพียงแต่ก่อให้เกิดความรำคาญ เช่น คุณอาจจะติดขัดในการเล่นเกมคอมพิวเตอร์ และหากว่าเกมนั้นออกวางตลาดมาได้สักสองสามเดือนแล้ว คุณอาจจะพอหาคำตอบได้ใน Google Groups หากคุณต้องการคำตอบสำหรับทั้งเกม คุณอาจจะลองใช้คำที่เป็น คาถาวิเศษดูบ้าง เช่นคำว่า “walkthrough” ดังนั้นหากคุณต้องการจะรู้รายละเอียดเกี่ยวกับเกม Quake II คุณอาจจะลองสืบค้นด้วยคำว่า “quake II” walkthrough (คุณไม่จำเป็นจะต้องไปสืบค้นในกลุ่มใดเลย เพราะคำว่า walkthrough นั้นเป็นคำที่รู้จักกันดีในหมู่นักเล่นเกมอยู่แล้ว)
การสืบค้นบทวิเคราะห์ข่าวทันทีหลังจากเกิดเหตุการณ์ จากการสืบค้นด้วย Google Groups การค้นหาวันที่จะเป็นไปอย่างแม่นยำมาก (ต่างกับการสืบค้นด้วยวันที่ในอินเด็กซ์ของ Web Page) วิธีนี้จึงเป็นวิธีที่ยอดเยี่ยมสำหรับการค้นหาบทวิเคราะห์ข่าวในระหว่าง เหตุการณ์หรือทันทีที่เกิดเหตุการณ์
บาร์ บารา สตรัยแซนต์ และ เจมส์ โบรลิน แต่งงานกันเมื่อวันที่ 1 กรกฎาคม พ.ศ. 2541 การสืบค้นหาชื่อ “Barbra Streisand” “James Brolin” ระหว่างวันที่ 30 มิถุนายน พ.ศ. 2541 และวันที่ 3 กรกฎาคม พ.ศ. 2541 จะให้ผลลัพธ์ประมาณ 40 รายการ ซึ่งรวมไปถึงบทความทางโทรสารข่าวที่เอากลับมาพิมพ์ใหม่ และลิงก์ต่างๆที่เชื่อมโยงไปยังเนื้อข่าว รวมถึงคำวิจารณ์จากแฟนเพลงด้วย แต่หากคุณเพียงแต่สืบค้นชื่อ “barbra streisand” “james brolin” โดยไม่ระบุวันที่ คุณจะได้ผลลัพธ์ถึง 1,300 รายการเลยทีเดียว
ย้ำ อีกครั้งว่า Usenet นั้นเป็นเครือข่ายที่เก่าแก่กว่าเครือข่าย “World Wide Web” เสียอีก และทำให้มันเหมาะเป็นอย่างมากที่จะใช้สำหรับหาข้อมูลเกี่ยวกับเหตุการณ์ ต่างๆที่เกิดก่อนที่จะมีเครือข่ายเว็บ เป็นต้นว่า โคคา-โคลา เปิดตัว “New Coke” ออกสู่ตลาดในเดือนเมษายน พ.ศ. 2528 แม้คุณจะสามารถหาข้อมูลเกี่ยวกับการวางตลาดผลิตภัณฑ์ในเครือข่ายเว็บได้ แต่การหาบทวิจารณ์ในเรื่องนี้คงจะไม่ง่ายเท่าใดนัก หลังจากที่ลองสืบค้นด้วยวันที่อยู่สักพัก (การที่ผลิตภัณฑ์ที่ถูกวางตลาดไม่ได้หมายความว่าจะมีสินค้าตัวนี้อยู่ในร้าน ค้าทุกร้าน) เราได้พบบทวิจารณ์มากมายเกี่ยวกับ “New Coke” ใน Google Groups ด้วยการสืบค้นจากวลี “new coke” ในช่วงระหว่างเดือนพฤษภาคม พ.ศ. 2528 ซึ่งข้อมูลเหล่านั้นประกอบไปด้วย ผลการสำรวจ การทดสอบเกี่ยวกับรสชาติและการคาดการณ์เกี่ยวกับโค้กสูตรใหม่นี้ การสืบค้นโดยใช้วันที่ในช่วงฤดูร้อนหลังจากนั้นจะให้ข้อมูลเกี่ยวกับการนำ เอาเครื่องดื่มโค้กรสดั้งเดิมมาวางตลาดใหม่ ภายใต้ชื่อ “Classic Coke”

Google Groups และ Goole API
ระหว่าง การเขียนหนังสือเล่มนี้ Google Groups ยังไม่ได้รับการสนับสนุนจาก Google API หากคุณต้องการที่จะจัดเก็บผลลัพธ์การสืบค้นของคุณไว้ในไฟล์ประเภทใดประเภท หนึ่ง ก็สามารถทำได้โดยดูรายละเอียดใน “การดึงผลลัพธ์ของ Google Groups ไปใช้” (Hack #46)

โพสต์ยอดนิยมจากบล็อกนี้

I miss you all กับ I miss all of you ต่างกันอย่างไร

ปัญหาและเฉลยวิชาธรรม นักธรรมชั้นตรี สอบในสนามหลวง วันอังคาร ที่ ๒๙ กันยายน พ.ศ.๒๕๕๒

ปัญหาและเฉลยวิชาอนุพุทธประวัติ นักธรรมชั้นโท สอบในสนามหลวง วันอาทิตย์ ที่ ๒๐ พฤศจิกายน พ.ศ. ๒๕๔๘