HACK#21 การสืบค้นเพื่อหาสารบบของข้อมูล

ใช้ Google เพื่อสืบค้นสารบบ (directory) หรือรายชื่อ Web Link และข้อมูลในรูปแบบต่างๆ
ใน บางครั้งคุณอาจจะสนใจสืบค้นข้อมูลในวงกว้าง มากกว่าจะเจาะเลือกลงไปที่คำแต่ละคำ ซึ่งสำหรับ Google คุณจะมีทางเลือกอยู่หลายวิธีที่จะหาสารบบ หรือรายชื่อ Web Link (Hack #44) และข้อมูลในรูปแบบอื่นๆ วิธีแรกจะเป็นการใช้คุณสมบัติการสืบค้นแบบ wildcard (Hack #13) และซินแท็กซ์‌ intitle: ส่วนวิธีที่สองจะเป็นการพิจารณาการใช้ keyword เป็นคำๆไป
Title Tags และ Wildcards
ลองนึกถึงคำสักคำที่คุณต้องการค้นหาขึ้นมา ในที่นี้เราจะใช้คำว่า “trees” เป็นตัวอย่าง สิ่งแรกที่เราจะสืบค้นก็คือ Web Page ที่มีคำว่า “directory” และ “trees” อยู่ในชื่อ Web Page จริงๆแล้วเราอาจจะสร้างซินแท็กซ์เผื่อคำที่จะปรากฏขึ้นระหว่างคำสองคำ ด้วยการใช้ full word wildcard (คือเครื่องหมาย *) (Hack #13) ด้วยวิธีการนี้เราจะได้คำสั่งดังต่อไปนี้
intitle:“directory * * trees”
คำ สั่งนี้จะไปสืบค้นหาวลีเช่น “directories of evergreen trees” และ “South African trees” และ “directories containing simply trees”
สมมติ ว่าคุณอยากจะได้ข้อมูลที่กว้างกว่านี้ และสืบค้นหาสารบบข้อมูลว่าด้วยพฤกษศาสตร์ (Botany) คุณอาจจะใช้คำสั่งที่มีทั้งซินแท็กซ์‌ intitle: และ keyword ที่คุณต้องการ เช่น
botany intitle:“directory of”
คุณ จะได้ผลลัพธ์กว่า 6,600 รายการทีเดียว การเปลี่ยนกลุ่มข้อมูลของผลการค้นหา อาจจะทำได้ด้วยการจำกัดที่มาของผลลัพธ์ เช่น หากคุณต้องการเฉพาะข้อมูลจากสถาบันการศึกษา คุณก็อาจจะเพิ่มคำว่า “edu” เข้าไปที่ซินแท็กซ์‌ site: เช่น
botany intitle:“directory of” site:edu
จาก คำสั่งนี้คุณจะได้ผลลัพธ์ประมาณ 120 รายการ ซึ่งได้แก่ข้อมูลที่เป็นแหล่งของสารบบข้อมูล (resource directory) และสารบบของศาสตราจารย์ (directory of university professor) ในมหาวิทยาลัยต่างๆไปพร้อมๆกัน
การเลือกใช้งานคำสั่งร่วมกันแบบนี้ จะทำงานได้ดีเมื่อคุณกำลังค้นหาสิ่งที่อาจจะมาจากสิ่งพิมพ์ที่ไม่ได้ออนไลน์ เช่น
cars intitle: “encyclopedia of”
คำสั่งนี้จะไปดึงข้อมูลมาจากเว็บไซต์ Amazon และเว็บไซต์อื่นๆที่ขาย Enclycopedia เกี่ยวกับรถยนต์ คุณอาจกลั่นกรองข้อมูลที่คุณรู้ดีอยู่แล้วออกไปด้วยการเปลี่ยนซินแท็กซ์เล็กน้อย เช่น
cars intitle:“encyclopedia of” –site:amazon.com
– inurl:book – inurl:products
คำ สั่งนี้ระบุว่าผลการสืบค้นนั้นข้อมูลจะต้องไม่ได้มาจากเว็บไซต์ Amazon.com และจะต้องไม่มีคำว่า “book” ใน URL ของผลลัพธ์ หรือไม่มีคำว่า “products” ซึ่งจะช่วยกำจัดผลการสืบค้นที่เป็นร้านค้าออนไลน์ออกไปได้มากพอสมควร คุณสามารถที่จะทดลองใช้คำสั่งนี้ ด้วยการเปลี่ยนคำว่า “cars” ไปเป็นคำอื่นๆที่คุณสนใจได้ (แน่นอนว่ามีเว็บไซต์ของร้านค้าออนไลน์ที่ขายหนังสืออยู่มากมายด้วยกัน แต่เมื่อคุณต้องการที่จะใส่ “สีสัน” ลงไปในผลการสืบค้นขณะที่คุณกำลังสืบค้นแหล่งข้อมูลออนไลน์ หรือข้อมูลที่เป็นงานวิจัย Amazon ก็ยังคงเป็นแหล่งข้อมูลที่ใหญ่ที่สุด ดังนั้นถ้าคุณกำลังค้นหาหนังสือ คุณควรจะต่อท้ายคำสั่งด้วย +site:amazon.com ลงไปด้วย
แต่ หากว่าการใช้งานคำสั่งร่วมกันไม่ได้ให้แหล่งข้อมูลที่คุณต้องการ ยังมีอีกวิธีหนึ่งที่คุณพอจะเลือกใช้ได้นั่นก็คือ การใช้งาน keyword ร่วมกันนั่นเอง
การสืบค้นอินเด็กซ์เรื่องด้วย Google
อิน เด็กซ์ชื่อเรื่องหลักๆ ที่คุณสามารถจะสืบค้นได้นั้นมีอยู่ไม่มากนัก และอินเด็กซ์ย่อยที่เป็นเรื่องเฉพาะนั้นยิ่งมีน้อยเข้าไปใหญ่ คุณจะหาอินเด็กซ์ย่อยๆ ได้ด้วยการแปลงคำสั่งการสืบค้นทั่วๆ ไป เช่น “what’s new” “what is cool” directory และประมวลเอาจากผลลัพธ์ผิดๆที่ได้ ก็จะเป็นวิธีที่ดีวิธีหนึ่งที่จะได้อินเด็กซ์ชื่อเรื่องที่คุณต้องการ ยกตัวอย่างเช่น คำสั่ง directory “gossamer threads” new ซึ่งเป็นคำสั่งที่น่าสนใจเพราะ Gossamer Threads (ใยแมงมุม) จะเป็นตัวสร้างโปรแกรมที่ลิงก็ไปยัง directory ที่อยู่ในความนิยม ซึ่งเป็นวิธีที่ดีที่จะหาอินเด็กซ์ชื่อเรื่องโดยไม่พลาดเป้ามากนัก ส่วนคำสั่ง directory “what’s new” categories cool นั้นทำงานได้ไม่ดีนัก เพราะคำว่า directory “what’s new’ categories cool นั้นทำงานได้ไม่ดีนัก เพราะคำว่า “directory” นั้นไม่ใช่คำค้นหาที่น่าเชื่อถือนัก แต่อย่างไรก็ตามคำสั่งนี้จะทำให้คุณได้ผลการสืบค้นที่คุณอาจจะหลงหูหลงตาไป จากการเลือกใช้คำสั่งอื่น
ลองดูตัวอย่างการใช้คำสั่ง ดังนี้
“what’s new” “what’s cool” directory phylum
“what’s new” “what’s cool” directory carburator
“what’s new” “what’s cool” directory “investigative jouralism”
“what’s new” directory categories gardening
directory “gossamer threads” new sailboats
directory “what is new” categories cool “basset hounds”
เคล็ด ลับนั้นอยู่ที่การใช้คำที่พื้นๆ แต่ทำให้มันมีเอกลักษณ์มากพอที่จะใช้โยงไปถึงเรื่องที่คุณกำลังสืบค้น ทว่าไม่ครอบคลุมไปถึงเรื่องอื่นๆ มากจนเกินไปนัก
ยก ตัวอย่างเช่น คำว่า acupuncture (การฝังเข็ม) คุณอาจจะเริ่มด้วยการจำกัดเรื่องให้แคบเข้า เช่น การฝังเข็มประเภทไหน? สำหรับคนหรือสำหรับสัตว์? ถ้าเป็นการฝังเข็มสำหรับคนหมายถึงการรักษาอาการแบบไหน? หากเป็นการฝังเข็มสำหรับสัตว์ จะหมายถึงสัตว์ประเภทไหน? คุณอาจจะต้องสืบค้นคำว่า “cat acupuncture” หรือคุณอาจจะต้องสืบค้นคำว่า acupuncture arthritis ถ้าการสืบค้นในครั้งแรกไม่ได้ผลลัพธ์ที่ใกล้เคียงพอ ก็จงพยายามต่อไป ลองวิเคราะห์ดูว่าคุณกำลังสืบค้นในเชิงการรักษาหรือเชิงวิชาการ? คุณอาจจะควบคุมให้ผลการสืบค้นเป็นไปในทางใดทางหนึ่งด้วยการใช้ซินแท็กซ์‌ site: เช่นคุณอาจจะระบุว่า “cat acupuncture” site:com หรือ arthritis acupuncture site:edu ลองระบุให้ชัดเจนลงไปทีละขั้น แล้วคุณก็อาจจะได้ผลการสืบค้นที่ตรงกับเรื่องที่คุณต้องการในปริมาณที่ไม่ มากจนเกินไป

โพสต์ยอดนิยมจากบล็อกนี้

I miss you all กับ I miss all of you ต่างกันอย่างไร

ปัญหาและเฉลยวิชาธรรม นักธรรมชั้นตรี สอบในสนามหลวง วันอังคาร ที่ ๒๙ กันยายน พ.ศ.๒๕๕๒

ปัญหาและเฉลยวิชาอนุพุทธประวัติ นักธรรมชั้นโท สอบในสนามหลวง วันอาทิตย์ ที่ ๒๐ พฤศจิกายน พ.ศ. ๒๕๔๘