HACK#9 เข้าใจใน URL ของ Google ให้มากขึ้น

ความเข้าใจใน URL ของ Google เอง จะทำให้คุณสามารถต่อยอดการสืบค้นได้ง่ายขึ้น
เมื่อ นึกถึงการแฮ็กคุณอาจจะคิดถึงการสืบค้นที่ต้องใช้แบบฟอร์มหรือการสืบค้นที่มี รูปแบบซับซ้อน แต่จริงๆแล้วคุณสามารถค่อยๆทำการสืบค้นด้วยการค้นหาจาก URL ที่ได้จากการสืบค้นอีกทีหนึ่งก็ได้ ซึ่งวิธีนี้จะทำให้คุณสามารถทำการสืบค้นต่อไปได้ โดยที่ไม่ต้องเสียเวลากลับไปเลือกคำสั่งเพื่อปรับตัวเลือก (preferences) สำหรับการสืบค้นขั้นสูงอีกทีหนึ่ง
มารู้จักโครงสร้างของ URL กันเสียก่อน
สมมุติ ว่าคุณต้องการสืบค้นวลีว่า three blind mice ผลลัพธ์ของ URL ที่คุณได้นั้นอาจจะแตกต่างกันไปขึ้นอยู่กับตัวเลือก (preferences) ที่คุณได้กำหนดเอาไว้ แต่โครงสร้างของ URL โดยปกติจะมีหน้าตาดังนี้
http://www.google.com/search?num=100&hl=en&g=%22three+blind+mice%22

ส่วน ที่ระบุถึงคำสั่ง คือ &g=%22three+blind+mice%22 สัญลักษณ์ %22 นั้นคือ รหัสของ URL ที่หมายถึงเครื่องหมายอัญประกาศ (“ ”) ซึ่งสามารถเข้าใจได้ค่อนข้างชัดเจน ต่อไปเราลองมาวิเคราะห์ดูส่วนอื่นกันบ้างดีกว่า
คำว่า num = 100 นั้นหมายถึง ผลของการสืบค้นต่อหนึ่งหน้า ในที่นี้คือ 100 รายการ ซึ่ง Google ยอมให้คุณระบุจำนวนที่ต้องการได้ตั้งแต่ 1 ถึง 100 รายการ การเปลี่ยนจำนวนผลลัพธ์ที่ต้องการในหนึ่งหน้าก็เป็นวิธีที่ดีวิธีหนึ่ง ที่จะจำกัดผลการสืบค้นของคุณ โดยที่ไม่ต้องวกกลับไประบุใหม่ที่หน้าจอของการสืบค้นขั้นสูงและทำการสืบค้น ใหม่
หากคุณไม่พบคำว่า num = ใน URL ที่ได้ คุณอาจจะใส่เพิ่มเองได้ด้วยการเพิ่มลงไปใน URL และใส่ตัวเลขที่คุณต้องการ โดยตัวเลขอยู่ระหว่าง 1-100
  • Tip : คุณสามารถที่จะเพิ่มหรือเปลี่ยน modifier ด้วยการใส่เพิ่มลงใน URL หรือเปลี่ยนค่าของมันที่อยู่หลังเครื่องหมาย = ไปเป็นค่าอื่นที่อยู่ภายในช่วงที่กำหนดให้ได้
คำว่า hl = en หมายถึงภาษาที่ใช้ นั่นก็คือภาษาที่คุณใช้ใน Google ซึ่งจะเป็นภาษาที่ใช้ในโฮมเพจ ในข้อความต่างๆ หรือเป็นปุ่มคำสั่ง ในที่นี้คือภาษาอังกฤษ ในหน้า Language Tool Page) [Hack #2] นั้นจะมีตัวเลือกของภาษาให้มากมาย คุณสามารถที่จะคลิกเม้าส์เลือกดูได้และโปรดสังเกตดูผลที่เกิดกับ URL ด้วย เช่นเมื่อตัวเลือกของภาษาเป็น Pig latin จะให้ URL ดังนี้
http://www. Google .com/intl/xx-piglatin/
Modifier สำหรับภาษาจะอยู่ระหว่าง intl/ และเครื่องหมาย/สุดท้าย ซึ่งในที่นี้คือ xx-piglatin หรือคุณสามารถที่จะใส่ใน URL เอง ด้วยรูปแบบดังนี้
hl=xx-piglatin

จะ เกิดอะไรขึ้นหากคุณใส่ &hl หลายๆ คำลงใน URL ที่ได้ คำตอบคือในกรณีที่มี modifier หลายตัว Google จะเลือกตัวสุดท้ายก่อน หมายความว่าคุณสามารถที่จะเพิ่ม modifier ตัวใหม่ต่อท้ายไปได้เรื่อยๆก็ได้ แทนที่จะต้องมานั่งแก้ไข modifier ที่ระบุไปแล้ว
ยังมี modifier อีกสองสามคำ ซึ่งเมื่อนำมาใช้ใน URL แล้ว อาจจะช่วยให้เกิดประโยชน์กับการค้นหาของคุณมากขึ้น เช่น
as_qdr=mx
modifier ตัวนี้จะระบุช่วงอายุของข้อมูลที่คุณต้องการค้นหาเป็นจำนวนเดือน โดยที่ x จะแทนหมายเลขตั้งแต่ 1 ถึง 12 แต่ขอแนะนำว่า ระบุตั้งแต่ 1 ถึง 6 เดือนจะดีที่สุด
safe=off
หมายถึงการปิด (disable) SafeSearch ซึ่ง SafeSearch จะกำจัดผลการค้นหาที่เกี่ยวกับเรื่องทางเพศออกไปก่อน ส่วน safe = on หมายถึงการกำหนดให้ใช้ SafeSearch

ดูเหมือนว่ากฎการแฮ็ก URL ของ Google อาจเป็นวิธีที่สร้างสรรค์ที่จะทำให้ได้ผลลัพธ์อย่างง่ายๆ
ยิ่ง ไปกว่านั้นมันยังทำให้การโหลดข้อมูลทำได้อย่างรวดเร็วขึ้นกว่าการโหลดจากแบบ ฟอร์มการสืบค้นขั้นสูงอีกด้วย เช่นในกรณีของการระบุช่วงอายุของข้อมูล มันคือวิธีเดียวที่จะทำให้ได้ข้อมูลกลุ่มที่ต้องการ

โพสต์ยอดนิยมจากบล็อกนี้

ปัญหาและเฉลยธรรม นักธรรมชั้นโท สอบในสนามหลวง พ.ศ. ๒๕๔๓ วันพฤหัสบดี ที่ ๑๖ พฤศจิกายน พ.ศ. ๒๕๔๓

ปัญหาและเฉลยวินัยบัญญัติ นักธรรมชั้นเอก สอบในสนามหลวง พ.ศ. ๒๕๔๓ วันเสาร์ ที่ ๑๘ พฤศจิกายน พ.ศ. ๒๕๔๓

ปัญหาและเฉลยวิชาธรรม นักธรรมชั้นโท สอบในสนามหลวง วันเสาร์ ที่ ๑๙ พฤศจิกายน พ.ศ. ๒๕๔๘