HACK#9 เข้าใจใน URL ของ Google ให้มากขึ้น

ความเข้าใจใน URL ของ Google เอง จะทำให้คุณสามารถต่อยอดการสืบค้นได้ง่ายขึ้น
เมื่อ นึกถึงการแฮ็กคุณอาจจะคิดถึงการสืบค้นที่ต้องใช้แบบฟอร์มหรือการสืบค้นที่มี รูปแบบซับซ้อน แต่จริงๆแล้วคุณสามารถค่อยๆทำการสืบค้นด้วยการค้นหาจาก URL ที่ได้จากการสืบค้นอีกทีหนึ่งก็ได้ ซึ่งวิธีนี้จะทำให้คุณสามารถทำการสืบค้นต่อไปได้ โดยที่ไม่ต้องเสียเวลากลับไปเลือกคำสั่งเพื่อปรับตัวเลือก (preferences) สำหรับการสืบค้นขั้นสูงอีกทีหนึ่ง
มารู้จักโครงสร้างของ URL กันเสียก่อน
สมมุติ ว่าคุณต้องการสืบค้นวลีว่า three blind mice ผลลัพธ์ของ URL ที่คุณได้นั้นอาจจะแตกต่างกันไปขึ้นอยู่กับตัวเลือก (preferences) ที่คุณได้กำหนดเอาไว้ แต่โครงสร้างของ URL โดยปกติจะมีหน้าตาดังนี้
http://www.google.com/search?num=100&hl=en&g=%22three+blind+mice%22

ส่วน ที่ระบุถึงคำสั่ง คือ &g=%22three+blind+mice%22 สัญลักษณ์ %22 นั้นคือ รหัสของ URL ที่หมายถึงเครื่องหมายอัญประกาศ (“ ”) ซึ่งสามารถเข้าใจได้ค่อนข้างชัดเจน ต่อไปเราลองมาวิเคราะห์ดูส่วนอื่นกันบ้างดีกว่า
คำว่า num = 100 นั้นหมายถึง ผลของการสืบค้นต่อหนึ่งหน้า ในที่นี้คือ 100 รายการ ซึ่ง Google ยอมให้คุณระบุจำนวนที่ต้องการได้ตั้งแต่ 1 ถึง 100 รายการ การเปลี่ยนจำนวนผลลัพธ์ที่ต้องการในหนึ่งหน้าก็เป็นวิธีที่ดีวิธีหนึ่ง ที่จะจำกัดผลการสืบค้นของคุณ โดยที่ไม่ต้องวกกลับไประบุใหม่ที่หน้าจอของการสืบค้นขั้นสูงและทำการสืบค้น ใหม่
หากคุณไม่พบคำว่า num = ใน URL ที่ได้ คุณอาจจะใส่เพิ่มเองได้ด้วยการเพิ่มลงไปใน URL และใส่ตัวเลขที่คุณต้องการ โดยตัวเลขอยู่ระหว่าง 1-100
  • Tip : คุณสามารถที่จะเพิ่มหรือเปลี่ยน modifier ด้วยการใส่เพิ่มลงใน URL หรือเปลี่ยนค่าของมันที่อยู่หลังเครื่องหมาย = ไปเป็นค่าอื่นที่อยู่ภายในช่วงที่กำหนดให้ได้
คำว่า hl = en หมายถึงภาษาที่ใช้ นั่นก็คือภาษาที่คุณใช้ใน Google ซึ่งจะเป็นภาษาที่ใช้ในโฮมเพจ ในข้อความต่างๆ หรือเป็นปุ่มคำสั่ง ในที่นี้คือภาษาอังกฤษ ในหน้า Language Tool Page) [Hack #2] นั้นจะมีตัวเลือกของภาษาให้มากมาย คุณสามารถที่จะคลิกเม้าส์เลือกดูได้และโปรดสังเกตดูผลที่เกิดกับ URL ด้วย เช่นเมื่อตัวเลือกของภาษาเป็น Pig latin จะให้ URL ดังนี้
http://www. Google .com/intl/xx-piglatin/
Modifier สำหรับภาษาจะอยู่ระหว่าง intl/ และเครื่องหมาย/สุดท้าย ซึ่งในที่นี้คือ xx-piglatin หรือคุณสามารถที่จะใส่ใน URL เอง ด้วยรูปแบบดังนี้
hl=xx-piglatin

จะ เกิดอะไรขึ้นหากคุณใส่ &hl หลายๆ คำลงใน URL ที่ได้ คำตอบคือในกรณีที่มี modifier หลายตัว Google จะเลือกตัวสุดท้ายก่อน หมายความว่าคุณสามารถที่จะเพิ่ม modifier ตัวใหม่ต่อท้ายไปได้เรื่อยๆก็ได้ แทนที่จะต้องมานั่งแก้ไข modifier ที่ระบุไปแล้ว
ยังมี modifier อีกสองสามคำ ซึ่งเมื่อนำมาใช้ใน URL แล้ว อาจจะช่วยให้เกิดประโยชน์กับการค้นหาของคุณมากขึ้น เช่น
as_qdr=mx
modifier ตัวนี้จะระบุช่วงอายุของข้อมูลที่คุณต้องการค้นหาเป็นจำนวนเดือน โดยที่ x จะแทนหมายเลขตั้งแต่ 1 ถึง 12 แต่ขอแนะนำว่า ระบุตั้งแต่ 1 ถึง 6 เดือนจะดีที่สุด
safe=off
หมายถึงการปิด (disable) SafeSearch ซึ่ง SafeSearch จะกำจัดผลการค้นหาที่เกี่ยวกับเรื่องทางเพศออกไปก่อน ส่วน safe = on หมายถึงการกำหนดให้ใช้ SafeSearch

ดูเหมือนว่ากฎการแฮ็ก URL ของ Google อาจเป็นวิธีที่สร้างสรรค์ที่จะทำให้ได้ผลลัพธ์อย่างง่ายๆ
ยิ่ง ไปกว่านั้นมันยังทำให้การโหลดข้อมูลทำได้อย่างรวดเร็วขึ้นกว่าการโหลดจากแบบ ฟอร์มการสืบค้นขั้นสูงอีกด้วย เช่นในกรณีของการระบุช่วงอายุของข้อมูล มันคือวิธีเดียวที่จะทำให้ได้ข้อมูลกลุ่มที่ต้องการ

โพสต์ยอดนิยมจากบล็อกนี้

I miss you all กับ I miss all of you ต่างกันอย่างไร

ปัญหาและเฉลยวิชาธรรม นักธรรมชั้นตรี สอบในสนามหลวง วันอังคาร ที่ ๒๙ กันยายน พ.ศ.๒๕๕๒

ปัญหาและเฉลยวิชาอนุพุทธประวัติ นักธรรมชั้นโท สอบในสนามหลวง วันอาทิตย์ ที่ ๒๐ พฤศจิกายน พ.ศ. ๒๕๔๘