HACK#9 เข้าใจใน URL ของ Google ให้มากขึ้น
ความเข้าใจใน URL ของ Google เอง จะทำให้คุณสามารถต่อยอดการสืบค้นได้ง่ายขึ้น
เมื่อ นึกถึงการแฮ็กคุณอาจจะคิดถึงการสืบค้นที่ต้องใช้แบบฟอร์มหรือการสืบค้นที่มี รูปแบบซับซ้อน แต่จริงๆแล้วคุณสามารถค่อยๆทำการสืบค้นด้วยการค้นหาจาก URL ที่ได้จากการสืบค้นอีกทีหนึ่งก็ได้ ซึ่งวิธีนี้จะทำให้คุณสามารถทำการสืบค้นต่อไปได้ โดยที่ไม่ต้องเสียเวลากลับไปเลือกคำสั่งเพื่อปรับตัวเลือก (preferences) สำหรับการสืบค้นขั้นสูงอีกทีหนึ่ง
มารู้จักโครงสร้างของ URL กันเสียก่อน
สมมุติ ว่าคุณต้องการสืบค้นวลีว่า three blind mice ผลลัพธ์ของ URL ที่คุณได้นั้นอาจจะแตกต่างกันไปขึ้นอยู่กับตัวเลือก (preferences) ที่คุณได้กำหนดเอาไว้ แต่โครงสร้างของ URL โดยปกติจะมีหน้าตาดังนี้
http://www.google.com/search?num=100&hl=en&g=%22three+blind+mice%22
ส่วน ที่ระบุถึงคำสั่ง คือ &g=%22three+blind+mice%22 สัญลักษณ์ %22 นั้นคือ รหัสของ URL ที่หมายถึงเครื่องหมายอัญประกาศ (“ ”) ซึ่งสามารถเข้าใจได้ค่อนข้างชัดเจน ต่อไปเราลองมาวิเคราะห์ดูส่วนอื่นกันบ้างดีกว่า
คำว่า num = 100 นั้นหมายถึง ผลของการสืบค้นต่อหนึ่งหน้า ในที่นี้คือ 100 รายการ ซึ่ง Google ยอมให้คุณระบุจำนวนที่ต้องการได้ตั้งแต่ 1 ถึง 100 รายการ การเปลี่ยนจำนวนผลลัพธ์ที่ต้องการในหนึ่งหน้าก็เป็นวิธีที่ดีวิธีหนึ่ง ที่จะจำกัดผลการสืบค้นของคุณ โดยที่ไม่ต้องวกกลับไประบุใหม่ที่หน้าจอของการสืบค้นขั้นสูงและทำการสืบค้น ใหม่
หากคุณไม่พบคำว่า num = ใน URL ที่ได้ คุณอาจจะใส่เพิ่มเองได้ด้วยการเพิ่มลงไปใน URL และใส่ตัวเลขที่คุณต้องการ โดยตัวเลขอยู่ระหว่าง 1-100
http://www. Google .com/intl/xx-piglatin/
Modifier สำหรับภาษาจะอยู่ระหว่าง intl/ และเครื่องหมาย/สุดท้าย ซึ่งในที่นี้คือ xx-piglatin หรือคุณสามารถที่จะใส่ใน URL เอง ด้วยรูปแบบดังนี้
hl=xx-piglatin
จะ เกิดอะไรขึ้นหากคุณใส่ &hl หลายๆ คำลงใน URL ที่ได้ คำตอบคือในกรณีที่มี modifier หลายตัว Google จะเลือกตัวสุดท้ายก่อน หมายความว่าคุณสามารถที่จะเพิ่ม modifier ตัวใหม่ต่อท้ายไปได้เรื่อยๆก็ได้ แทนที่จะต้องมานั่งแก้ไข modifier ที่ระบุไปแล้ว
ยังมี modifier อีกสองสามคำ ซึ่งเมื่อนำมาใช้ใน URL แล้ว อาจจะช่วยให้เกิดประโยชน์กับการค้นหาของคุณมากขึ้น เช่น
as_qdr=mx
modifier ตัวนี้จะระบุช่วงอายุของข้อมูลที่คุณต้องการค้นหาเป็นจำนวนเดือน โดยที่ x จะแทนหมายเลขตั้งแต่ 1 ถึง 12 แต่ขอแนะนำว่า ระบุตั้งแต่ 1 ถึง 6 เดือนจะดีที่สุด
safe=off
หมายถึงการปิด (disable) SafeSearch ซึ่ง SafeSearch จะกำจัดผลการค้นหาที่เกี่ยวกับเรื่องทางเพศออกไปก่อน ส่วน safe = on หมายถึงการกำหนดให้ใช้ SafeSearch
ดูเหมือนว่ากฎการแฮ็ก URL ของ Google อาจเป็นวิธีที่สร้างสรรค์ที่จะทำให้ได้ผลลัพธ์อย่างง่ายๆ
ยิ่ง ไปกว่านั้นมันยังทำให้การโหลดข้อมูลทำได้อย่างรวดเร็วขึ้นกว่าการโหลดจากแบบ ฟอร์มการสืบค้นขั้นสูงอีกด้วย เช่นในกรณีของการระบุช่วงอายุของข้อมูล มันคือวิธีเดียวที่จะทำให้ได้ข้อมูลกลุ่มที่ต้องการ
เมื่อ นึกถึงการแฮ็กคุณอาจจะคิดถึงการสืบค้นที่ต้องใช้แบบฟอร์มหรือการสืบค้นที่มี รูปแบบซับซ้อน แต่จริงๆแล้วคุณสามารถค่อยๆทำการสืบค้นด้วยการค้นหาจาก URL ที่ได้จากการสืบค้นอีกทีหนึ่งก็ได้ ซึ่งวิธีนี้จะทำให้คุณสามารถทำการสืบค้นต่อไปได้ โดยที่ไม่ต้องเสียเวลากลับไปเลือกคำสั่งเพื่อปรับตัวเลือก (preferences) สำหรับการสืบค้นขั้นสูงอีกทีหนึ่ง
มารู้จักโครงสร้างของ URL กันเสียก่อน
สมมุติ ว่าคุณต้องการสืบค้นวลีว่า three blind mice ผลลัพธ์ของ URL ที่คุณได้นั้นอาจจะแตกต่างกันไปขึ้นอยู่กับตัวเลือก (preferences) ที่คุณได้กำหนดเอาไว้ แต่โครงสร้างของ URL โดยปกติจะมีหน้าตาดังนี้
http://www.google.com/search?num=100&hl=en&g=%22three+blind+mice%22
ส่วน ที่ระบุถึงคำสั่ง คือ &g=%22three+blind+mice%22 สัญลักษณ์ %22 นั้นคือ รหัสของ URL ที่หมายถึงเครื่องหมายอัญประกาศ (“ ”) ซึ่งสามารถเข้าใจได้ค่อนข้างชัดเจน ต่อไปเราลองมาวิเคราะห์ดูส่วนอื่นกันบ้างดีกว่า
คำว่า num = 100 นั้นหมายถึง ผลของการสืบค้นต่อหนึ่งหน้า ในที่นี้คือ 100 รายการ ซึ่ง Google ยอมให้คุณระบุจำนวนที่ต้องการได้ตั้งแต่ 1 ถึง 100 รายการ การเปลี่ยนจำนวนผลลัพธ์ที่ต้องการในหนึ่งหน้าก็เป็นวิธีที่ดีวิธีหนึ่ง ที่จะจำกัดผลการสืบค้นของคุณ โดยที่ไม่ต้องวกกลับไประบุใหม่ที่หน้าจอของการสืบค้นขั้นสูงและทำการสืบค้น ใหม่
หากคุณไม่พบคำว่า num = ใน URL ที่ได้ คุณอาจจะใส่เพิ่มเองได้ด้วยการเพิ่มลงไปใน URL และใส่ตัวเลขที่คุณต้องการ โดยตัวเลขอยู่ระหว่าง 1-100
- Tip : คุณสามารถที่จะเพิ่มหรือเปลี่ยน modifier ด้วยการใส่เพิ่มลงใน URL หรือเปลี่ยนค่าของมันที่อยู่หลังเครื่องหมาย = ไปเป็นค่าอื่นที่อยู่ภายในช่วงที่กำหนดให้ได้
http://www. Google .com/intl/xx-piglatin/
Modifier สำหรับภาษาจะอยู่ระหว่าง intl/ และเครื่องหมาย/สุดท้าย ซึ่งในที่นี้คือ xx-piglatin หรือคุณสามารถที่จะใส่ใน URL เอง ด้วยรูปแบบดังนี้
hl=xx-piglatin
จะ เกิดอะไรขึ้นหากคุณใส่ &hl หลายๆ คำลงใน URL ที่ได้ คำตอบคือในกรณีที่มี modifier หลายตัว Google จะเลือกตัวสุดท้ายก่อน หมายความว่าคุณสามารถที่จะเพิ่ม modifier ตัวใหม่ต่อท้ายไปได้เรื่อยๆก็ได้ แทนที่จะต้องมานั่งแก้ไข modifier ที่ระบุไปแล้ว
ยังมี modifier อีกสองสามคำ ซึ่งเมื่อนำมาใช้ใน URL แล้ว อาจจะช่วยให้เกิดประโยชน์กับการค้นหาของคุณมากขึ้น เช่น
as_qdr=mx
modifier ตัวนี้จะระบุช่วงอายุของข้อมูลที่คุณต้องการค้นหาเป็นจำนวนเดือน โดยที่ x จะแทนหมายเลขตั้งแต่ 1 ถึง 12 แต่ขอแนะนำว่า ระบุตั้งแต่ 1 ถึง 6 เดือนจะดีที่สุด
safe=off
หมายถึงการปิด (disable) SafeSearch ซึ่ง SafeSearch จะกำจัดผลการค้นหาที่เกี่ยวกับเรื่องทางเพศออกไปก่อน ส่วน safe = on หมายถึงการกำหนดให้ใช้ SafeSearch
ดูเหมือนว่ากฎการแฮ็ก URL ของ Google อาจเป็นวิธีที่สร้างสรรค์ที่จะทำให้ได้ผลลัพธ์อย่างง่ายๆ
ยิ่ง ไปกว่านั้นมันยังทำให้การโหลดข้อมูลทำได้อย่างรวดเร็วขึ้นกว่าการโหลดจากแบบ ฟอร์มการสืบค้นขั้นสูงอีกด้วย เช่นในกรณีของการระบุช่วงอายุของข้อมูล มันคือวิธีเดียวที่จะทำให้ได้ข้อมูลกลุ่มที่ต้องการ