HACK#14 ซินแท็กซ์ inurl: และ site:

การใช้ inurl เพื่อค้นหาไดเร็กทอรี่ย่อยของเว็บไซต์
ซิ นแท็กซ์ site: จะทำงานได้อย่างสมบูรณ์ในกรณีที่คุณต้องการจำกัดการสืบค้นไปที่ Domain ใด Domain หนึ่งเท่านั้น หรือสืบค้นที่ตัวลงท้ายของ Domain (domain suffix) เช่น “example.com” หรือ “www.example.org” หรือ “edu” เช่น คำสั่ง site: edu แต่มันจะสะดุดในกรณีที่คุณพยายามที่จะค้นหาเว็บไซต์ที่อยู่ลึกลงไปจากหน้าโฮ มเพจ (เช่นในไดเร็กทอรี่ย่อย /~ sam/album/)
ยก ตัวอย่างเช่น หากคุณกำลังค้นหาสิ่งที่อยู่ภายใต้เว็บไซต์ Geocities ซึ่งเป็นเว็บไซต์หลัก คุณไม่สามารถที่จะใช้ซินแท็กซ์‌ site: เพื่อที่จะค้นหา Web Page ทั้งหมดในไดเร็กทอรี่ย่อย http://www.geocities.com/heartland/meadows/6485 ได้ เพราะ Google จะไม่สามารถค้นหาผลลัพธ์ให้กับคุณได้ แต่ถ้าคุณใช้ซินแท็กซ์พิเศษเป็น inurl: เพื่อที่จะระบุคำที่อาจจะพบได้ใน URL ที่เป็นผลการสืบค้น คำสั่งนี้จะทำงานให้ตามที่คุณต้องการ โดยมีรูปแบบดังนี้คือ
inurl:www.geocities.com/heartland/meadows/6485/
  • Tip : ใน ขณะที่ site: จะไม่สนใจคำว่า http:// ที่อยู่หน้าชื่อเว็บไซต์ แต่คุณจะได้ผลการสืบค้นจำนวนน้อยกว่า หากคุณระบุ http:// ลงใน inurl: ดังนั้นเพื่อผลการสืบค้นที่ดีที่สุด คุณจึงไม่ควรใสคำว่า http:// เมื่อใช้ inurl:
คุณจะเห็นว่าการใช้ inurl: แทน site: จะมีข้อได้เปรียบอยู่สองประการคือ
  • คุณสามารถใช้ inurl: ได้โดยไม่ต้องระบุซินแท็กซ์ค้นหาอื่นๆ (ซึ่งคุณไม่สามารถทำได้เมื่อใช้ site:)
  • คุณสามารถใช้ซินแท็กซ์นี้เพื่อสืบค้นไดเร็กทอรี่ย่อยภายใต้เว็บไซต์นั้นๆได้
การสืบค้นภายใต้ Subdomain
คุณสามารถใช้ inurl: ร่วมกับ site: เพื่อที่จะสืบค้นข้อมูลเกี่ยวกับ Subdomain ได้ ยกตัวอย่างเช่น คุณต้องการทราบว่าเว็บไซต์ OReilly.com มี Subdomain เป็น อย่างไรบ้าง ซึ่งคุณไม่สามารถที่จะได้คำตอบนี้จากคำสั่ง site:oreilly.com หรือ จากคำสั่ง inurl:“*.oreilly.com” ได้ (ซินแท็กซ์นี้จะสืบค้นทั้ง Web Page ที่เป็น mirrors (ดู Hack #91) และ Web Page อื่นๆ ซึ่งมีคำว่า oreilly.com ที่อยู่นอกเหนือจากเว็บไซต์ของ O’Reilly)
แต่คุณต้องใช้ซินแท็กซ์ต่อไปนี้ร่วมกันกันจึงจะสามารถที่จะทำงานได้
site:oreilly.com inurl:“*.oreilly” -inurl:“www.oreilly”
คำสั่งข้างต้นนี้บอกให้ Google สืบค้นที่เฉพาะเว็บไซต์ OReilly.com ซึ่งมี Web Page หน้าที่ชื่อ URL มีคำว่า ‘*.oreilly’ อยู่ด้วย (Hack #13) โดยการใช้เครื่องหมาย wildcard แทนหน้าใดๆก็ได้ที่อยู่ภายในเว็บไซต์แห่งนี้ แต่ให้ยกเว้น URL ที่มีคำว่า “www.oreilly’ ” (เพราะคุณคุ้นเคยกับ Domain นี้ดีอยู่แล้ว)

โพสต์ยอดนิยมจากบล็อกนี้

I miss you all กับ I miss all of you ต่างกันอย่างไร

ปัญหาและเฉลยวิชาธรรม นักธรรมชั้นตรี สอบในสนามหลวง วันอังคาร ที่ ๒๙ กันยายน พ.ศ.๒๕๕๒

ปัญหาและเฉลยวิชาอนุพุทธประวัติ นักธรรมชั้นโท สอบในสนามหลวง วันอาทิตย์ ที่ ๒๐ พฤศจิกายน พ.ศ. ๒๕๔๘