HACK#14 ซินแท็กซ์ inurl: และ site:

การใช้ inurl เพื่อค้นหาไดเร็กทอรี่ย่อยของเว็บไซต์
ซิ นแท็กซ์ site: จะทำงานได้อย่างสมบูรณ์ในกรณีที่คุณต้องการจำกัดการสืบค้นไปที่ Domain ใด Domain หนึ่งเท่านั้น หรือสืบค้นที่ตัวลงท้ายของ Domain (domain suffix) เช่น “example.com” หรือ “www.example.org” หรือ “edu” เช่น คำสั่ง site: edu แต่มันจะสะดุดในกรณีที่คุณพยายามที่จะค้นหาเว็บไซต์ที่อยู่ลึกลงไปจากหน้าโฮ มเพจ (เช่นในไดเร็กทอรี่ย่อย /~ sam/album/)
ยก ตัวอย่างเช่น หากคุณกำลังค้นหาสิ่งที่อยู่ภายใต้เว็บไซต์ Geocities ซึ่งเป็นเว็บไซต์หลัก คุณไม่สามารถที่จะใช้ซินแท็กซ์‌ site: เพื่อที่จะค้นหา Web Page ทั้งหมดในไดเร็กทอรี่ย่อย http://www.geocities.com/heartland/meadows/6485 ได้ เพราะ Google จะไม่สามารถค้นหาผลลัพธ์ให้กับคุณได้ แต่ถ้าคุณใช้ซินแท็กซ์พิเศษเป็น inurl: เพื่อที่จะระบุคำที่อาจจะพบได้ใน URL ที่เป็นผลการสืบค้น คำสั่งนี้จะทำงานให้ตามที่คุณต้องการ โดยมีรูปแบบดังนี้คือ
inurl:www.geocities.com/heartland/meadows/6485/
  • Tip : ใน ขณะที่ site: จะไม่สนใจคำว่า http:// ที่อยู่หน้าชื่อเว็บไซต์ แต่คุณจะได้ผลการสืบค้นจำนวนน้อยกว่า หากคุณระบุ http:// ลงใน inurl: ดังนั้นเพื่อผลการสืบค้นที่ดีที่สุด คุณจึงไม่ควรใสคำว่า http:// เมื่อใช้ inurl:
คุณจะเห็นว่าการใช้ inurl: แทน site: จะมีข้อได้เปรียบอยู่สองประการคือ
  • คุณสามารถใช้ inurl: ได้โดยไม่ต้องระบุซินแท็กซ์ค้นหาอื่นๆ (ซึ่งคุณไม่สามารถทำได้เมื่อใช้ site:)
  • คุณสามารถใช้ซินแท็กซ์นี้เพื่อสืบค้นไดเร็กทอรี่ย่อยภายใต้เว็บไซต์นั้นๆได้
การสืบค้นภายใต้ Subdomain
คุณสามารถใช้ inurl: ร่วมกับ site: เพื่อที่จะสืบค้นข้อมูลเกี่ยวกับ Subdomain ได้ ยกตัวอย่างเช่น คุณต้องการทราบว่าเว็บไซต์ OReilly.com มี Subdomain เป็น อย่างไรบ้าง ซึ่งคุณไม่สามารถที่จะได้คำตอบนี้จากคำสั่ง site:oreilly.com หรือ จากคำสั่ง inurl:“*.oreilly.com” ได้ (ซินแท็กซ์นี้จะสืบค้นทั้ง Web Page ที่เป็น mirrors (ดู Hack #91) และ Web Page อื่นๆ ซึ่งมีคำว่า oreilly.com ที่อยู่นอกเหนือจากเว็บไซต์ของ O’Reilly)
แต่คุณต้องใช้ซินแท็กซ์ต่อไปนี้ร่วมกันกันจึงจะสามารถที่จะทำงานได้
site:oreilly.com inurl:“*.oreilly” -inurl:“www.oreilly”
คำสั่งข้างต้นนี้บอกให้ Google สืบค้นที่เฉพาะเว็บไซต์ OReilly.com ซึ่งมี Web Page หน้าที่ชื่อ URL มีคำว่า ‘*.oreilly’ อยู่ด้วย (Hack #13) โดยการใช้เครื่องหมาย wildcard แทนหน้าใดๆก็ได้ที่อยู่ภายในเว็บไซต์แห่งนี้ แต่ให้ยกเว้น URL ที่มีคำว่า “www.oreilly’ ” (เพราะคุณคุ้นเคยกับ Domain นี้ดีอยู่แล้ว)

โพสต์ยอดนิยมจากบล็อกนี้

ปัญหาและเฉลยธรรม นักธรรมชั้นโท สอบในสนามหลวง พ.ศ. ๒๕๔๓ วันพฤหัสบดี ที่ ๑๖ พฤศจิกายน พ.ศ. ๒๕๔๓

ปัญหาและเฉลยวินัยบัญญัติ นักธรรมชั้นเอก สอบในสนามหลวง พ.ศ. ๒๕๔๓ วันเสาร์ ที่ ๑๘ พฤศจิกายน พ.ศ. ๒๕๔๓

ปัญหาและเฉลยวิชาธรรม นักธรรมชั้นโท สอบในสนามหลวง วันเสาร์ ที่ ๑๙ พฤศจิกายน พ.ศ. ๒๕๔๘