HACK#31 Google Images

การเสาะหาภาพในวัยเด็กของเพื่อนคุณหรือหาภาพธงชาติของประเทศซิมบับเว จากคลังภาพที่มีถึง 390 ล้านภาพซึ่งได้ถูกจัดทำอินเด็กซ์เอาไว้ใน Google Images
เรามาพักการค้นหาข้อมูลที่เป็นข้อความสักครู่กันดีกว่า คราวนี้ลองมาดูที่การค้นหารูปภาพบ้าง โดยการใช้ Google Images (http://images.google.com/) ซึ่งเป็นอินเด็กซ์ที่เก็บรวบรวมภาพกว่า 390 ล้านภาพเอาไว้ แม้ว่าจะไม่มีส่วนที่เป็นซินแท็กซ์เหมือนการสืบค้นแบบอื่นๆ ทว่า Google Images ก็มีการสืบค้นขั้นสูงที่เรียกว่า Advanced Image Search (http://images.google.com/advanced_image_search) กับเค้าเช่นกัน ซึ่งสามารถให้ทางเลือกที่น่าสนใจกับผู้ใช้ได้
  • Tip : คุณสามารถระบุตัวเลือกในเว็บเพจของการค้นหาภาพขั้นสูง (Advance Image Search) ผ่านทาง URL (Hack #9) ได้ด้วย
การ สืบค้นภาพในขั้นสูง สามารถเริ่มได้จากการสืบค้นคีย์เวิร์ด เพราะภาพต่างๆ นั้นถูกจัดทำเป็นอินเด็กซ์ด้วยคีย์เวิร์ด ซึ่งมีความครอบคลุมมากน้อยไม่เท่ากัน ดังนั้นจงระบุให้เฉพาะเจาะจงที่สุดเท่าที่จะมากได้ หากคุณกำลังหารูปแมวก็จงอย่าใช้คำว่า cat เป็นคีย์เวิร์ด นอกเสียจากว่าคุณไม่รังเกียจที่จะได้ผลลัพธ์มากมายเกินจำเป็น ดังนั้น จงใช้คำซึ่งมีความหมายเฉพาะเจาะจงและมีความเกี่ยวข้องกับคำว่า cat มากกว่านั้น เช่น feline หรือ kitten เป็นต้น ขอให้เฉพาะเจาะจงลงไปให้มากที่สุดเท่าที่จะทำได้โดยที่ใช้จำนวนคำน้อยที่สุด แม้กระนั้นก็ตาม สำหรับคีย์เวิร์ดสืบค้นบางคำเช่นคำว่า feline fang นั้นจะให้ผลลัพธ์มากกว่า 3,000 ภาพเลยทีเดียว ดังนั้นในกรณีนี้คำว่า cat fang อาจให้ผลลัพธ์ที่ดีกว่า (การเลือกคีย์เวิร์ดที่ใช้ในการสืบค้นรูปภาพนั้นต้องอาศัยความอดทน และการฝึกฝนมากพอสมควรเลยทีเดียว)
ผลการสืบค้นที่ได้จะให้ทั้งรูปภาพซึ่งแสดงเป็น thumbnail (คือการแสดงผลรูปภาพโดยเรียงต่อกันไปหลายๆภาพ) ชื่อของรูปภาพนั้นๆ ขนาดของภาพ (ทั้งที่เป็นพิกเซลและกิโลไบต์) รวมทั้งชื่อ URL ของรูปภาพแต่ละภาพด้วย การคลิกที่ภาพจะทำให้คุณได้เว็บเพจที่อยู่ในกรอบ และมี thumbnail อยู่ส่วนบน จากนั้นจะมีชื่อเว็บเพจที่มีภาพนั้นอยู่ในส่วนล่าง
ภาพที่ 2-2 หน้าตาของ Google Image
การสืบค้นจาก Google Images
ก็ เหมือนกับการเสี่ยงดวงเพราะมันยากที่จะสร้างคำถามสืบค้นที่ประกอบด้วยคำ หลายๆคำได้ เพราะการสืบค้นด้วยคำเดียวโดดๆนั้น จะให้ผลลัพธ์มากมายเกินไป แต่อย่างไรก็ตาม คุณยังมีทางเลือกที่จะระบุคำสืบค้นของคุณให้เฉพาะเจาะจงมากขึ้นได้ทั้งจาก การใช้การสืบค้นขั้นสูง (Advanced Image Search) และการใช้ซินแท็กซ์พิเศษ (Google Image Search Specia Syntaxes) เข้าช่วยอีกทีหนึ่ง
การใช้ Advanced Image Search ของ Google
Advanced Image Search (http://images.google.com/advanced-image-search) จะให้คุณระบุขนาด (เป็นพิกเซลไม่ใช่กิโลไบต์) ของภาพที่คุณต้องการ คุณสามารถระบุประเภทของไฟล์ภาพนั้นๆได้ด้วย (Google จัดทำอินเด็กซ์เฉพาะภาพที่เป็น JPEG และ GIF เท่านั้น) นอกจากนี้คุณยังสามารถระบุสี (เช่น ขาว ดำ เทา หรือ ทุกสี) และระบุ Domain Name ที่คุณต้องการสืบค้นได้อีกด้วย
การ สืบค้นด้วยภาพจาก Google จะใช้ Filter ที่แยกออกเป็นสามระดับ คือ ไม่กรองเลย (none) กรองระดับปานกลาง (moderate) และสุดท้ายคือการกรองแบบเข้มงวด (strict) Filter ในระดับปานกลางจะกรองเฉพาะภาพที่เฉพาะเจาะจงออกไป ในขณะที่ในระดับเข้มงวดจะกรองทั้งภาพและตัวอักษรเลยทีเดียว แต่การใช้ Filter ก็ไม่ได้รับประกันว่าคุณจะไม่ได้รับเนื้อหาที่ไม่เหมาะสมซะเลยทีเดียว ในบางครั้ง Filter เหล่านี้ก็ไม่ช่วยอะไรเลย ยกตัวอย่างเช่น คุณต้องการที่จะค้นหาภาพเกี่ยวกับมะเร็งเต้านม แต่ Filter ของ Google ได้ตัดผลการสืบค้นที่คุณควรจะได้ไป ดังนั้นเมื่อใดก็ตามที่คุณกำลังสืบค้นคำที่อาจจะเป็นคำต้องห้าม ทั้งๆที่มีเจตนาจะใช้ในความหมายทั่วๆไปอยู่ก็ตาม คุณอาจจะต้องยกเลิกการใช้ Filter ไปเลย เพื่อตัดโอกาสที่จะไม่ได้ผลลัพธ์ที่ต้องการทางออกไป หรือไม่อีกวิธีหนึ่งก็คือ พยายามใช้คำอื่นแทน เช่น หากคุณกำลังค้นหาภาพเกี่ยวกับมะเร็งเต้านมอยู่ ก็ให้ใช้คำสืบค้นว่า mamograms หรือ Tamoxifen ซึ่งเป็นชื่อตัวยาที่ใช้รักษามะเร็วเต้านมแทน
ซินแท็กซ์พิเศษของ Google Images
Google Images มีซินแท็กซ์พิเศษให้คุณได้เลือกใช้ได้ดังต่อไปนี้
intitle:
ซินแท็กซ์นี้จะสืบค้นจาก Title ของเว็บเพจ วิธีนี้เป็นวิธีที่ดีวิธีหนึ่ง ในการจำกัดผลการสืบค้นของคุณ
filetype:
ซินแท็กซ์นี้จะสืบค้นรูปภาพที่เป็นไฟล์ JPEG หรือ GIF อย่างใดอย่างหนึ่งเท่านั้น โดยไม่สนใจรูปไฟล์ชนิดอื่นๆ ไม่ว่าจะเป็น BMP หรือ PNG หรืออื่นๆที่ Google ไม่ได้เก็บเอาไว้ โปรดสังเกตว่าการใช้คำสั่งว่า filetype:jpg และ filetype:jpeg จะให้ผลการสืบค้นที่ต่างกัน เพราะ Filter จะดูที่ชื่อสกุลของไฟล์ แต่จะไม่สามารถแยกแยะให้ลึกซึ้งไปกว่านั้นได้
inurl:
ซินแท็กซ์นี้จะทำงานคล้ายกับซินแท็กซ์ในการสืบค้นเว็บเพจปกติ โดยจะไปค้นหาคำที่ต้องการใน URL แต่ผลลัพธ์ที่ได้อาจทำให้คุณสับสนได้ ยกตัวอย่างเช่น คุณอาจจะค้นหารูปแมวด้วยคำสั่งว่า inurl:cat แต่กลับได้ผลลัพธ์เป็น URL ต่อไปนี้
แล้ว คำว่า cat หายไปไหน? ที่เป็นเช่นนี้ก็เพราะ Google ได้จัดทำอินเด็กซ์โดยมีชื่อของรูปภาพเป็นส่วนหนึ่งของชื่อ URL ดังนั้น URL ข้างบนนี้อาจมีคำว่า cat อยู่ได้เช่นกัน หาก URL ดังกล่าวมีคำว่า cat.jgp อยู่ด้วย นี่คือปัญหาที่อาจเกิดขึ้นได้เมื่อคุณใช้คำสั่ง inurl:cat เพราะมันจะไปค้นหา cat ซึ่งเป็นชื่อของภาพ แทนที่จะเป็น URL
site:
ซิ นแท็กซ์ site: จะจำกัดการสืบค้นไปที่โฮสหรือ Domain Name เป็นหลัก อย่างไรก็ตาม คุณไม่ควรที่จะใช้ซินแท็กซ์นี้เพื่อเจาะจงโฮส นอกเสียจากว่าคุณจะรู้ดีว่ามีข้อมูลอะไรอยู่ที่นั่น ดังนั้นจึงควรใช้กับ Domain Name จะดีกว่า เช่น คุณอาจระบุคำสั่งเป็น football site:uk จากนั้นจึงสืบค้นคำว่า football ต่อไปในผลลัพธ์ที่ได้
คำ สั่ง site:com เป็นตัวอย่างที่ดีอีกตัวอย่างหนึ่งที่จะแสดงให้เห็นว่าซินแท็กซ์ site: สามารถให้ผลการสืบค้นที่แตกต่างกันได้มากเพียงใด ระหว่างการใช้กับไม่ใช้ซินแท็กซ์ดังกล่าว
Google Images และ Google API
ในขณะที่เขียนหนังสือเล่มนี้ Google Images ยังไม่รวมอยู่ใน Google API แต่อย่างใด

โพสต์ยอดนิยมจากบล็อกนี้

I miss you all กับ I miss all of you ต่างกันอย่างไร

ปัญหาและเฉลยวิชาธรรม นักธรรมชั้นตรี สอบในสนามหลวง วันอังคาร ที่ ๒๙ กันยายน พ.ศ.๒๕๕๒

ปัญหาและเฉลยวิชาอนุพุทธประวัติ นักธรรมชั้นโท สอบในสนามหลวง วันอาทิตย์ ที่ ๒๐ พฤศจิกายน พ.ศ. ๒๕๔๘