วันเสาร์ที่ 8 กันยายน พ.ศ. 2555

ข้อแตกต่างระหว่าง Index และ Search Engine



               คือ  วิธีในการค้นหาข้อมูลแบบ Index  จะใช้คนเป็นผู้จัดรวบรวม และทำระบบฐานข้อมูลขึ้นมา ส่วนแบบ Search Engine นั้น  ระบบฐานข้อมูลของมันจะได้รับการจัดสร้างโดยใช้ Software ที่มีหน้าที่เกี่ยวกับงานทางด้านนี้โดยเฉพาะมาเป็นตัวควบคุม และจัดการ  ซึ่ง Software ตัวนี้จะมีชื่อเรียกว่า Spiders การทำงานของมันจะใช้วิธีการเดินลัดเลาะไปตามเครือข่ายต่าง ๆ ที่เชื่อมโยงถึงกันอยู่เต็มไปหมดใน Internet  เพื่อค้นหา Website ที่เกิดขึ้นมาใหม่ ๆ รวมทั้งยังสามารถตรวจสอบหาความเปลี่ยนแปลงของ ข้อมูลใน Site เดิมที่มีอยู่ ว่าที่ใดถูกอัพเดตแล้วบ้าง จากนั้นมันก็จะนำเอาข้อมูลทั้งหมดที่สำรวจเข้ามาได้เก็บใส่เข้าไปในฐานข้อมูลของตนอัตโนมัติ  ยกตัวอย่างของผู้ให้บริการประเภทนี้  เช่น Excite , Lycos Infoserch  เป็นต้น การค้นหาด้วยวิธี Search Engine นั้น  มักจะได้ผลลัพธ์ออกมากว้าง ๆ ชี้เฉพาะ เจาะจงได้ยาก บางครั้งข้อมูลที่ค้นหามาได้อาจมีถึงเป็นร้อยเป็นพัน Site ซึ่งต้องเสียเวลานานมากในการค้นหาและอ่านเว็บเพจ  โดยไม่รับรองได้ว่าจะได้ข้อมูลที่ต้องการหรือไม่ ดังนั้นจึงมีหลักในการค้นหา เพื่อให้ได้ข้อมูลใกล้เคียงความเป็นจริงมากที่สุด 

เทคนิคใน Search engine
ผลลัพธ์จากการค้นหาจาก Search engine ที่มีใช้งานอยู่ทั่วไปนั้น นอกจากจะได้ลิงค์ของเว็บเพจแล้ว Search engine ยังแสดงเนื้อหาข้อมูลในเว็บเพจนั้นด้วย นั่นหมายความว่า Search engine จะต้องจัดเก็บข้อมูลที่นำมาแสดงนั้นไว้ในฐานข้อมูล Search engine แต่ละตัวมีวิธีเลือกเก็บข้อมูลแตกต่างกันไปเช่น เก็บเฉพาะอักขระ 200 ตัวแรกของเว็บเพจ  Search engine จะคัดเอาอักขระ 200 ตัวแรกที่ไม่ได้เป็นคำสั่ง HTML มาทำเป็นคำบรรยาย หรือเก็บจำนวนคำที่พบในเพจเพื่อนำมาแสดงเป็นคะแนนว่าเว็บเพจที่ค้นได้มีความเกี่ยวข้องกับคำที่ค้นมามากเพียงใด
ตัวสไปเดอร์ใน Search engine จะใช้ทรัพยากรของระบบเป็นจำนวนมาก Search engineที่ดีจะมี สไปเดอร์ที่ไม่ใช้ทรัพยากรของระบบสูงมากเกินไปโดยอาศัยเทคนิคดังเช่น
- ไม่อ่านเอกสาร HTML มากเกินไป แม้ว่าสไปเดอร์ จะมีความสามารถจัดการเอกสารได้ทัน เพราะอาจจะทำให้เครือข่ายทำงานช้าลง
- อ่านเฉพาะส่วนที่จำเป็นต้องใช้ เช่นอาจจะอ่านมาเฉพาะส่วนที่เป็นตัวอักษร ซึ่งในโปรโตคอล http มีฟิลด์ Accept ซึ่งใช้สำหรับบอกชนิดของข้อมูลที่ต้องการ หากมีการระบุชนิดของข้อมูลลงในฟิลด์นี้ เว็บเซิร์ฟเวอร์จะส่งข้อมูลมาเฉพาะชนิดที่ระบุในไฟล์
- ตรวจสอบไม่ให้อ่านเว็บที่เคยอ่านไปแล้ว ข้อควรระวังของข้อนี้ก็คือ เซิร์ฟเวอร์บางเซิร์ฟเวอร์อาจจะมีชื่อได้หลายชื่อ เช่น web.nexor.co.uk, nercules.nexor.co.uk และ 128.243.219.1 เป็นเซิร์ฟเวอร์ เดียวกัน

Multi Search engine
นอกไปจาก Search engine แล้ว ในปัจจุบันยังมี Multi Search engine หรือ Search engineแบบขนาน ซึ่งก็คือ Search engine ที่จะส่งคำไปถามหรือ Search engine หลาย ๆ ตัวพร้อมกันในครั้งเดียว แล้วนำผลลัพธ์ที่ได้มารวมและเรียบเรียงใหม่ ตัวอย่างของ  Multi Search engine เช่น

ไม่มีความคิดเห็น:

แสดงความคิดเห็น