LAB การสืบค้นข้อมูล 2

ให้ยกตัวอย่างในการค้นหาข้อมูลของหัวข้อที่ต้องการรู้แล้วทำการเปรียบเทียบผลของการค้นหาจาก Search Engines ดังต่อไปนี้

AltaVista

go

  • 137,000,000 results
  • มี Ads ที่เป็น keyword อยู่ด้านขวา
  • แสดผลของ YAHOO! search solution
  • ภาษาอังกฤษ
  • มีคุณสมบัติการค้นหาด้วยความเร็วปานสายฟ้าแลบและตรงกับความต้องการของผู้ใช้อย่างมาก สามารถสั่งให้ค้นหาแบบคำสำคัญหรือคีย์เวิร์ดได้อย่างชัดเจนอีกทั้งในการใช้ตรรกบูลีน (OR, AND, NOT)  จะดีมาก
  • การเน้นคำที่สำคัญในแต่ละหน้า
    AltaVista Discovery จะเน้นคำสำคัญที่สามารถค้นหาข้อมูลเพิ่มเติมได้อีกในแต่ละหน้าบนเว็บ ซึ่งช่วยให้ผู้ใช้คลิ้กหาข้อมูลเพิ่มเติมได้ทันที
  • การสรุปข้อมูลในแต่ละหน้า
    AltaVista Discovery จะทำการสรุปย่อข้อมูลที่มากเกินไปในแต่ละหน้าเพื่อช่วยให้อ่านข้อมูลได้เร็วขึ้น
  • การค้นหาข้อมูลที่คล้ายคลึงกัน
    ผู้ใช้สามารถค้นหาข้อมูลบนหน้าอื่นๆ ที่มีข้อความคล้ายคลึงกับหน้าที่ดูอยู่ได้ด้วยการคลิ้กเพียงครั้งเดียว
  • การแสดงชื่อเว็บที่มาของข้อมูลแต่ละหน้า
    AltaVista Discovery สามารถระบุรายชื่อเว็บไซต์ที่มีข้อความอ้างอิงถึงเนื้อหาข้อมูลที่แสดงบนจอพร้อมเชื่อมโยงได้ทันที
  • แสดงข้อมูลในหน้าอื่นๆ จากเว็บไซต์เดียวกัน
    AltaVista Discovery สามารถแสดงรายการของหน้าทั้งหมดบนเว็บไซต์เดียวกันโดยยังเปิดหน้าปัจจุบันไว้ด้วยการคลิ้กเม้าส์เพียงครั้งเดียว

AOL Search

aol

  • 708,000,000 results
  • เน้น keyword ด้วยหนังสือตัวหนาสีน้ำเงิน
  • มี Ads ที่เป็น keyword อยู่ด้านขวา
  • มีการแสดง rated และ reviews
  • ภาษาอังกฤษ
  • มี related searches
  • ค้นหาได้ในหลายหมวด เช่น images ,videos ,AOL

Excite

excite

  • search results from : Google ,YAHOO!  ,Yandex
  • ภาษาไทยและภาษาอังกฤษ
  • มี Are you looking for ?
  • ค้นหาได้หลายหมวด เช่น Web ,Images .Video ,News ,Yellow Pages ,White Pages
  • มี Advanced Search
  • เน้นข้อความด้วยตัวอักษารหนา สีน้ำเงิน ในเนื้อเรื่องจะเส้นตัวอักษรหนา สีดำ

HotBot

hotbot

  • Web Results 1-10 of 137,000,000
  • ภาษาอังกฤษ
  • นำเอา Open Directory Project ซึ่งเป็นฐานข้อมูลไดเรกทอรีเข้ามาผสานเพิ่มคุณภาพของการเสิร์ช
  • ใช้โปรแกรม หรือที่เรียกว่า Robot ช่วยค้นหา เอกสารและจัดทำดัชนีในการสืบค้นเว็บท่าเหล่านี้มีข้อดีที่สามารถสืบค้นข้อมูลได้อย่างกว้างขวางมาก แต่จะมีข้อเสียที่ได้ข้อมูลไม่ตรงกับความต้องการ หรือได้มากจนเกินไป

Go.com

go

  • แสดงในหน้าของ YAHOO!
  • results 142,000,000
  • เน้น keyword ด้วยหนังสือตัวหนาสีน้ำเงิน
  • ภาษาอังกฤษ
  • มี also try
  • มีภาพประกอบ
  • มี Image Results ประกอบ
  • มีฐานข้อมูลขนาดใหญ่และยังรวมถึงฐานข้อมูลของรายชื่ออีเมล์และนิวส์กรุ๊ปได้ เป็น Search Engine ที่เป็นแบบนามานุกรมที่มีความเร็วในการค้นหาอีกทั้งหน้าตาเว็บยังสวยงาม และมีลูกเล่นด้วย

Google

google

  • ผลการค้นหาประมาณ 748,000,000 รายการ
  • ใช้เวลา 0.02 วินาที
  • keyword เน้นด้วยสีแดง 
  • มีผลลัพธ์แบบรูปภาพ
  • มีตัวเลือกที่เป็น “แคช” และ “แปลหน้านี้”
  • มีคีย์บอดเสริมโดยใช้เม้าท์กดแทนแป้นพิมพ์
  • มีฐานข้อมูลมากกว่าสามพันล้านเว็บไซต์และเพิ่มขึ้นเรื่อยๆ ทุกวัน จุดเด่นที่เหนือกว่าผู้ให้บริการรายอื่นๆ คือ เป็นเว็บไซต์ค้นหาที่สนับสนุนภาษาต่างๆ
    มากกว่า 80 ภาษาทั่วโลก(รวมทั้งภาษาไทย) และมีเครื่องเซิร์ฟเวอร์ให้บริการในส่วนต่างๆ ของโลกมากถึง 36 ประเทศ รวมทั้งในประเทศไทย
    ซึ่งบริการค้นหาของ Google จะแยกฐานข้อมูลออกเป็น 4 หมวด และแต่ละหมวดมีการค้นหาแบบพิเศษเพิ่มเติมด้วย คือ
                 เว็บ : เป็นการค้นหาข้อมูลจากเว็บไซต์ต่างๆ ทั่วโลก
                 รูปภาพ : เป็นการค้นหารูปภาพหลากหลายฟอร์แมตจากเว็บไซต์ต่างๆ
                 กลุ่มข่าว : เป็นการค้นหาเรื่องราวที่น่าสนใจจากกลุ่มข่าวต่างๆ
                 สารบนเว็บ : การค้นหาข้อมูลจากเว็บไซต์ที่แยกออกเป็นหมวดหมู่

Lycos

lycos

  • results 1 thru 10 of 137,000,000
  • ภาษาอังกฤษ
  • มีภาพประกอบ
  • รูปแบบการค้นหา เช่น web ,Images ,Videos ,News เป็นต้น

MSN.com

msn

  •  แสดงในรูปแบบ bing
  • 141,000,000 results
  • เน้น keyword ด้วยตัวอักษรหนาสีน้ำเงิน 
  • มีภาพประกอบ
  • ภาษาอังกฤษ
  • มี Related Searches
  • ค้นหาได้หลายหมวด เช่น web ,images ,videos ,news
  • มีเวลาบอก เช่น 1 hour ago
  • เป็นหนึ่งในฐานข้อมูลที่ใหญ่ที่สุดของ Inktomi
  • มีประสิทธิภาพสูงใน Advance search
  • สามารถแสดงผลได้ในปริมาณมากต่อหนึ่งหน้าและให้รายละเอียดของข้อมูลสมบูรณ์
  • การค้นข้อมูลจะต้องทำตามขั้นตอนอย่างถูกต้อง ไม่เช่นนั้นผลจะออกมาไม่ตรง
  • ความไม่สม่ำเสมอของการใช้งาน Truncation (*) บางครั้งเครื่องหมายนี้ไม่มีผลต่อการแสดงผลการสืบค้นข้อมูล
  • ไม่มี Customization

Web Crawler

craw

  • มี Are you looking for?
  • ภาษาไทยและภาษาอังกฤษ
  • เน้น keyword ด้วยตัวอักษรตัวหนาสีน้ำเงิน และตัวอักษรตัวหนาสีดำ
  • ค้นหาได้ในหมวด เช่น web ,images ,video ,news

Yahoo!

yahoo

  • แสดงใน YAHOO! ประเทศไทย
  • 145,000,000 ผลลัพธ์
  • ภาษาไทยและภาษาอังกฤษ
  • ลองค้นจาก
  • ค้นหาใน เว็บ หรือ เว็บภาษาไทย
  • ค้นหาในหมวด เว็บ ภาพ วิดีโอ ข่าว
  • การค้นหาที่เกี่ยวข้อง
  • กรองตามเวลา เช่น วันที่ผ่านมา  สัปดาห์ที่ผ่านมา  เดือนที่ผ่านมา
  • เน้น keyword ด้วยตัวอักษรตัวหนาสีน้ำเงิน และตัวอักษรตัวหนาสีดำ
  • จุดเด่นหลักของเว็บไซต์นี้คงมาจากความสามารถในการค้นหาข้อมูลที่ทำได้อย่างรวดเร็ว จุดหนึ่งที่ทำให้ Yahoo โดดเด่นเป็นพิเศษก็คือการแบ่งเว็บไซต์ที่เก็บในฐานข้อมูลออกเป็นหมวดหมู่และยังมีการโยงใยระหว่างกลุ่มย่อยแต่ละกลุ่มเข้าด้วยกันอย่างเป็นระบบ
อ้างอิงจาก

LAB การสืบค้นข้อมูล 1

 จงทำการศึกษาค้นคว้า Types of Search Engines แต่ละประเภทดังนี้ พร้อมยกตัวอย่างประกอบของแต่ละประเภทให้ชัดเจน

Crawler-Based Search Engines

Crawler Based Search Engines คือ เครื่องมือการค้นหาบนอินเตอร์เน็ตแบบอาศัยการบันทึกข้อมูลและจัดเก็บข้อมูลเป็นหลัก ซึ่งจะเป็นจำพวก Search Engine ที่ได้รับความนิยมสูงสุด เนื่องจากให้ผลการค้นหาแม่นยำที่สุดและการประมวลผลการค้นหาสามารถทำได้อย่างรวดเร็วจึงทำให้มีบทบาทในการค้นหาข้อมูลมากที่สุดในปัจจุบัน
โดยมีองประกอบหลักเพียง 2 ส่วนด้วยกัน คือ
1. ฐานข้อมูล โดยส่วนใหญ่แล้ว Crawler Based Search Engine เหล่านี้จะมีฐานข้อมูลเป็นของตัวเองที่มีระบบการประมวลผลและการจัดอันดับที่เฉพาะเป็นเอกลักษณ์ของตนเองอย่างมาก
2. ซอฟแวร์ คือ เครื่องมือหลักสำคัญที่สุดอีกส่วนหนึ่งสำหรับ Search Engine ประเภทนี้ เนื่องจากต้องอาศัยโปรแกรมเล็ก ๆ ทำหน้าที่ในการตรวจหาและทำการจัดเก็บข้อมูลหน้าเพจหรือเว็บไซต์ต่างๆในรูปแบบของการทำสำเนาข้อมูลเหมือนกับต้นฉบับทุกอย่าง ซึ่งเราจะรู้จักกันในนาม Spider หรือ Web Crawler หรือ Search Engine Robots
ตัวอย่าง  หนึ่งของ Crawler Based Search Engine ชื่อดัง http://www.google.com Crawler Based Search Engine ได้แก่ Google , Yahoo, MSN, Live, Search, Technorati (สำหรับ blog) ส่วนลักษณะการทำงานและการเก็บข้อมูลของ Web Crawler หรือ Robot หรือ Spider นั้นแต่ละแห่งจะมีวิธีการเก็บข้อมูลและการจัดอันดับข้อมูลที่ต่างกัน

Snap 2012-12-01 at 22.06.44

Google

Snap 2012-12-01 at 22.08.04

YAHOO

Snap 2012-12-01 at 22.11.52

MSN

LIVE

Snap 2012-12-01 at 22.17.05

Technorati (สำหรับ blog)

อ้างอิง

Directories

Web Directory หรือ Blog Directory คือ สารบัญเว็บไซต์ที่ให้คุณสามารถค้นหาข่าวสารข้อมูลด้วยหมวดหมู่ข่าวสารข้อมูลที่เกี่ยวข้องกันในปริมาณมากๆคล้ายๆกับสมุดหน้าเหลืองซึ่งจะมีการสร้างดรรชนี มีการระบุหมวดหมู่อย่างชัดเจนซึ่งจะช่วยให้การค้นหาข้อมูลต่างๆตามหมวดหมู่นั้นๆ ได้รับการเปรียบเทียบอ้างอิงเพื่อหาข้อเท็จจริงได้ในขณะที่เราค้นหาข้อมูลเพราะว่าจะมีเว็บไซต์มากมาย หรือ Blog มากมายที่มีเนื้อหาคล้ายๆ กันในหมวดหมู่เดียวกันให้เราเลือกที่จะหาข้อมูลได้อย่างตรงประเด็นที่สุด (ลดระยะเวลาได้มากในการค้นหา)
ตัวอย่าง
ODP Web Directory ชื่อดังของโลก ที่มี Search Engine มากมายใช้เป็นฐานข้อมูล Directory

http://www.dmoz.org

1.ODP หรือ Dmoz ที่หลายๆ คนรู้จัก ซึ่งเป็น Web Directory ที่ใหญ่ที่สุดในโลก  Search Engine หลาย ๆ แห่งก็ใช้ข้อมูลจากที่แห่งนี้เกือบทั้งสิ้น เช่น Google, AOL, Yahoo, Netscape และอื่น ๆ อีกมากมาย ODP มีการบันทึกข้อมูลประมาณ 80 ภาษาทั่วโลกรวมถึงภาษาไทยด้วย

 

Snap 2012-12-01 at 21.59.58

http://webindex.sanook.com

2. สารบัญเว็บไทย SANOOK ก็เป็น Web Directory ที่มีชื่อเสียงอีกเช่นกันและเป็นที่รู้จักมากที่สุดในเมืองไทย

Snap 2012-12-01 at 22.01.24

3. Blog Directory อย่าง BlogFlux Directory ที่มีการเก็บข้อมูลเกี่ยวกับบล็อกมากมายตามหมวดหมู่ต่างๆ หรือ Blog Directory อื่น ๆ ที่สามารถหาได้จาก Make Many แห่งนี้
อ้างอิง

 

Hybrid Search Engines

Hybrid Search Engines เสิร์ชเอนจิ้นลูกผสมทุกวันนี้มีพัฒนาการของเสิร์ชเอนจิ้นในลักษณะที่นำข้อดีของทั้ง crawler-based และ directories มาใช้งานมากขึ้นแต่โดยปกติแล้วเสิร์ชเอนจิ้นลูกผสมนั้นมักจะให้ผลลัพธ์ในการค้นหาเอียงไปทางใดทางหนึ่งมากกว่าอีกทางหนึ่ง เช่น MSN search นั้น มักจะโอนเอียงไปทางไดเรกทอรี่ที่ดูแลโดย editor มากกว่า crawler-based อาทิเช่น LookSmart (เสิร์ชเอนจิ้นตัวหนึ่งของ MSN) แต่ก็มีการโอนเอียงไปทาง crawler-based เช่นกัน อาทิเช่น Inktormi (เสิร์ชเอนจิ้นตัวหนึ่งของ MSN)โดยเฉพาะอย่างยิ่งคำค้นหาที่มีความสลับซับซ้อนมากๆ

ตัวอย่าง

Snap 2012-12-01 at 22.03.56

http://www.wondermay.com/search/index.htm

อ้างอิง

Meta Search Engines

Meta Search Engine คือ Search Engine ที่ใช้หลักการในการค้นหาโดยอาศัย Meta Tag ในภาษา HTML ซึ่งมีการประกาศชุดคำสั่งต่างๆ เป็นรูปแบบของ Tex Editor ด้วยภาษา HTML นั่นเอง เช่น ชื่อผู้พัฒนา คำค้นหา เจ้าของเว็บ หรือ บล็อก คำอธิบายเว็บหรือบล็อกอย่างย่อผลการค้นหาของ Meta Search Engine นี้มักไม่แม่นยำอย่างที่คิด เนื่องจากบางครั้งผู้ให้บริการหรือผู้ออกแบบเว็บสามารถใส่อะไรเข้าไปก็ได้มากมายเพื่อให้เกิดการค้นหาและพบเว็บหรือบล็อกของตนเองและอีกประการหนึ่งก็ คือ มีการอาศัย Search Engine Index Server หลายๆ แห่งมากประมวลผลรวมกันจึงทำให้ผลการค้นหาข้อมูลต่าง ๆ ไม่เที่ยงตรงเท่าที่ควร
Search Engines ประเภทนี้อาจจัดได้ว่าไม่ใช่ Search Engines ที่แท้จริงเนื่องจากไม่ได้ทำการสืบค้นข้อมูลเองแต่จะส่งต่อคำถามจากผู้ใช้ (query) ไปให้ Search Engines ตัวอื่นผลการค้นที่ได้จึงแสดงที่มา (ชื่อของ Search Engines) ที่เป็นเจ้าของข้อมูลไว้ต่อท้ายรายการที่ค้นได้แต่ละรายการ
ข้อดีของ Search Engines ประเภทนี้คือ
สามารถค้นเรื่องที่ต้องการได้จากแหล่งเดียวไม่ต้องเสียเวลาไปค้นจากหลายที่โดย Search Engines จะตัดข้อมูลที่มีความซ้ำซ้อนกันออกไปเหมาะที่จะใช้ในกรณีที่ต้องการรวบรวมข้อมูลที่ต้องการให้ครอบคลุมมากที่สุดเนื่องจาก Search Engines เพียงตัวเดียวอาจรวบรวมข้อมูลได้ไม่ครอบคลุมทั้งหมด หรือ Search Engines อาจไม่ได้ทำดรรชนีให้และที่สำคัญช่วยประหยัดเวลาในการค้นให้กับผู้ใช้
ข้อด้อยที่ต้องคำนึงถึง
คำค้นที่ Search Engines แต่ละตัวใช้มีโครงสร้างประโยค (Syntax) ของตนเองซึ่งแตกต่างกันไปแต่ผู้ใช้จะใส่คำค้นที่  Multi Search Engines เพียงคำค้นเดียว (Query) ในกรณีที่คำค้นมีการสร้างสูตรการค้นที่ซับซ้อนหรือใช้ภาษาอื่นๆ ที่ไม่ใช่ภาษาอังกฤษอาจให้ผลการค้นไม่เที่ยงตรงได้เนื่องจากไม่เข้าใจคำสั่งที่แท้จริง
ตัวอย่าง Meta Search Engines
https://i0.wp.com/home.kku.ac.th/hslib/412141/internet/metasearch_files/metacrawler.png

https://i0.wp.com/home.kku.ac.th/hslib/412141/internet/metasearch_files/thaifind.png

อ้างอิง

 

Specialty Search Engines

เป็นซอฟต์แวร์หรือบริการที่ให้บริการค้นหาข้อมูลเฉพาะประเภทที่อยู่ในสภาวะจำกัดเท่านั้น เช่น http://www.amazon.com จะมีเครื่องมือสืบค้นหาหนังสือหรือสินค้าที่สามารถค้นหาได้เฉพาะในร้านของตนเองเท่านั้น napster เป็นซอฟต์แวร์ที่ให้บริการค้นหาเพลงเฉพาะผู้ที่สมัครเป็นสมาชิกเท่านั้น http://www.dejanews.com เป็นบริการค้นหาสารสนเทศจาก Newsgroups เท่านั้น

Snap 2012-12-01 at 21.56.45

 www.amazon.com

napster

http://www.napster.com/

อ้างอิง