Frank兄在前文   亞馬遜搜尋引擎:A9迴響中有提到二個搜尋引擎,一個是Mooter, 另一個是kartoo,今日就逛了逛Mooter這個搜尋引擎。

網址:http://www.mooter.com/
一進去網頁,一如Google一樣的單一查詢介面,之前在上自動分類與索引時,課程裡該有介紹這個搜尋引擎,一見到介面,印象就上來了。.


如果輸入關鍵字, Mooter會進行分類的動作,它會把搜尋的結果分成更的的類目,並以圖型的方式呈現出來,這個類目是如何產生的呢? 它不是像以圖書館的分類法來產生的,而是以系統來Clustering來計算出數值,把所有的結果數值,相似的放在一起,再加以收斂,最後就會產生這些類目了。
假設我輸入Library這個關鍵字,它的結果會如下圖:


可以看到以 library下關鍵字的話,得出的結果是會有關Information , university, internet , search, book , map ,...這些,這些字就是剛剛說的以加權所算出這些結果會有相關的關鐋字,換言之,輸入Library,你得到的不只是有Library的相關網頁,你同時也可以了解到有哪些的領域會和Library有相關度,這就多了主題、觀念上的進一步認識。這方面就比Google要強了…
可以再觀察一下,它的線長都不同長度,這是代表它的相關度,愈近就代表相關度愈高.
如果再按一下next clusters的話,Mooter會再度的向下cluster,等於是再往下進行一個分類。
會如下圖


很明顯的 Mooter把這些結果再向下進行了一次分類,Library和books , resource, audio, site, catalog等有相關度,線最短就是最相關的,竟然是Site,而不是Book…嗯,蠻有趣的。
還可以在向下分類,會如下圖:


其實,可以看到,以目前的系統用加權的方式進行自動分類,還是有它不足的地方,只能當作一個參考,還是有它的侷限存在。

Mooter這種視覺化的搜尋引擎,其實是把加權的數值進行視覺的呈現,在自動分類與索引裡,其實不是一種新的科技,只能說Mooter是選擇了視覺化的呈現,搜尋引擎的加權數值的公式,每個搜尋引擎都不同,但大多是以字詞的頻率等為計算依據,如果願意的話,其結果可以看成三度空間的座標來看關係遠近,(大多的搜尋引擎是以向量來計算…就是三度空間來計算的),還記得上課時,老師還有展示國外有人做出四度空間的模組(其實只是加上了時間為第四數值)。

那Google呢?它之所以轟動或可以立足,是因為它不是用向量來計算,而是以引用關係/連結關係的觀念出發來進行計算,改善了正確率,相較以往的向量計算,它能更快的得到更精準的結果。

不論如何 ,可以玩玩看Mooter這種視覺呈現的搜尋引擎,說不定會有另一種驚喜…





創作者介紹

梁董的吧台後

arshloh 發表在 痞客邦 PIXNET 留言(3) 人氣()


留言列表 (3)

發表留言
  • frank
  • 今天又看到了三個搜尋引擎,也有一些特別,<br />
    clusty: http://clusty.com/<br />
    giga blast http://www.gigablast.com/<br />
    grokker: http://www.grokker.com/<br />
    <br />
    尤其grokker,也是一種圖型化的介面.<br />
    <br />
    另,梁董提到有關google的連結關係,Touch Graph 網站<br />
    ( http://www.touchgraph.com/ )是可以去看看的.<br />
    當然,這個網站不只介紹google而己,還有其他的介紹,<br />
    均以圖型化表示,滿有趣的.<br />
  • arshloh
  • 謝謝二位的指教,<br />
    Frank兄的推介網址,小弟會再去研究<br />
    XXC兄的大作之前就有拜讀,獲益匪淺 <br />
    <br />
    記得上課時,老師有說到,搜尋引擎這種一定是會不斷更迭,從以前的<br />
    Alta Vista到Yahoo到現在的Google,在技術上若不求進步,很可能被追<br />
    過的,相信Google也有體認,所以發展了多樣化的服務。競爭者真的不少啊…
找更多相關文章與討論