1,全文搜索引擎
這種搜索方法方便、簡單,容易獲得所有相關信息;使用爬蟲程序抓取網上所有相關文章並索引;但是搜索到的信息過於復雜,需要用戶逐壹瀏覽識別所需信息。
2.元搜索引擎
基於多個搜索引擎的結果並整合它們的二次搜索方法;元搜索引擎適合廣泛、準確地收集信息;有利於基礎搜索引擎之間的優勢互補;有利於對基礎搜索方式的全局掌控,引導全文搜索引擎不斷完善。
3.垂直搜索引擎
快速檢索特定行業數據的專業搜索方法;適合有明確搜索意圖的搜索,從而準確快速的獲取相關信息。
4.目錄搜索引擎
依靠人工收集處理數據並置於分類目錄鏈接下的檢索方法;整合網站中的信息,分目錄呈現給用戶;目錄搜索法的應用範圍非常有限,需要很高的人力成本來支持維護。
擴展數據:
搜索引擎的關鍵技術
1.Web crawler根據相應的規則,以壹些站點為起始站點,通過各個頁面上的超鏈接遍歷整個互聯網,並使用URL bow I按照廣度優先遍歷策略從壹個html文檔爬行到另壹個html文檔,抓取信息。
2、中文分詞,在創建索引之前,需要對中文內容進行合理的分詞。中文分詞是文本挖掘的基礎。對於壹段輸入的中文,成功的中文分詞可以達到計算機自動識別句子意思的效果。
3、大數據處理技術,通過使用大數據處理計算框架,對數據進行分布式計算。由於互聯網數據量巨大,需要利用大數據處理技術提高數據處理效率。在搜索引擎中,大數據處理技術主要用於進行網頁重要性評分等數據計算。?
百度百科-搜索引擎