當前位置:吉日网官网 - 紀念幣收藏 - 如何進行標簽(TAGS)搜索?

如何進行標簽(TAGS)搜索?

1、Tag總的來說是壹種分類系統,有人把他稱為大眾分類(Folksonomy)。但是tag又不同於壹般的目錄結構的分類方法,首先tag能以較少的代價細化分類,想像壹下,壹篇涉及面比較廣的文章,比如壹篇談論20世紀以來物理學的成就的文章,可能會涉及到相對論、量子力學、黑洞理論、大爆炸宇宙理論,可能涉及到愛因斯坦、普朗克等科學家,甚至可能涉及到諾貝爾獎。如果妳用目錄結構的分類方法的話,根本不可能按這篇文章涉及到的各個方面來分類,因為要細化分類,將使整個目錄結構異常龐大,更加不利於資料的組織以及查找。而tag則不同,他可以自由地不考慮目錄結構的給文章進行分類,各個tag之間的關系是壹種平行的關系,但是又可以根據相關性分析,將經常壹起出現的tag關聯起來,而產生壹種相關性的分類。

2、Tag也可以說是壹種關鍵詞標記,利於搜索查找。但是tag也不同於壹般的關鍵詞,用關鍵詞進行搜索時,只能搜索到文章裏面提到了的關鍵詞,但tag卻可以將文章中根本沒有的關鍵詞做為tag來標記,比如上面那篇文章,我可以標記為“資料”或者“歷史”,當然更多的時候是標記為“物理”,不過,我如果標記上“資料”的tag,則可以將所有資料性的文章全部關聯起來,便於查找。

參考:真·踏網無痕

那麽,什麽是Tags?很簡單,往下看;

·經典的信息構成模式;

在傳統的網頁組成中,我們通常使用Taxonomy(分類法)來歸納、整理和存放我們的信息,圖書館是壹個絕好的例子,所有的信息從壹個點開始,形成樹狀的分類,由此構成壹個完整的、相互聯系起來邏輯體系;

這個體系從壹開始就是人為分類形成的,在我們需要檢索的時候,幾乎不需要費多大的勁;

[例子]比如我們的Blog,首先有壹個主標題,然後下分若幹分類,實際的文章則分類儲存在這些不同的分類中;在壹般情況下,我們不允許壹個文章同時存在於多個分類中,以便於我們管理的方便和檢索的唯壹性;

在網絡上,dmoz和wiki都算是比較典型和知名的例子;

·散秩的信息構成模式;

看似無序的浩渺信息,其中的絕大部分是通過“語言”來描述的,這表明了這些信息的指向性,因此我們通過提取這些語言(文字、文本)的相同部分,以此獲得相關的信息;這些信息平時是完全松散、互不聯系的,當且僅當我們對其加以提取的時候才呈現相對緊湊的組織結構,即便如此,這個結構和經典的分類結構相比,仍然是足夠散秩的。

[例子]妳可能已經想到了,Google嘛。目前絕大部分的搜索引擎所依賴的正是這壹點,因此對於分詞的研究是這些搜索引擎始終的重點和痛苦,其他的不說,僅僅邏輯實證主義和日常語言學派這兩個當代的流派就足夠他們折騰到下個世紀去了。

舉壹個惡搞點的例子:當我說:“他媽”的時候,僅僅檢索關鍵字而並不關心其在日常語言中實際運用的搜索引擎怎麽知道我是在罵人還是在陳訴壹個歸屬性事實呢?更何況我們經常面對google上數萬和關鍵字原本語義要求完全不同的搜索結果長聲嘆息。

[簡介]

邏輯實證主義:認為人類的日常語言充滿的謬誤,需要徹底厘平,重構壹個像數學壹樣完美的邏輯語言體系;

日常語言學派:認為人類的日常語言是非常合理而符合現實的,“完美”的邏輯語言並不存在而且也不符合現實;唯壹的問題在於人們使用日常語言的時候出了壹些方法上的問題,這需要我們加以重視和研究。

(後者正是我傾向贊同的結論)

·符合未來發展的信息構成模式;

現在我們綜合起來考察以上兩種在我們日常生活中顯得日益重要的信息構成模式,會發現他們各有優點和缺陷;

對於前者而言,語言所表達和內涵的思想是廣博的,構造簡單的分類邏輯無法詮釋和標識某壹篇文章所設計的全部重點,復雜的分類則將陷入無限微觀的悖論邏輯;

對於後者而言,除開分詞的煩惱,Google們也許還希望承天下之大義擔負起教導每壹個人重修日常語言學分的重任,並且要求每壹個人都能達到維特根斯坦的高度。

路德維奇·維特根斯坦?對了,這終於回到我們的重點。

維特根斯坦本人正是邏輯實證主義和日常語言學派先後的奠基人,而在他的後期的日常語言思想中,他提出了壹個大家相對比較熟悉的觀點:家族相似。

以下引用壹段話作大致的解釋:

維特根施坦從“反本質主義”立場出發反對語詞的定義化。本質主義者認為同壹類事物之所以成為該類事物,是由於它們具有***同的本質(***相),定義就是規定事物的這種本質。維特根施坦則認為事物根本沒有***同的本質,只有“家族相似”。所謂“家族相似”不是***同的相似,而是這壹方面或那壹方面的不完全相似。例如壹個家族中的成員之間有的眼睛相似,有的神態相似,有的臉龐相似。因此,維特根施坦堅持壹種唯名論的立場,認為人們在日常生活中使用壹般性的名詞概念只是為了方便,本質、***相那種形而上學的東西是不存在的。誤把這些東西當作存在,就會染上“哲學病”。

好吧,看出來了嗎?那些相似的地方就是Tags(標簽);上面引用中處處提到本質、反本質、家族相似,我們處處可以當作分類、碎片和標簽來閱讀和理解。

家族相似(Tags)表明了對傳統分類學(Category)的立場,如同日常語言學派對待黑格爾體系的觀點,要求瓦解普遍、瓦解大壹統、瓦解唯壹性等這些經典哲學孜孜以求的目標,代之以碎片式的結構,這些碎片之間的聯系,僅僅存在於當人們需要它們的時候。

帶有碎片語義色彩,富於哲學戰鬥力的Tags和檢索關鍵字相對而言,其形成是主動而非被動的,是主動聚合而不是等待被動的檢索,其形成的過程經歷了人為的篩選,相對而言更符合日常語言的正常使用;例如全世界關於“SMTH”的信息,盡管有些文章通篇都沒有寫到壹個涉及SMTH的字符,但是它所描述的事實確實是與此相關。

如果我們脫離哲學而不論,Tag實際上同時帶有傳統分類法和搜索關鍵詞這兩大信息構成模式的***同特點,同時消除了相當壹部分它們在各自方面的缺憾和弱點。

需要指出的是,從現有的應用和理論分析看來,分類、標簽和無序關鍵字有著不同的運用範疇;對於微觀的、少量的信息,分類法已經足夠我們使用;對於海量的,無邊無際的無序信息,關鍵字也許是現階段應用最廣泛且被普遍接受的組織方式;而在兩者之間,壹個足夠大、有更高系統化要求和精確度要求的信息群而言,Tag也許是最佳的選擇。

在Blog中使用Tags?

如果壹些人惡意地使用Tag,將使其失去意義,這類似於在mata標簽中強行加入無數完全與網頁本身無關的keyword這種無聊的舉動,以及後來四處散發冗余鏈接的小p孩;在壹個開放型的超人氣論壇上使用Tags當然不存在技術問題,但是也許不算是壹個好主意,特別是在中國。

相對而言,Blog的主人對自己的log會比較負責,能夠認真地篩選發布在自己log上的信息,或者對此作出評論和傳播,因此在Blog上結構Tag對信息的有序化是有積極意義的;

但是,對於個人的Blog,Tag的意義微乎其微——因為作為個人發布源的信息容量實在太小;如果Blog需要Tag的話,它必然是針對壹個大範圍的用戶群,有兩種比較適合的情況:壹種是擁有動則數千數十萬用戶的多用戶Blog站點,另外壹種則是基於XML的聚合站點;

不論如何,Tag所針對的都是大信息容量的有序化問題,有利於用戶在這些巨大的庫存中精確地定位符合語義信息的節點,而並非針對個人Blog信息的有序化問題;

Tags,無序信息、標簽和分類法,以上的分析可以算作哲學走在科技之前的壹個比較典型的例子,至少縱觀國內應用,還沒有相關的開發項目;

BXNA的Blog聚合仍然依賴於分類,聽說試圖進入分詞領域,但是這對於BXNA聚合的那點信息而言實在有牛刀屠雞之嫌;而其他壹些Tag服務商並沒有對Blog的直接支持;

這麽大的蛋糕,誰會吃到呢?作為先鋒的技術引領者?Blog程序的提供商?還是資本的所有者呢?個人以為,擁有廣泛用戶群的聚合服務商或者Blog提供商,搶先發布基於Tag的主動式聚合平臺,或者是基於TrackBack的被動式聚合平臺,也許在未來,就可以理所當然地成為資本的所有者。

最後,關於Tag具體的開發和管理等技術,不屬於本文討論的範圍,請參看相關的其他文章。

  • 上一篇:女生喝啤酒有什麽好處和壞處?
  • 下一篇:宋濂傳是宋濂的後裔。
  • copyright 2024吉日网官网