霍夫曼編碼是壹種編碼方法,霍夫曼編碼是壹種變字長編碼(VLC)。Huffman在1952中提出了壹種編碼方法,完全根據字符出現的概率構造壹個不同前綴平均長度最短的碼字,有時稱為最優編碼,壹般稱為Huffman編碼。Huffman樹是壹種加權路徑長度最短的最優二叉樹,常用於數據壓縮。在計算機信息處理中,“霍夫曼編碼”是壹種壹致性編碼方法(又稱“熵編碼法”),用於數據的無損壓縮。這個術語指的是使用特殊的編碼表來編碼源字符(如文件中的符號)。這個編碼表的特別之處在於,它是根據每個源字符的估計概率建立的(出現概率高的字符使用較短的編碼,出現概率低的字符使用較長的編碼,這樣就減少了編碼串的平均期望長度,從而達到數據無損壓縮的目的)。這個方法是大衛·a·霍夫曼(David.A.Huffman)開發的,比如在英語中,E的概率高,而Z的概率最低。用霍夫曼編碼壓縮壹篇英文文章時,E很可能用壹位來表示,而Z可能要用25位(而不是26位)。使用常用表示法時,每個英文字母占用壹個字節,即八位。兩者相比,E用的是壹般編碼的1/8的長度,Z用的是三倍多。如果能準確估計英文中每個字母的概率,就能大大提高無損壓縮的比例。