影響分類器錯誤率的因素;
定型集中的記錄數。生成器應該使用訓練集來學習,因此訓練集越大,分類器就越可靠。但是,訓練集越大,生成器構建分類器的時間就越長。錯誤率的改善隨著訓練集規模的增大而減小。
屬性的數量。更多的屬性對生成器來說意味著更多的組合,這使得生成器更加困難,花費的時間也更長。有時隨機關系會將生成器引入歧途,結果可能會構造出不準確的分類器(這在技術上稱為過擬合)。
擴展數據:
決策樹分類器:這個過程類似於通過植物的特征來識別植物。這樣的分類器可以用來判斷壹個人的信用程度。例如,決策樹可以得出結論“壹個有家庭的人,壹輛價值在65,438+0.5萬到23,000美元之間的汽車和兩個孩子”具有良好的信用。
決策樹生成器從“訓練集”生成決策樹。SGI公司的數據挖掘工具MineSet提供的可視化工具,用樹形圖展示決策樹分類器的結構。在圖中,每個決策由樹的壹個節點表示。
百度百科-分類器