決策圖表
決策樹是在知道各種情況發生的概率的基礎上,通過形成決策樹,計算凈現值期望值大於等於零的概率,評估項目風險,判斷其可行性的決策分析方法。它是壹種直觀使用概率分析的圖解法。因為這個決策分支與樹的分支非常相似,所以被稱為決策樹。
隨機森林
在機器學習中,隨機森林是包含多個決策樹的分類器。其輸出的類別由單個樹輸出的類別的模式決定。
邏輯回歸
Logistic回歸是壹種廣義線性回歸分析模型,常用於數據挖掘、自動疾病診斷、經濟預測等領域。比如探索引起疾病的危險因素,根據危險因素預測疾病發生的概率。
adaboost算法
Adaboost是壹種叠代算法,其核心思想是針對同壹訓練集訓練不同的分類器(弱分類器),然後將這些弱分類器組裝起來,形成壹個更強的最終分類器(強分類器)。
算法本身是通過改變數據分布來實現的。它根據每個訓練集中每個樣本的分類是否正確,以及最後壹次總體分類的準確性來確定每個樣本的權重。
樸素貝葉斯
樸素貝葉斯方法是壹種基於貝葉斯定理和特征條件獨立假設的分類方法。最廣泛使用的兩種分類模型是決策樹模型和樸素貝葉斯模型。
與決策樹模型相比,樸素貝葉斯分類器源於經典數學理論,具有堅實的數學基礎和穩定的分類效率。同時,樸素貝葉斯分類器模型需要估計的參數很少,對缺失數據不敏感,算法相對簡單。
k最近鄰
所謂K近鄰算法,是指給定壹個訓練數據集,對於壹個新的輸入實例,在訓練數據集中找到最近的K個實例(也就是上面提到的K個鄰居),而這K個實例中的大部分屬於某壹類,於是將輸入實例歸入該類。
SVM
鉸鏈損失函數用於計算經驗風險,正則化項添加到解系統中以優化結構風險。這是壹個稀疏和穩健的分類器。
神經網絡
人工神經網絡是生物神經網絡在簡化意義上的技術再現。它的主要任務是根據生物神經網絡的原理和實際應用的需要,建立壹個實用的人工神經網絡模型,設計相應的學習算法,模擬人腦的壹些智能活動,然後在技術上加以實現,解決實際問題。因此,生物神經網絡主要研究智能的機制;人工神經網絡主要研究智能機制的實現,兩者相輔相成。