1.監督學習
在監督學習下,輸入的數據稱為“訓練數據”,每組訓練數據都有明確的標識或結果,如反垃圾系統中的“垃圾”和“非垃圾”,手寫數字識別中的“1”、“2”、“3”、“4”。
在建立預測模型時,監督學習建立壹個學習過程,將預測結果與“訓練數據”的實際結果進行比較,不斷調整預測模型,直到模型的預測結果達到壹個預期的精度。
分類問題、回歸問題等監督學習的常見應用場景。常見的算法包括邏輯回歸和反向傳播神經網絡。
加強學習
在這種學習模式下,輸入數據被用作對模型的反饋,而不像監督模型那樣,只被用作檢查模型是對還是錯的壹種方式。在強化學習下,輸入數據直接反饋給模型,模型必須立即做出調整。
常見的應用場景包括動態系統和機器人控制。常見的算法有Q學習和時間差分學習。
3.無監督學習在無監督學習中,數據是沒有特別標記的,學習模型是推斷數據的壹些內部結構。常見的應用場景包括學習關聯規則和聚類。常見的算法有Apriori算法和k-Means算法。
4.半監督學習
在這種學習模式中,壹些輸入數據被識別,壹些沒有被識別。這種學習模型可以用於預測,但是模型需要先學習數據的內部結構,以便合理地組織數據進行預測。
應用場景包括分類和回歸,算法包括常用的監督學習算法的壹些擴展。這些算法首先嘗試對未標記的數據進行建模,然後對標記的數據進行預測。例如圖形推理算法或拉普拉斯SVM。