1、分類和聚類
分類算法是極其常用的數據挖掘方法之壹,其核心思想是找出目標數據項的***同特征,並按照分類規則將數據項劃分為不同的類別。聚類算法則是把壹組數據按照相似性和差異性分為若幹類別,使得同壹類別數據間的相似性盡可能大,不同類別數據的相似性盡可能小。分類和聚類的目的都是將數據項進行歸類,但二者具有顯著的區別。分類是有監督的學習,即這些類別是已知的,通過對已知分類的數據進行訓練和學習,找到這些不同類的特征,再對未分類的數據進行分類。而聚類則是無監督的學習,不需要對數據進行訓練和學習。常見的分類算法有決策樹分類算法、貝葉斯分類算法等;聚類算法則包括系統聚類,K-means均值聚類等。
2、回歸分析
回歸分析是確定兩種或兩種以上變量間相互依賴的定量關系的壹種統計分析方法,其主要研究的問題包括數據序列的趨勢特征、數據序列的預測以及數據間的相關關系等。按照模型自變量的多少,回歸算法可以分為壹元回歸分析和多元回歸分析;按照自變量和因變量間的關系,又可分為線性回歸和非線性回歸分析。
3、神經網絡
神經網絡算法是在現代神經生物學研究的基礎上發展起來的壹種模擬人腦信息處理機制的網絡系統,不但具備壹般計算能力,還具有處理知識的思維、學習和記憶能力。它是壹種基於導師的學習算法,可以模擬復雜系統的輸入和輸出,同時具有非常強的非線性映射能力。基於神經網絡的挖掘過程由數據準備、規則提取、規則應用和預測評估四個階段組成,在數據挖掘中,經常利用神經網絡算法進行預測工作。
4、關聯分析
關聯分析是在交易數據、關系數據或其他信息載體中,查找存在於項目集合或對象集合之間的關聯、相關性或因果結構,即描述數據庫中不同數據項之間所存在關系的規則。例如,壹項數據發生變化,另壹項也跟隨發生變化,則這兩個數據項之間可能存在某種關聯。關聯分析是壹個很有用的數據挖掘模型,能夠幫助企業輸出很多有用的產品組合推薦、優惠促銷組合,能夠找到的潛在客戶,真正的把數據挖掘落到實處。4市場營銷大數據挖掘在精準營銷領域的應用可分為兩大類,包括離線應用和在線應用。其中,離線應用主要是基於客戶畫像進行數據挖掘,進行不同目的針對性營銷活動,包括潛在客戶挖掘、流失客戶挽留、制定精細化營銷媒介等。而在線應用則是基於實時數據挖掘結果,進行精準化的廣告推送和市場營銷,具體包括DMP,DSP和程序化購買等應用。