目前,傳統(非互聯網)企業已經認識到大數據的價值,但如何結合企業現狀有效應用大數據,仍普遍存在困惑。針對這種情況,HCR基於企業大數據應用的相關服務經驗,提出壹些可行的思路和建議,供企業客戶理解和實施。
本文內容適用於擁有較多客戶資源(ToC和部分ToB)和內部數據的大中型企業,對擁有大量企業/個人管理數據的政府機構(如稅務)的大數據應用也有借鑒意義。
1.企業最有價值的數據在哪裏?
大數據的價值基礎來源於數據。對於企業最有價值的數據,我們認為有兩點:
1)內部業務大數據(非外部大數據)應用價值最高。
企業的大數據可分為內部(自身業務生產經營中產生的所有數據)和外部(來自外部,如第三方/互聯網)。目前,企業熱衷於從外部(如互聯網/電子商務/移動互聯網)引入大數據及相關服務應用,而忽略了現有的內部業務大數據才是最大的價值挖掘目標。
在信息化和數據應用過程中,大部分大中型企業已經完成了第壹階段(信息化系統建設和業務數據采集的自動化/規範化)。多年來建立的各種業務信息系統積累了大量的業務數據。但進入第二階段(挖掘數據提升企業經營管理)後,進展緩慢。與外部數據相比,內部業務數據是企業大數據的主體,數據量大、內容多樣、時間跨度長。因為它直接關系到企業的特性,涵蓋了運營的方方面面,所以它對企業的價值遠大於各種外部數據。但是這些數據很少發揮出應有的價值,大部分都沈睡在那裏,甚至成為負擔。
2)內部業務大數據中,應優先考慮與客服相關的數據。
內部業務大數據根據邏輯屬性可以分為兩類:
1)產品/服務關聯:與企業產品/服務相關的數據(R&D/設計/原材料/生產/制造/反饋)。
2)客服:相關數據(售前/銷售/客服/運維/活動/CRM等。)圍繞目標客戶(可以是B也可以是C)。
在上述兩種數據中,與客戶服務相關的業務行為對企業運營的影響很大。其數據也是企業內部大數據的主體,應優先作為內部大數據挖掘應用的對象。
二、實施過程
接下來針對企業最有價值的內部業務數據集,結合消費者研究和標簽化研究方法,介紹如何有效挖掘其大數據價值的機理。
首先我們給出壹個主流程,然後我們會詳細講解每壹步。
來源:大數據平臺部@HCR
Step1整體系統設計:重構現有內部數據。
根據實際情況和未來應用目標,對現有業務數據系統進行重新組織和規劃。在這個過程中要註意兩點:
點1:數據的組織要從面向功能轉變為面向客戶(按生命階段組織)。目前,企業內部的業務數據大多是圍繞業務功能(系統)進行組織的,相互之間沒有完全的聯系。用於價值挖掘的業務數據要以每個客戶為中心,以用戶的生命周期為線,把所有業務功能階段的數據串起來。
要點二:以類標註的思想建立客戶的數據描述體系,作為未來全景數據整合的框架。描述系統的源數據不僅包括內部數據,還包括外部數據(輔助)。實際的數據整合處理會基於這個系統:現有的數據可以直接導入,缺失的數據內容是後續獲取/外包的主要目標。
以某車企客戶為例,其相關大數據是由內部9個業務系統生成的,相互獨立。在數據系統改造和整合中,改造示意圖如下:
來源:大數據平臺部@HCR
第二步數據整合與集中:實際整合現有數據,建立統壹的大數據平臺。
基於step1獲得的規劃方案,通過技術手段將現有業務數據從各個業務系統整合到統壹的大數據平臺。平臺作為壹個數據分析平臺,與生產業務系統相分離,提供對數據倉庫/結構化/非結構化數據的支持。
應註意整合:
(1)數據模型的設計和數據ETL(清洗/轉換)需要以客戶為中心統壹規劃。
(2)充分考慮新數據系統中數據內容缺失/不足的未來集成和整合機制。
第三步標簽分析:對客戶進行全方位的標簽分析,生成標簽描述結果。
在第二步整合的以用戶為中心的多維數據空間上,基於消費者研究和業務特征建立用戶標簽體系,對客戶進行實際標簽化分析。標簽系統的定義應考慮用戶的基本信息、業務特征和未來應用的目的,並不斷擴展。
比如前面提到的車企客戶,對用戶標簽定義了以下幾類:基本屬性(性別、年齡、購買力、職業階層……)、家庭情況(家裏有孩子、有第二輛車)、車型/駕駛偏好(比如對SUV的偏好、對安全的偏好、對速度的追求……)、對配件的關註點(喜歡原裝產品、喜歡功能性配件)、內置偏好。
Step4業務的實際應用/挖掘:通過業務活動,進行客戶大數據價值的實際挖掘和應用。
通過統壹的客戶分析平臺,可以將所有客戶分析得到的標簽化描述結果提供給企業中的所有部門進行實際應用。各部門可以根據實際業務需求,靈活、精準地篩選目標客戶(比如營銷部門可以尋找80後生孩子、購買力強的目標客戶推廣MPV家用車型),或者發現產品客戶群的深層特征(產品設計部門可以分析車型目標客戶與實際客戶是否壹致)。
第三,如何實施
在內部大數據應用流程閉環的五個主要步驟中,每個步驟都有不同的側重點:
Step1的總體系統設計
整體的系統設計決定了未來企業內部大數據應用可以發揮的價值空間,因此需要高度重視。前期要踏實,不要急於求成。
主要工作包括:
●徹查企業現有數據,確定各業務系統中與客戶相關的數據(分布/數據屬性/相關性/數據質量等。).
●通過在各業務部門的調研和訪談,以及用戶研究的發展趨勢,確定企業未來各部門的整體應用需求目標,並抽象為對客戶屬性/標簽的相關需求。
●在前兩步的基礎上,通過用戶研究員和大數據架構/分析師的合作,完成相關的整體設計。
輸出結果至少包括:
●新數據系統的設計與重構方案,定義新的以客戶為中心的數據模型的抽象/關聯/屬性來源/生成機制,包括現有數據的整合機制和缺失數據屬性的收集與融合機制(基於標簽系統的要求)。
●客戶標簽應用系統框架實施方案,包括客戶標簽系統框架和分類體系、重要標簽設計和分析思路、未來應用模式等。
第二步數據集成集中
根據新數據系統的設計要求,建立統壹的內部大數據平臺,對相關數據進行有效整合和管理。
主要工作包括:
●建設統壹的大數據平臺軟硬件/網絡基礎設施(包括應用和數據庫系統)。
●對於現有數據,在新數據系統設計的基礎上,設計數據物理模型和對接方案,通過技術手段(ETL/編程)對接內部業務系統,將各業務系統的相關數據整合到大數據平臺中。
●針對缺失數據和外部來源的大數據,建立壹套相應的機制,保證未來此類數據的持續有效整合。
輸出結果包括:
●壹個統壹的大數據平臺,能夠持續整合和管理企業內外所有與用戶相關的數據資源。
●壹套技術和業務實施機制,確保數據整合和收集的可持續性和有效性。
在整合現有數據時,企業內部有很多業務信息系統,往往對應不同的IT開發人員。為了保證多業務系統數據集成的準確性和效率,該步驟的實施者建議優先考慮企業內部現有業務信息系統的核心IT開發人員,或者由企業的信息中心來完成。註意:在實施過程中需要大數據架構和數據專家提供建議和指導。
第三步用戶標簽分析
這個階段的工作對數據的未來價值影響最大。在實際執行中,不是壹蹴而就的過程,而是壹個長期漸進的過程。需要根據業務變化和應用需求,不斷優化和擴展用戶標簽體系。相關工作主要由熟悉行業的用戶研究員和數據挖掘/算法工程師根據企業業務需求完成。
●用戶研究員:基於整體的客戶標簽體系,對數據中反映的用戶行為進行深入的研究和分析,根據業務需求定義應用價值高的標簽,發現相關的分析規律。
●數據挖掘/算法工程師:綜合運用大數據技術(數據挖掘/機器學習等。)方法,與研究人員合作進行挖掘,完成標簽分析算法編程,使大量標簽的分析處理以自動化的方式實現。
輸出結果包括:
●所有客戶的標簽分析和描述結果。
●與特定客戶群/業務需求相關的深度分析報告。
Step4服務的實際應用
由企業各部門人員完成,業務人員根據第三步生成的客戶標簽分析結果,提取並分析所需內容,並應用於後續的業務活動(如針對選定客戶的廣告和營銷...)和決策分析。
為了方便實際使用,針對步驟3中的分析結果建立統壹的應用分析平臺,支持業務人員靈活篩選/分析所有客戶的標簽化屬性,能夠提供更深入的研究報告和最新的可視化分析工具,支持企業更多更深層次的數據應用。
對於業務人員來說,如果缺乏運用分析結果的思路和想法,可以通過培訓和案例拓展思路。同時,使用後需要與數據研究者溝通,根據業務情況不斷反饋,幫助提高標簽分析模型的準確性。
第五步應用結果的反饋
各部門利用數據開展業務後,需要盡可能收集其接觸的客戶的反饋結果。反饋結果的收集內容應參考全球數據系統的定義,並通過便捷的電子表格(如二維碼問卷)完成和提交。這種反饋閉環機制可以有效避免客戶長期的實際感知,有效提升用戶標簽化畫像的準確率和後續應用價值。我們有壹個外資藥企的客戶已經開始做相關的嘗試,取得了不錯的效果。
四、應註意的問題及解決辦法
目前,大數據在企業中的整合挖掘和應用已經引起了很多行業龍頭企業的關註,並開始嘗試。但是由於缺乏系統的思考和經驗,遇到了很多困難。企業在實施計劃時,必須首先註意以下問題:
1,建設思路和實施者的選擇
從前面的解釋可以發現,內部大數據整合和應用挖掘的本質是用戶的深入研究和相關應用。不僅是數據組織和標註體系,IT相關數據平臺的整合和建設都是按照用戶研究的思路完成的。用戶研究/大數據挖掘技術(如數據挖掘/算法)人員是實施的核心團隊。
遺憾的是,在我們接觸的壹些企業中,建設思路還是有很大偏差的。有的還是沿襲IT系統建設的思路,認為應該由IT企業來做。事實上,it企業在實施中並不具備用戶研究/數據挖掘等最重要的專業能力(更適合step2/4要求的相關IT平臺的開發)。有些企業認為這是CRM業務的延伸,適合CRM服務商。這也是不對的。CRM數據/業務只是企業用戶大數據/應用的子集,CRM人員是用戶研究成果的使用者而非創始人。
以上誤區直接影響了大數據挖掘及相關應用在很多企業的有效推廣。壹個主流手機廠商,只是註重技術平臺,不註重深入研究。感覺收集整合大量數據後應用價值自然就來了。而某合資車企打算由國際知名的it服務咨詢公司來完成項目(其實我們認為咨詢公司並不能深刻理解汽車行業的產業規律和用戶特點)。某省移動運營商在為集團客戶提供大數據整合和營銷支持服務時,由某上市it公司實施。雖然這家企業的it R&D能力很強,但是由於傳統的業務流程管理思路,壹線客戶經理無法從系統中深入了解所服務的集團客戶,很難進行有針對性的業務推廣。
因此,在企業內部實施大數據應用,選擇壹個綜合的實施者是非常重要的。實施者不僅要熟悉企業的業務特點,具備專業的用戶研究能力,還要具備大數據相關技術(平臺架構設計/數據挖掘/大數據算法分析)的能力,兩者缺壹不可。
2.整合數據會很困難。
企業在實施step2(數據集成與集中)時,大多會遇到同樣的問題:進度延遲,數據集中達不到設計目標,極大地影響了後續的數據應用。
主要原因如下:
●數據涉及的內部業務系統很多,開發人員往往不同,每個系統通常由不同的業務部門管理。所以整合各個部門和業務系統的數據,涉及到很多部門(管理者和開發者)的權限、利益和精力。相關協調/推動通常效率低下。
●實施集成的it公司熟悉內部數據的細節,但大多開發能力較強,對於集成大數據的主要工作(對接、同步、數據清洗等)缺乏經驗和優化方法。).
以上原因,加上總體目標不明確,導致整合和集中成為企業數據價值應用的最大障礙。以某省級運營商為例,其內部用戶大數據整合斷斷續續進行了近兩年,並未完成預期目標。
為了避免這種情況,我們需要做以下兩件事:
●高層要重視,要有強有力的內部執行控制。關註公司層面對打破各業務系統的數據壁壘很有幫助,而專業的總控團隊對進度和效果影響很大。以某大型企業客戶為例,涉及6個部門9個系統的數據整合難度相當大。公司由副總裁掛帥,信息中心成立專門小組負責實際協調和考核。最終按計劃完成了相關工作,走在了同行的前列。
●大數據處理和集成方面的技術專家將通過咨詢/培訓,幫助it實施企業提升數據集成技術方面的能力。
3.內部業務數據的改善任重道遠。
數據屬性缺失和數據質量問題是企業業務數據最常見的問題,也極大地影響了未來的應用價值。同時,在大數據環境下,客戶數據的粒度/深度不足也逐漸明顯。比如搜索某上市藥企的相關數據,發現客戶相關數據只到達渠道層面,沒有到達終端用戶,導致大量最有價值的內容缺失。造成這些問題的核心原因是缺乏壹個全球性的、系統化的數據框架和實施機制,業務各環節數據收集的目標、方法和舉措存在不足,而這種相關的改變不是壹朝壹夕可以完成的。
對此,企業應該註意:
●如果客戶識別/聯系體系不完善,就要盡快建立統壹的客戶體系(如會員制)。
●要有明確的全球數據體系作為指引,並相應建立制度化的收集整合機制,讓各個環節的業務人員從自發變為自覺。
●外部大數據/應用反饋數據也應納入數據體系,統壹規劃建設相關采集機制和融合方式。
●在這個過程中不要鋪開太多,根據情況逐步實施,優先考慮最重要/最容易的數據資源。
第三,hcr幫助企業內部的大數據應用
企業內部大數據的研究和應用,要求實施者在行業/應用研究和大數據應用技術方面具備全面深入的綜合能力。目前無論是研究行業還是it行業,符合相關要求的實施企業都很少。
作為壹家結合大數據和小數據的領先數據研究公司,hcr完全有能力:
●10以上行業資深研究員,長期面向企業研究,行業/用戶研究經驗豐富。以bdu和qgroup為代表的研究團隊,在國內外幫助企業進行大數據研究方面有著豐富的經驗。
●hcr大數據平臺部擁有業內最強的大數據技術能力。數據架構組可以幫助企業摸清業務數據,設計/規劃適合企業特點的大數據系統和平臺,並具備實際的技術實施能力。挖掘算法組在大數據環境下的挖掘算法/機器學習/非結構化文本分析方面實力強大,在用戶標簽化分析方面與研究人員合作成果豐富。
正是由於研究和技術的綜合優勢,hcr目前正在幫助多家客戶企業實現內部業務大數據的價值挖掘,使客戶能夠通過大數據的應用為其業務運營帶來新的改善。
以上是邊肖為大家分享的關於企業最有價值的數據在哪裏的相關內容。更多信息可以關註環球常春藤分享更多幹貨。