教育是壹個超復雜的系統,涉及 教學、管理、教研、服務 等諸多業務。與金融系統具有清晰、規範、壹致化的業務流程所不同的是,不同地區、不同學校的教育業務雖然具有壹定的***性,但差異性也很突出,而業務的差異性直接導致教育數據來源更加多元、數據采集更加復雜。
教育大數據產生於 各種教育實踐活動 ,既包括校園環境下的教學活動、管理活動、科研活動以及校園生活,也包括家庭、社區、博物館、圖書館等非正式環境下的學習活動;既包括線上的教育教學活動,也包括線下的教育教學活動。
教育大數據的核心數據源頭是“人”和“物”——“人”包括學生、教師、管理者和家長,“物”包括信息系統校園網站、服務器、多媒體設備等各種教育裝備。
依據來源和範圍的不同,可以將教育大數據分為個體教育大數據、課程教育大數據、班級教育大數據、學校教育大數據、區域教育大數據、國家教育大數據等六種 。
二、 教育大數據的分類
教育數據有多重分類方式。
從數據產生的業務來源來看,包括 教學類數據、管理類數據、科研類數據 以及服務類數據。
從數據產生的技術場景來看,包括 感知數據 、業務數據和互聯網數據等類型。
從數據結構化程度來看,包括 結構化數據、半結構化數據和非結構化數據 。結構化數據適合用二維表存儲。
從數據產生的環節來看,包括 過程性數據和結果性數據 。過程性數據是活動過程中采集到的、難以量化的數據(如課堂互動、在線作業、網絡搜索等);結果性數據則常表現為某種可量化的結果(如成績、等級、數量等)。
國家采集的數據主要以管理類、結構化和結果性的數據為主,重點關註宏觀層面教育發展整體狀況。到大數據時代,教育數據的全面采集和深度挖掘分析變得越來越重要。教育數據采集的重心將向非結構化、過程性的數據轉變。
三、教育數據的結構模型
整體來說,教育大數據可以分為四層,由內到外分別是基礎層、狀態層、資源層和行為層。
基礎層:也就是我們國家最最基礎的數據,是高度保密的數據; 包括教育部2012年發布的七個教育管理信息系列標準中提到的所有數據,如學校管理信息、行政管理信息和教育統計信息等;
狀態層,各種裝備、環境與業務的運行狀態的數據; 必然設備的耗能、故障、運行時間、校園空氣質量、教室光照和教學進度等;
資源層,最上層是關於教育領域的用戶行為數據。 比如PPT課件、微課、教學視頻、圖片、遊戲、教學軟件、帖子、問題和試題試卷等;
行為層:存儲擴大教育相關用戶(教師、學生、教研員和教育管理者等)的行為數據, 比如學生的學習行為數據、教師的教學行為數據、教研員的教學指導行為數據以及管理員的系統維護行為數據等。
不同層次的數據應該有不同的采集方式和教育數據應用的場景。
關於教育大數據的冰山模型,目前我們更多的是采集壹些顯性化的、結構性的數據,而存在冰山之下的是更多的非結構化的,而且真正為教育產生最大價值的數據是在冰山之下的。
參考文獻:
教育大數據的來源與采集技術? 邢蓓蓓