壹、深度學習技術的現狀
深度學習是這壹輪人工智能大爆發的關鍵技術。人工智能技術在計算機視覺和自然語言處理方面的突破,迎來了人工智能新壹輪的爆發式發展。而深度學習是實現這些突破的關鍵技術。其中,基於深度卷積網絡的圖像分類技術已經超過人眼的準確率,基於深度神經網絡的語音識別技術已經達到95%的準確率,基於深度神經網絡的機器翻譯技術已經接近人類的平均翻譯水平。準確率的大幅提升,使得計算機視覺和自然語言處理進入產業化階段,帶來了新興產業的崛起。
深度學習是大數據時代的算法武器,近年來成為研究熱點。與傳統的機器學習算法相比,深度學習技術有兩個優勢。第壹,深度學習技術可以隨著數據規模的增大不斷提升性能,而傳統的機器學習算法很難利用海量數據不斷提升性能。第二,深度學習技術可以直接從數據中提取特征,減少了為每個問題設計特征提取器的工作,而傳統的機器學習算法需要人工提取特征。因此,深度學習已經成為大數據時代的熱門技術,學術界和工業界都對深度學習進行了大量的研究和實踐工作。
深度學習的各種模型全面賦能基礎應用。卷積神經網絡和循環神經網絡是兩種廣泛使用的深度神經網絡模型。計算機視覺和自然語言處理是人工智能的兩個基本應用。卷積神經網絡廣泛應用於計算機視覺領域,在圖像分類、目標檢測、語義分割等任務中的性能大大超過傳統方法。循環神經網絡適合於解決與序列信息相關的問題,在自然語言處理領域得到了廣泛的應用,如語音識別、機器翻譯、對話系統等。
深度學習技術還不完善,需要進壹步完善。第壹,深度神經網絡的模型高度復雜,參數數量龐大導致模型規模龐大,難以部署到移動終端設備。二是模型訓練需要大量數據,訓練數據樣本獲取和標註成本高,部分場景樣本獲取困難。三是應用門檻高,算法建模和參數調整過程復雜,算法設計周期長,系統實現和維護難度大。第四,缺乏因果推理能力。圖靈獎獲得者、貝葉斯網絡之父朱迪亞·珀爾(Judea Pearl)指出,目前的深度學習只是“曲線擬合”。第五,還有可解釋性的問題。由於內部參數和復雜的特征提取和組合,很難解釋模型學到了什麽,但出於安全原因和倫理法律需要,算法的可解釋性是非常必要的。所以深度學習還是需要解決上述問題。
二、深度學習的發展趨勢
深度神經網絡呈現出層次越來越深、結構越來越復雜的發展趨勢。為了不斷提高深度神經網絡的性能,業界從網絡深度和網絡結構兩個方面不斷探索。神經網絡的層數已經擴展到數百層甚至數千層。隨著網絡層數的加深,其學習效果越來越好。2015年,微軟提出的ResNet以152層的網絡深度,首次超過了圖像分類任務的精度。新的網絡設計結構不斷被提出,使得神經網絡的結構越來越復雜。比如2014,Google提出了初始網絡結構,2015,微軟提出了剩余網絡結構,2016,黃高等人提出了密集連接網絡結構。這些網絡結構設計不斷提高了深度神經網絡的性能。
深度神經網絡節點的功能不斷豐富。為了克服當前神經網絡的局限性,業界探索並提出了壹種新型的神經網絡節點,使得神經網絡的功能越來越豐富。2017年,Jeffrey Hinton提出了膠囊網絡的概念,用膠囊作為網絡節點,理論上更接近人腦的行為,以克服卷積神經網絡缺乏空間分層和推理能力等局限性。2018年,來自DeepMind、Google Brain和MIT的學者共同提出了圖網絡的概念,定義了壹類新的具有關系歸納偏向功能的模塊,旨在賦予深度學習因果推理的能力。
深度神經網絡工程應用技術正在深化。深度神經網絡模型大多參數上億,占用空間數百兆,很難部署到智能手機、相機、可穿戴設備等性能和資源有限的終端設備上。為了解決這個問題,業界采用模型壓縮技術,減少模型的參數和大小,減少計算量。目前使用的模型壓縮方法包括對訓練好的模型進行剪枝(如剪枝、權重分擔和量化等。)和設計更精細的模型(如MobileNet等。).深度學習算法建模和參數調整過程復雜,應用門檻高。為了降低深度學習的應用門檻,業界提出了自動機器學習(AutoML)技術,可以實現深度神經網絡的自動化設計,簡化使用過程。
深度學習和多種機器學習技術不斷融合發展。由深度學習和強化學習融合而誕生的深度強化學習技術,結合了深度學習的感知能力和強化學習的決策能力,克服了強化學習只適用於離散和低維狀態的缺陷,可以直接從高維原始數據中學習控制策略。為了減少深度神經網絡模型訓練所需的數據量,業界引入了遷移學習的思想,從而誕生了深度遷移學習技術。遷移學習(Transfer learning)是指利用數據、任務或模型之間的相似性,將舊領域所學的模型應用到新領域的學習過程。通過將訓練好的模型遷移到相似的場景中,只需要少量的訓練數據就可以達到很好的效果。
第三,對未來發展的建議
加強圖網絡、深度強化學習、生成對策網絡等前沿技術的研究。由於國內深度學習領域缺乏重大原創性研究成果,基礎理論研究貢獻不足。比如膠囊網、圖網等創新性、原創性的概念都是美國專家提出來的,中國的研究貢獻不足。在深度強化學習方面,最新的研究成果多由DeepMind、OpenAI等國外公司的研究人員提出,國內尚無突破性的研究成果。近年來的研究熱點——生成對策網絡(GAN)由美國研究人員Goodfellow提出,Google、facebook、twitter、Apple等公司提出了各種改進和應用模型,有力地推動了GAN技術的發展。然而,中國在這方面的研究成果卻很少。因此,應鼓勵科研院所和企業加強深度神經網絡與因果推理模型結合、生成對抗網絡、深度強化學習等前沿技術的研究,提出更多原創性研究成果,提升全球學術研究的影響力。
加快自動化機器學習、模型壓縮等深度學習應用技術研究。依托國內市場優勢和企業成長優勢,針對中國特色的個性化應用需求,加快深度學習應用技術研究。加強自動機器學習、模型壓縮等技術研究,加速深度學習的工程化應用。加強深度學習在計算機視覺領域的應用研究,進壹步提高目標識別等視覺任務的準確率和在實際應用場景中的性能。加強深度學習在自然語言處理領域的應用研究,提出性能更好的算法模型,提高機器翻譯、對話系統等應用的性能。
來源:工業情報官員
結束
更多精彩內容請登陸官網。
往期精選▼
1.2018-2019中國人工智能產業創新百強榜單發布!
2.2018-2019中國人工智能行業投資機構20強榜單發布!
3.2018-2019中國大數據產業創新百強榜單發布!
4.2018-2019中國大數據行業投資機構20強榜單發布!
5.2018-2019中國物聯網產業創新百強榜單出爐!
6.2018-2019中國5G與物聯網行業20強投資機構名單發布!
7.2018-2019中國創新集成電路產業百強榜單出爐!
8.2018-2019中國集成電路行業投資機構20強榜單發布!
9.2018-2019中國服務業創新百強企業名單出爐!
10.中國企業服務行業投資機構20強榜單在Yinlu.com 2018-2019發布!