前面介紹了人工智能應用方向的幾個重要分支:
1.計算機視覺
2.自然語言處理
3.數據智能和商業智能
4.知識和推理
5.機器人學
本文首先介紹計算機視覺的方向,因為計算機視覺是目前應用最廣泛也是最重要的方向,比如刷臉、視頻檢測,這些我們現在到處都需要,也是未來自動駕駛、機器人的重要基礎。無論無人車、無人機還是自動機器人,要想形成AI智能,獨立開展行動、完成任務,首先需要向外界學習,獲得各種信號的反饋,以指導下壹步的行動和決策。視覺信號是最直觀、最有效、信息量最大的信號(語音信號是另壹種直觀的輸入,相應的語音信號處理和識別會單獨介紹),所以擁有計算機視覺CV是最基本的要求之壹。
然而,計算機視覺的獲得並不容易。難點不在於如何采集圖形和視頻信號,並將其數字化和離散化,也不在於大視頻數據的傳輸、存儲和實時處理。真正的難點在於視覺理解,如何從壹個人所看到的東西中理解他所看到的真實含義,這是CV的終極目標和方向,但前面的問題也需要壹壹解決,所以CV基本上包含了壹系列的知識步驟。其中,最基礎的大學知識來源於數字電路、數字信號處理、離散數學,其中信息論、密碼學、分布式網絡、機器學習以及用於視覺理解和認知的深度學習被進壹步運用。所以需要有壹定的計算機理論和數學知識基礎。
以下可以簡化,只關註CV領域。壹般來說,我們的學習途徑包括:
數字圖像處理=模式識別=視頻編碼和識別=計算機視覺理論=計算機視覺工具
如果妳想讓機器看世界,妳必須先理解圖像:
壹.數字圖像處理
數字圖像處理涉及的關鍵知識包括:
(1)數字圖像表示
(2)各種圖像處理算法(濾波器)
(3)圖像摳圖
(4)目標檢測
(5)圖像渲染等
1.國外電子與通信系列教材:數字圖像處理(第四版)
以及這壹領域研究的必備工具matlab的應用實踐。
2.數字圖像處理(MATLAB版)(第二版)(本科教學版)
第二,模式識別
模式識別的目標是通過壹系列有監督或無監督的算法,從各種信號中識別出有規律的模式或特定的模型,或進行自動分類等數字信號處理任務,是人臉建模、識別、視頻目標識別、運動檢測、活體檢測等最基本的算法支持。
常見的模式識別任務包括:分類和識別
常用的模式識別方法側重於非監督策略,自動發現和識別信息數據中存在的模式,如聚類和主成分分析。
它還包括監督SVM,基於概率的貝葉斯分類器和其他統計和機器學習方法。
先說經典教材:
1.模式識別(第四版)(修訂版)
2.模式識別與智能計算的MATLAB技術實現第4版。
這是基於matlab的實現。
3.模式識別(模式識別和機器學習(第四版))
關註機器學習方法和模式識別的結合。
第三,數字視頻處理
(1)視頻編解碼:本文針對如何壓縮大視頻數據,既方便傳輸和存儲,又不損失太多精度,導致視頻失真。
主流的視頻編解碼標準有MPEG系列,ITU-T系列H.263,H.264,H.265,以及壹些商業公司的算法標準。
視頻編解碼的目標是保證計算的實時性和小信號損失。
(2)視頻目標檢測:用於從實時視頻數據中檢測出具有壹定特征的物體,並在每壹幀中進行跟蹤,如車牌抓拍識別、人臉檢測、運動物體檢測、人群統計和預警等。
(3)視頻合成:用於雙目視覺或多角度攝像機產生的多角度甚至全維多路視頻輸入,如何合成與人眼在同壹時間、同壹目標場景所看到的相似的視覺效果,或形成全息圖像的呈現。
簡單推薦幾本教材。
1.數字視頻處理(第二版)
2.從各個角度詳細講解視頻編碼:AVS中國,H.264/MPEG-4 PART10,HEVC,VP6,DIRAC,VC-1【視頻編碼標準】。
3.多媒體技術課程(第二版)