當前位置:吉日网官网 - 油畫收藏 - 人工智能書單(二)計算機視覺(壹)

人工智能書單(二)計算機視覺(壹)

前面我介紹了與人工智能概述相關的暢銷書、經典技術書籍和教程,充分接觸和了解了人工智能各方面的基礎數學理論、前沿技術和經典算法,然後我涉及了如何將人工智能應用到實際場景的技術方向,這是AI技術的重點。

前面介紹了人工智能應用方向的幾個重要分支:

1.計算機視覺

2.自然語言處理

3.數據智能和商業智能

4.知識和推理

5.機器人學

本文首先介紹計算機視覺的方向,因為計算機視覺是目前應用最廣泛也是最重要的方向,比如刷臉、視頻檢測,這些我們現在到處都需要,也是未來自動駕駛、機器人的重要基礎。無論無人車、無人機還是自動機器人,要想形成AI智能,獨立開展行動、完成任務,首先需要向外界學習,獲得各種信號的反饋,以指導下壹步的行動和決策。視覺信號是最直觀、最有效、信息量最大的信號(語音信號是另壹種直觀的輸入,相應的語音信號處理和識別會單獨介紹),所以擁有計算機視覺CV是最基本的要求之壹。

然而,計算機視覺的獲得並不容易。難點不在於如何采集圖形和視頻信號,並將其數字化和離散化,也不在於大視頻數據的傳輸、存儲和實時處理。真正的難點在於視覺理解,如何從壹個人所看到的東西中理解他所看到的真實含義,這是CV的終極目標和方向,但前面的問題也需要壹壹解決,所以CV基本上包含了壹系列的知識步驟。其中,最基礎的大學知識來源於數字電路、數字信號處理、離散數學,其中信息論、密碼學、分布式網絡、機器學習以及用於視覺理解和認知的深度學習被進壹步運用。所以需要有壹定的計算機理論和數學知識基礎。

以下可以簡化,只關註CV領域。壹般來說,我們的學習途徑包括:

數字圖像處理=模式識別=視頻編碼和識別=計算機視覺理論=計算機視覺工具

如果妳想讓機器看世界,妳必須先理解圖像:

壹.數字圖像處理

數字圖像處理涉及的關鍵知識包括:

(1)數字圖像表示

(2)各種圖像處理算法(濾波器)

(3)圖像摳圖

(4)目標檢測

(5)圖像渲染等

1.國外電子與通信系列教材:數字圖像處理(第四版)

以及這壹領域研究的必備工具matlab的應用實踐。

2.數字圖像處理(MATLAB版)(第二版)(本科教學版)

第二,模式識別

模式識別的目標是通過壹系列有監督或無監督的算法,從各種信號中識別出有規律的模式或特定的模型,或進行自動分類等數字信號處理任務,是人臉建模、識別、視頻目標識別、運動檢測、活體檢測等最基本的算法支持。

常見的模式識別任務包括:分類和識別

常用的模式識別方法側重於非監督策略,自動發現和識別信息數據中存在的模式,如聚類和主成分分析。

它還包括監督SVM,基於概率的貝葉斯分類器和其他統計和機器學習方法。

先說經典教材:

1.模式識別(第四版)(修訂版)

2.模式識別與智能計算的MATLAB技術實現第4版。

這是基於matlab的實現。

3.模式識別(模式識別和機器學習(第四版))

關註機器學習方法和模式識別的結合。

第三,數字視頻處理

(1)視頻編解碼:本文針對如何壓縮大視頻數據,既方便傳輸和存儲,又不損失太多精度,導致視頻失真。

主流的視頻編解碼標準有MPEG系列,ITU-T系列H.263,H.264,H.265,以及壹些商業公司的算法標準。

視頻編解碼的目標是保證計算的實時性和小信號損失。

(2)視頻目標檢測:用於從實時視頻數據中檢測出具有壹定特征的物體,並在每壹幀中進行跟蹤,如車牌抓拍識別、人臉檢測、運動物體檢測、人群統計和預警等。

(3)視頻合成:用於雙目視覺或多角度攝像機產生的多角度甚至全維多路視頻輸入,如何合成與人眼在同壹時間、同壹目標場景所看到的相似的視覺效果,或形成全息圖像的呈現。

簡單推薦幾本教材。

1.數字視頻處理(第二版)

2.從各個角度詳細講解視頻編碼:AVS中國,H.264/MPEG-4 PART10,HEVC,VP6,DIRAC,VC-1【視頻編碼標準】。

3.多媒體技術課程(第二版)

  • 上一篇:中***100周年紀念幣即將發行,這壹枚紀念幣升值的空間大嗎?
  • 下一篇:八種會使用工具的動物
  • copyright 2024吉日网官网