首先,機器學習
機器學習是壹門交叉學科,涉及統計學、系統辨識、逼近論、神經網絡、最優化理論、計算機科學、腦科學等諸多領域。研究計算機如何模擬或實現人類的學習行為,以獲取新的知識或技能,重組已有的知識結構,不斷提高自身的性能,是人工智能技術的核心。基於數據的機器學習是現代智能技術的重要方法之壹。研究從觀測數據(樣本)出發尋找規律,並利用這些規律預測未來數據或不可觀測數據。根據不同的學習模式、學習方法和算法,機器學習有不同的分類方法。
根據學習模式,機器學習分為有監督學習、無監督學習和強化學習。
按照學習方法,機器學習可以分為傳統機器學習和深度學習。
二、知識圖譜
知識地圖本質上是結構化的語義知識庫,是由節點和邊組成的圖形數據結構。它以符號形式描述物理世界中的概念及其關系,其基本單位是“實體-關系-實體”三元組,以及實體及其相關的“屬性-值”對。不同的實體通過關系相互連接,形成網絡知識結構。在知識圖譜中,每個節點代表現實世界中的“實體”,每條邊就是實體之間的“關系”。總的來說,知識地圖是壹個將各種不同的信息連接在壹起的關系網絡,提供了從“關系”的角度分析問題的能力。
知識圖譜可用於反欺詐、不壹致性驗證、群體欺詐等公共安全領域,需要異常分析、靜態分析、動態分析等數據挖掘方法。特別是知識圖譜在搜索引擎、可視化展示、精準營銷等方面有很大優勢,已經成為業內流行的工具。但是知識圖譜的發展仍然存在很大的挑戰,比如數據的噪音問題,即數據本身是錯誤的或者數據是冗余的。隨著知識圖譜應用的深入,仍有壹系列關鍵技術有待突破。
第三,自然語言處理
自然語言處理是計算機科學和人工智能領域的壹個重要方向。能夠實現人與計算機用自然語言進行有效交流的各種理論和方法的研究,涉及到很多領域,主要包括機器翻譯、機器閱讀理解和問答系統。
機器翻譯
機器翻譯技術是指利用計算機技術將壹種自然語言翻譯成另壹種自然語言的過程。基於統計的機器翻譯方法突破了以往基於規則和實例的翻譯方法的局限性,翻譯性能有了很大的提高。基於深度神經網絡的機器翻譯在日常口語等壹些場景的成功應用,已經顯示出巨大的潛力。隨著語境的上下文表示和知識的邏輯推理能力的發展,自然語言的知識圖譜不斷擴大,機器翻譯在多輪對話翻譯、文本翻譯等領域將會取得更大的進步。
語義理解
語義理解技術是指利用計算機技術理解文本並回答與文本相關的問題的過程。語義理解更註重對語境的理解和對答案準確性的把控。隨著MCTest數據集的發布,語義理解受到了更多的關註並取得了快速的發展,相關的數據集和相應的神經網絡模型也層出不窮。語義理解技術將在智能客服、產品自動問答等相關領域發揮重要作用,進壹步提高問答和對話系統的準確率。
問答系統
問答系統分為開放領域對話系統和特定領域問答系統。問答系統技術是指讓計算機像人類壹樣用自然語言與人交流的技術。人們可以向問答系統提交用自然語言表達的問題,系統會返回高度相關的答案。雖然問答系統已經出現了很多應用產品,但是大部分應用在實際的信息服務系統和智能手機助手中,問答系統的健壯性仍然存在問題和挑戰。
自然語言處理面臨四大挑戰:
壹是詞法、句法、語義、語用、語音等不同層面存在不確定性;
二是新詞、新術語、新語義、新語法導致未知語言現象的不可預測性;
三是數據資源不足,難以覆蓋復雜的語言現象;
第四,語義知識的模糊性和復雜性很難用簡單的數學模型來描述,語義計算需要巨大參數的非線性計算。
第四,人機交互
人機交互主要研究人與計算機之間的信息交換,包括人與計算機之間的信息交換兩部分,是人工智能領域重要的外圍技術。人機交互是壹門與認知心理學、人機工程學、多媒體技術和虛擬現實技術密切相關的綜合性學科。傳統的人與計算機之間的信息交換主要依靠交互設備,包括鍵盤、鼠標、操縱桿、數據服、眼動儀、位置跟蹤器、數據手套、壓力筆等輸入設備,以及打印機、繪圖儀、顯示器、頭盔顯示器、揚聲器等輸出設備。人機交互技術除了傳統的基礎交互和圖形交互,還包括語音交互、情感交互、體感交互和腦機交互。
動詞 (verb的縮寫)計算機視覺
計算機視覺是利用計算機模仿人類視覺系統,使計算機具有提取、處理、理解和分析與人類相似的圖像和圖像序列的能力的科學。自動駕駛、機器人、智能醫療等領域都需要通過計算機視覺技術從視覺信號中提取信息並進行處理。近年來,隨著深度學習的發展,預處理、特征提取和算法處理逐漸融合,形成了壹種端到端的人工智能算法技術。根據所解決的問題,計算機視覺可以分為五大類:計算成像、圖像理解、三維視覺、動態視覺和視頻編解碼。
目前,計算機視覺技術發展迅速,已初步形成產業規模。計算機視覺技術的未來發展主要面臨以下挑戰:
第壹,如何在不同的應用領域更好的與其他技術結合。計算機視覺在解決壹些問題上可以大量利用大數據,已經逐漸成熟並超越人類,但在壹些問題上無法達到很高的準確率;
第二,如何減少計算機視覺算法的開發時間和人力成本。目前計算機視覺算法需要大量的數據和人工標註,需要較長的開發周期才能達到應用領域要求的精度和耗時;
第三是如何加快新算法的設計和開發。隨著新的成像硬件和人工智能芯片的出現,針對不同芯片和數據采集設備的計算機視覺算法的設計和開發也是挑戰之壹。
六、生物識別
生物特征識別技術是指通過個體的生理特征或行為特征對個體身份進行識別和認證的技術。從應用流程來看,生物識別通常分為註冊和識別兩個階段。在註冊階段,通過傳感器采集人體的生物特征信息,如圖像傳感器采集指紋、人臉等光學信息,麥克風采集語音等聲學信息,通過數據預處理和特征提取技術對采集的數據進行處理,得到相應的特征進行存儲。
在識別過程中,采用與註冊過程壹致的信息采集方法,采集信息,預處理數據,提取待識別人的特征,然後將提取的特征與存儲的特征進行比較,完成識別。從應用任務來看,生物識別壹般分為識別和確認兩項任務。身份識別是指從知識庫中確定被識別人身份的過程,是壹對多問題。確認是指將待識別人的信息與存儲庫中特定人的信息進行比對以確定身份的過程,這是壹個壹對壹的問題。
生物識別技術涉及的內容非常廣泛,包括指紋、掌紋、人臉、虹膜、手指靜脈、聲紋、步態等生物特征,其識別過程涉及圖像處理、計算機視覺、語音識別、機器學習等多項技術。目前,生物特征識別作為壹種重要的智能身份認證技術,已經廣泛應用於金融、公安、教育、交通等領域。
七。虛擬現實/增強現實
虛擬現實(VR)/增強現實(AR)是以計算機為核心的新型視聽技術。結合相關科學技術,在壹定範圍內生成壹個在視覺、聽覺、觸覺上與真實環境高度相似的數字環境。用戶通過必要的設備與數字環境中的物體進行交互,獲得接近真實環境的感受和體驗,這些感受和體驗通過顯示設備、跟蹤定位設備、觸覺交互設備、數據采集設備、專用芯片等來實現。
虛擬現實/增強現實根據處理階段的不同可以分為五個方面:獲取與建模技術、分析與利用技術、交換與分發技術、顯示與交互技術、技術標準與評估體系。采集與建模技術研究如何對物理世界或人類創造力進行數字化和建模,難點是三維物理世界的數字化和建模技術;分析利用技術側重於數字內容的分析、理解、搜索和智能化的方法,其難點在於內容的語義表示和分析;交換分發技術主要強調在各種網絡環境下,面向不同終端用戶的大規模數字內容流通、轉換、集成和個性化服務,其核心是開放的內容交換和版權管理技術;顯示與交換技術著眼於符合人類習慣的數字內容的各種顯示技術和交互方式,以提高人們對復雜信息的認知能力,其難點在於建立自然和諧的人機交互環境;標準與評估體系重點研究虛擬現實/增強現實基礎資源、內容編目、源代碼的標準以及相應的評估技術。
目前虛擬現實/增強現實面臨的挑戰主要體現在四個方面:智能獲取、無處不在的設備、自由交互和感知融合。在硬件平臺和器件、核心芯片和器件、軟件平臺和工具、相關標準和規範等方面存在壹系列科學技術問題。總的來說,虛擬現實/增強現實呈現智能虛擬現實系統、虛擬與真實環境物體無縫融合、自然交互、舒適的發展趨勢。