光學字符識別的功能:
1,OCR識別技術不僅可以自動判斷、拆分、識別、還原各種通用打印表格,在表格理解方面也取得了令人滿意的實用效果。
2.OCR可以自動分析稿件的版面,自動分欄,確定標題、欄、圖像、表格等對應屬性。,並確定識別順序,可將識別結果還原為與掃描原稿版面壹致的新文字。
3.OCR還可以支持表格自動錄入技術,可以自動識別特定表格的印刷或打印的漢字、字母、數字,識別手寫漢字、手寫字母、數字以及各種手寫符號,並按照表格格式輸出。提高了表單錄入的效率,節省了大量的人力。
擴展數據:
要進行OCR處理的主題必須通過光學儀器(如圖像掃描儀、傳真機或任何照相設備)傳輸到計算機。隨著科技的進步,掃描儀等輸入設備已經做得越來越精致,輕薄短小,質量高,這對OCR有很大的幫助。掃描儀的分辨率使圖像更清晰,掃頻速度提高了OCR處理的效率。
圖像預處理:圖像預處理是OCR系統中需要解決最多問題的模塊。圖像首先要把圖片、表格和文字區域分開,甚至要區分文章的排版方向、輪廓和正文,文字的大小和字體才能判斷為原始文檔。
百度百科-OCR技術