技術背景有什麽區別？

1.1技術背景——什麽是文本檢測與識別？

OCR的全稱是光學字符識別，最早由德國科學家Tausheck在1929年提出。OCR被定義為從紙質文檔中識別印刷字符。現在的OCR，狹義上是指對輸入的掃描文檔圖像進行分析處理，識別圖像中的文字信息。隨著OCR技術的發展，人們不再滿足於文檔或書籍中的文本，而是開始將目標轉移到現實場景中的文本，這就是所謂的場景文本識別(Scene Text Recognition，STR)。

所以現在的OCR泛指所有的圖像文字檢測識別技術，包括傳統的文檔圖像識別和場景文字識別技術。自然場景文本提取技術是傳統OCR技術在自然場景圖像中的延伸，具有廣闊的應用前景。自然場景文字主要出現在車牌、廣告牌、路標、招牌上。與傳統的掃描圖像文本不同，自然場景文本由於其豐富的表現形式、復雜的圖像背景以及圖像拍攝引入的幹擾因素，比傳統的掃描文檔圖像更加難以分析和處理。