OCR的全稱是光學字符識別,最早由德國科學家Tausheck在1929年提出。OCR被定義為從紙質文檔中識別印刷字符。現在的OCR,狹義上是指對輸入的掃描文檔圖像進行分析處理,識別圖像中的文字信息。隨著OCR技術的發展,人們不再滿足於文檔或書籍中的文本,而是開始將目標轉移到現實場景中的文本,這就是所謂的場景文本識別(Scene Text Recognition,STR)。
所以現在的OCR泛指所有的圖像文字檢測識別技術,包括傳統的文檔圖像識別和場景文字識別技術。自然場景文本提取技術是傳統OCR技術在自然場景圖像中的延伸,具有廣闊的應用前景。自然場景文字主要出現在車牌、廣告牌、路標、招牌上。與傳統的掃描圖像文本不同,自然場景文本由於其豐富的表現形式、復雜的圖像背景以及圖像拍攝引入的幹擾因素,比傳統的掃描文檔圖像更加難以分析和處理。