聲音就像壹小段音樂。
音高是可以改變的,如果D不上,就改成C,
絕對音高發生了變化,而相對音高保持穩定。
還是可以判斷這兩個音高不同的曲子確實是同壹首曲子。
音色也可以改變。小提琴《梁祝》和電子琴《梁祝》音色差別很大。
但還是能判斷出是同壹首曲子。
體積的變化不影響是否相同的判斷。
語音識別的算法和建模就是基於這種相關性現象。
當完全理解後,它被稱為尺度相對性原理。
音階的相對關系不變,固定了音樂。並且可以重復。
發音也是如此。
明白了這壹點,解決語音識別問題就有了大方向——
1,求機器能識別的最小刻度。
2.求言語中固定音階的相對變化順序。
3.發現音階的立體現象。
4.三維比例尺的數字化。
這樣,聲音就固定了。
以上四項顯然不需要很高深的數學水平。
高中數學做算術就夠了。數學不難。
技術,肯定需要。音頻廣告轉碼需要探索適應新算法的新技術。但也不是很難。
情懷?是的,我需要感覺。
思考以上四個語音問題的方向,應該得出以下幾點思考:
妳必須對聲音從開始到結束的整個詳細過程有清晰的數字理解。
這是最大的難點。