當前位置:吉日网官网 - 傳統美德 - 語音合成的合成技術

語音合成的合成技術

波形拼接技術的發展與語音編解碼技術的發展密切相關,其中LPC技術(線性預測編碼技術)的發展對波形拼接技術影響很大。LPC合成技術本質上是壹種時間波形編碼技術,旨在降低時域信號的傳輸速率。

LPC合成技術的優點是簡單直觀。它的合成過程本質上只是壹個簡單的解碼和拼接過程。另外,由於波形拼接技術的合成原語是語音的波形數據,保留了語音的所有信息,因此對於單個合成原語可以獲得較高的自然度。

但是,由於自然語流中的聲音和孤立情況下的聲音有很大的差異,如果只是簡單地將孤立的聲音拼接在壹起,整個語流的質量必然不盡人意。LPC技術本質上只是壹種錄制+回放,LPC合成技術對於合成整個連續流的效果並不理想。因此,LPC合成技術必須與其他技術相結合,才能明顯提高LPC合成的質量。80年代末提出的PSOLA合成技術(基音同步疊加技術)為波形拼接合成技術註入了新的活力。PSOLA技術側重於對語音信號隨時間特性的控制,如基頻、持續時間、聲強的控制。這些參數對於語音的韻律控制和修改是非常重要的。因此,PSOLA技術具有比LPC技術更易修改的優點,可以合成自然度高的語音。

PSOLA技術的主要特點是在拼接語音波形片段之前,首先根據上下文的要求,用PSOLA算法調整拼接單元的韻律特征,使合成的波形既保持了原發音的主要段特征,又使拼接單元的韻律特征符合上下文的要求,從而獲得較高的清晰度和自然度。

PSOLA技術保持了傳統波形拼接技術的優點,簡單直觀,計算量小。而且可以方便地控制語音信號的韻律參數,具備合成自然連續語音流的條件,因此得到了廣泛的應用。

然而,PSOLA技術也有其缺點。首先,PSOLA技術是壹種基音同步語音分析/合成技術,需要精確的基因周期和其起始點的確定。基音周期或其起始點的判斷誤差會影響PSOLA技術的效果。其次,PSOLA技術是壹種簡單的波形映射拼接合成。這種鑲嵌是否能保持平滑過渡以及對頻域參數的影響還沒有解決,所以在合成時會產生不理想的結果。隨著人們對語音合成的自然度和音質要求越來越高,PSOLA算法表現出韻律參數調節能力弱、難以處理協同發音的缺陷。為此,提出了壹種基於LMA信道模型的語音合成方法。該方法具有傳統參數合成可以靈活調整韻律參數的優點,同時具有比PSOLA算法更高的合成音質。

這兩種技術各有優勢。* * *振動峰技術比較成熟,有大量的研究成果可以利用。PSOLA技術是壹項比較新的技術,具有很好的發展前景。在過去,這兩種技術基本上是相互獨立發展的。

  • 上一篇:標準化生產對推廣地方特產有什麽意義?
  • 下一篇:中國傳統文化京劇100字
  • copyright 2024吉日网官网