八月瓜首页 > 专利查询 > >正文

用于交织语音编码器中线性谱信息量化方法的方法和设备

基本信息

  • 申请号 CN00810352.6 
  • 公开号 CN1145930C 
  • 申请日 2000/07/19 
  • 公开日 2004/04/14 
  • 申请人 高通股份有限公司  
  • 优先权日期  
  • 发明人 A·K·阿南塔帕德玛那伯汉 S·曼朱那什  
  • 主分类号  
  • 申请人地址 美国加利福尼亚州 
  • 分类号  
  • 专利代理机构 上海专利商标事务所 
  • 当前专利状态 发明专利权部分无效宣告的公告 
  • 代理人 沈昭坤 
  • 有效性 期限届满 
  • 法律状态 【期限届满】
  •  

权利要求书

1、一种语音编码器,包括: 线性预测滤波器,配置为用于分析帧并依据分析生成线性谱信息码矢量;和 与所述线性预测滤波器耦合的量化器,配置为用于通过使用基于非移动平均 预测矢量量化方案的第一矢量量化技术来对线性谱信息矢量进行矢量量化, 其特征在于,所述量化器进一步配置为用来计算用于第一技术的等效移动平 均码矢量,用所述等效移动平均码矢量对经语音编码器预先处理的预定帧数的码 矢量移动平均码本存储值进行更新,依据已更新的所述移动平均码本存储值计算 用于第二技术的目标量化矢量,通过所述第二矢量量化技术对目标量化矢量进行 量化来生成经量化的目标码矢量,所述第二矢量量化技术是使用基于移动平均预 测的方案,用所述经量化的目标码矢量对所述移动平均码本存储值进行更新,并 从所述经量化的目标码矢量中计算经量化的线性谱信息矢量。
2、如权利要求1所述的语音编码器,其特征在于,所述帧是语音帧。
3、如权利要求1所述的语音编码器,其特征在于,所述帧是线性预测剩 余帧。
4、如权利要求1所述的语音编码器,其特征在于,所述目标量化矢量是 根据下述公式进行计算: U M { U M n = ( L M n - α 1 n U ^ M - 1 n - α 2 n U ^ M - 2 n - . . . . - α P n U ^ M - P n ) α o n ; n = 0.1 . . . . N - 1 } , ]]>其中 { U ^ M - 1 n , U ^ m - 2 n , · · · , U ^ M - P n ; N = 0,1 , · · · , N - 1 } ]]>是对应于紧接在帧之前 已处理的预定数目帧的线性谱信息参量的码本表项,而{α1n,α2n,…,αPn; n=0,1,…,N-1}是各参数权重,这样{α0n1n+,…,+αPn=1;n=0,1,…, N-1}。
5、如权利要求1所述的语音编码器,其特征在于,所述经量化线性谱信 息矢量是根据下述公式进行计算: L ^ M { L ^ M n = α o n U ^ M n + α 1 n U ^ M - 1 n + . . . . + α P n U ^ M - P n ; n = 0.1 . . . . N - 1 } , ]]>其中 { U ^ M - 1 n , U ^ M - 2 n , · · · , U ^ M - P n ; n = 0,1 , · · · , N - 1 } ]]>是对应于紧接在帧之前 已处理的预定数目帧的线性谱信息参量的码本表项,而{α1n,α2n,…,αPn; n=0,1,…,N-1}是各参量权重,这样{α0n1n+,…,+αPn=1;n=0,1,…, N-1}。
6、如权利要求1所述的语音编码器,其特征在于,所述等效移动平均码 矢量是根据下述公式进行计算: U ^ ~ M - K { U ^ ~ M - K n = ( L ^ M - R n - β 1 n U ^ M - K - 1 n - β 2 n U ^ M - K - 2 n - . . . . - β R n U ^ M - K - P n ) β 0 M ; n = 0.1 . . . . N - 1 } ]]>其中{β1n,β2n,…,βPn;n=0,1,…,N-1}是各等效移动平均码矢量单元 权重使得{β0n1n+,…,+βPn=1;n=0,1,…,N-1},并且其中初始条件 { U ^ ~ - 1 , U ^ ~ - 2 , · · · , U ^ ~ - P } ]]>已确立。
7、如权利要求1所述的语音编码器,其特征在于,所述语音编码器驻留 在无线通信系统用户单元中。
8、一种对帧的线性谱信息矢量进行矢量量化的方法,使用第一和第二量 化矢量量化技术,第一技术使用基于非移动平均预测矢量量化方案,第二技术使 用基于移动平均预测矢量量化方案,其特征在于,该方法包括下述步骤: 用所述第一矢量量化技术对线性谱信息矢量进行矢量量化; 计算用于所述第一技术的等效移动平均码矢量; 用所述等效移动平均码矢量更新经语音编码器预先处理的预定帧数的码矢量 移动平均码本的存储值; 依据所述已更新的移动平均码本的存储值来计算用于所述第二技术的目标量 化矢量; 用所述第二矢量量化技术对目标量化矢量进行矢量量化来产生量化的目标码 矢量; 用所述已量化的目标码矢量来更新所述移动平均码本的存储值;和 从所述已量化的目标码矢量中导出量化线性谱信息矢量。
9、如权利要求8所述的方法,其特征在于,所述帧是语音帧。
10、如权利要求8所述的方法,其特征在于,所述帧是线性预测剩余帧。
11、如权利要求8所述的方法,其特征在于,所述计算步骤包括根据下 述公式计算所述目标量化矢量: U M { U M n = ( L M n - α 1 n U ^ M - 1 n - α 2 n U ^ M - 2 n - . . . . - α P n U ^ M - P n ) α 0 n ; n = 0.1 . . . . N - 1 } , ]]>其中 { U ^ M - 1 n , U ^ M - 2 n , · · · , U ^ M - P n ; N = 0,1 , · · · , N - 1 } ]]>是对应于紧接在帧之前 已处理的预定数目帧的线性谱信息参数的码本表项,而{α1n,α2n,…,αPnn=0,1,…,N-1}是各参数的权重,使得{α0n1n+,…,+αPn=1;n=0, 1,…,N-1}。
12、如权利要求8所述的方法,其特征在于,所述导出步骤包括根据下 述公式导出所述经量化线性谱信息矢量: L ^ M { L ^ M n = α 0 n U ^ M n + α P n U ^ M - 1 n + . . . . + α P n U ^ M - P n ; n = 0.1 . . . . N - 1 } , ]]>其中 { U ^ M - 1 n , U ^ M - 2 n , · · · , U ^ M - P n ; n = 0,1 , · · · , N - 1 } ]]>是对应于紧接在帧之前已 处理的预定数目帧的线性谱信息参量的码本表项,而{α1n,α2n,…,αPn;n =0,1,…,N-1}是各参数权重,这样{α0n1n+,…,+αPn=1;n=0,1,…, N-1}。
13、如权利要求8所述的方法,其特征在于,所述计算步骤包括根据下 述公式计算所述等效移动平均码矢量: U ^ ~ M - K { U ^ ~ M - K n = ( L ^ M - R n - β 1 n U ^ M - K - 1 n - β R n U ^ M - K - P n ) β 0 n ; n = 0.1 . . . . N - 1 } ]]>其中{β1n,β2n,…,βPn;n=0,1,…,N-1}是各等效移动平均码矢量单元 权重使得{β0n1n+,…,+βPn=1;n=0,1,…,N-1},并且其中初始条件 { U ^ ~ - 1 , U ^ ~ - 2 , · · · , U ^ ~ - P } ]]>已确立。
14、一种语音编码器,其特征在于,包括: 用于通过用第一矢量量化技术对线性谱信息矢量进行矢量量化的装置,所述 技术使用基于非移动平均预测矢量量化方案; 用于计算用于所述第一技术的等效移动平均码矢量的装置; 用于用所述等效移动平均码矢量更新经语音编码器预先处理的预定帧数的码 矢量移动平均码本存储值的装置; 用于依据所述已更新的移动平均码本存储值来计算用于第二技术的目标量化 矢量的装置; 用于用所述第二矢量量化技术对所述目标量化矢量进行矢量量化来产生量化 的目标码矢量的装置; 用于用所述已量化的目标码矢量来更新所述移动平均码本的存储值的装置; 和 用于从所述已量化的目标码矢量中导出量化线性谱信息矢量的装置。
15、如权利要求14所述的语音编码器,其特征在于,所述帧是语音帧。
16、如权利要求14所述的语音编码器,其特征在于,所述帧是线性预测 剩余帧。
17、如权利要求14所述的语音编码器,其特征在于,所述目标量化矢量 是根据下述公式进行计算: U M { U M n = ( L M n - α 1 n U ^ M - 1 n - α 2 n U ^ M - 2 n - . . . . - α P n U ^ M - P n ) α 0 n ; n = 0.1 . . . . N - 1 } ]]>其中 { U ^ M - 1 n , U ^ M - 2 n , · · · , U ^ M - P n ; n = 0,1 , · · · , N - 1 } ]]>是对应于紧接在帧之前 已处理的预定数目帧的线性谱信息参数的码本表项,而{α1n,α2n,…,αPn; n=0,1,…,N-1}是各参数的权重,使得{α0n1n+,…,+αPn=1;n=0, 1,…,N-1}。
18、如权利要求14所述的语音编码器,其特征在于,所述经量化线性谱 信息矢量是根据下述公式导出: L ^ M { L ^ M n = α 1 n U ^ M n + α 1 n U ^ M - 1 n + . . . . + α P n U ^ M - P n ; n = 0.1 . . . . N - 1 } , ]]>其中 { U ^ M - 1 n , U ^ M - 2 n , · · · , U ^ M - P n ; n = 0,1 , · · · , N - 1 } ]]>是对应于紧接在帧之前 已处理的预定数目帧的线性谱信息参数的码本表项,而{α1n,α2n,…,αPn; n=0,1,…,N-1}是各参数权重,这样{α0n1n+,…,+αPn=1;n=0,1,…, N-1}。
19、如权利要求14所述的语音编码器,其特征在于,所述等效移动平均 码矢量是根据下述公式计算进行计算: U ^ ~ M - K { U ^ ~ M - K n = ( L ^ M - K n - β 1 n U ^ M - K - 1 n - β 2 n U ^ M - K - 2 n - . . . . - β R n U ^ M - K - P n ) β 0 n ; n = 0.1 . . . . N - 1 } ]]>其中{β1n,β2n,…,βPn;n=0,1,…,N-1}是各等效移动平均码矢量单元 权重使得{β0n1n+,…,+βPn=1;n=0,1,…,N-1},并且其中初始条件 { U ^ ~ - 1 , U ^ ~ - 2 , · · · , U ^ ~ - P , } ]]>已确立。
20、如权利要求14所述的语音编码器,其特征在于,所述语音编码器驻 留在无线通信系统用户单元中。
展开

说明书

技术领域 本发明通常涉及语音处理领域,并且特别针对用于对语音编码器中的线性谱 信息进行量化的方法和设备。
背景技术 通过数字技术进行语音传输已经变得很普遍,特别是在长距离和数字无线电 话应用中。
这反过来又使人们对在信道上所发送的能保持重构语音感知质量的信 息最小量的确定产生了兴趣。
如果语音是以简单的采样和数字化进行传输,那么 就需要大约64千位每秒(kbps)的数据率才能达到传统模拟电话的语音质量。
然 而,通过语音分析的使用,后随合适的编码、传输和在接收器的再合成,可以使 数据率明显下降。
用于压缩语音的设备在许多电信领域中都能找到。
一个示例领域就是无线通 信。
无线通信领域具有很多应用包括例如无绳电话、无线电寻呼、无线本地环路、 无线电话例如蜂窝或PCS电话系统、移动网际协议(IP)电话和卫星通信系统。
一 种特别重要的应用就是用于移动用户的无线电话。
针对无线通信系统包括例如频分多路访问(FDMA)、时分多路访问(TDMA)和码 分多路访问(CDMA)已经开发出各种空中接口。
与之连接中,建立了各种国内和国 际标准包括例如高级移动电话服务(AMPS)、全球移动通信系统(GSM)和临时标准 95(IS-95)。
一种示范无线电话通信系统是码分多路访问(CDMA)系统。
IS-95标准 和其衍生物IS-95A、ANSI J-STD-008,IS-95B、提议的第三代标准IS-95C和IS- 2000等(在此共同归类为IS-95)是由电信工业协会(TIA)和其他知名标准团体公布 来说明用于蜂窝或PCS电话通信系统的CDMA空中接口的使用。
大致根据使用的 IS-95标准配置的示范无线通信系统在美国专利号5,103,459和4,901,307(已转 让给本发明的受让人并在此作为合作参考)中有所描述。
采用以提取与人类语音生成模型有关的参量来压缩语音的技术的设备被称为 语音编码器。
语音编码器将输入语音信号分为时间块或分析帧。
语音编码器通常 由编码器和译码器组成。
编码器对输入语音帧进行分析来提取某些相关参量,并 且随后将参量量化为二进制码表示,即量化为一组位或二进制数据包。
数据包在 通信信道上向接收器和解码器传输。
解码器对这些数据包进行处理,把它们去量 化来产生参量,并且使用去量化参量来再合成语音帧。
语音编码器的功能是通过去除语音中固有的所有自然冗余来将数字化的语音 信号压缩为低比特率信号。
通过用一组参量代表输入语音帧并对参量进行量化来 用一组位表示参量就可以实现数字压缩。
如果输入语音帧具有位数为Ni并且语音 编码器产生的数据包具有位数No,语音编码器所达到的压缩系数为Cr=Ni/No
在压缩技术中所面临的挑战是在达到目标压缩系数的情况下还要保持解码语音的 高语音质量。
评价语音编码器的性能的依据是(1)上述语音模型或分析和合成的混 合处理完成的效果有多好,以及(2)以目标比特率每帧No位进行参量量化处理所 执行的效果如何。
语音模型的目标就是对于每帧用较小一组参量来获得语音信号 的实质或目标语音质量。
在语音编码器的设计中最重要的可能就是寻找一组好的参数(包括向量)来描 述语音信号。
一组好的参数需要较低的系统带宽用于感觉上准确的语音信号重构。
音调、信号功率、谱包络(或共振峰)、振幅谱和相谱都是语音编码参数的实例。
语音编码器可以作为时域编码器实现,时域编码器是试图通过每次使用高时 间分辨率处理对较小的语音段(通常是5毫秒(ms)子帧)进行编码来捕获时域语音 波形。
对于每个子帧,依靠本领域中已知的各种搜索算法从码本空间中寻找高精 度的代表。
或者,语音编码器可以作为频域编码器来实现,频域编码器是试图用 一组参量(分析)来捕获输入语音帧的短期语音频谱,并且使用相应的合成处理来 从谱参量中重建语音波形。
参量量化器根据A.Gersho & R.M.Gray,的矢量量化 和信号压缩(Vector Quantization and Signal Compression)(1992)中描述的已 有量化技术通过用已存储的码矢量代表表示这些参量来保存它们。
一种著名的时域编码器是在L.B.Rabiner & R.W.Schafter,的语音信号数 字处理(Digital Processing of Speech Signals)396-453(1978,在此作为合作 参考)中所描述的代码激发线性预测(CELP)编码器。
在CELP编码器中,通过线性 预测(LP)分析去除了短期相关或冗余,该分析是找出短期共振峰滤波器的系数。
对输入语音帧使用短期预测滤波器就产生LP剩余信号,该信号将进一步用长期预 测滤波器参数和后续随机码本进行模拟和量化。
这样,CELP编码将对时域语音波 形的编码任务分为对LP短期滤波器系数编码和对LP剩余编码的独立任务。
时域 编码能以固定速率(即对每个帧使用相同的位数,No)或可变速率(对不同类型的帧 内容使用不同的速率)执行。
可变速率编码器试图仅使用足够获得目标质量水平而 对编解码器参量进行编码所需的位数。
一种示范可变速率CELP编码器在美国专利 号5,414,796(已转让给本发明的受让人,并在此作为合作参考)中有描述。
时域编码器例如CELP编码器通常依靠较高的每帧位数No来保持时域语音波 形的精确度。
这样的编码器通常以相对较大的每帧位数No(例如8kbps或以上) 所提供的极好的语音质量进行传输。
然而,在较低比特率(4kbps和以下),时域 编码器由于有限的可用位数而不能保持高质量传输和稳健的性能。
在低比特率时, 有限的码本空间削减了传统时域编码器的波形匹配能力,该编码器在更高比特率 的商业应用中使用得非常成功。
因此,虽然随时间进行了很多改进,但是,许多 在低比特率上工作的CELP编码系统还是受到通常用噪声表征的明显感觉上失真的 困扰。
当前人们对开发在中到低比特率(即2.4到4kbps和以下的范围)工作的高质 量语音编码器有着浓厚的研究兴趣和强烈的商业需求。
其应用领域包括无线电话、 卫星通信、因特网电话、各种多媒体和语音流应用程序、语音邮件和其他语音存 储系统。
其驱动力是人们对高容量的需求和在包丢失情况下对稳健性能的要求。
各种新近的语音编码标准化工作是另一种推动低比特率语音编码算法研究和发展 的直接驱动力。
低比特率语音编码器在每个允许的应用带宽上创建更多的信道或 用户,并且结合有适合信道编码的附加层的低比特率语音编码器能符合编码器规 范的总体位预算,并能在信道错误的条件下提供稳健的性能。
一种在低比特率下能有效对语音编码的有用技术是多模编码。
一种示范多模 编码技术在美国申请序列号09/217,341在1998.12.21申请的名为可变比特率语 音编码(VARIABLE RATE SPEECH CODING,已转让给本发明的受让人并在此作为合 作参考)中有描述。
传统的多模编码器对不同类型的输入语音帧采用不同的模式或 编码-解码算法。
每种模式或编码-解码处理是为以最有效的方式最佳表示某种类 型语音段而定制的,例如即有声语音、无声语音、过渡语音(例如有声和无声之间) 和背景噪声(无语音)。
一种外部开环模式判定机制对输入语音帧进行检验,并做 出有关对帧采用什么模式的判定。
开环模式判定通常是通过从输入帧中提取许多 参量,对有关某些时间和频谱特性的参数进行评估,并以评估值作为模式判定的 基础。
在许多传统语音编码器中,通过未充分减少码率而对有声语音帧进行编码, 在未利用有声语音的稳态特性情况下,传输线性谱信息例如线性谱对或线性谱余 弦。
因此,浪费了宝贵的带宽。
在另一些传统语音编码器、多模式语音编码器或 低比特率语音编码器中,对每帧都利用有声语音的稳态特性。
因此,非稳态帧性 能退化,并影响了语音质量。
提供一种能反应每帧语音内容特性的自适应编码方 法是很有益的。
另外,因为有益信号通常是非稳态或非平稳的,在语音编码中使 用的线性谱信息(LSI)参数的量化效率可以通过使用对每帧语音的LSI参数可选择 性地使用基于移动平均(moving-average)(MA)预测矢量量化(VQ)或其他标准VQ方 法进行编码的方案得到改进。
这种方案适合发挥上述两种VQ方法的优势。
因此, 需要提供一种语音编码器,该编码器在从一种方法过渡到另一种方法的边界处通 过适当地混合两种方案来交织两种VQ方法。
这样,就需要一种使用多种矢量量化 方法来适应在周期帧和非周期帧之间变化的语音编码器。
发明内容 本发明针对一种使用多种矢量量化方法来适应在周期帧和非周期帧之间变化 的语音编码器。
因此,在本发明的一个方面中,语音编码器最好包括配置来分析 帧并依据上述分析生成线性谱信息码矢量的线性预测滤波器;和与线性预测滤波 器耦合并配置用于使用基于非移动平均预测矢量量化方案的第一矢量量化技术对 线性谱信息矢量进行矢量量化的量化器,其中该量化器进一步配置来计算用于第 一技术的等效移动平均的码矢量,用等效移动平均码矢量来更新经语音编码器预 先处理的预定帧数的码矢量移动平均码本的存储值,依据已更新的移动平均码本 存储值来计算用于第二技术的目标量化矢量,用第二矢量量化技术对目标量化矢 量进行矢量量化来产生量化的目标码矢量,第二矢量量化技术使用基于移动平均 预测方案,用已量化的目标码矢量来更新移动平均码本的存储值,并从已量化的 目标码矢量中计算量化线性谱信息矢量。
在本发明的另一方面中,对帧的线性谱信息矢量进行矢量量化的方法,使用 第一和第二量化矢量量化技术,第一技术使用基于非移动平均预测矢量量化方案, 第二技术使用基于移动平均预测矢量量化方案,最好包括用第一矢量量化技术对 线性谱信息矢量进行矢量量化的步骤;计算用于第一技术的等效移动平均码矢量 的步骤;用等效移动平均码矢量更新经语音编码器预先处理的预定帧数的码矢量 移动平均码本存储值的步骤;依据已更新的移动平均码本存储值来计算用于第二 技术的目标量化矢量的步骤;用第二矢量量化技术对目标量化矢量进行矢量量化 来产生量化的目标码矢量的步骤;用已量化的目标码矢量来更新移动平均码本的 存储的步骤;以及从已量化的目标码矢量中导出量化线性谱信息矢量的步骤。
在本发明的另一方面中,语音编码器最好包括用第一矢量量化技术对线性谱 信息矢量进行矢量量化的装置,该技术使用基于非移动平均预测矢量量化方案; 用于计算用于第一技术的等效移动平均码矢量的装置;用于用等效移动平均码矢 量更新经语音编码器预先处理的预定帧数的码矢量移动平均码本存储值的装置; 用于依据已更新的移动平均码本存储值来计算用于第二技术的目标量化矢量的装 置;用于用第二矢量量化技术对目标量化矢量进行矢量量化来产生量化的目标码 矢量的装置;用于用已量化的目标码矢量来更新移动平均码本的存储的装置;以 及用于从已量化的目标码矢量中导出量化线性谱信息矢量的装置。
附图说明 图1是无线电话系统的框图。
图2是由语音编码器在每个端点终止的通信信道框图。
图3是编码器框图。
图4是解码器框图 图5是说明语音编码判决过程的流程图。
图6A是语音信号放大与时间的相对图 具体实施方式 下述示范实施例是驻留在使用CDMA空中接口配置的无线电话通信系统 中。
然而,对于本领域的熟练技术人员来说应该理解使用本发明特征的子抽 样方法和设备可以安置在为本领域熟练技术人员所熟知的广阔技术领域中所 使用的各种通信系统中的任意系统中。
如图1所示,CDMA无线电话系统通常包括多个移动用户单元10、多个基 站12、基站控制器(BSCs)14和移动交换中心(MSC)16。
MSC16配置来与传统的 公用电话交换网(PSTN)18对接。
MSC也配置来与BSCs 14对接。
BSCs 14通过 回传线与基站12连接。
回传线可以配置来支持任意几种已知接口包括例如 E1/T1、ATM、IP、PPP、帧中继、HDSL、ADSL或xDSL。
应该明白在系统中可 能有多于2个的BSCs 14。
每个基站12最好包括至少一个扇区(未示出),每 个扇区由全向天线或沿径向从基站12离开指向特定方向的天线组成。
或者, 每个扇区可能包括两个用于分集接收的天线。
每个基站12最好能设计成支持 多个频率分配。
扇区的相交和频率分配可以称为CDMA信道。
基站12也可以 通称为基站收发器子系统(BTSs)12。
或者,“基站”在工业界可以用统称为BSC 14和一个或多个BTSs 12。
BTSs 12也能表示为“蜂窝站”12。
或者,给定的 BTS12的单独扇区可以称为蜂窝站。
移动用户单元10通常是蜂窝或PCS电话 10。
根据IS-95标准对该系统的使用进行了有利的配置。
在蜂窝电话系统的典型工作期间,基站12从移动单元10组中接收到反 向链路信号集。
移动单元10处理电话呼叫或其他通信。
由给定基站12接收 的每个反向链路信号在该基站12中进行处理。
结果数据提交给BSCs 14。
BSCs 14提供呼叫资源分配和移动性管理的功能包括在基站12之间的软切换控制。
BSCs 14也将接收的数据发送给MSC 16,MSC 16提供了与PSTN 18对接的附 加路由服务。
同样,PSTN 18与MSC 16对接,并且MSC 16与BSCs 14对接, BSCs 14依次控制基站12向移动单元10组发送前向链路信号集。
在图2中,第一编码器100接收数字化语音采样s(n),并对采样s(n)编 码用于在传输介质102或通信信道102上向第一解码器104传输。
解码器104 对编码的语音采样进行解码,并合成为输出语音信号sSYNTH(n)。
为了能在反 向传输,第二编码器106对在通信信道108上传输的数字化语音采样s(n)进 行编码。
第二解码器110接收编码的语音采样并对其进行解码,生成经合成 的输出语音信号sSYNTH(n)。
语音采样s(n)代表根据本领域已知各种方法,包括例如脉冲编码调制 (PCM)、压扩μ-律(companded μ-law)或A-律,中的任何方法经数字化和量化 的语音信号。
如本领域中所知,语音采样s(n)是以输入数据帧的形式编制, 其中每个帧由预定数量的数字化语音采样s(n)组成。
在示范实施例中,使用 8kHz的采样率,就是20ms的帧由160个采样组成。
在下述实施例中,数据传 输率在帧与帧的基础上从13.2kbps(全速)到6.2kbps(半速)到2.6kbps(1/4 速)到1kbps(1/8速)进行有利地变化。
变化的数据传输率具有优势是因为对 于含有相对较少语音信息的帧可选择使用低比特率。
如本领域熟练技术人员 所知,可以使用其他采样率、帧大小和数据传输率。
第一编码器100和第二解码器110都由第一语音编码器或语音编译码器 组成。
语音编码器可以用在用于传输语音信号的任意通信设备中,包括例如 如图1中所述的用户单元、BTSs或BSCs。
同样,第二编码器106和第一解码 器104都由第二语音编码器组成。
本领域熟练技术人员可以了解语音编码器 可以用数字信号处理器(DSP)、专用集成电路(ASIC)、离散门逻辑、固件或任 何传统的可编程软件模块和微处理器来实现。
软件模块可以驻留在RAM存储 器、快闪存储器、寄存器或任何本领域已知的可写入存储媒体的其他形式中。
或者,可以用任何传统的处理器、控制器或状态机来替代微处理器。
特别设 计用于语音编码的示范例ASICs在美国专利号5,727,123(已转让给本发明的 受让人,并在此作为合作参考)以及美国申请号08/197,417名为声码器 ASIC(VOCODER ASIC,1994.2.16申请,已转让给本发明的受让人,并在此作 为合作参考)中有描述。
在图3中,可以用在语音编码器中的编码器200包括模式判决模块202、 音调估值模块204、LP分析模块206、LP分析滤波器208、LP量化模块210 和剩余量化模块212。
输入语音帧s(n)提供给模式判决模块202、音调估值模 块204、LP分析模块206和LP分析滤波器208。
模式决策模块202依据每个 输入语音帧s(n)的周期、能量、信噪比(SNR)或过零率和其他特征来产生模式 索引IM和模式M。
根据周期对语音帧分类的各种方法在美国专利号 5,911,128(已转让给本发明的受让人,并在此作为合作参考)中有描述。
在电 信工业协会临时标准TIA/EIA IS-127和TIA/EIA IS-733也包括有这样的方 法。
一种示范模式判决方案在上述美国申请号09/217,341中也有描述。
音调估计模块204依据每个输入语音帧s(n)产生音调索引IP和滞后值 P0
LP分析模块206对每个输入语音帧s(n)执行线性预测分析来产生LP参 量α。
LP参量α提供给了LP量化模块210。
LP量化模块210也接收模式M, 因此,就以与模式有关的方式执行量化处理。
LP量化模块210产生LP索引ILP和已量化的LP参数。
LP分析滤波器208除输入语音帧s(n)之外还接收已量 化的LP参数。
LP分析滤波器208生成LP剩余信号R[n],该信号依据量化 线性预测参数表示了在输入语音帧s(n)和重构语音之间的错误。
LP剩余 R[n]、模式M和量化LP参数提供给剩余量化模块212。
依据这些值,剩余量 化模块212产生剩余索引IR和量化剩余信号 在图4中,可以在语音编码器中使用的解码器300包括LP参数解码模块 302、剩余解码模块304、模式解码模块306和LP合成滤波器308。
模式解码 模块306接收模式索引IM并对其解码,从中产生模式M。
LP参数解码模块302 接收模式M和LP索引ILP
LP参数解码模块302对接收的值进行解码来产生 量化LP参数。
剩余解码模块304接收剩余索引IR、音调索引IP和模式索引 IM
剩余解码模块304对接收的值进行解码来产生量化剩余信号 [n]。
量化 剩余信号 [n]和量化LP参数提供给LP合成滤波器308,滤波器308将其合 成为经解码的输出语音信号 [n]。
图3的编码器200以及图4的解码器300的各种模块的运作和实现为本 领域的熟练技术人员所熟知,并且在上述美国专利号5,414,796和L.B. Rabiner & R.W.Schafer,的语音信号数字处理(Digital Processing of Speech Signals)396-453(1978)中有描述。
如图5中流程图所示,根据一个实施例的语音编码器按照一组步骤来处 理用于传输的语音采样。
在步骤400,语音编码器接收连续帧中的语音信号数 字采样。
一当接收到的给定帧,语音编码器进入步骤402。
在步骤402中,语 音编码器检测帧的能量。
该能量是测量帧语音活动的一种度量。
通过将数字 化语音采样振幅的平方求和,并将结果能量和阀值进行比较就能执行语音检 测。
在一个实施例中,阀值依据背景噪声的变化水平进行适应改变。
一种示 范可变阀值活动检测器在上述美国专利号5,414,796中有描述。
某些无声语 音声音可以是非常低能量采样,该采样可能被误认为基底噪声编码。
为了避 免这样的情况发生,可能用低能量采样的光谱倾斜来从基底噪声中分辨无声 语音,如上述美国专利号5,414,796所述。
在检测帧能量之后,语音编码器进到步骤404。
在步骤404中,语音编码 器对检测到的帧能量是否足够将帧分类为含有语音信息的帧进行判定。
如果 检测到的帧能量降到预定阀值之下,语音编码器就进入步骤406。
在步骤406 中,语音编码器将帧作为背景噪声(即非语音或静音)进行编码。
在一个实施 例中,背景噪声以1/8速或1kbps速率进行编码。
如果在步骤404中,检测 到的帧能量达到或超过预定阀值,帧就分类为语音,并且语音编码器进到步 骤408。
在步骤408中,语音编码器对帧是否是无声语音进行判定,即语音编码 器检验帧的周期。
各种已知周期判定方法包括例如通过使用过零和通过使用 标准自相关函数(NACFs)的方法。
特别是使用过零和NACFs来检测周期在上述 美国专利号5,911,128和美国申请序列号09/217,341中有描述。
另外,上述 用于从无声语音中分辨有声语音的方法包括在了电信工业协会临时标准 TIA/EIA IS-127和TIA/EIA IS-733中。
如果该帧在步骤408中判定为无声语 音,语音编码器就进行步骤410。
在步骤410,语音编码器将帧作为无声语音 编码。
在一个实施例中,无声语音帧以1/4速率或2.6kbps进行编码。
如果 在步骤408中,没有判定该帧为无声语音,语音编码器就进到步骤412。
在步骤412中,语音编码器使用本领域已知的周期检测方法对该帧是否 是过渡语音,如例如上述美国专利号5,911,128中所述。
如果该帧确定为过渡 语音,语音编码器就进到步骤414。
在步骤414,该帧作为过渡语音(即从无 声语音到有声语音的过渡)进行编码。
在一个实施例中,转换语音帧根据在美 国申请序列号09/307,294名为过渡语音帧的多脉冲内插编码(MULTIPULSE INTERPOLATIVE CODING OF TRANSITION SPEECH FRAMES)1999.5.7申请(已转 让给本发明的受让人并在此作为合作参考)中所述的多脉冲内插编码方法进行编 码。
在另一实施例中,过渡语音帧以全速或13.2kbps进行编码。
如果在步骤412中,语音编码器判定该帧不是过渡语音,语音编码器就 进入步骤416。
在步骤416中,语音编码器将该帧作为有声语音进行编码。
在 一个实施例中,有声语音帧能以半速率或6.2kbps进行编码。
也可以以全速 率或13.2kbps(或在8k CELP编码器中以全速率,8kbps)对有声语音帧进行编 码。
本领域的熟练技术人员可以理解以半速率进行有声帧编码允许编码器通 过利用有声帧的稳态特性来节省宝贵的带宽。
进一步,不管用于对有声语音 编码的速率是多少,有声语音可以使用过去帧的信息方便地进行编码,因此 可以说是通过预测进行编码。
本领域的熟练技术人员可以理解语音信号或相应的LP剩余可以通过如图 5中所示的步骤进行编码。
噪声、无声、过渡和有声语音的波形特征可以看作 是图6A中的时间函数。
噪声、无声、过渡和有声LP剩余的波形特征可以看 作是图6B中的时间函数。
在一个实施例中,语音编码器执行如图7所示的流程图中的步骤来交织 两种线性谱信息(LSI)矢量量化(VQ)的方法。
语音编码器最好计算用于基于非 MA预测LSI VQ的等效移动平均(MA)码本矢量的估值,该非MA预测ISI VQ能 使语音编码器交织两种LSI VQ方法。
在基于MA预测的方案中,计算MA用于 先前处理的帧数,P,如下所述,MA是通过将各矢量码本表项乘以参量权重来 计算。
如下所述,从LSI参量的输入矢量中减去MA来产生目标量化矢量。
本 领域的熟练技术人员能很容易地理解基于非MA预测VQ的方法可以是不使用 基于MA预测VQ的任何已知VQ方案。
通常通过使用具有帧间MA预测的VQ或通过使用任何其他标准基于非MA 预测VQ方法例如分割VQ、多级VQ(MSVQ)、交换预测VQ(SPVQ)或这些方法中 的一些或全部方法的混合来将LSI参量量化。
在结合图7所述的实施例中, 使用一种方案来对任何具有基于MA预测VQ方法的上述VQ方法混合。
这是因 为基于MA预测VQ的方法适最用于本质上是稳态或平衡的语音帧(该帧所示出 信号例如图6A-B中所示的平衡有声帧所示的信号),基于非MA预测VQ的方 法最适用于本质上是非稳态或非平衡的语音帧(该帧所示出信号例如图6A-B 中所示的无声帧和过渡帧所示的信号)。
在用于量化N维LSI参数的基于非MA预测VQ的方案中,对于第M帧的 输入矢量,LM≡{LMn;n=0,1,…,N-1},是直接作为目标量化矢量使用, 并且使用任何上述标准VQ技术将其量化为矢量 L ^ M { L ^ M n ; n = 0.1 · · · N - 1 } . ]]>在示范帧间MA预测方案中,目标量化矢量如下计算 U M { U M n = ( L M n - α 2 n U ^ M - 1 n - α 2 n U ^ M - 2 n - . . . . - α P n U ^ M - P n ) α 0 n ; n = 0.1 . . . . N - 1 } . . . . . ( 1 ) ]]>其中 { U ^ M - 1 n , U ^ M - 2 n , · · · , U ^ M - P n ; n = 0,1 , · · · , N - 1 } ]]>是对应于紧接在帧M之 前的P帧LSI参量的码本记录,而{α1n,α2n,…,αPn;n=0,1,…,N-1} 是各权重,这样{α0n1n+,…,+αPn=1;n=0,1,…,N-1}。
随后,使用 任何上述VQ技术将目标量化矢量UM量化为
经量化的LSI矢量如下计算 L ^ M { L ^ M n = α 0 n U ^ M n + α 1 n U ^ M - 1 n + . . . . + α P n U ^ M - P n ; n = 0.1 . . . . N - 1 } . . . . . . ( 2 ) ]]>MA预测方案需要过去P帧的码本表项, { U ^ M - 1 , U ^ M - 2 , · · · , U ^ M - P } ]]>,的 过去值的存在。
而码本表项对于那些使用MA方案进行自身量化的帧(在过去P 帧中)是自动可供使用的,过去P帧的剩余帧可以使用基于非MA预测VQ方法 来进行量化,并且其相应的码本表项 对于这些帧是不能直接使用的。
这就 使得混合或交织上述两种VQ方法变得很困难。
在结合图7所述的实施例中,下述公式最适用于计算在K∈{1,2,…, P}其中码本标项 没有明示可用的情况下的码本表项 的估值 U ^ ~ M - K { U ^ ~ M - K n = ( L ^ M - K n - β 1 n U ^ M - K - 1 n - β 2 n U ^ M - K - 2 n - . . . . - β R n U ^ M - K - P n ) β 0 n ; n = 0.1 . . . . N - 1 } ( 3 ) ]]>其中{β1n,β2n,…,βPn;n=0,1,…,N-1}是各权重使得{β0n1n+,…,+βPn=1;n=0,1,…,N-1},并且具有初始条件 { U ^ ~ - 1 , U ^ ~ - 2 , · · · , U ^ ~ - P } ]]>
一 种示范初始条件为 { U ^ ~ - 1 = U ^ ~ - 2 = , · · · , = U ^ ~ - P = L B } ]]>,其中LB是LSI参量的 偏差值。
下述是权重的示范集合: 在图7流程图的步骤500,语音编码器判定是否用基于MA预测VQ的技术 来量化输入LSI矢量LM
该判决最好依据帧的语音内容。
例如,用于平稳有 声帧的LSI参量量化为最有利于基于MA预测VQ的方法,而用于无声帧和过 渡帧的LSI参量量化为最有利于基于非MA预测VQ的方法。
如果语音编码器 确定用基于MA预测VQ的技术来量化输入LSI矢量LM,语音编码器就进入步 骤502。
另一方面,如果语音编码器确定不用基于MA预测VQ的技术来量化输 入LSI矢量LM,语音编码器就进入步骤504。
在步骤502中,语音编码器根据上述公式(1)计算用于量化的目标UM
随后,语音编码器进入步骤506。
在步骤506中,语音编码器根据任何各种通 常为本领域所知的VQ技术来对目标UM量化。
随后,语音编码器进入步骤508。
在步骤508中,语音编码器根据上述公式(2)从经量化的目标 中计算经量化 的LSI参数的矢量 在步骤504中,语音编码器根据任何各种通常为本领域所知的基于非MA 预测VQ技术来对目标UM量化。
(如本领域熟练技术人员所知,在基于非MA预 测VQ技术中用于量化的目标矢量为LM,而不是UM
)随后语音编码器进入 步骤510。
在步骤510中,语音编码器根据上述公式(3)从经量化的LSI参数 的矢量 中计算等效的MA码矢量 在步骤512中,语音编码器使用在步骤506中获得的已量化目标 以及 在步骤510获得的等效MA码矢量 来更新过去P帧MA码本矢量的存储值。
随后,将已更新的过去P帧MA码本矢量的存储值用于步骤502来计算用于后 继帧输入LSI矢量LM+1量化的目标UM
这样,就揭示了一种用于交织语音编码器中线性谱信息量化方法的新颖方 法和设备。
本领域的熟练技术人员应该理解,此处所揭示的与实施例有关的各种 说明逻辑块和算法步骤可以由数字信号处理器(DSP)、专用集成电路(ASIC)、离散 门或晶体管逻辑、离散硬件部件例如寄存器和FIFO、执行一组固件指令的处理器 或任何传统可编程软件模块和处理器,来实现或执行。
该处理器最好是微处理器, 但作为替代,该处理器也可以是任何传统处理器、控制器、微控制器或状态机。
软件模块可以驻留在RAM存储器、快闪存储器、寄存器或任何本领域已知的可 写入存储媒体的其他形式中。
本领域的熟练技术人员可以进一步理解,在上 述整个描述中提到的数据、指令、命令、信息、信号、位、字符和码片最好 由电压、电流、电磁波、磁场或粒子、光场或粒子或其任意组合来表示。
本发明的较佳实施例已经示出并讨论。
对于本领域普通技术人员来说, 在不背离本发明的精神和范畴的情况下,很明显可以对此处揭示的实施例做 出许多改动。
因而,本发明仅局限于下述权利要求。
展开

查看更多专利详情信息请先登录或注册会员

相关专利类别推荐

获取手机验证码,即可注册成为会员

专利详情咨询

咨询内容

姓名

手机

验证码

用户登录

手机号

手机验证码

提示

不能再减了!!!

提交成功

八月瓜客服中心已经收到您的信息,正在为您派遣知识产权顾问。知识产权顾问会携带贴心的服务以闪电搬的速度与您联系。

扫一扫关注八月瓜微信 创业一手掌握