八月瓜首页 > 专利查询 > >正文

音频编码

基本信息

  • 申请号 CN00810431.X 
  • 公开号 CN1377500A 
  • 申请日 2000/05/17 
  • 公开日 2002/10/30 
  • 申请人 皇家菲利浦电子有限公司  
  • 优先权日期  
  • 发明人 A·C·登布林克 A·W·J·奥门  
  • 主分类号  
  • 申请人地址 荷兰艾恩德霍芬 
  • 分类号  
  • 专利代理机构 中国专利代理(香港)有限公司 
  • 当前专利状态 发明专利申请公布 
  • 代理人 陈霁 
  • 有效性 失效 
  • 法律状态 失效
  •  

摘要

提供了对音频信号(A)的编码(2),其中确定(200)在音频信号(A)内的基本波形,通过音频信号(A)减去(21)基本波形而获得(21)噪声成分(S);通过确定自动回归和运动平均参数(p展开

权利要求书


1.一种对音频信号(A)进行编码(2)的方法,其包括以下步骤: 测定(200)音频信号(A)内的基本波形; 通过音频信号(A)减去(21)基本波形而获得(21)噪声成分(S); 通过确定自动回归和运动平均参数(pi,qi)而模型化(22)噪声成分(S) 的波谱;以及 把自动回归和运动平均参数(pi,qi)以及代表基本波形的波形参数(Ci) 包括(23)在编码的音频信号(A′)内。

2.一种对音频信号(A′)进行解码(4)的方法,其包括以下步骤: 接收(40)编码的音频信号(A′),所述编码的音频信号(A′)包括代表 基本波形的波形参数(Ci)以及代表剩余噪声成分的自动回归和运动平均参数 (pi,qi); 过滤(41)白噪声信号(y)以获得重构噪声成分(S′),所述过滤是通过 自动回归pi和运动平均参数qi确定的; 合成(42)基于波形参数(Ci)的基本波形成分;以及 把重构噪声成分(S′)加入到合成的基本波形,以便获得解码的音频信号 (A″)。

3.一种音频编码器(2),其包括 装置(200),用于确定音频信号(A)内的基本波形; 装置(21),通过音频信号(A)减去(21)基本波形,用于从音频信号 (A)内获得噪声成分(S); 装置(22),通过确定自动回归和运动平均参数(pi,qi),用于模型化噪声 成分(S)的波谱;以及 装置(23),用于把自动回归和运动平均参数(pi,qi)以及代表基本波形的 波形参数(Ci)包括在编码的音频信号(A′)内。

4.一种音频播放器(4),其包括: 装置(40),用于接收(40)编码音频信号(A′),该编码的音频信号(A′) 包括代表基本波形的波形参数(Ci)以及代表剩余噪声成分的自动回归和运动 平均参数(pi,qi); 装置(41),用于过滤白噪声信号(y)以获得重构噪声成分(S′),所述 过滤是通过自动回归pi和运动平均参数qi确定的; 装置(42),用于合成基于波形参数(Ci)的基本波形成分;以及 装置(43),用于把重构噪声成分(S′)加入到合成的基本波形,以便获 得解码的音频信号(A″)。

5.一种音频系统,其包括如权利要求3所述的音频编码器(2)和如权利要 求4所述的音频播放器(4)。

6.一种编码的音频信号(A′),其包括: 代表基本波形的波形参数(Ci); 代表剩余噪声成分(S)的自动回归和运动平均参数(pi,qi)。

7.一种存储介质,在该介质上存储有权利要求6所述的编码的音频信号(A′)。
展开

说明书

本发明涉及音频编码。
WO97/28527公开了通过下述方式来提高语音参数:测定背景噪声PSD估 计量,测定噪声语音参数,测定来自语音参数的噪声语音PSD估计量,扣除噪 声语音PSD估计量中背景噪声PSD估计量,以及对来自增强的语音PSD估计量 的增强语音参数进行估计。
该增强参数可以用于过滤噪声语音,以便抑制噪声 或直接用作语音编码中的语音参数。
参数和PSD估计通过自动回归模型而获得。
应 注意到:在该文献中,这种估计量不是统计一致的估计量,但是在语音信号处 理中这并不是一个严重问题。
本发明的目的是提供有益的音频编码。
为实现此目的,正如独立 所限定的是,本发明提供对音频信号进行编码/解码的方法、音频编码器、音频 播放器、音频系统、编码的音频信号和存储媒质。
在从属权利要求中对有益的 实施例进行了限定。
根据本发明的第一方面,参数ARMA模型用于模型化音频信号中的噪声成 分,所述噪声成分是通过从音频信号中减去基本波形而获得的。
通常,音频信 号可以包括音频,例如音乐,而且也包括语音。
根据本发明,噪声成分的AR MA模型有另外的优点:在可相比拟的精确度下,对于噪声成分的精确模型来 说,其需要的参数比全AR或MA模型的情形要少。
特别是,较少的参数意味着 更好的抑制。
本发明使用适合于实时实施的ARMA估算模型。
本发明认识到:在传递功 率谱估算信息方面,AR或MA模型并不总是足够精确或节俭的。
在对数标度上, 利用线性预报编码(LPC)方法(全极点模型(all-pole modeling)),通常能很 好地模型化函数的波峰,但是波谷却估算不足。
相反的情况发生在全零点模型 (all-zero model)上。
在音频和语音编码中,对数标度比线性标度更合适。
因 此,在对数标度上对于功率谱的好拟合是优选的。
根据本发明的模型给出了复 杂度和精确度之间更好的折衷方案。
该模型中的误差能够在对数标度上进行计 算。
在本发明的第一实施例中,将模型化的波谱分解成第一部分和第二部分, 其中第一部分通过第一模型而模型化,以便获得自动回归参数,第二部分通过 第二模型而模型化,以便获得运动平均(moving-average)参数。
这些分支过 程的结合便提供了精确的ARMA模型。
分解优选在迭代过程中执行。
在根据本 发明的方法中,可能忽略非线性最优化问题。
在本发明的优选实施例中,第二模型操作包括对目标波谱第二部分的倒数 使用第一模型操作的步骤。
在该实施例中,仅需要确定一个模型操作,其中自 动回归参数通过波谱的第一部分模型化而获得,运动平均参数按照相同的方式, 即第一模型操作,通过波谱的第二部分的倒数模型化而获得。
尽管是次优选, 但是使用第二模型操作以及对于波谱的一部分的倒数使用相同的第二模型操作 以获得自动回归参数也是可能的,第二模型操作在第二部分产生运动平均参数。
Introduction to Spectral analysis(波谱分析介绍)第101-108页(P.Stoica和R.L .Moses,Prentice Hall,New Jersey,1997)公开了用于模型化合理波谱的参数方 法。
通常,通过使用全零点过滤器过滤白噪声而获得运动平均(MA)信号。
由于该全零点结构,除非选择的MA的阶“足够大”,否则使用MA公式来模型 化带有尖峰的波谱是不可能的。
这势必与自动回归(AR)的能力、或者全极 点(all-pole)以及通过其阶相当小的模型来模型化窄波段谱的公式相反。
MA 模型对具有宽峰和窄哑点(sharp null)特征的这些波谱提供了很好的近似。
波 谱的应用没有窄波段谱频繁,因此,把MA信号模型用于波谱估计时,在某种 程度上工程有益效果是有限的。
该有限的有益效果的另一个原因在于,MA参 数估算问题基本上是非线性的问题,该问题比AR参数估算问题更加难以解决。
在任何情形下,在MA和ARMA的估算问题上的各种困难是相当类似的。
既带有尖峰又带有深零位(deep null)的波谱不能够通过合理的小阶AR 或MA公式而模型化。
只有在更普遍的ARMA模型(也称为极点-零点(pole-zer o)模型)下才是可用的。
然而ARMA波谱估算最初巨大的前景逐渐减小到某 种程度,因为对于ARMA参数估算,无论是从在理论上还是从在实践观点上来 说,都还没有建立很好的算法。
“理论最优化ARMA估计量(estimator)”建立 在迭代过程的基础上,但不能保证该迭代过程的整体收敛。
“实际ARMA估计 量”是容易计算的并且通常是可靠的,但是在某些情况下它们的统计精确度可 能很低。
现有技术公开了两级(two stage)模型,在该模型中,首先执行AR 估算,然后执行MA估算。
两种方式都能给出非精确的估计值或者都需要庞大 的计算工作量。
在这些情况下,ARMA模型描述的极点和零点在单位圆附近的 位置紧密地靠近在一起。
这些ARMA模型具有几乎重合的极点和零点模,并且 与窄波段信号对应。
在两种方法中,对零点(zero)的估算转移到非线性最优 化问题上来。
在根据Stoica和Moses的现有技术方法中,计算负担存在于矩阵求逆。
另外,除 了对靠近单位圆的零点阶需高一点外,AR模型的阶应该设置为哪一个值还不 清楚。
因此计算的复杂度很难把握。
在根据本发明的方法中,计算负担存在于分 解过程的迭代性质和向频域的转换(Stoica和Moses基本上在时域进行计算)。
在零点接近单位圆的情况下,本发明提供了更好的结果。
而且,向频域的转换 打开了变化的可能性。
一个例子是基于现有或测量数据产生分裂的频率。
另一 优点是下面将要解释的弯曲(warped)频率数据的应用。
为了保证实时ARMA 模型,应采用向频率的快速转化,例如,本领域公知的Welch的平均频率图方 法。
自动回归和运动平均参数能够以不同的方式表达,例如多项式,多项式(与 增益系数一起)的零点,反射系数或对数(log)(面积)比值。
在音频编码应 用中,优选以对数(面积)比值的方式进行自动回归和运动平均参数的表达。
在 根据本发明的ARMA模型中结合测定的自动回归和运动平均参数以获得透射的 过滤参数。
US5943429A公开了基于数字通讯系统帧内的波谱减法噪声抑制方法。
该 方法通过波谱减法函数执行,该减法函数建立在非语音帧的背景噪声功率谱密 度估算和语音结构功率谱密度估算的基础上。
通过参数模型近似每一语音帧, 该参数模型减少了自由度的位数。
从近似参数模型估算每一语音帧的功率谱密 度的估计值。
同样在该情形下,参数模型为AR模型。
US4188667A公开了ARMA过滤器和获得该过滤器参数的方法。
该方法的 第一步涉及执行随机选择频谱振幅的离散逆傅立叶变换,以获得稳定的纯运动 平均模型系数的舍位结果,即非递推过滤器模型参数。
系数的舍位结果具有N+ 1项(term),接着该结果由随机结果用于卷积(convolve)运算以获得与随机 结果相关的输出。
接着以最小化整数误差函数规范的方式来执行时域、收敛参 数标识,从而获得模型接近最小阶的自动回归和运动平均参数,该模型具有所 需的振幅和相位-频率响应。
这些参数在离线时确定。
该实施例的目的是提供最 小的或接近最小的稳定ARMA过滤器。
该参数以成批过滤器程序方式确定。
通常,对功率谱密度函数估算不同于特征化线性系统,特别是这样的特征: 可以得到和使用输入和输出信号,而在估算功率谱密度函数时,仅功率谱密度 函数是可得到的(不是相关的输入函数)。
本发明的前述和其它方面将从下述的实施例及实施例的解释而变得清清楚 楚 在附图中: 图1表示包括根据本发明的音频编码器示意性的实施例; 图2表示包括根据本发明的音频播放器示意性的实施例; 图3表示根据本发明的音频系统的示意性实施例;以及 图4表示示例性的映射函数m。
这些附图仅表示出理解发明所需的那些元件。
本发明优选地应用在音频和语音编码方案中,在该方案中利用了合成噪声 的产生,一般地,在逐帧(frame to frame)的基础上对音频信号进行编码。
估 算帧中的噪声功率谱密度函数(或者其可能的非均匀采样版本),找出来自某 等级过滤器的一类振幅平方响应最接近的函数。
在本发明的一个实施例中,使 用迭代程序来估算ARMA模型,以便AR或MA模型符合功率谱函数,所述AR MA模型以现存的低复杂度技术为基础。
图1表示根据本发明示例性的音频编码器2。
从音频源(例如麦克风、存储 介质、网络等)获得音频信号A。
把音频信号A输入到音频编码器2。
在音频编 码器2内在逐帧的基础上参数模型化音频信号A。
编码单元20包括分析单元(A U)200和合成单元(SU)201。
AU 200分析音频信号并确定音频信号A内的基 本波形。
此外,AU 200产生波形参数或系数CI来表达基本波形。
波形参数Ci提 供给SU 201以获得重构音频信号,该信号包括合成的基本波形。
该重构的音频 信号提供到减法器21,以从原始的音频信号A减去该重构的音频信号。
其余的 信号S看作音频信号A的噪声成分。
在优选实施例中,编码单元20包括两级:执 行瞬时模型化的一级,以及当减去模型化的瞬时分量后对音频信号执行正弦模 型化的另一级。
根据本发明的一方面,在音频信号A内的噪声成分S的功率谱密度函数被A RMA模型化,从而产生自动回归参数pi和运动平均参数qi
根据本发明,在噪 声分析器(NA)22内模型化噪声成分S的波谱,从而获得过滤器参数(pi,qi)。
通过确定NA 22内过滤器的过滤器参数而执行参数(pi,qi)的估计值,NA 22 具有转移函数H-1,在过滤后其生成函数S,即H-1(S),波谱过滤得尽可能扁平, 即“白噪声化频谱”。
在解码器内,通过利用具有转移函数H的过滤器过滤白 噪声,从而能够生成重构噪声成分,其和噪声成分S具有近似相同的特性,该 过滤器与编码器内使用的过滤器相反。
该相反过滤器的过滤操作通过ARMA参 数pi和qi确定。
过滤器参数(pi,qi)同波形参数Ci一起都包括在放大器23中编码 的音频信号A′内。
把音频流A′从音频编码器通过通讯频道3提供到音频播放器, 所述通讯频道3可以是无线连接、数据总线或存储介质等。
参见图2的实施例,其包括根据本发明的音频播放器4。
音频信号A′从通讯 频道3获得并在多路解码器40内进行多路解码,以便获得包括在编码的音频信 号A′内的参数(pi,qi)和Ci
参数(pi,qi)提供给噪声合成器(NS)41。
该NS 4 1主要是带有转移函数H的过滤器。
白噪声信号y输入到NS 4。
通过ARMA参数 (pi,qi)确定NS 41的过滤操作。
通过NS 41过滤白噪声y,噪声成分S′就产生了,NS 41与编码器2内使用的过滤器(NA)22相反,噪声成分S′与原始音频信号A内的噪 声成分S具有相同的随机特性。
噪声成分S′加入到加法器43中的其它重构成分而 获得重构的音频信号(A″),例如所述重构成分从合成单元(SU)获得。
SU 4 2类似于SU 201。
重构音频信号A″提供到输出设备5,其可以是扬声器等。
图3表示根据本发明的音频系统,其包括如图1所示的音频编码器2和如图2 所示的音频播放器4。
这种系统提供了播放和记录设备。
通讯频道3可以为音频 系统的一部分,但是通常位于音频系统的外部。
在通讯频道3为存储介质的情 况下,可以把存储介质固定在系统内,存储介质为可拆卸的圆盘、存储棒、条 等。
下面,将进一步描述S波谱的模型化。
假定S是离散时间真值函数的功率 谱密度函数。
另外,S是在区间I=(-π,π)上确定的真值函数。
假设S是对称 的,其中min(S)>0,max(S)<∝。
为了方便起见,假设S的对数平均值等于0,即: 公式: 1 2 π I ln S ( θ ) = 0 ]]>对于对数标度上的平均值不等于0的情况,延伸是直线向前的,但是能够 以各种方式处理该延伸。
注意:S通过合适的内插法和归一化从实际测量的功 率谱密度函数的试样派生而来。
根据H=B/A,其中 ,让H成为一个 合理的转移函数。
这里,pi和qi分别是转移函数H的极点和零点。
注意:|H|2的 对数平均值也等于0。
目标函数通过H模的平方近似得出,即S≈|H|2
校正近似值的测量通过下式引入: 公式: J = 1 2 π I 1 2 ( ln S - ln | H | 2 ) 2 - - - - - ( 2 ) ]]>判别式(2)能够改写成: 公式: J = 1 2 π I ln ( S / | H | 2 ) + 1 2 ( ln ( S / | H | 2 ) ) 2 - - - - - ( 3 ) ]]>考虑到以下事实:S和|H|2的对数平均值都为0,如果进一步,对每一个θ 值,有S(θ)/|H(ejv|2≈1,判别式(2)通过J′-1来近似,其中 公式: J = 1 2 π I S | H | 2 - - - - - ( 4 ) ]]>这意味着在优化解法的领域内判别式(2)和(4)实际上是相等的。
众所周知,在H=1/A(即B=1)的情况下,(4)与前向线性预测(FLP) 相关,FLP为LPC方法的一个例子。
因此,多项式A通过计算(或至少近似) 自动相关性函数以及解Wiener-Hopf方程式而被找到,该自动相关性函数与S相 关。
该程序的定量结果也是公知的。
上述概略的程序将给出S波峰很好的近似 (当在对数标度上测量或目测时),但是对S波谷通常却仅提供很差的拟合。
总 之,用于估算全极点模型的标准程序是可从功率谱密度函数得出的,该函数通 过(2)提供了优化解法的一种近似并且对模型化S波峰来说基本上是很好的。
应该注意到,lnS的波峰和波谷基本上具有相同的特性,除了信号反向外: 波峰为正偏移,而波谷为负偏移。
因此,取□=1/S,则能够通过上述概略的用 于全极点模型的程序估算全零点模型。
从该程序的结果,预料能够得到S波谷 好的拟合,但是对S波峰的拟合却仅仅很差或至多一般。
本发明的目的是为S的波峰和波谷提供良好的表达式。
在本发明的实施例 中,提供了ARMA模型,在该模型中全极点和全零点模型以下列方式结合。
S 被分成两部分,即S=SA/SB
从SA估算全极点模型以产生多项式A,从SB估算全 零点模型以产生多项式B。
结合式|H|2=|B|2/|A|2被认为是S的一个近似。
根据本发明的优选方面,在迭代过程中执行S的分解。
迭代步骤称为1。
在 迭代的每一步骤,产生新的分解SA,1和SB,1,并且计算相应的估计值A1和B1
以SA和SB中给定S的分支开始,然后SB的不能够被精确模型化的部分被归于SA,反 之亦然。
在迭代方案的步骤1-1,H1-1=B1-1/A1-1
此后,考虑部分函数SA,1=S/|B1-1|2和SB,1=1/S|A1-1|2
通过该方式,通过提供给SB,排除S中那些能够被全极点模型 精确模型化的部分。
类似的,从SA中排除S的那些能够被全零过滤器模型化的 部分。
从SA,1和SB,1估计函数A1和B1
通过这种方式,交换前面的迭代中不能够被 合理模型化的部分。
下一步,优选的是,考虑下面四个可能的组合: G0=B1-1/A1-1             G1=B1-1/A1G2=B1/A1-1               G3=B1/A1对这4个候选的过滤器的S最佳的拟合被定义成误差最小的拟合,相关的过 滤器是步骤1的最终结果。
优选地,以对数判别式为基础把H1(以及因此得到的A1和 B1)选择为候选Gi最好的,其中i=0,1,2,3,所述对数判别式依据: 公式: H 1 = arg min G 1 1 2 π I ( ln S - ln | G i | 2 ) 2 - - - - - ( 5 ) ]]>从此,步骤已经进行到1+1步,取SA,1+1=S/|B1|2和SB,1+1=1/S|A1|2
可以使用任何普通的终止步骤,例如迭代的最大位数,当前估算的足够精 度或者从一步到另一步时不足的进度(progress)。
可替代地,稍微不同的步骤执行AR或MA模型化。
如果先前步骤回到计算 量B1-1的精确估计值,则 SA,1=S/|B1-1|2并计算A1
把B1看作B1-1
如果先前步骤回到计算量A1-1的精确估计值,则 SB,1=1/S|A1-1|2并计算B1
把A1看作A1-1
从A1和B1,建成H1并计算误差(例如在对数标度上的均方差)。
初始化迭代方案的替代方案很多。
下述提汲多个可能性,但并不是作为限 制。
首先,通过取SA,0=S,SB,0=1以及SA,0=1,1/SB,0=S提供初始化的简单方式。
下一步,计算A0和B0,从这两个初始的估计值,选择最好的拟合(根据某些规 则)。
通过该方式,第一次猜测或为全极点模型或为全零点模型。
第二步,根据 ,S可以被分成相等的两部分。
第三步,因为SA应包括波峰,SB应包括波谷,所以合适的分解是把平均对 数级之上(例如0以上)的任何事归于SA,0以及把低于该级的任何事情归于SB,0
可以在整体对数平均值下进行该分解,但是也可以在某些局部对数平均值下进 行。
第四步,考虑进一步的分解过程:在以对数标度为基础的功率谱函数内, 靠近单位圆的极点和零点分别产生了显著了波峰和波谷。
对数据S的分解依据 以下意图,全极点和全零点模型更适合于处理logS内的波峰和波谷。
定义: P=logS PA=logSAPB=logSB考虑到映射函数m,其中m: →[-1,1]。
考虑到对数标度上极点和零点特 征的对称,映射函数将通常为非递减的点对称S形曲线函数。
然而,也能够使 用非对称函数,其具有对极点或零点模型给出了更多加权的影响。
图4示出了 示例性的映射函数。
考虑下面的初始分解: 公式: P A = 1 + m ( P ) 2 P ]]>公式: P B = - 1 - m ( P ) 2 P ]]>通过该方式,P的正偏移(波峰)被显著地归于PA,从而,通过全极点过 滤器而模型化。
P的负偏移(波谷)被主要地归于PB,因此,通过全零点过滤 器而模型化。
从PA和PB,建构SA和SB,并且计算下一个A0和B0
m有两种约束情形(这类似于上面讨论的第二和第三初始化): m=0,则 S A , 0 = 1 / S B , 0 = S ]]>m为正负号函数:(公式) 在这种情况下: 公式: 公式: 建议的波谱模型非常适合于波峰和波谷的模型化,因为,基本上这些构成 了由极点和零点提供的自由度产生的图形。
因此,该程序对溢出值(outlier) 很灵敏:这些值将以近似出现,而不是平滑。
因此,输入数据S必须是精确的 估计值(在标准偏差和平均值每频率样品的小比率的意义上来说)或者S必须 是预处理的(例如平滑的),以便抑制对不想要溢出值的模型化。
如果在模型 中的自由度数目相对于作为功率谱密度函数基础的数据点数目很大的话,则尤 其要保持该观察值。
对实际最优化步骤A和B及选择规范没有认识的话是不能建立收敛的。
不 能够保证在迭代过程的每一步都能减小误差。
在多种情况下,对数定标的频率轴上功率谱密度函数需要有好的近似。
例 如,对视觉上以Bode曲线形式存在的波谱上合适结果进行估算是一种惯例。
类 似的是,对于音频和语音应用来说,优选的等级将是Bark或者Equivalent Recta ngular Bandwidth(等效矩形带宽)(ERB)等级,其大致为对数标度。
根据本发 明的方法适合于频率弯曲模型。
无论如何,能够在任何振荡栅(frequency grid) 上计算波谱密度的大小。
在频率弯曲接近于第一阶全通区的频率弯曲的条件下 以及保持ARMA模型等级的同时,这能够被重新弯曲。
应该注意到,上述实施例不是对本发明的限制,本领域普通技术人员能够 设计出多种替代实施例而且不超出所附权利要求的范围。
在这些权利要求中, 括号内的任何参考标记不应构成对发明的限制。
单词“包括”并不排除列于权 利要求之外的其它元件或步骤的出现。
本发明能够通过硬件的方式以及合适的 程控计算机而完成,所述硬件包括几个明显的元件。
在装置权利要求中列举了 几个设备,这些设备中的其中几个能够通过一个设备或硬件的相同部件体现。
纯粹的事实是,某些手段在相互不同的从属权利要求中被引用,该事实并不表 明这些手段的结合不能被用来产生益处。
总之,提供了对音频信号的编码,其中测定音频信号中的基本波形,噪声 成分通过音频信号减去基本波形而得到,噪声成分的波谱通过确定自动回归和 运动平均参数而模拟,以及自动回归和运动平均参数与代表基本波形的波形参 数一起被包括在编码的音频信号中。
展开

查看更多专利详情信息请先登录或注册会员

相关专利类别推荐

获取手机验证码,即可注册成为会员

专利详情咨询

咨询内容

姓名

手机

验证码

用户登录

手机号

手机验证码

提示

不能再减了!!!

提交成功

八月瓜客服中心已经收到您的信息,正在为您派遣知识产权顾问。知识产权顾问会携带贴心的服务以闪电搬的速度与您联系。

扫一扫关注八月瓜微信 创业一手掌握