CN102089810B - 多基准线性预测系数滤波器量化和逆量化设备及方法 - Google Patents
多基准线性预测系数滤波器量化和逆量化设备及方法 Download PDFInfo
- Publication number
- CN102089810B CN102089810B CN2009801267267A CN200980126726A CN102089810B CN 102089810 B CN102089810 B CN 102089810B CN 2009801267267 A CN2009801267267 A CN 2009801267267A CN 200980126726 A CN200980126726 A CN 200980126726A CN 102089810 B CN102089810 B CN 102089810B
- Authority
- CN
- China
- Prior art keywords
- wave filter
- benchmark
- lpc wave
- lpc
- quantification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/3082—Vector coding
Abstract
一种多基准量化设备和用于量化输入的LPC滤波器的方法,包括:使用相应的不同基准的多个差分量化器;以及使用基准选择标准在差分量化器的不同基准之中选择基准的选择器。差分量化器使用所选择的基准来将输入的LPC滤波器差分量化。一种用于将从比特流提取的多基准差分量化的LPC滤波器逆量化的设备和方法,包括:提取器,从比特流提取关于多个可能基准之中用于量化所述多基准差分量化的LPC滤波器的基准的信息;以及差分逆量化器,用于使用与所提取的基准信息相对应的基准将所述多基准差分量化的LPC滤波器逆量化。
Description
技术领域
本发明涉及例如音频信号的声音信号的编码和解码。更具体地,本发明涉及多基准LPC(线性预测系数)滤波器(filter)量化和逆量化设备及方法。
背景技术
在诸如远程会议、多媒体和无线通信之类的各种应用领域中,对于在主观质量和比特率之间具有良好权衡的高效的数字语音和音频编码技术的需求正在增长。
语音编码器将语音信号转换为数字比特流,该数字比特流经由通信信道发送或者被存储在存储介质中。要编码的语音信号被数字化,即,被采样并且例如每个样本使用16比特而被量化。语音编码器的挑战是利用数目较少的比特来表示数字样本,同时保持良好的主观语音质量。语音解码器或合成器将所发送或存储的比特流转换回声音信号。
码激励线性预测(Code-Excited Linear Prediction)(CELP)编码是用于实现主观质量和比特率之间的良好折衷的最佳技术之一。CELP编码技术是在无线应用和有线应用二者中的若干语音编码标准的基础。在CELP编码中,将语音信号采样,并且在通常被称为帧的L个样本的连续块中被处理,其中L是典型地对应于10-30ms的语音的样本的预定数目。对于每个帧计算并发送线性预测滤波器(filter);LP滤波器也被称为LPC(线性预测系数)滤波器。LPC滤波器的计算典型地使用预见(lookahead),例如来自后续帧的5-15ms的语音片段。L个样本的帧被划分为称为子帧的更小的块。在每个子帧中,通常从两个分量(过去的激励和创新的固定码本激励)获得激励信号。过去的激励常被称为自适应码本或音质(pitch)码本激励。表征激励信号的参数被编码和发送给解码器,在解码器中,所述激励信号被重建并且被用作LPC滤波器的输入。
在诸如多媒体流式发送和广播的应用中,可能需要以低比特率编码语音、音乐和混合内容。为了该目的,开发了编码模型,其将针对语音信号优化的CELP编码与针对音频信号优化的变换编码相组合。这种模型的示例是AMR-WB+[1],其在CELP和TCX(变换编码激励)之间切换。为了提高音乐和混合内容的质量,使用长延迟以供变换域中的更精细的频率分辨率使用。在AMR-WB+中,使用所谓的超帧,其由4个CELP帧(典型为80ms)构成。
尽管在AMR-WB+中每4个帧发送一次CELP编码参数,但是在每个帧中分别执行LPC滤波器的量化。此外,在CELP帧的情况下,对于每个帧利用固定数目的比特来量化LPC滤波器。
为了克服上述缺点,需要一种使用LPC滤波器的可变比特率量化来减小在LPC滤波器的量化中涉及的比特数目的技术。此外,这种技术将与语音或音频编码模型相关,所述语音或音频编码模型使用超帧和多模式结构两者,例如AMR-WB+[1]和在MPEG中正在开发的USAC。
发明内容
根据本发明的第一方面,提供了一种用于量化输入的LPC滤波器的多基准量化设备,包括:使用相应的不同基准(reference)的多个差分量化器;以及用于使用基准选择标准在差分量化器的不同基准之中选择基准的部件。差分量化器使用所选择的基准对输入的LPC滤波器进行差分量化。
根据本发明的第二方面,提供了一种用于量化输入的LPC滤波器的多基准量化方法,包括:提供使用相应的不同基准的多个差分量化器;使用基准选择标准在不同基准之中选择基准;以及利用差分量化器使用所选择的基准来对输入的LPC滤波器进行量化。
根据本发明的第三方面,提供了一种用于对从比特流提取的多基准差分量化的LPC滤波器进行逆量化的设备,包括:用于从比特流提取关于多个可能的基准之中用于量化所述多基准差分量化的LPC滤波器的基准的信息的部件;以及用于使用与所提取的基准信息相对应的基准来对所述多基准差分量化的LPC滤波器进行逆量化的部件。
根据本发明的第四方面,提供了一种用于对从比特流提取的多基准差分量化的LPC滤波器进行逆量化的方法,包括:从比特流提取关于多个可能的基准之中用于量化所述多基准差分量化的LPC滤波器的基准的信息;以及使用与所提取的基准信息相对应的基准来对所述多基准差分量化的LPC滤波器进行逆量化。
当参照附图阅读对仅作为示例给出的本发明的说明性实施例的以下非限制性描述时,本发明的前述和其它目的、优点和特征将变得更加清楚。
附图说明
在附图中:
图1是图示绝对和多基准差分LPC滤波器量化器和量化方法的框图;
图2是图示开环量化方案的示意图;
图3是图示在超帧中使用并发送四个(4个)LPC滤波器的配置中确定要发送的LPC滤波器的设备和方法的流程图。
图4a是当在基于LPC的编解码器中对于每个帧(或超帧)估计一个LPC滤波器时的典型的LPC分析窗口和典型的LPC分析中心位置,其中,LPC0对应于在前一帧(或超帧)期间计算的最后的LPC滤波器;
图4b是当在基于LPC的编解码器中对于每个帧(或超帧)估计四个(4个)LPC滤波器时的典型的LPC分析窗口,其中LPC分析窗口中心在帧的末尾处;
图5是图示环外量化方案的示例的流程图;
图6是加权的代数LPC量化器和量化方法的示意框图;
图7是加权的代数LPC逆量化器和逆量化方法的示意框图;
图8是量化器和量化方法的示意框图;以及
图9是解码器和解码方法的示意框图。
具体实施方式
选择可能的基准的差分量化
使用在若干可能的基准之间选择的差分量化。更具体地,相对于若干可能的基准而对LPC滤波器进行差分量化。
已知连续的LPC滤波器呈现某种程度的相关性。为了利用该相关性,LPC量化器通常使用预测。作为直接量化表示LPC滤波器的线性预测系数的向量(LPC向量)的替代,差分(或预测)量化器首先计算该LPC向量的预测值,然后将原始LPC向量和预测的LPC向量之间的差(常常被称为预测残差(residual))量化。
预测通常基于LPC滤波器的先前值。常常使用两种类型的预测器(predictor):移动平均(MA)预测器和自回归(AR)预测器。尽管与MA预测器相比AR预测器在减小要量化的数据的L2-范数(均方)上常常效率更高,但是因为在传输错误的情况下MA预测器比较不易于传播错误,因此MA预测器有时是有用的[2]。
由于预测残差的L2-范数平均低于原始LPC向量的L2-范数(二者之间的比率取决于LPC滤波器的可预测程度),因此差分(或预测)量化器可以在更低的比特率上取得与绝对量化器相同程度的性能。
平均地,在减小要量化的数据的L2-范数上,预测确实高效。然而,这种行为不是恒定的;与过渡区段(segment)期间相比,在信号的稳定区段期间预测高效得多。当LPC滤波器快速改变时,预测甚至可以导致增大的L2-范数值。可以通过考虑两个不同的预测器来取得一些性能提高,一个预测器用于高预测性区段,另一个预测器用于低预测性区段[3,4]。如上面的描述所提到的,该技术只使用LPC滤波器的过去的值。
为了克服这一问题,提出相对于在多个可能的基准中选择的基准(例如基准滤波器)来对LPC滤波器进行差分量化。可能的基准滤波器是已经被量化的过去的或者未来的LPC滤波器(因此与在编码器处一样可以在解码器处获得)、或者是应用到已经被量化的过去的或者未来的LPC滤波器的各种外插或内插操作的结果。选择在给定速率上提供较低失真或者对于给定的目标失真水平提供较低比特率的基准滤波器。
图1是图示多基准LPC滤波器量化设备和方法的框图。由线性预测系数的向量表示的给定的LPC滤波器101被输入到该多基准LPC滤波器量化设备和方法中。输入的LPC滤波器10相对于在多个可能的基准1、2、...、n中选择的基准而被差分量化。可能的基准包括:
-过去或未来的量化的LPC滤波器;
-应用于过去或未来的量化的LPC滤波器的外插或内插操作的结果;或
-在编码器和解码器二者处可以获得的任何量化值。
作为非限制示例,可以相对于先前的量化的LPC滤波器、随后的量化的LPC滤波器、或者先前的量化的LPC滤波器和随后的量化的LPC滤波器这两者的平均值而差分量化输入的LPC滤波器101。基准也可以是使用绝对量化器量化的LPC滤波器,或者是应用到已经量化的LPC滤波器的任何种类的内插、外插或预测(AR或MA)的结果。
操作102和1031、1032、...、103n:仍然参照图1,将输入的LPC滤波器101提供给绝对量化器(操作102)和差分量化器(操作1031、1032、...、103n)。绝对量化器(操作102)将输入的LPC滤波器101的绝对值(不是差)量化。差分量化器(操作1031、1032、...、103n)被设计为相对于各个基准1、2、...、n而将输入的LPC滤波器101差分量化。
操作104:图1的多基准LPC滤波器量化设备和方法包括选择器,该选择器用于在基准1、2、...、n中选择在给定比特率上提供最低失真水平或者对于给定目标失真水平提供最低比特率的基准。更具体地,选择器(操作104)使用使比特率最小化以取得某个目标失真水平或者使在给定比特率上产生的失真水平最小化的选择标准。
在操作104中,可以在闭环中或者在开环中执行实际要在差分量化过程中使用的基准1、2、...、n中的基准的选择。
在闭环中,尝试所有可能的基准,并且选择使某个失真标准或比特率最优化的基准。例如,闭环选择可以基于使输入的LPC向量和与每个基准相对应的量化的LPC向量之间的加权均方误差最小化。此外,可以使用输入的LPC向量和量化的LPC向量之间的频谱失真。可替换地,可以执行使用所述可能基准的量化,同时将失真保持在某个阈值之下,并且选择满足该标准且使用较少数目的比特两者的基准。如将在下面的描述中解释的,可以使用可变比特率代数向量量化器来将缩放的残差向量(输入的LPC向量和所述基准之间的差)量化,所述缩放的残差向量基于该缩放的残差向量的能量而使用某个比特预算。在这种情况下,选择产生较少数目的比特的基准。
在开环中,操作104的选择器基于要量化的输入的LPC滤波器的线性预测系数的值以及可以获得的基准LPC滤波器的线性滤波系数的值来预先确定基准。例如,对于所有基准计算残差向量的L2-范数,并且选择产生较小值的基准。
操作105:在通过操作104选择了基准1、2、...、n之一之后,发送器(操作105)向解码器(未示出)发送或者用信号通知量化的LPC滤波器(未示出)和指示量化模式(例如绝对量化或差分量化)的索引(子操作1051)。此外,当使用差分量化时,发送器(操作105)向解码器发送或用信号通知表示操作1031、1032、...、103n的所选择的基准以及相关联的差分量化器的索引(子操作1052)。一些特定比特被发送给解码器以进行这种信号通知。
与如在传统预测中那样仅限制为过去的值相比,使用多个不同的可能的基准使得差分量化在减小预测残差的L2-范数方面更加高效。此外,对于给定的目标失真水平,该技术在平均比特率方面更加高效。
切换的绝对量化或差分量化
根据第二方面,使用切换的绝对/差分(或预测)量化。图1图示了在一个绝对量化器(操作102)和n个差分量化器(操作1031、1032、...、103n)之间选择的绝对/差分方案的示例,所述n个差分量化器使用相应的不同的基准1、2、...、n。同样,可以通过操作104的选择器在绝对量化器和差分量化器(操作102和操作1031、1032、...、103n)中进行量化器的选择,其中根据选择标准,所选择的量化器将使在给定比特率上产生的失真水平最小或者使比特率最小以取得目标失真水平。
可以使用绝对量化器(操作102)将一些LPC滤波器编码。在差分量化器(操作1031、1032、...、103n)中,相对于一个或若干个基准LPC滤波器将其它LPC滤波器差分编码。
例如在大的LPC偏差的情况下,或者当绝对量化器(操作102)在比特率方面比差分量化器(操作1031、1032、...、103n)更加高效时,可以使用绝对量化器(操作102)作为用于在以其它方式被差分量化的LPC滤波器的安全网(safety-net)解决方案。一个或多个基准LPC滤波器可以都处于相同的超帧中以便避免引入超帧之间的相关性,所述相关性在传输错误(分组丢失或帧擦除)的情况下通常会引起问题。
如在前面的描述中解释的,在LPC量化中使用预测导致要量化的数据的L2-范数减小,并且因此导致用于取得某个性能水平的平均比特率的减小。然而,预测不总是同样高效的。在切换的LPC[3,4]中,执行LPC滤波器的预分类,并且根据要量化的LPC滤波器的可预测性而使用不同的预测器。然而,在固定比特率的背景下已经开发了这一技术,两个差分量化器需要相同数目的比特以便将LPC滤波器编码。
此外,可以提供一个或若干个绝对量化器(操作102)。而且,可以提供一个或若干个差分(预测)量化器(操作1031、1032、...、103n)。若干差分量化器操作(1031、1032、...、103n)涉及若干可能基准(例如1、2、...、n)和/或若干差分量化器大小和/或结构。
如在前面的描述中描述的,当使用若干差分量化器(操作1031、1032、...、103n)时,可以在开环选择过程中或者在闭环选择过程中进行要使用的实际差分量化器的选择。
当差分量化未能取得目标失真水平时,或者当绝对量化比差分量化需要更少数目的比特以便取得该失真水平时,使用绝对量化作为安全网解决方案。取决于可能的绝对和差分量化器的数目的一个或若干比特,通过发送器发送(操作105),以便向解码器(未示出)指示所使用的实际的量化器。
绝对/差分量化组合了预测量化的优点(与要量化的数据的L2-范数的减小相关联的比特率减小)和绝对量化的通用性(在差分(或预测)量化没有取得目标(例如不显著的)失真水平的情况下,绝对量化被用作安全网)。
当包括若干差分量化器(操作1031、1032、...、103n)时,这些差分量化器可以利用相同的预测器或不同的预测器。具体地,但不是排他性地,所述若干差分量化器可以使用相同的预测系数或不同的预测系数。
解码器包括诸如解复用器之类的用于接收比特流和从比特流提取以下各项的部件:(a)量化的LPC滤波器、以及(b)一个或多个索引或者信息,所述索引或信息:
-关于量化模式,以确定已经使用了绝对量化还是差分量化将LPC滤波器量化;以及
-关于所述多个可能基准中已经被用于将LPC滤波器量化的基准。
如果关于量化模式的信息指示已经使用了绝对量化将LPC滤波器量化,则提供绝对逆量化器(未示出)来将量化的LPC滤波器逆量化。如果关于量化模式的信息指示已经使用了差分量化将LPC滤波器量化,则差分逆量化器(未示出)随后使用与所提取的基准信息相对应的基准将所述多基准差分量化的LPC滤波器差分逆量化。
环外量化方案
AMR-WB+编解码器是在基于ACELP编码方案的时域编码模型和被称为TCX的变换域编码模型之间切换的混合编解码器。AMR-WB+如下进行[1]:
-将输入信号分段为四个(4个)帧的超帧;
-使用四种(4种)可能的编码模式的组合编码每个超帧,每种编码模式覆盖不同的持续时间:
-ACELP(覆盖一个(1个)帧的持续时间);
-TCX256(覆盖一个(1个)帧的持续时间);
-TCX512(覆盖两个(2个)帧的持续时间);以及
-TCX1024(覆盖四个(4个)帧的持续时间)。
因此,存在26个可能的模式组合来编码每个超帧。
对于给定的超帧,通过“闭环”模式选择规程来确定使总加权误差最小的模式组合。更具体地,代替测试26个组合,通过十一(11)个不同的试验(树形搜索,参见表1)来进行模式的选择。在AMR-WB+编解码器中,闭环选择基于使得在加权域中的输入和编解码器信号之间的均方误差最小化(或者使信号对量化噪声的比率最大化)。
表1-AMR-WB+中用于闭环模式选择的11个试验
LPC滤波器是由AMR-WB+编解码器发送的各种参数之一。接下来是关于那些LPC滤波器的量化和传输的一些关键要素。
尽管不同的编码模式没有覆盖相同数目的帧,但是发送给解码器的LPC滤波器的数目对于所有编码模式是相同的,并且等于1。只发送与所覆盖的区段的末尾相对应的LPC滤波器。更具体地,在TCX1024的情况中,对于四个(4个)帧的持续时间计算和发送一个(1个)LPC滤波器。在TCX512的情况中,对于两个(2个)帧的持续时间计算和发送一个(1个)LPC滤波器。在TCX256或ACELP的情况中,对于一个(1个)帧的持续时间计算和发送一个(1个)LPC滤波器。
AMR-WB+编解码器使用(一阶(order)移动平均)预测LPC量化器。后面的量化器的操作取决于先前发送的LPC滤波器,从而取决于先前选择的编码模式。因此,因为在将整个超帧编码之前确切的模式组合是未知的,所以在确定最终的模式组合之前某些LPC滤波器被编码若干次。
例如,仅在第三帧被编码为ACELP或TCX256时,才将位于帧3末尾的LPC滤波器发送给解码器。当使用TCX512将帧3和4联合编码时,不发送所述LPC滤波器。对于位于帧2末尾的LPC滤波器,其在除了TCX1024中之外的所有模式组合中被发送。因此,在量化超帧的最后的LPC滤波器时执行的预测取决于用于整个超帧的模式组合。
所公开的技术的原理是:选择量化LPC滤波器的顺序,使得一旦完成闭环判定,就可以使与不必要的LPC滤波器相对应的量化信息跳过发送,而不影响将对其它滤波器进行发送并且在解码器处解码的方式。对于要使用上述差分量化策略量化的每个LPC滤波器,这对可能的基准LPC滤波器施加了一些限制。
参照图2给出以下示例。
图2的操作1:为了避免任何超帧间相关性,使用绝对LPC量化器量化至少一个LPC滤波器。由于无论通过闭环选择规程确定的编码模式组合是什么,总是发送超帧的帧4的滤波器LPC4,因此使用绝对量化器量化滤波器LPC4是方便的。
图2的操作2:下一个要量化的LPC滤波器是对于除了TCX1024以外的所有模式组合发送的、超帧的帧2的滤波器LPC2。例如,可以使用差分量化器将滤波器LPC2和滤波器LPC4的绝对量化版本之间的差编码。例如在LPC偏差大的情况下,或者当绝对LPC量化器在比特率和/或失真水平方面比差分量化器更高效时,也可以使用与用于将滤波器LPC4编码的绝对量化器相同的绝对量化器作为安全网解决方案。
图2的操作3:剩余的两个LPC滤波器(超帧的帧1的滤波器LPC1和超帧的帧3的滤波器LPC3)也使用相同的差分/绝对量化策略来量化。可以相对于滤波器LPC2的量化版本来量化这两个LPC滤波器。在这里,在下面给出一些替代策略。
图5是更详细地图示环外量化方案的示例的流程图。
操作501:绝对量化器量化滤波器LPC4。
操作502:操作512是可选的,并且用于非基于LPC的编码帧之后的第一个基于LPC的编码帧。绝对量化器量化滤波器LPC0,或者差分量化器相对于量化的滤波器LPC4而将滤波器LPC0差分量化。滤波器LPC0是来自前一超帧的最后的LPC滤波器(LPC4),并且可以被用作用于将滤波器LPC1到LPC4量化的可能基准。
操作503:绝对量化器量化滤波器LPC2,或者差分量化器相对于被用作基准的量化的滤波器LPC4而将滤波器LPC2差分量化。
操作504:绝对量化器量化滤波器LPC1,差分量化器相对于被用作基准的量化的滤波器LPC2而将滤波器LPC1差分量化,或者差分量化器相对于被用作基准的((量化的滤波器LPC2+量化的滤波器LPC0)/2)而将滤波器LPC1差分量化。
操作505:绝对量化器量化滤波器LPC3,差分量化器相对于被用作基准的量化的滤波器LPC2而将滤波器LPC3差分量化,差分量化器相对于被用作基准的量化的滤波器LPC4而将滤波器LPC3差分量化,或者差分量化器相对于被用作基准的((量化的滤波器LPC2+量化的滤波器LPC4)/2)而将滤波器LPC3差分量化。
图3是图示在可以在超帧中计算并且发送四个(4个)LPC滤波器的配置中要发送的LPC滤波器的确定的流程图。
首先应当记住的是,仅在对于超帧的前半部分选择了ACELP和/或TCX256时才发送量化的滤波器LPC1。类似地,仅在对于超帧的后半部分选择了ACELP和/或TCX256时才发送的滤波器LPC3。
操作301:使用例如关于图2和图5示出和描述的量化策略来量化超帧的帧1的滤波器LPC1、超帧的帧2的滤波器LPC2、超帧的帧3的滤波器LPC3和超帧的帧4的滤波器LPC4。当然,其它量化策略也是可能的。
操作302:执行上述编码模式的闭环选择。
操作303:例如通过图1的发送器105将量化的滤波器LPC4发送给解码器。解码器包括:
-用于接收比特流并且从所接收的比特流提取量化的滤波器LPC4的部件,例如解复用器;以及
-绝对逆量化器,向其提供量化的滤波器LPC4,以便将该量化的滤波器LPC4逆量化。
操作304:如果使用模式TCX1024将超帧编码,则不需要进一步的发送。
操作305:如果没有使用模式TCX1024将超帧的第一、第二、第三和第四帧编码,则例如通过图1的发送器105将量化的滤波器LPC2以及指示绝对量化模式和差分量化模式之一的索引发送给解码器。解码器包括:
-用于接收比特流并且从所接收的比特流提取量化的滤波器LPC2以及指示绝对量化模式和差分量化模式之一的索引的部件,例如解复用器;以及
-绝对逆量化器,向其提供量化的滤波器LPC2以及指示绝对量化模式的索引,以便将该量化的滤波器LPC2逆量化,;或者差分逆量化器,向其提供量化的滤波器LPC2以及指示差分量化模式的索引,以便将该量化的滤波器LPC2逆量化。
操作306:如果使用模式TCX512将超帧的帧1和2编码,则不将量化的滤波器LPC1发送给解码器。
操作307:如果没有使用TCX512将超帧的帧1和2编码,即,使用ACELP或TCX256将超帧的帧1和2编码,则例如通过图1的发送器105将量化的滤波器LPC1和索引发送给解码器,所述索引指示绝对量化模式、相对于被用作基准的量化的滤波器LPC2的差分量化模式、以及相对于被用作基准的(量化的滤波器LPC2+量化的滤波器LPC0)/2的差分量化模式中的一个。解码器包括:
-用于接收比特流并且从所接收的比特流提取量化的滤波器LPC1以及指示绝对量化模式、相对于被用作基准的量化的滤波器LPC2的差分量化模式、以及相对于被用作基准的(量化的滤波器LPC2+量化的滤波器LPC0)/2的差分量化模式中的一个的索引的部件,例如解复用器;以及
-绝对逆量化器,向其提供量化的滤波器LPC1以及指示绝对量化模式、相对于被用作基准的量化的滤波器LPC2的差分量化模式、以及相对于被用作基准的(量化的滤波器LPC2+量化的滤波器LPC0)/2的差分量化模式中的一个的索引,以便将该量化的滤波器LPC1逆量化。
操作308:如果使用模式TCX512将超帧的帧3和4编码,则不将量化的滤波器LPC3发送给解码器。
操作309:如果没有使用TCX512将超帧的帧3和4编码,即,使用ACELP或TCX256将超帧的帧3和4编码,则例如通过图1的发送器105将量化的滤波器LPC3和索引发送给解码器,所述索引指示绝对量化模式、相对于被用作基准的量化的滤波器LPC2的差分量化模式、相对于被用作基准的量化的滤波器LPC4的差分量化模式、以及相对于被用作基准的(量化的滤波器LPC2+量化的滤波器LPC4)/2的差分量化模式中的一个。解码器包括:
-用于接收比特流并且从所接收的比特流提取量化的滤波器LPC3以及指示绝对量化模式、相对于被用作基准的量化的滤波器LPC2的差分量化模式、相对于被用作基准的量化的滤波器LPC4的差分量化模式、以及相对于被用作基准的(量化的滤波器LPC2+量化的滤波器LPC4)/2的差分量化模式中的一个的索引的部件,例如解复用器;以及
-绝对逆量化器,向其提供量化的滤波器LPC3以及指示绝对量化模式、相对于被用作基准的量化的滤波器LPC2的差分量化模式、相对于被用作基准的量化的滤波器LPC4的差分量化模式、以及相对于被用作基准的(量化的滤波器LPC2+量化的滤波器LPC4)/2的差分量化模式中的一个的索引,以便将该量化的滤波器LPC3逆量化。
上述解决方案的一些益处包括:
-在编码模式的闭环选择之前量化LPC滤波器的整个集合减小了复杂度;
-在全局量化方案中使用差分量化器保留了例如在原来的AMR-WB+量化方案中通过预测量化器获得的一些比特率的节省。
可以使用以下变体来构造在差分量化器(诸如1031、1032、...、103n的操作)中使用的基准LPC滤波器:
-如果超帧间相关性不是问题,则可以使用来自前一超帧(LPC0)的最后的LPC滤波器(LPC4)作为用于将滤波器LPC1到LPC4编码的可能基准;
-当可以使用不同的基准LPC滤波器(例如将滤波器LPC2编码时的滤波器LPC0和LPC4)时,可以将特定的比特图案发送给解码器以指示实际使用哪个基准。例如,可以如上面参照图1所述的那样,例如基于距离或比特率测量来进行基准的选择;
-当可以使用不同的基准LPC滤波器时,可以通过将各种外插或内插方案应用于已经可以使用的基准LPC滤波器来获得额外的辅助基准LPC滤波器。可以发送特定的比特图案以指示编码器选择的实际的内插或外插策略。例如,可以相对于滤波器LPC2或LPC4的量化版本,或者甚至相对于这两个量化的滤波器LPC2和LPC4之间的内插值(例如平均)来将滤波器LPC3差分量化(参见图5的操作505)。
上述“环外”量化方案可以被扩展为将超过四个(4个)LPC滤波器编码:例如量化滤波器LPC0并且将其与超帧一起发送。在该情况下,作为非限制性示例,可以相对于滤波器LPC4将与在前一超帧期间计算的最后的LPC滤波器(LPC4)相对应的滤波器LPC0量化,这是因为该滤波器LPC4始终可以用作基准。将量化的滤波器LPC0与指示绝对量化模式和差分量化模式之一的索引一起发送给解码器。解码器包括:
-用于接收比特流并且从所接收的比特流提取量化的滤波器LPC0以及指示绝对量化模式以及差分量化模式之一的索引的部件,例如解复用器;以及
-绝对逆量化器,向其提供量化的滤波器LPC0以及指示绝对量化模式的索引,以便将该量化的滤波器LPC0逆量化;或者差分逆量化器,向其提供量化的滤波器LPC0以及指示差分量化模式的索引,以便将该量化的滤波器LPC0逆量化。
在从非基于LPC的编码模式切换到基于LPC的编码模式的情况下,将滤波器LPC0发送给解码器对于初始化基于LPC的编解码器是有用的。非基于LPC的编码模式的示例为:脉冲码调制(PCM)、以及例如由MP3和高级音频编解码器AAC使用的变换编码。基于LPC的编码模式的示例为:码激励线性预测(CELP)和由AMR-WB+编解码器使用的代数CELP(ACELP)[1]。
在基于LPC的编解码器中,对于每帧(或者每个超帧)估计一个或若干个LPC滤波器并且将其发送给解码器。当对于每帧估计和发送一个LPC滤波器时,最常使用如图4a所示的中心在帧的末尾的LPC分析窗口来估计该LPC滤波器。当对于每帧(或者如在AMR-WB+编解码器中那样对于每个超帧)发送若干LPC滤波器时,最常在帧的长度上均匀隔开的位置上估计所述若干LPC滤波器,如图4b表示的那样。图4a和4b中的滤波器LPC0实际上是被量化并且被发送给解码器的前一帧(或超帧)的最后的LPC滤波器。
典型的基于LPC的编解码器通常使用LPC滤波器的内插值。在图4a的示例中,例如,基于LPC的编解码器将典型地把帧划分为四个(4个)子帧,并且对于每个子帧使用不同的内插LPC滤波器,第一子帧的LPC滤波器更接近滤波器LPC0,而第四子帧的LPC滤波器更接近滤波器LPC1。
在从非基于LPC的编码模式切换到基于LPC的编码模式的编解码器中,在从非基于LPC的编码模式切换到基于LPC的编码模式之后的第一个帧处,通常不能使用用于操作基于LPC的编解码器的滤波器LPC0。
在该背景下,提出在编码和解码从非基于LPC的编码模式切换到基于LPC的编码模式之后的第一个帧时,提供在编码器和解码器二者处都可用的滤波器LPC0的值。更具体地,在解码器处,从发自编码器的参数获得滤波器LPC0的值。
根据第一解决方案,在决定了从非基于LPC的编码模式向基于LPC的编码模式的切换之后,在编码器处(使用本领域普通技术人员熟知的LPC分析)确定滤波器LPC0,将滤波器LPC0量化并且发送给解码器。解码器使用所发送的量化值和滤波器LPC0。为了高效地将滤波器LPC0量化,可以使用被扩展到多于四个(4个)LPC滤波器的如上所述的环外量化方案。
下面描述用于在解码器处从所发送的参数估计滤波器LPC0的第二和第三解决方案:
-使用例如外插从其它发送的LPC滤波器估计滤波器LPC0;以及
-从其它发送的参数估计滤波器LPC0。例如,可以通过将传统的LPC分析规程应用于过去的解码信号(更具体地,从非基于LPC的编码模式切换到基于LPC的编码模式之前所切换的解码器的输出)来估计滤波器LPC0。
利用均匀代数向量量化器的量化
随机向量量化的原理是从向量的码本中搜索要量化的向量的最近的邻居(通常依据欧几里德距离或加权欧几里德距离)。当在LSF(线谱频率)或ISF(导谱频率)域中量化LPC滤波器时,通常使用加权欧几里德距离,向量的每个分量根据其值以及其它分量的值而被不同地加权[5]。该加权的目的是使欧几里德距离的最小化表现得尽可能地接近频谱失真的最小化。与随机量化器不同,均匀代数向量量化器不执行码本的穷尽搜索。因此,难以在距离计算中引入加权函数。
在这里提出的解决方案中,作为非限制性示例,在LSF域中量化LPC滤波器。因此,提供用于在LSF量化域中转换LPC滤波器以便形成输入的LSF向量的适当部件。更具体地,使用从输入的LSF向量的第一级近似计算的加权函数来扭曲(warp)LSF残差向量,即输入的LSF向量和所述第一级近似之间的差,其中所述第一级近似使用输入的LSF向量的随机绝对量化器、输入的LSF向量的差分量化器、输入的LSF向量的内插器、或者给出要量化的输入的LSF向量的估计的其它元件。扭曲是指将不同的权重应用于LSF残差向量的分量。因为所述第一级近似也可以在解码器处获得,因此也可以在解码器处计算逆权重,并且可以将逆扭曲应用于量化的LSF残差向量。当量化器是均匀的(uniform)时,根据使频谱失真最小化的模型扭曲LSF残差向量是有用的。在解码器处接收的量化的LSF是第一级近似与在解码器处被逆扭曲的可变比特率量化(例如AVQ(代数向量量化)改进(refinement)的组合。
所提出的解决方案的一些益处如下:
-利用好的加权函数,均匀量化器可以提供相对均匀的频谱失真。
-可变比特率向量量化(例如AVQ(代数向量量化))相对于SVQ(随机向量量化)的优点是表(存储器)的数目较小、复杂度较低和比特率粒度较高。
-可变比特率向量量化(例如AVQ(代数向量量化))的另一个有利的优点是其不受限制的码本大小;这对于任何类型的信号保证了相同的频谱失真。
在图6中给出给定LPC滤波器的量化的一般原理。在该非限制性示例中,在LSF域中量化LPC滤波器。
操作601:计算器计算输入的LSF向量607的第一级近似608。
操作602:减法器从输入的LSF向量607中减去来自操作601的第一级近似608,以便产生残差LSF向量609。
操作603:计算器从操作601的第一级近似608导出LSF加权函数610。
操作604:乘法器或扭曲器将来自操作603的LSF加权函数610应用于来自操作602的残差LSF向量609。
操作605:可变比特率量化器(例如代数向量量化器(AVQ))将所得到的加权的残差LSF向量611量化以提供量化的加权的残差LSF向量612。
操作606:多路复用器响应来自操作601的第一级近似608和来自操作605的量化的加权的残差LSF向量612,以便多路复用和发送对应的编码索引613。
可以用不同的方式计算第一级近似(操作601)。作为非限制性示例,第一级近似608的计算器可以是具有少量比特的输入的LSF向量607的绝对随机向量量化器,或者是使用如上所述的基准的输入的LSF向量607的差分量化器,其中第一级近似是基准本身。例如,当如图5的操作504中那样量化向量LPC1时,第一级近似608的计算器可以是具有8比特的绝对量化器、或量化的滤波器LPC2、或(量化的滤波器LPC2+量化的滤波器LPC0)/2。
在这里,在下面描述加权函数(操作603)的计算和目的。
图7中图示了对应的逆量化器。
操作701:来自编码器的编码索引707被解复用器解复用。
操作702:解复用的编码索引包括第一级近似708。
操作703:由于与在编码器处一样可以在解码器处获得第一级近似(操作702),因此可以使用计算器来计算逆LSF加权函数709。
操作704:表示量化的加权的残差LSF向量的解码的索引710被提供给可变比特率逆向量量化器,例如代数逆向量量化器(逆AVQ)以便恢复加权的残差LSF向量711。
操作705:乘法器将来自操作704的加权的残差LSF向量711乘以来自操作703的逆LSF加权函数709,以便恢复残差LSF向量712。
操作706:加法器对来自操作702的第一级近似708和来自操作705的残差LSF向量712求和,以便形成解码的LSF向量713。解码的LSF向量713是来自操作702的第一级近似与在解码器处被逆加权(操作705)的可变比特率逆量化改进(操作704)的组合。
第一级近似
如上面解释的,可以使用若干量化模式来量化给定的LPC滤波器,所述若干量化模式包括绝对量化和使用若干基准的差分量化。第一级近似取决于量化模式。在绝对量化的情况下,第一级近似可以使用具有少量比特(例如8比特)的向量量化器。在差分量化的情况下,第一级近似构成基准本身。例如,当如图5所示量化向量LPC3(操作505)时,第一级近似可以是以下之一:
-8比特VQ(绝对量化)
-量化的滤波器LPC2(使用量化的滤波器LPC2作为基准的差分量化);
-量化的滤波器LPC4(使用量化的滤波器LPC4作为基准的差分量化);
-量化的滤波器LPC2和LPC4的平均值(使用(量化的滤波器LPC2+量化的滤波器LPC4)/2作为基准的差分量化)
作为非限制性示例,在用LSF参数表示的第p阶(order)LPC滤波器的情况下,在绝对量化模式中,使用被应用于输入的LSF向量的p维8比特随机向量量化器来计算第一级近似。码本搜索使用加权欧几里德距离,其中,输入的LSF向量和码本条目之间的平方差的每个分量被乘以权重wt(i)。例如,权重wt(i)可以由以下表达式给出:
并且:
d0=f(0)
dp=SF/2-f(p-1)
di=f(i)-f(i-1),i=1,...,p-1
其中,f(i),i=0,...,p-1是要量化的输入的LSF向量,p是LP分析的阶数,SF是基于LPC的编解码器的内部采样频率(Hz)。
在差分量化模式中,第一级近似基于已经量化的LPC滤波器。
如参照图5解释的,按照以下顺序量化LPC滤波器的集合:LPC4、LPC2、LPC1,然后是LPC3。当需要时,在滤波器LPC4之后量化可选的滤波器LPC0。因此,只能相对于LPC4进行滤波器LPC2的差分量化,而可以相对于LPC2、LPC4或者LPC2和LPC4二者的组合来进行滤波器LPC3的差分量化;LPC1不被认为是好的选择,因为它与LPC3不相邻。
对于每个第一级近似f1st(i),残差LSF向量被计算为:
r(i)=f(i)-f1st(i),i=0,...p-1
如图6所示,利用来自操作603的基于第一级近似f1st(i)计算的加权函数610加权(操作604)来自操作602的残差LSF向量609,以便获得扭曲的残差LSF向量611(操作604)。然后,使用可变比特率量化器(例如代数向量量化器)量化扭曲的残差LSF向量611(操作605)。
例如,应用于第p残差LSF向量的分量的权重可以由以下关系给出:
并且:
d0=f1st(0)
dp=SF/2-f1st(p-1)
di=f1st(i)-f1st(i-1),i=1,...,p-1
其中f1st(i)是第一级近似,SF是基于LPC的编解码器的以Hz为单位的内部采样频率,W是取决于量化模式的缩放因子。选择W的值,以便一旦利用可变比特率量化器量化扭曲的残差LSF向量,就获得某个目标频谱失真和/或某个目标平均比特率。作为非限制性示例,可变比特率向量量化器基于某个向量的平均能量选择用于该向量的比特率。
在说明性示例中,根据图5量化超帧中的四个(4个)LPC滤波器以及可选的LPC0滤波器。表2示出了对于每个量化模式所使用缩放因子以及在此示例中使用的模式索引的编码。注意:量化模式指明使用绝对量化或差分量化中的哪一个,并且在差分量化的情况下,其指明所使用的基准滤波器。如上面解释的,对于可变比特率量化,在差分量化中使用的基准滤波器是实际的第一级近似。
表2-可能的绝对和相对量化模式和对应的比特流信令、以及缩放因子和加权函数
图8是解释在这里如上所述的量化规程的示意框图。
操作801、8011、8012、...、801n:输入的LSF向量800被提供给绝对量化器(操作801)以便进行例如输入的LSF向量800的8比特绝对向量量化。该输入的LSF向量还被提供给差分量化器(操作8011、8012、...、801n)以便执行输入的LSF向量800的差分量化。如参照图1在上面的描述中解释的那样,差分量化器使用相应的不同基准。操作801中的8比特VQ和操作8011、8012、...、801n中的基准表示第一级近似。
在操作802、8021、8022、...、802n中,计算器从分别来自操作801、8011、8012、...、801n的第一级近似向量计算残差LSF向量。计算该残差向量,作为输入向量和第一级近似之间的差。这对应于图6的操作601和602。
在操作803、8031、80232、...、803n中,计算器计算加权函数以便扭曲分别来自操作802、8021、8022、...、802n的残差LSF向量。这对应于图6的操作601和603。
在操作804、8041、8042、...、804n中,扭曲器将分别来自操作802、8021、8022、...、802n的残差LSF向量乘以分别来自操作803、8031、80232、...、803n的加权函数。
在操作805、8051、8052、...、805n中,可变比特率量化器(例如代数向量量化器(AVQ))将分别来自操作804、8041、8042、...、804n的所得到的加权的残差LSF向量量化,以便提供量化的加权的残差LSF向量。
在操作806中,选择器在绝对量化(操作801)和使用基准1、2、...、n之一的差分量化(操作8011、8012、...、801n)之中执行量化模式的选择。例如,操作806可以选择对于给定比特率产生较低失真或者对于目标失真水平产生较低比特率的量化模式(操作801、8011、8012、...、801n)。关于在8比特VQ和基准1、2、...、n之中的选择,可以在闭环或在开环中执行该选择。在闭环中,尝试所有可能的基准,并且选择最优化失真或比特率的某个标准(例如对于给定比特率失真较低或者对于目标失真水平比特率较低)的基准。在开环中,操作806基于要量化的LPC滤波器的线性预测系数的值以及可用的基准LPC滤波器的线性预测系数的值来预先确定基准。
操作807:在操作806中的选择之后,发送器(操作807)向解码器(未示出)发送或用信号通知指示以下内容的索引:
-量化模式(子操作8071),例如绝对量化或差分量化;以及
-在差分量化的情况下,操作8011、8012、...、801n的所选择的基准和相关联的差分量化器(子操作8072)。
一些特定的比特被发送给解码器以用于这种信号通知。
代数向量量化器
例如在图6的操作605和图8的操作805、8051、8052、...、805n中使用的可能的代数向量量化器(AVQ)基于用于在AMR-WB+的TCX模式中量化频谱的8维RE8栅格(1attice)向量量化器[1]。
对于16阶LPC,每个加权的残差LSF向量被分割为两个8维子向量B1和B2。使用下面所述的三个操作的方法来量化这两个子向量中的每一个。
LSF向量对于量化误差(error)不具有全部相同的敏感度,由此施加到一个LSF向量的某个量化误差对于频谱失真可能具有比施加到另一LSF向量的相同的量化误差更大的影响。加权操作对于所有加权的LSF向量给出相同的相对敏感度。AVQ具有将相同的量化误差水平引入加权的LSF向量的特性(均匀量化误差)。当执行逆量化时,应用于逆量化的加权的LSF向量的逆权重显然也应用于量化误差。因此,原来均匀的量化误差分布在量化的LSF向量之中,较敏感的LSF向量获得较小的量化误差,而较不敏感的LSF向量获得较大的量化误差。结果,使量化误差对频谱失真的影响最小化。
如在参考文献[1]中解释的,RE8量化器使用固定的和预定的量化。结果,编码子向量所需的比特率随着该子向量的幅度增大。
缩放因子W控制加权的LSF向量的幅度。因此,缩放因子W也控制量化LSF向量所需的比特率和平均频谱失真二者。
第一操作:找出栅格RE
8
中的最近的邻居
RE8=2D8∪{2D8+(1,...,1)}
也就是,被定义为栅格2D8与被移位了向量(1,1,1,1,1,1,1,1)的栅格2D8的版本的并集。因此,搜索栅格RE8中的最近的邻居等效于搜索栅格2D8中的最近的邻居,然后搜索栅格2D8+(1,1,1,1,1,1,1,1)中的最近的邻居,最后选择这两个栅格点中最好的栅格点。栅格2D8是栅格D8缩放了因子2,其中栅格D8被定义为:
D8={(x1,...,x8)∈Z8|x1+...+x8为偶数}
也就是说,栅格D8中的点均为整数,并且有所有分量的和为偶数的限制。这也意味着栅格2D8中的点的分量的和是4的整数倍。
1.zk=0.5*Bk
3.
4.计算S,作为y1k的分量的和
5.如果S不是4的整数倍(负值也是可能的),则如下修改其分量之一:
-找出abs(zk(i)-y1k(i))最高的位置I
-如果zk(I)-y1k(I)<0,则y1k(I)=y1k(I)-2
-如果zk(I)-y1k(I)>0,则y1k(I)=y1k(I)+2
6.zk=0.5*(Bk-1.0),其中1.0表示所有分量为1的向量
7.将zk的每个分量舍入为最接近的整数,以产生
8.
9.计算S,作为y2k的分量的和
10.如果S不是4的整数倍(负值也是可能的),则如下修改其分量之一:
-找出abs(zk(I)-y2k(I))最高的位置I
-如果zk(I)-y2k(I)<0,则y2k(I)=y2k(I)-2
-如果zk(I)-y2k(I)>0,则y2k(I)=y2k(I)+2
11.y2k=y2k+1.0
12.计算e1k=(Bk-y1k)2和e2k=(Bk-y2k)2
13.如果e1k>e2k,则最佳的栅格点(栅格中最近的邻居)为y1k,否则最佳的栅格点为y2k。
第二操作:索引计算
用于栅格RE8中的给定点的索引的计算基于两个基本原理:
1.栅格RE8中的所有点位于半径的同心球面上,其中m=0,1,2,3等,并且给定球面上的每个栅格点可以通过排列(permute)被称为领导点(leader)的基准点的坐标来产生。与位于球面上的栅格点的总数目相比,球面上存在非常少的领导点。可以通过只包括多至给定数目m的球面来构造不同比特率的码本。对于更多细节,参见参考文献[6],其中,分别用0、4、8、12、16和20比特来构造码本Q0、Q1、Q2、Q3、Q4和Q5。因此,码本Qn需要4n比特来对该码本中的任何点编制索引。
2.根据基本码本C(即,包含来自多至数目m的球面的给定集合的所有栅格点的码本),可以通过将基本码本C的元素乘以因子M并且将被称为Voronoi扩展的第二级码本相加来生成扩展码本。该构造是通过y=Mz+v给出的,其中M是缩放因子,z是基本码本中的点,v是Voronoi扩展。以任何点y=Mz+v也是栅格RE8中的点的方式计算该扩展。扩展码本包括相对于基本码本从原点进一步延伸出的点。
在该情况中,LPC量化器中的基本码本C可以是来自参考文献[6]的任一码本Q0、Q2、Q3或Q4。当给定栅格点ck没有被包括在这些基本码本中时,应用Voronoi扩展,这次只使用码本Q3或Q4。注意,在这里,但是
然后,根据以下操作执行用于在第一操作中获得的每个栅格点ck的索引的计算。
验证ck是否在基本码本C中。这意味着验证ck是否是来自参考文献[6]的码本Q0、Q2、Q3或Q4的元素。
-如果ck是基本码本C的元素,则因此用于将ck编码的索引为码本号nk加上码本Qnk中的码向量ck的索引Ik。如在第三操作中所述的那样将码本号nk编码。索引Ik表示码向量ck的排序,即,要应用到特定领导点以获得ck-的排列(参见参考文献[7])。如果nk=0,则Ik不使用比特。否则,索引Ik使用4nk比特。
-如果ck不在基本码本C中,则通过以下子操作,来应用Voronoi扩展,这次只使用码本Q3或Q4作为基本码本。
V0设置扩展阶数r=1,并且缩放因子M=2r=2。
V1计算栅格点ck的Voronoi索引k。Voronoi索引k依赖于扩展阶数r和缩放因子M。通过模操作来计算所述Voronoi索引,使得k只依赖于在缩放和转换的Voronoi区域中ck的相对位置:
k=modM(ckG-1)
其中,G是生成矩阵,并且modM(·)是分量方式(component-wise)的模M运算。因此,Voronoi向量k是每个分量被包括在区间0到M-1中的整数的向量。
V2根据Voronoi索引k计算Voronoi码向量v。这可以使用如参考文献[8]中描述的算法实现。
V3计算差向量w=ck-V。该差向量w始终属于缩放的栅格mΛ,其中Λ是栅格RE8。计算z=w/M,即,将逆缩放应用于差向量w。码向量z属于栅格Λ,因为w属于mΛ。
V4验证z是否在基本码本中(即,在Q3或Q4中)
如果z不在基本码本C中,则将扩展阶数r递增1,将缩放因子M乘以2,并且回到子操作V1。否则,如果z在基本码本C中,则找到了足够大到将ck的索引编码的扩展阶数r和缩放因子M=2r。该索引由三部分形成:1)作为下面定义的一元码的码本号nk;2)对应的基本码本(Q3或Q4)中的z的排序Ik;以及3)在子操作V1中计算的Voronoi索引向量k的8个索引,其中每个索引需要正好r个比特(r是在子操作V0中设置的Voronoi扩展阶数)。码本号nk如第三操作中描述的那样编码。
然后栅格点ck被描述为:
ck=Mz+v。
第三操作:码本号的可变长度编码
使用可变长度码将码本号nk编码,所述可变长度码取决于LPC滤波器的位置和量化模式,如表3所示。
表3-码本号nk的编码模式
nk模式0和3:
将码本号nk编码为可变长度码,如下所示:
Q2→用于nk的码为00
Q3→用于nk的码为01
Q4→用于nk的码为10
其它:用于nk的码为11,然后是:
Q5→0
Q6→10
Q0→110
Q7→1110
Q8→11110
等等。
nk模式1:
将码本号nk编码为一元码,如下所示:
Q0→用于nk的一元码为0
Q2→用于nk的一元码为10
Q3→用于nk的一元码为110
Q4→用于nk的一元码为1110
等等。
nk模式2:
将码本号nk编码为可变长度码,如下所示:
Q2→用于nk的码为00
Q3→用于nk的码为01
Q4→用于nk的码为10
其它:用于nk的码为11,然后是:
Q0→0
Q5→10
Q6→110
等等。
量化模式判定
对于每个LSF向量,尝试如表2所述的所有可能的绝对和差分量化模式中的每一个,并且例如选择需要最少数目的比特的量化模式。将编码的量化模式和对应的量化索引的集合发送给解码器。
如上面的描述中所提到的,从编码器发送给解码器的量化的LPC滤波器的实际数目不是固定的,而是取决于在编码器处做出的ACELP/TCX判定。例如,长TCX(TCX1024)只需要发送量化的滤波器LPC4,而任何包含ACELP或短TCX(TCX256)的组合需要发送全部四个(4个)量化的LPC滤波器LPC1到LPC4。实际上只发送ACELP/TCX模式配置需要的量化的LPC滤波器。
代数向量量化器的解码过程
如在这里上面提到的,在比特流中编码的量化的LPC滤波器的实际数目取决于超帧的ACELP/TCX模式组合。ACELP/TCX模式组合是从比特流提取的,并且确定组成超帧的四个(4个)帧中的每一个的编码模式,即mod[k],k=0到3。模式值对于ACELP为0,对于TCX256为1,对于TCX512为2,对于TCX1024为3。
除了超帧的所述一个(1个)到四个(4个)量化的LPC滤波器以外,对于使用基于线性预测的编解码器编码的每个区段的第一超帧,发送上述可选的量化的滤波器LPC0。
通常在比特流中发现量化的LPC滤波器的顺序为:LPC4、可选的LPC0、LPC2、LPC1和LPC3。
在表4中概括了在比特流中存在给定LPC滤波器的条件。
LPC滤波器 | 如果满足以下条件则存在 |
LPC0 | 使用LP将第一超帧编码 |
LPC1 | Mod[0]<2 |
LPC2 | Mod[2]<3 |
LPC3 | Mod[2]<2 |
LPC4 | 始终 |
表4-在比特流中存在给定LPC滤波器的条件
图9是概括解码过程的示意框图。
操作901和902:解码器包括用于接收比特流并且从所接收的比特流提取与ACELP/TCX模式组合需要的每个量化的LPC滤波器相对应的量化索引的部件,例如解复用器。对于给定的量化的LPC滤波器,量化模式的确定器从接收自编码器的比特流提取所述索引或与量化模式有关的信息,并且如表2所指示的那样确定量化模式是绝对量化模式还是差分量化模式。
操作903和905:当操作901和902确定量化模式是绝对量化模式时,提取器从比特流提取与随机VQ-量化的第一级近似相对应的一个或多个索引(操作903)。然后,计算器通过逆量化计算第一级近似(操作905)。
操作904和905:当操作901和902确定量化模式是差分量化模式(不是绝对量化模式)时,提取器从比特流提取所述索引或者代表多个可能基准中的基准(例如基准LPC向量)的信息(操作904)。然后,计算器根据该信息如参照表2所描述的那样计算第一级近似(操作905)。
在操作906中,VQ信息的提取器从接收自编码器的比特流提取可变比特率VQ信息,例如AVQ信息。更具体地,作为非限制性示例,从比特流提取两个残差LSF子向量的AVQ信息。AVQ信息通常包括两个编码的码本号、以及对应的AVQ索引。唯一的例外是在相对于(量化的滤波器LPC0+量化的滤波器LPC2)/2而将滤波器LPC差分量化的时候,因为在这种情况下,在比特流中不存在AVQ信息。在后一例外的情况下,输出量化的LSF向量909,作为来自操作905的第一级近似。
操作907:逆代数向量量化器接收来自操作906的所提取的AVQ信息,以便逆量化或者逆加权和恢复AVQ基值(contribution)。
AVQ索引的解码
将LPC滤波器解码包含将所提取的AVQ信息解码,所述AVQ信息例如为描述加权的残差LSF向量的每个量化的子向量的AVQ参数。在前面的示例中,每个子向量Bk具有维度8。在上述代数向量量化的第二操作中描述了用于每个子向量Bk的AVQ参数。对于每个量化的子向量编码器将三组二元索引发送给解码器:
a)如在上述代数向量量化的第三操作中描述的使用熵码发送的码本号nk;
b)基本码本中的所选择的栅格点z的排序Ik,其指示必须将什么排列应用于特定领导点(参见上述代数向量量化的第二操作)以获得栅格点z;以及
c)如果量化的子向量(栅格RE8中的栅格点)不在基本码本中,在上述代数向量量化的第二操作的子操作V1中计算的Voronoi扩展索引向量k的8个索引;根据所述Voronoi扩展索引,可以如参考文献[8]教导的那样计算扩展向量v。通过扩展阶数r给出索引向量k的每个分量中的比特数目,所述扩展阶数r可以从索引nk的码值获得。Voronoi扩展的缩放因子M由M=2r给出。
当没有Voronoi扩展(即,nk<5,M=1且z=0)时,基本码本是来自参考文献[6]的任一码本Q0、Q2、Q3或Q4。然后,不需要比特来发送向量k。或者,当因为足够大而使用Voronoi扩展时,仅使用来自参考文献[6]的Q3或Q4作为基本码本。Q3或Q4的选择隐含在码本号值nk中,如在上述代数向量量化的第二操作中所述。
操作908:加法器将来自操作905的第一级近似加到来自操作907的逆加权的AVQ基值上,以重构和恢复量化的LSF向量909。
尽管在上面的描述中通过本发明的说明性实施例限定了本发明,但是在所附权利要求的范围内,这些实施例可以被随意修改,而不背离本发明的精神和本质。
参考文献
[1]3GPP Technical Specification TS 26.290,“Audio Codec ProcessingFunctions;Extended Adaptive Multi-Rate-Wideband(AMR-WB+)Codec;Transcoding Functions,”June 2005.
[2]J.Skoglund,J.Linden,“Predictive VQ for Noisy Channel SpectrumCoding:AR Or MA?,”IEEE 1997 International Conference on Acoustics,Speech,and Signal Processing(ICASSP’97),pp.1351-1354,Munich,Germany,April21-24,1997.
[3]H.Zarrinkoub,P.Mermelstein,“Switched Prediction and Quantization ofLSP Frequencies,”IEEE 1996 International Conference on Acoustics,Speech,andSignal Processing(ICASSP’96),Vol.2,pp.757-760,7-10 May 1996.
[4]A.V.McCree,“Method for Switched-Predictive Quantization,”USPatent No.6,122,608.
[5]R.Laroia,N.Phamdo,and N.Farvardin,“Robust and EfficientQuantization of Speech LSP Parameters Using Structured Vector Quantizers,”IEEE Int.Conf.on Acoustics,Speech and Signal Processing(ICASSP′1991),pp.641-644,Washington,DC,April 14-17,1991.
[6]M.Xie and J.-P.Adoul,“Embedded Algebraic Vector Quantization(EAVQ)with Application to Wideband Audio Coding,”IEEE InternationalConference on Acoustics,Speech,and Signal Processing(ICAS SP),Atlanta,GA,U.S.A,Vol.1,pp.240-243,1996.
[7]P.Rault,C.Guillemot,“Indexing Algorithm for Zn,An,Dn and Dn++Lattice Vector Quantizers,IEEE Transactions on Multimedia,Vol.3,No.4,December 2001.
[8]J.H.Conway and N.J.A.Sloane,“A Fast Encoding Method for LatticeCodes and Quantizers,”IEEE Trans.Inform.Theory,Vol.IT-29,No.6,pp.820-824,Nov.1983.
Claims (32)
1.一种用于量化输入的LPC滤波器的多基准量化设备,包括:
使用相应的不同基准的多个差分量化器;以及
用于使用基准选择标准在差分量化器的不同基准中选择基准的基准选择部件;
其中,差分量化器使用所选择的基准来将输入的LPC滤波器差分量化。
2.如权利要求1所述的用于量化输入的LPC滤波器的多基准量化设备,包括:用于向解码器发送由差分量化器使用所选择的基准产生的差分量化的LPC滤波器的部件。
3.如权利要求1所述的用于量化输入的LPC滤波器的多基准量化设备,其中,从由以下各项组成的组中选择至少一个基准:
-先前量化的LPC滤波器;
-未来的量化的LPC滤波器;
-先前量化的LPC滤波器和未来的量化的LPC滤波器的平均值;
-使用绝对量化器量化的LPC滤波器;
-应用于过去的量化的LPC滤波器的外插操作的结果;
-应用于未来的量化的LPC滤波器的外插操作的结果;
-应用于过去的量化的LPC滤波器的内插操作的结果;
-应用于未来的量化的LPC滤波器的内插操作的结果;
-应用于量化的LPC滤波器的自回归预测的结果;
-应用于量化的LPC滤波器的移动平均预测的结果;以及
-编码器和解码器两者都已知的量化的滤波器值。
4.如权利要求1所述的用于量化输入的LPC滤波器的多基准量化设备,其中,从由以下各项组成的组中选择所述基准选择标准:
-使得比特率最小来取得目标失真水平的第一标准;以及
-使得在给定比特率产生的失真水平最小的第二标准。
5.如权利要求1所述的用于量化输入的LPC滤波器的多基准量化设备,其中,所述基准选择部件包括闭环选择器,在该闭环选择器中,在相应的差分量化器中尝试所有不同的基准,并且选择使基准选择标准最优化的基准。
6.如权利要求1所述的用于量化输入的LPC滤波器的多基准量化设备,其中,所述基准选择部件包括开环选择器,该开环选择器基于要量化的输入的LPC滤波器的系数的值和形成所述不同的基准的滤波器的系数的值来执行基准的预先确定。
7.如权利要求1所述的用于量化输入的LPC滤波器的多基准量化设备,包括用于向解码器发送表示所选择的基准和使用所选择的基准的差分量化器的索引的部件。
8.如权利要求1所述的用于量化输入的LPC滤波器的多基准量化设备,还包括:
至少一个绝对量化器;以及
用于使用量化模式选择标准选择用于量化输入的LPC滤波器的绝对量化模式和差分量化模式之一的部件。
9.如权利要求8所述的用于量化输入的LPC滤波器的多基准量化设备,包括用于向解码器发送表示所选择的绝对量化模式或差分量化模式的索引的部件。
10.如权利要求8所述的用于量化输入的LPC滤波器的多基准量化设备,其中,从由以下各项组成的组中选择所述量化模式选择标准:
-使得比特率最小来取得目标失真水平的第一标准;以及
-使得在给定比特率产生的失真水平最小的第二标准。
11.一种用于量化输入的LPC滤波器的多基准量化方法,包括:
提供使用相应的不同基准的多个差分量化器;
使用基准选择标准在不同基准中选择基准;以及
利用所述差分量化器使用所选择的基准来量化输入的LPC滤波器。
12.如权利要求11所述的用于量化输入的LPC滤波器的多基准量化方法,包括向解码器发送由差分量化器使用所选择的基准产生的差分量化的LPC滤波器。
13.如权利要求11所述的用于量化输入的LPC滤波器的多基准量化方法,其中,从由以下各项组成的组中选择至少一个基准:
-先前量化的LPC滤波器;
-未来的量化的LPC滤波器;
-先前量化的LPC滤波器和未来的量化的LPC滤波器的平均值;
-使用绝对量化器量化的LPC滤波器;
-应用于过去的量化的LPC滤波器的外插操作的结果;
-应用于未来的量化的LPC滤波器的外插操作的结果;
-应用于过去的量化的LPC滤波器的内插操作的结果;
-应用于未来的量化的LPC滤波器的内插操作的结果;
-应用于量化的LPC滤波器的自回归预测的结果;
-应用于量化的LPC滤波器的移动平均预测的结果;以及
-编码器和解码器两者都已知的量化的滤波器值。
14.如权利要求11所述的用于量化输入的LPC滤波器的多基准量化方法,其中,从由以下各项组成的组中选择所述基准选择标准:
-使得比特率最小来取得目标失真水平的第一标准;以及
-使得在给定比特率产生的失真水平最小的第二标准。
15.如权利要求11所述的用于量化输入的LPC滤波器的多基准量化方法,其中,选择基准包括闭环选择,该闭环选择包含:在相应的差分量化器中尝试所有不同的基准,并且选择使基准选择标准最优化的基准。
16.如权利要求11所述的用于量化输入的LPC滤波器的多基准量化方法,其中,选择基准包括开环选择,该开环选择包含:基于要量化的输入的LPC滤波器的系数的值和形成所述不同的基准的滤波器的系数的值来执行基准的预先确定。
17.如权利要求11所述的用于量化输入的LPC滤波器的多基准量化方法,包括向解码器发送表示所选择的基准和使用所选择的基准的差分量化器的索引。
18.如权利要求11所述的用于量化输入的LPC滤波器的多基准量化方法,还包括:
提供至少一个绝对量化器;以及
使用量化模式选择标准选择用于量化输入的LPC滤波器的绝对量化模式和差分量化模式之一。
19.如权利要求18所述的用于量化输入的LPC滤波器的多基准量化方法,包括向解码器发送表示所选择的绝对量化模式或差分量化模式的索引。
20.如权利要求18所述的用于量化输入的LPC滤波器的多基准量化方法,其中,从由以下各项组成的组中选择所述量化模式选择标准:
-使得比特率最小来取得目标失真水平的第一标准;以及
-使得在给定比特率产生的失真水平最小的第二标准。
21.一种用于将从比特流提取的多基准差分量化的LPC滤波器逆量化的设备,包括:
用于从比特流提取关于多个可能基准中用于量化所述多基准差分量化的LPC滤波器的基准的信息的部件;以及
用于使用与所提取的基准信息相对应的基准将所述多基准差分量化的LPC滤波器逆量化的部件。
22.如权利要求21所述的用于将从比特流提取的多基准差分量化的LPC滤波器逆量化的设备,其中,所述关于多个可能基准中用于量化所述多基准差分量化的LPC滤波器的基准的信息包括表示所述基准的索引。
23.如权利要求21所述的用于将从比特流提取的多基准差分量化的LPC滤波器逆量化的设备,其中,从由以下各项组成的组中选择所述基准:
-先前量化的LPC滤波器;
-未来的量化的LPC滤波器;
-先前量化的LPC滤波器和未来的量化的LPC滤波器的平均值;
-使用绝对量化器量化的LPC滤波器;
-应用于过去的量化的LPC滤波器的外插操作的结果;
-应用于未来的量化的LPC滤波器的外插操作的结果;
-应用于过去的量化的LPC滤波器的内插操作的结果;
-应用于未来的量化的LPC滤波器的内插操作的结果;
-应用于量化的LPC滤波器的自回归预测的结果;
-应用于量化的LPC滤波器的移动平均预测的结果;以及
-编码器和解码器两者都已知的量化的滤波器值。
24.如权利要求21所述的用于将从比特流提取的多基准差分量化的LPC滤波器逆量化的设备,还包括:
用于从比特流提取关于量化模式的信息以便确定已经使用绝对量化还是多基准差分量化量化了所述LPC滤波器的部件。
25.如权利要求24所述的用于将从比特流提取的多基准差分量化的LPC滤波器逆量化的设备,其中,所述关于量化模式的信息包括表示绝对量化或多基准差分量化的索引。
26.如权利要求24所述的用于将从比特流提取的多基准差分量化的LPC滤波器逆量化的设备,其中,如果所述关于量化模式的信息指示已经使用绝对量化量化了LPC滤波器,则所述用于逆量化的部件使用逆绝对量化。
27.一种用于将从比特流提取的多基准差分量化的LPC滤波器逆量化的方法,包括:
从比特流提取关于多个可能基准中用于量化所述多基准差分量化的LPC滤波器的基准的信息;以及
使用与所提取的基准信息相对应的基准将所述多基准差分量化的LPC滤波器逆量化。
28.如权利要求27所述的用于将从比特流提取的多基准差分量化的LPC滤波器逆量化的方法,其中,所述关于多个可能基准中用于量化所述多基准差分量化的LPC滤波器的基准的信息包括表示所述基准的索引。
29.如权利要求27所述的用于将从比特流提取的多基准差分量化的LPC滤波器逆量化的方法,其中,从由以下各项组成的组中选择所述基准:
-先前量化的LPC滤波器;
-未来的量化的LPC滤波器;
-先前量化的LPC滤波器和未来的量化的LPC滤波器的平均值;
-使用绝对量化器量化的LPC滤波器;
-应用于过去的量化的LPC滤波器的外插操作的结果;
-应用于未来的量化的LPC滤波器的外插操作的结果;
-应用于过去的量化的LPC滤波器的内插操作的结果;
-应用于未来的量化的LPC滤波器的内插操作的结果;
-应用于量化的LPC滤波器的自回归预测的结果;
-应用于量化的LPC滤波器的移动平均预测的结果;以及
-编码器和解码器两者都已知的量化的滤波器值。
30.如权利要求27所述的用于将从比特流提取的多基准差分量化的LPC滤波器逆量化的方法,还包括:
从比特流提取关于量化模式的信息以便确定已经使用绝对量化还是多基准差分量化量化了所述LPC滤波器。
31.如权利要求30所述的用于将从比特流提取的多基准差分量化的LPC滤波器逆量化的方法,其中,所述关于量化模式的信息包括表示绝对量化或多基准差分量化的索引。
32.如权利要求30所述的用于将从比特流提取的多基准差分量化的LPC滤波器逆量化的方法,其中,如果所述关于量化模式的信息指示已经使用绝对量化量化了LPC滤波器,则使用逆绝对量化将所述LPC滤波器逆量化。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US12966908P | 2008-07-10 | 2008-07-10 | |
US61/129,669 | 2008-07-10 | ||
US20207509P | 2009-01-27 | 2009-01-27 | |
US61/202,075 | 2009-01-27 | ||
PCT/CA2009/000981 WO2010003254A1 (en) | 2008-07-10 | 2009-07-10 | Multi-reference lpc filter quantization and inverse quantization device and method |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102089810A CN102089810A (zh) | 2011-06-08 |
CN102089810B true CN102089810B (zh) | 2013-05-08 |
Family
ID=41506638
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2009801267267A Active CN102089810B (zh) | 2008-07-10 | 2009-07-10 | 多基准线性预测系数滤波器量化和逆量化设备及方法 |
CN2009801267394A Active CN102119414B (zh) | 2008-07-10 | 2009-07-10 | 用于在超帧中量化和逆量化线性预测系数滤波器的设备和方法 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2009801267394A Active CN102119414B (zh) | 2008-07-10 | 2009-07-10 | 用于在超帧中量化和逆量化线性预测系数滤波器的设备和方法 |
Country Status (17)
Country | Link |
---|---|
US (4) | US8712764B2 (zh) |
EP (3) | EP2301021B1 (zh) |
JP (2) | JP2011527442A (zh) |
KR (2) | KR101604774B1 (zh) |
CN (2) | CN102089810B (zh) |
BR (1) | BRPI0915450B1 (zh) |
CA (5) | CA2729665C (zh) |
CY (3) | CY1119501T1 (zh) |
DK (3) | DK2301022T3 (zh) |
ES (3) | ES2639747T3 (zh) |
HK (2) | HK1153840A1 (zh) |
MX (1) | MX2011000363A (zh) |
NO (1) | NO2313887T3 (zh) |
PL (1) | PL2313887T3 (zh) |
PT (3) | PT2313887T (zh) |
RU (2) | RU2509379C2 (zh) |
WO (3) | WO2010003252A1 (zh) |
Families Citing this family (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008107027A1 (en) * | 2007-03-02 | 2008-09-12 | Telefonaktiebolaget Lm Ericsson (Publ) | Methods and arrangements in a telecommunications network |
CN101308655B (zh) * | 2007-05-16 | 2011-07-06 | 展讯通信(上海)有限公司 | 一种音频编解码方法与装置 |
EP2077551B1 (en) * | 2008-01-04 | 2011-03-02 | Dolby Sweden AB | Audio encoder and decoder |
US20110158189A1 (en) * | 2009-12-29 | 2011-06-30 | Industrial Technology Research Institute | Methods and Apparatus for Multi-Transmitter Collaborative Communications Systems |
KR101660843B1 (ko) * | 2010-05-27 | 2016-09-29 | 삼성전자주식회사 | Lpc 계수 양자화를 위한 가중치 함수 결정 장치 및 방법 |
JP5882895B2 (ja) * | 2010-06-14 | 2016-03-09 | パナソニック株式会社 | 復号装置 |
CA3025108C (en) * | 2010-07-02 | 2020-10-27 | Dolby International Ab | Audio decoding with selective post filtering |
KR101747917B1 (ko) * | 2010-10-18 | 2017-06-15 | 삼성전자주식회사 | 선형 예측 계수를 양자화하기 위한 저복잡도를 가지는 가중치 함수 결정 장치 및 방법 |
CN104025191A (zh) * | 2011-10-18 | 2014-09-03 | 爱立信(中国)通信有限公司 | 用于自适应多速率编解码器的改进方法和设备 |
US9842598B2 (en) * | 2013-02-21 | 2017-12-12 | Qualcomm Incorporated | Systems and methods for mitigating potential frame instability |
US9208775B2 (en) * | 2013-02-21 | 2015-12-08 | Qualcomm Incorporated | Systems and methods for determining pitch pulse period signal boundaries |
US9940942B2 (en) * | 2013-04-05 | 2018-04-10 | Dolby International Ab | Advanced quantizer |
UA112833C2 (uk) | 2013-05-24 | 2016-10-25 | Долбі Інтернешнл Аб | Аудіо кодер і декодер |
FR3008533A1 (fr) * | 2013-07-12 | 2015-01-16 | Orange | Facteur d'echelle optimise pour l'extension de bande de frequence dans un decodeur de signaux audiofrequences |
CN104299614B (zh) * | 2013-07-16 | 2017-12-29 | 华为技术有限公司 | 解码方法和解码装置 |
US10970967B2 (en) * | 2014-09-24 | 2021-04-06 | Jcm American Corporation | Electronic voucher ticket system |
US9407989B1 (en) | 2015-06-30 | 2016-08-02 | Arthur Woodrow | Closed audio circuit |
CN108701462B (zh) * | 2016-03-21 | 2020-09-25 | 华为技术有限公司 | 加权矩阵系数的自适应量化 |
US10366698B2 (en) | 2016-08-30 | 2019-07-30 | Dts, Inc. | Variable length coding of indices and bit scheduling in a pyramid vector quantizer |
CN111670473A (zh) | 2017-12-19 | 2020-09-15 | 杜比国际公司 | 用于统一语音及音频解码基于qmf的谐波移调器改进的方法及设备 |
TWI812658B (zh) | 2017-12-19 | 2023-08-21 | 瑞典商都比國際公司 | 用於統一語音及音訊之解碼及編碼去關聯濾波器之改良之方法、裝置及系統 |
EP3729298A1 (en) | 2017-12-19 | 2020-10-28 | Dolby International AB | Methods and apparatus systems for unified speech and audio decoding improvements |
US10950251B2 (en) * | 2018-03-05 | 2021-03-16 | Dts, Inc. | Coding of harmonic signals in transform-based audio codecs |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5859932A (en) * | 1994-04-20 | 1999-01-12 | Matsushita Electric Industrial Co. Ltd. | Vector quantization coding apparatus and decoding apparatus |
US6996523B1 (en) * | 2001-02-13 | 2006-02-07 | Hughes Electronics Corporation | Prototype waveform magnitude quantization for a frequency domain interpolative speech codec system |
CN101110214A (zh) * | 2007-08-10 | 2008-01-23 | 北京理工大学 | 一种基于多描述格型矢量量化技术的语音编码方法 |
Family Cites Families (76)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE69133296T2 (de) * | 1990-02-22 | 2004-01-29 | Nec Corp | Sprachcodierer |
US6006174A (en) * | 1990-10-03 | 1999-12-21 | Interdigital Technology Coporation | Multiple impulse excitation speech encoder and decoder |
US5255339A (en) * | 1991-07-19 | 1993-10-19 | Motorola, Inc. | Low bit rate vocoder means and method |
US5233660A (en) * | 1991-09-10 | 1993-08-03 | At&T Bell Laboratories | Method and apparatus for low-delay celp speech coding and decoding |
FI90477C (fi) * | 1992-03-23 | 1994-02-10 | Nokia Mobile Phones Ltd | Puhesignaalin laadun parannusmenetelmä lineaarista ennustusta käyttävään koodausjärjestelmään |
EP0751496B1 (en) | 1992-06-29 | 2000-04-19 | Nippon Telegraph And Telephone Corporation | Speech coding method and apparatus for the same |
JP3255189B2 (ja) | 1992-12-01 | 2002-02-12 | 日本電信電話株式会社 | 音声パラメータの符号化方法および復号方法 |
DE4492048T1 (de) * | 1993-03-26 | 1995-04-27 | Motorola Inc | Vektorquantisierungs-Verfahren und Vorrichtung |
WO1995010760A2 (en) * | 1993-10-08 | 1995-04-20 | Comsat Corporation | Improved low bit rate vocoders and methods of operation therefor |
FI98163C (fi) * | 1994-02-08 | 1997-04-25 | Nokia Mobile Phones Ltd | Koodausjärjestelmä parametriseen puheenkoodaukseen |
CA2154911C (en) * | 1994-08-02 | 2001-01-02 | Kazunori Ozawa | Speech coding device |
JP3235703B2 (ja) * | 1995-03-10 | 2001-12-04 | 日本電信電話株式会社 | ディジタルフィルタのフィルタ係数決定方法 |
US6263307B1 (en) * | 1995-04-19 | 2001-07-17 | Texas Instruments Incorporated | Adaptive weiner filtering using line spectral frequencies |
US5649051A (en) * | 1995-06-01 | 1997-07-15 | Rothweiler; Joseph Harvey | Constant data rate speech encoder for limited bandwidth path |
JP3537008B2 (ja) | 1995-07-17 | 2004-06-14 | 株式会社日立国際電気 | 音声符号化通信方式とその送受信装置 |
TW321810B (zh) * | 1995-10-26 | 1997-12-01 | Sony Co Ltd | |
US5956674A (en) * | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
JP3094908B2 (ja) * | 1996-04-17 | 2000-10-03 | 日本電気株式会社 | 音声符号化装置 |
US6904404B1 (en) * | 1996-07-01 | 2005-06-07 | Matsushita Electric Industrial Co., Ltd. | Multistage inverse quantization having the plurality of frequency bands |
JP3357795B2 (ja) * | 1996-08-16 | 2002-12-16 | 株式会社東芝 | 音声符号化方法および装置 |
JP3707153B2 (ja) * | 1996-09-24 | 2005-10-19 | ソニー株式会社 | ベクトル量子化方法、音声符号化方法及び装置 |
JP3707154B2 (ja) * | 1996-09-24 | 2005-10-19 | ソニー株式会社 | 音声符号化方法及び装置 |
US6154499A (en) * | 1996-10-21 | 2000-11-28 | Comsat Corporation | Communication systems using nested coder and compatible channel coding |
US6167375A (en) * | 1997-03-17 | 2000-12-26 | Kabushiki Kaisha Toshiba | Method for encoding and decoding a speech signal including background noise |
DE19730130C2 (de) * | 1997-07-14 | 2002-02-28 | Fraunhofer Ges Forschung | Verfahren zum Codieren eines Audiosignals |
TW408298B (en) * | 1997-08-28 | 2000-10-11 | Texas Instruments Inc | Improved method for switched-predictive quantization |
US6889185B1 (en) * | 1997-08-28 | 2005-05-03 | Texas Instruments Incorporated | Quantization of linear prediction coefficients using perceptual weighting |
WO1999010719A1 (en) * | 1997-08-29 | 1999-03-04 | The Regents Of The University Of California | Method and apparatus for hybrid coding of speech at 4kbps |
KR100361883B1 (ko) * | 1997-10-03 | 2003-01-24 | 마츠시타 덴끼 산교 가부시키가이샤 | 오디오신호압축방법,오디오신호압축장치,음성신호압축방법,음성신호압축장치,음성인식방법및음성인식장치 |
JP3842432B2 (ja) * | 1998-04-20 | 2006-11-08 | 株式会社東芝 | ベクトル量子化方法 |
US7072832B1 (en) * | 1998-08-24 | 2006-07-04 | Mindspeed Technologies, Inc. | System for speech encoding having an adaptive encoding arrangement |
US6507814B1 (en) * | 1998-08-24 | 2003-01-14 | Conexant Systems, Inc. | Pitch determination using speech classification and prior pitch estimation |
US6823303B1 (en) * | 1998-08-24 | 2004-11-23 | Conexant Systems, Inc. | Speech encoder using voice activity detection in coding noise |
US7272556B1 (en) * | 1998-09-23 | 2007-09-18 | Lucent Technologies Inc. | Scalable and embedded codec for speech and audio signals |
FR2784218B1 (fr) * | 1998-10-06 | 2000-12-08 | Thomson Csf | Procede de codage de la parole a bas debit |
JP3343082B2 (ja) * | 1998-10-27 | 2002-11-11 | 松下電器産業株式会社 | Celp型音声符号化装置 |
US6691082B1 (en) | 1999-08-03 | 2004-02-10 | Lucent Technologies Inc | Method and system for sub-band hybrid coding |
US6782360B1 (en) * | 1999-09-22 | 2004-08-24 | Mindspeed Technologies, Inc. | Gain quantization for a CELP speech coder |
AU7486200A (en) | 1999-09-22 | 2001-04-24 | Conexant Systems, Inc. | Multimode speech encoder |
US7315815B1 (en) | 1999-09-22 | 2008-01-01 | Microsoft Corporation | LPC-harmonic vocoder with superframe structure |
US6792405B2 (en) * | 1999-12-10 | 2004-09-14 | At&T Corp. | Bitstream-based feature extraction method for a front-end speech recognizer |
JP2002055699A (ja) * | 2000-08-10 | 2002-02-20 | Mitsubishi Electric Corp | 音声符号化装置および音声符号化方法 |
JP2002055700A (ja) | 2000-08-11 | 2002-02-20 | Hitachi Kokusai Electric Inc | 音声信号符号復号化システム |
KR100910282B1 (ko) * | 2000-11-30 | 2009-08-03 | 파나소닉 주식회사 | Lpc 파라미터의 벡터 양자화 장치, lpc 파라미터복호화 장치, 기록 매체, 음성 부호화 장치, 음성 복호화장치, 음성 신호 송신 장치, 및 음성 신호 수신 장치 |
KR20020075592A (ko) * | 2001-03-26 | 2002-10-05 | 한국전자통신연구원 | 광대역 음성 부호화기용 lsf 양자화기 |
US7003454B2 (en) * | 2001-05-16 | 2006-02-21 | Nokia Corporation | Method and system for line spectral frequency vector quantization in speech codec |
US6584437B2 (en) | 2001-06-11 | 2003-06-24 | Nokia Mobile Phones Ltd. | Method and apparatus for coding successive pitch periods in speech signal |
US6658383B2 (en) | 2001-06-26 | 2003-12-02 | Microsoft Corporation | Method for coding speech and music signals |
US6711027B2 (en) * | 2001-07-23 | 2004-03-23 | Intel Corporation | Modules having paths of different impedances |
US7647223B2 (en) * | 2001-08-16 | 2010-01-12 | Broadcom Corporation | Robust composite quantization with sub-quantizers and inverse sub-quantizers using illegal space |
US7386447B2 (en) * | 2001-11-02 | 2008-06-10 | Texas Instruments Incorporated | Speech coder and method |
SE521600C2 (sv) * | 2001-12-04 | 2003-11-18 | Global Ip Sound Ab | Lågbittaktskodek |
JP4263412B2 (ja) * | 2002-01-29 | 2009-05-13 | 富士通株式会社 | 音声符号変換方法 |
US20040002856A1 (en) * | 2002-03-08 | 2004-01-01 | Udaya Bhaskar | Multi-rate frequency domain interpolative speech CODEC system |
KR101001170B1 (ko) | 2002-07-16 | 2010-12-15 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 오디오 코딩 |
US7536305B2 (en) * | 2002-09-04 | 2009-05-19 | Microsoft Corporation | Mixed lossless audio compression |
CA2511516C (en) * | 2002-12-24 | 2009-03-03 | Nokia Corporation | Method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding |
KR100486732B1 (ko) | 2003-02-19 | 2005-05-03 | 삼성전자주식회사 | 블럭제한된 트렐리스 부호화 양자화방법과 음성부호화시스템에있어서 이를 채용한 라인스펙트럼주파수 계수양자화방법 및 장치 |
WO2004090864A2 (en) | 2003-03-12 | 2004-10-21 | The Indian Institute Of Technology, Bombay | Method and apparatus for the encoding and decoding of speech |
KR100732659B1 (ko) * | 2003-05-01 | 2007-06-27 | 노키아 코포레이션 | 가변 비트 레이트 광대역 스피치 음성 코딩시의 이득양자화를 위한 방법 및 장치 |
FR2867649A1 (fr) * | 2003-12-10 | 2005-09-16 | France Telecom | Procede de codage multiple optimise |
CA2457988A1 (en) | 2004-02-18 | 2005-08-18 | Voiceage Corporation | Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization |
FR2869151B1 (fr) * | 2004-04-19 | 2007-01-26 | Thales Sa | Procede de quantification d'un codeur de parole a tres bas debit |
BRPI0510303A (pt) * | 2004-04-27 | 2007-10-02 | Matsushita Electric Ind Co Ltd | dispositivo de codificação escalável, dispositivo de decodificação escalável, e seu método |
US7739120B2 (en) | 2004-05-17 | 2010-06-15 | Nokia Corporation | Selection of coding models for encoding an audio signal |
US7596486B2 (en) * | 2004-05-19 | 2009-09-29 | Nokia Corporation | Encoding an audio signal using different audio coder modes |
JP4871501B2 (ja) | 2004-11-04 | 2012-02-08 | パナソニック株式会社 | ベクトル変換装置及びベクトル変換方法 |
JP5129118B2 (ja) * | 2005-04-01 | 2013-01-23 | クゥアルコム・インコーポレイテッド | 帯域幅拡張音声予測励振信号の反疎性フィルタリングのための方法及び装置 |
WO2007040353A1 (en) | 2005-10-05 | 2007-04-12 | Lg Electronics Inc. | Method and apparatus for signal processing |
JP2007142547A (ja) | 2005-11-15 | 2007-06-07 | Oki Electric Ind Co Ltd | 符号化方法及び復号化方法とその符号器及び復号器 |
US8306813B2 (en) * | 2007-03-02 | 2012-11-06 | Panasonic Corporation | Encoding device and encoding method |
US8515767B2 (en) * | 2007-11-04 | 2013-08-20 | Qualcomm Incorporated | Technique for encoding/decoding of codebook indices for quantized MDCT spectrum in scalable speech and audio codecs |
EP2077551B1 (en) * | 2008-01-04 | 2011-03-02 | Dolby Sweden AB | Audio encoder and decoder |
CN101911185B (zh) * | 2008-01-16 | 2013-04-03 | 松下电器产业株式会社 | 矢量量化装置、矢量反量化装置及其方法 |
US8386271B2 (en) * | 2008-03-25 | 2013-02-26 | Microsoft Corporation | Lossless and near lossless scalable audio codec |
GB2466670B (en) * | 2009-01-06 | 2012-11-14 | Skype | Speech encoding |
-
2009
- 2009-07-10 NO NO09793769A patent/NO2313887T3/no unknown
- 2009-07-10 CA CA2729665A patent/CA2729665C/en active Active
- 2009-07-10 JP JP2011516938A patent/JP2011527442A/ja active Pending
- 2009-07-10 WO PCT/CA2009/000979 patent/WO2010003252A1/en active Application Filing
- 2009-07-10 CA CA2729751A patent/CA2729751C/en active Active
- 2009-07-10 ES ES09793768.4T patent/ES2639747T3/es active Active
- 2009-07-10 PT PT97937692T patent/PT2313887T/pt unknown
- 2009-07-10 CA CA2729752A patent/CA2729752C/en active Active
- 2009-07-10 DK DK09793770.0T patent/DK2301022T3/en active
- 2009-07-10 WO PCT/CA2009/000981 patent/WO2010003254A1/en active Application Filing
- 2009-07-10 DK DK09793768.4T patent/DK2301021T3/en active
- 2009-07-10 BR BRPI0915450-7A patent/BRPI0915450B1/pt active IP Right Grant
- 2009-07-10 DK DK09793769.2T patent/DK2313887T3/da active
- 2009-07-10 CN CN2009801267267A patent/CN102089810B/zh active Active
- 2009-07-10 US US12/501,197 patent/US8712764B2/en active Active
- 2009-07-10 CA CA2972808A patent/CA2972808C/en active Active
- 2009-07-10 US US12/501,188 patent/US8332213B2/en active Active
- 2009-07-10 EP EP09793768.4A patent/EP2301021B1/en active Active
- 2009-07-10 CA CA2972812A patent/CA2972812C/en active Active
- 2009-07-10 RU RU2011104784/08A patent/RU2509379C2/ru active
- 2009-07-10 KR KR1020117002977A patent/KR101604774B1/ko active IP Right Grant
- 2009-07-10 ES ES09793770.0T patent/ES2650492T3/es active Active
- 2009-07-10 MX MX2011000363A patent/MX2011000363A/es active IP Right Grant
- 2009-07-10 PT PT97937700T patent/PT2301022T/pt unknown
- 2009-07-10 RU RU2011104813/08A patent/RU2011104813A/ru unknown
- 2009-07-10 PL PL09793769T patent/PL2313887T3/pl unknown
- 2009-07-10 ES ES09793769.2T patent/ES2645375T3/es active Active
- 2009-07-10 JP JP2011516937A patent/JP5710476B2/ja active Active
- 2009-07-10 KR KR1020117002983A patent/KR101592968B1/ko active IP Right Grant
- 2009-07-10 WO PCT/CA2009/000980 patent/WO2010003253A1/en active Application Filing
- 2009-07-10 EP EP09793769.2A patent/EP2313887B1/en active Active
- 2009-07-10 PT PT97937684T patent/PT2301021T/pt unknown
- 2009-07-10 CN CN2009801267394A patent/CN102119414B/zh active Active
- 2009-07-10 US US12/501,201 patent/US9245532B2/en not_active Ceased
- 2009-07-10 EP EP09793770.0A patent/EP2301022B1/en active Active
-
2011
- 2011-07-27 HK HK11107811.9A patent/HK1153840A1/xx unknown
- 2011-08-04 HK HK11108095.4A patent/HK1154109A1/xx unknown
-
2017
- 2017-09-08 CY CY20171100951T patent/CY1119501T1/el unknown
- 2017-10-26 CY CY20171101113T patent/CY1119494T1/el unknown
- 2017-12-05 CY CY20171101272T patent/CY1119659T1/el unknown
-
2018
- 2018-01-23 US US15/877,829 patent/USRE49363E1/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5859932A (en) * | 1994-04-20 | 1999-01-12 | Matsushita Electric Industrial Co. Ltd. | Vector quantization coding apparatus and decoding apparatus |
US6996523B1 (en) * | 2001-02-13 | 2006-02-07 | Hughes Electronics Corporation | Prototype waveform magnitude quantization for a frequency domain interpolative speech codec system |
CN101110214A (zh) * | 2007-08-10 | 2008-01-23 | 北京理工大学 | 一种基于多描述格型矢量量化技术的语音编码方法 |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102089810B (zh) | 多基准线性预测系数滤波器量化和逆量化设备及方法 | |
CN100576319C (zh) | 用于可变比特率语音编码中的线性预测参数的稳健预测向量量化的方法和设备 | |
JPH08263099A (ja) | 符号化装置 | |
Bessette et al. | Universal speech/audio coding using hybrid ACELP/TCX techniques | |
CN103843062A (zh) | 用于产生带宽扩展信号的设备和方法 | |
CN102150205A (zh) | 用于编码和解码统合的语音与音频的设备 | |
Chatterjee et al. | Low complexity wideband LSF quantization using GMM of uncorrelated Gaussian mixtures | |
kS kkSkkS et al. | km mmm SmmSZkukkS kkkk kkkLLk k kkkkkkS |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 1153840 Country of ref document: HK |
|
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: GR Ref document number: 1153840 Country of ref document: HK |