CN101490748B - 使用有损编码数据流和无损扩展数据流对源信号进行无损编码的方法和设备 - Google Patents
使用有损编码数据流和无损扩展数据流对源信号进行无损编码的方法和设备 Download PDFInfo
- Publication number
- CN101490748B CN101490748B CN2007800275553A CN200780027555A CN101490748B CN 101490748 B CN101490748 B CN 101490748B CN 2007800275553 A CN2007800275553 A CN 2007800275553A CN 200780027555 A CN200780027555 A CN 200780027555A CN 101490748 B CN101490748 B CN 101490748B
- Authority
- CN
- China
- Prior art keywords
- data stream
- signal
- lossless
- coding
- output signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/0017—Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M13/00—Coding, decoding or code conversion, for error detection or error correction; Coding theory basic assumptions; Coding bounds; Error probability evaluation methods; Channel models; Simulation or testing of codes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
Abstract
本发明涉及使用有损编码数据流和无损扩展数据流对源信号(SPCM)进行的无损编码,所述有损编码数据流和所述无损扩展数据流共同形成所述源信号的无损编码数据流(SDEC),无损音频压缩是指在解码器输出处具有原始PCM样本的比特精确重现的音频编码。无损编码/解码可以是mp3编码/解码。本发明使用针对基本层有损音频编解码器的残差信号的整数MDCT以及频域解相关(16)和时域解相关(16)。利用来自有损基本层编解码器的辅助信息允许减少总比特流中的冗余,从而提高基于有损的无损编解码器的编码效率。
Description
技术领域
本发明涉及一种使用有损编码数据流和无损扩展数据流对源信号进行无损编码的方法和设备,所述有损编码数据流和无损扩展数据流共同形成所述源信号的无损编码数据流。
背景技术
与有损音频编码技术(如mp3、AAC等)相反,无损压缩算法仅可以利用原始音频信号的冗余以减小数据速率。不可能依赖于如现有技术的有损音频编解码器中的心理声学模型所指出的不相关内容。相应地,所有无损音频编码方案的共同技术原理是应用滤波器或变换来解相关(例如预测滤波器或频率变换),然后以无损方式对变换后的信号进行编码。编码比特流包括:变换或滤波器的参数,以及变换后的信号的无损表示。参见例如:J.Makhoul,“Linear prediction:A tutorialreview”,Proceedings of the IEEE,Vol.63,pp.561-580,1975、T.Painter,A.Spanias,“Perceptual coding of digital audio”,Proceedings of the IEEE,Vol.88,No.4,pp.451-513,2000以及M.Hans,R.W.Schafer,“Losslesscompression of digital audio”,IEEE Signal Processing Magazine,July2001,pp.21-32。
图12和图13中描述了基于有损的无损编码的基本原理。在图12左侧的编码部分,PCM音频输入信号SPCM通过有损编码器121到达有损解码器122,并且作为有损比特流到达解码部分(右侧)的有损解码器125。使用有损编码和解码来对信号进行解相关。在减法器123中,将解码器122的输出信号从输入信号SPCM中移除,所产生的差信号通过无损编码器124,作为扩展比特流到达无损解码器127。将解码器125和127的输出信号组合126,以恢复原始信号SPCM。
在EP-B-0756386和US-B-6498811中公开了这一基本原理,还在以下文献中讨论了该原理:P.Craven,M.Gerzon,“Lossless Coding forAudio Discs”,J.Audio Eng.Soc.,Vol.44,No.9,September 1996,以及J.Koller,Th.Sporer,K.H.Brandenburg,“Robust Coding of High QualityAudio Signals”,AES 103rd Convention,Preprint 4621,August 1997。
在图13的有损编码器中,PCM音频输入信号SPCM通过分解滤波器组131和子带样本的量化132到达编码和比特流打包133。量化由感知模型计算器134控制,感知模型计算器134从分解滤波器组131接收信号SPCM和相应信息。在解码器侧,编码后的有损比特流进入用于对比特流进行解打包的装置135,接着是用于对子带样本进行解码的装置136,以及输出解码后的有损PCM信号SDec的合成滤波器组137。
在标准ISO/IEC 11172-3(MPEG-1音频)中对有损编码和解码的示例进行了详细描述。
在现有技术中,基于以下三种基本信号处理概念之一进行无损音频编码:
a)使用线性预测技术的时域解相关;
b)使用可逆整数分解-合成滤波器组的频域无损编码;
c)有损基本层编解码器的残差(误差信号)的无损编码。
发明内容
本发明要解决的问题是提供分级的无损音频编码和解码,所述分级的无损音频编码和解码建立在嵌入的有损音频编解码器之上,并提供与现有技术中基于有损的无损音频编码方案相比相同或更高的效率(即压缩比),而在计算复杂度方面可以以更有效的方式来实现。该问题是通过权利要求1和3中公开的方法来解决的。在权利要求2和4中分别公开了利用这些方法的设备。
本发明的另外的优选实施例在相应从属权利要求中公开。
本发明在有损编码之上使用数学上无损的编码和解码。数学上无损的音频压缩是指在解码器输出处具有原始PCM样本的比特精确重现的音频编码。对于一些实施例,假设有损编码使用例如类似MDCT的频率变换或类似滤波器组在变换域中操作。作为示例,在整个描述中,使用mp3标准(ISO/IEC 11172-3层3)作为有损基本层。
所发送或记录的编码比特流包括两个部分:有损音频编解码器的嵌入比特流,以及针对一个或多个附加层的扩展数据,用于获得无损(即比特精确)的原始PCM样本或中间质量。
本发明利用来自概念a)、b)、c)的特征,即来自多种现有技术中无损音频编码方案的技术的相互组合。
本发明以协作的方式来使用频域解相关、时域解相关、或其组合,以准备用于有效无损编码的基本层有损音频编解码器的残差信号(误差信号)。
一些实施例还使用来自有损基本层编解码器的编码器信息。使用来自基本层编解码器的辅助信息允许降低总比特流中的冗余,因此提高了基于有损的无损编解码器的编码效率。
所有实施例的共同之处在于,可以从比特流中提取具有不同质量等级的音频信号的至少两种不同变型。这些变型包括由嵌入的有损编码方案和原始PCM样本的无损解码所表示的信号。对于一些实施例(见以下可选扩展3和4),可以对具有中间质量(在有损编解码器和数学上无损的质量所限定的范围内)的音频信号的一个或多个另外的变型进行解码。
描述了一种具体实现,其中通过整数MDCT在并行数据路径中代替或复制作为混合滤波器组的MDCT部分,整数MDCT使无损编码器模块内的全部有损解码成为多余,从而实现计算复杂度的降低。
此外,本发明允许使用简单的比特丢弃技术来剥离嵌入的有损比特流。
一些实施例可能有效地对嵌入的有效比特流进行重新编码,获得数据速率不同于(低于或高于)嵌入的“有损”比特流的原始数据速率的新‘有损’比特流。
本发明限于采用混合(分解)滤波器组的有损核心编解码器(例如通过利用子带滤波器组(例如多相滤波器组)接着是附加的MDCT/DCT以增加频谱分辨率)。如果子带滤波器组是不可能通过类似分解为“吉文斯旋转”和“提升步(lifting steps)”的技术来进行特定可逆整数实现的类型,即如果不可能通过应用分解和合成子带滤波器组来实现整数输入信号的完美数学重建,则本发明尤为适用。
附图说明
参照附图描述本发明的示例性实施例,在附图中:
图1是基于有损的无损编码器的普通方框图;
图2是基于有损的无损解码器的普通方框图;
图3是mp3编码器的方框图;
图4是应用于mp3核心编解码器的第一实施例编码器的方框图;
图5是第一和第二实施例解码器的方框图;
图6是第二实施例编码器的方框图;
图7是具有附加舍入增益因子处理的第一实施例编码器的方框图;
图8是具有附加舍入增益因子处理的第一实施例解码器的方框图;
图9是用于嵌入的mp3比特流的解码器的方框图;
图10是用于嵌入mp3比特流加频域残差的解码器的方框图;
图11是编码器(左)和解码器(右)的可选时间解相关模块或步骤;
图12是已知的有损编码器和解码器的基本方框图;
图13是已知的基于有损的无损编码器和解码器的基本方框图。
具体实施方式
在图1的基于有损的无损编码器中,PCM音频输入信号SPCM通过子带滤波器组和抽选器(decimator)模块或步骤11、第一量化器12、整数变换13和第二量化器14到达复用器10。第一量化器14的输出提供表示量化器输入信号的量化值的索引值,即其对信号进行编码。量化器14的第二输出信号是量化后的输入信号值,在第一减法器151中从整数变换模块或步骤13的输出信号中减去该量化后的输入信号值(从而表示频域中的误差),第一减法器151的输出信号通过无损编码FD(频域)模块或步骤16到达复用器10。第一量化器12的输出信号通过插值和反子带滤波器组模块或步骤18并在第二减法器152中从相应延迟的(延迟17)输入信号SPCM中减去该信号。第二减法器的输出信号通过无损编码TD(时域)模块或步骤19到达复用器10,该复用器10输出相应复用的编码比特流SDEC。模块/级11、12、13和14共同形成了有损编码器。
在有损解码器内,跟随分解子带滤波器组11之后的变换由舍入/量化步骤12和整数变换13来代替。可选地,原始变换和舍入/量化步骤之后可以接着是整数变换作为并行数据路径。以下将对该选项进行详细描述。整数变换近似传统(浮点)MDCT变换,但在输入处接收整数值并在输出处产生整数值。通过将变换操作分解成可逆的“提升步”序列,可以以数学上无损的方式对完整的整数MDCT近似进行反转。在类似MPGE SLS(可缩放至无损)标准中的无损音频编码方案中,已经将这样的整数MDCT变换应用至原始时域PCM样本。然而,在本发明中,将整数变换应用在混合滤波器组(即如类似mp3的音频编码标准中所使用的混合滤波器组)的子带域中。
子带信号的无损传输可以解释为频域中的解相关。通过从原始频谱系数中减去量化的频谱系数来形成频谱残差。对频谱残差进行无损编码(无损编码FD16)。可选地,这可以以可缩放的方式来进行,以提供中间音频质量(参见EP06113596和EP06113576以及以下可选扩展4)。
由于在整数变换13之前的舍入/量化步骤12,并且由于子带滤波器组11的可能不完美的重建特性,通过从延迟的原始PCM输入数据减去反子带滤波后的信号18(在舍入/量化步骤之后)来计算时域内的残差。在无损编码TD模块19内对时域中的残差(时间残差)进行无损编码。
这里,如EP06113596(参见以下可选扩展5)所述,可以应用使用线性预测滤波的可选时域解相关。
可以对有损编码比特流和已编码(整数)频谱以及时间残差进行复用以形成单个比特流或形成两个流(有损编码流和携带残差的无损扩展)或形成三个流:有损编码流、已编码频谱残差流和已编码时间残差流)。
在图2的解码器侧,已编码比特流SDEC进入解复用器20,该解复用器20输出有损编码比特流、无损编码的FD比特流和无损编码的TD比特流。有损编码比特流通过解码模块或步骤24(从表示量化值的索引值中恢复量化值,即量化器14的第二输出信号)、第一加法器25、反整数变换模块或步骤23以及插值器和反子带滤波器组模块或步骤21到达第二加法器28的第一输入。无损编码的FD比特流通过无损解码器模块或步骤26到达第一加法器的第二输入。无损编码的TD比特流通过无损解码器TD模块或步骤29和相应的延迟27到达第二加法器的第二输入,第二加法器输出解码的有损PCM信号SPCM。
在该无损解码器中,对全部有损的、频谱和时间残差数据进行解打包和解码。将频谱残差加至频域中的解码的有损数据中,并应用反整数变换23。注意,由于可逆整数变换和频谱残差编码方案的完美整数重建属性,反整数变换的结果将精确地是在编码器计算的量化后的子带信号。在恢复这些数据(混合滤波器组11的第一部分的量化后的子带信号)之后,应用反子带滤波器组21来重建时间信号。将解码和延迟后的时间残差加至该时间信号来重建与原始编码的PCM样本SPCM在数学上相同的PCM信号SPCM。
最后,在特定应用中,可以重现两级中间质量:完全而完美的重建将应用两种残差。可以仅通过应用频谱残差而忽略时间残差来创建较低一级但感知上无损的质量。使用传统的符合标准的有损解码器,可以仅通过对有损编码流进行解码来创建有损质量。可以仅通过应用频谱残差数据的一部分来创建另外的中间质量级。
在以下附图中,相同的附图标记分别表示相同的功能或模块或信号。
第一优选实施例
该优选实施例将使用公知的mp3标准作为嵌入的有损核心编解码器,在图3中示出了该编解码器的编码部分。原始输入信号SPCM通过多相滤波器组和抽选器503、分段和MDCT 504以及比特分配和量化器505到达复用器507。输入信号SPCM还通过FFT级或步骤501到达心理声学分析502,心理声学分析502控制步骤/级504和量化505中的分段(或加窗)。比特分配和量化器505还提供辅助信息515,该辅助信息515通过辅助信息编码器506到达输出信号517的复用器507。mp3标准应用MDCT变换系数的非均匀(即非整数)量化。
图4中的第一实施例编码器包括图3的mp3标准编码器。然而,采用以下的方式对嵌入的mp3编码器进行了修改:对来自多相滤波器组和抽选器503的子带信号512进行量化(执行舍入),并且已经使用整数MDCT(Int-MDCT)变换504代替了各子带信号的模块或步骤504中的原始MDCT变换。整数MDCT近似于原始非整数MDCT变换的数值行为,以保证由图4的编码器产生的嵌入mp3比特流可以被任何符合标准的mp3解码器解码而不出现质量退化。
除了修改的mp3编码器以外,本发明的编码器信号处理包括针对两个误差信号的无损编码方案:在频域中和在时域中。在频域中,在反量化器舍入模块或步骤521中对量化后的变换系数(从mp3比特流514中获得)进行舍入来获得整数值,在第一减法器522中从原始整数MDCT变换系数513中减去该整数值。在无损编码FD(频域)模块或步骤523中,对产生的整数误差值进行无损编码,并将其复用(使用复用器507)为比特流。在时域中,将量化(舍入)后的子带信号馈送入插值和子带滤波器组模块525中,并且在减法器526中从相应延迟(使用延迟514)的原始PCM样本SPCM中减去产生的时域信号。可选地,对产生的时域误差信号进行时域解相关(见以下时域解相关器527)、无损编码(使用无损编码TD模块或步骤528)并复用(使用复用器507)为比特流。复用器507输出相应编码比特流517。以独立于平台的方式来实现子带滤波器组525。
实质上,在图5的第一实施例无损解码器中,对编码器方框图中的所有步骤进行反转。在解复用器301中,对接收的编码比特流517进行解复用。在“反”量化器模块或步骤217中,对来自嵌入的mp3比特流的MDCT系数215进行解码,并在舍入模块或步骤221中对其进行舍入来获得整数值222。在辅助信息解码器模块或步骤306中对辅助信息进行解码,并且使用辅助信息来控制反量化器217。在无损解码FD模块或步骤305中对频域残差243进行解码,并在第一加法器261中对其执行加法来获得完整的整数MDCT系数。在应用反整数MDCT变换308之后,将子带信号226馈送入插值和多相合成滤波器组232中。在图5的上侧路径中,在无损解码TD模块或步骤302中对时域残差240进行解码,可选地在反TD相关模块或步骤303(即可选的TD解相关527的反过程)中对其进行相关,最后在第二加法器262中将其与多相合成滤波器组232的输出信号相加来获得原始PCM样本SPCM。
有利地,任何符合标准的mp3解码器都可以对嵌入的mp3比特流进行解码。
第二优选实施例
在图6的编码器中,编码器方框图的下部包括未修改的传统的符合标准的mp3编码器,参见图3。与嵌入的mp3编码器的分段和MDCT变换模块504并行,在舍入模块或步骤520中对子带信号512(多相滤波器组和抽选模块503的输出)进行舍入来获得整数值,然后将该整数值馈送入分段和整数MDCT模块529以及插值和子带滤波器组模块525。将模块529的输出输入至第一减法器522。模块/步骤521到528具有与图4中类似的相同意义和操作。
实质上,与第一优选实施例的差别在于,以并行于传统MDCT的方式来计算整数MDCT变换而非取代传统MDCT。第二实施例具有的优点在于,通过完全符合标准和传统mp3编码器来获得比特流的mp3部分。即与通常的MDCT相比,不存在通过舍入步骤加整数MDCT的任何近似误差使嵌入的mp3比特流的质量退化的危险。
在编码器方框图的其余部分(模块/步骤521到528)中,信号流包括在频域和时域中针对两个误差信号的无损编码方案。在频域中,对量化后的变换系数(从mp3比特流中获得)进行舍入来获得整数值,随后从整数MDCT变换系数中减去该整数值。对产生的整数误差值进行无损编码(在523中),并复用为比特流。在时域中,将量化(舍入)后的子带信号馈送入插值和子带滤波器组中,并从原始PCM样本SPCM中减去产生的时域信号。可选地,对时域误差信号进行解相关(见以下)、无损编码(在528中)并复用为比特流。以独立于平台的方式来实现子带滤波器组。
第二实施例的解码器与第一实施例解码器相同。
可选扩展1:在对子带信号进行舍入之前应用增益
为了减小由对子带信号进行舍入而产生的量化误差,在舍入操作之前可以应用增益因子g。为了将舍入后的值转换回至原始域,在舍入之后要应用反增益因子1/g。在图7的编码器和图8的解码器中分别示出了所需的缩放。图7中示出的编码器是图4中编码器的附加使用了这些增益因子的增强版本。
在图7中,实质上,所示的模块具有与图4中相应模块相同的功能或操作。在第一乘法器223中,子带信号206乘以增益因子g。在舍入操作225之后,获得可以由整数MDCT 248来处理的整数取值的子带样本226。为了获得多相滤波器组232的重建误差(即时域残差),在第一除法器230中要将舍入后的子带样本226除以g。因此,产生的样本231是原始子带样本206的量化版本。量化后的样本值是1/g的倍数。通过选择更大的值g,可以减小量化误差。整数MDCT 248之后,在第二除法器249中,也要将整数取值的频谱值229除以g以继续标准mp3编码器中的处理。量化和“反”量化后的频谱值255需要放置回到整数域中。因此,在第二乘法器219中,这些值与因子g相乘并且在舍入模块或步骤221中对其进行舍入。产生的值257表示整数域中的量化后的频谱数据,并且在第一减法器247中从整数MDCT 248的输出信号229中减去该值257以产生频域残差258。其余处理类似于图4中的处理。
在图8的相应的解码器中,也要考虑使用增益因子g。在频谱数据的解码(“反”量化器217和辅助信息解码器306)之后,在乘法器219中,量化值与因子g相乘,并在舍入模块或步骤221中将其舍入为如编码器(219、221)中的整数。在加入与编码器中信号258相同解码后的频域残差371、并应用反整数MDCT 308之后,在除法器309中执行使用因子1/g的重新缩放,以便将子带样本转换到原始域。产生的样本231与编码器中合成滤波器组205的输出相同。其余处理类似于图5中的处理。
可选扩展2:有损版本的解码(mp3解码器)
由于所提出的基于有损的无损编码方案的完整比特流包括嵌入的符合标准的mp3比特流,因此可以应用传统的mp3解码。在图9中所示的相应解码器信号流中,丢弃了比特流中描述时域残差240和频域残差243的部分。该丢弃操作也可以在解码器的上游进行,例如在传输网络中。模块或步骤301、306、217和232与图5中相应模块或步骤相同。然而,反MDCT模块或步骤3081可以用于代替反整数MDCT模块或步骤308。
可选扩展3:较高质量有损版本的解码
通过将来自嵌入的mp3比特流的信息和频域解相关进行组合,可以对音频内容的较高高质量而仍为有损的版本进行解码。在图10所示的信号流中,与图5中完全无损解码器相比,丢弃了关于时域残差240的信息。该丢弃操作也可以在解码器的上游进行,例如在传输网络中。
由于该可选解码器不会呈现无损PCM样本,因此没有必要(但可能)使用反整数MDCT 308来代替插值和多相滤波器组232之前的反MDCT 3081。
可选扩展4:用于对频域残差进行编码的分层结构
可以使用多层比特流结构对频域残差258的信息进行编码。例如,可以应用从MPEG SLS草案标准的比特平面算术编码原理或类似方案。因此,结合根据图10的高质量解码器,可以以比特速率级的精细颗粒度(和质量)来实现完全可缩放的编码方案。
可选扩展5:时域残差的解相关
结合图4、图5和图6,如上所述,可以在编码器侧应用时域残差信号的解相关,并在解码器侧应用时域残差信号的相应反解相关。图11示出了模块527(左侧)和模块303(右侧)内的功能。在TD解相关编码器(图11左侧)中,对时域残差应用线性预测滤波器。从残差中减去预测信号来移除任何剩余的短期相关。通过分析来自有损编码器和/或来自编解码器核心的频域解相关模块的信息,并可选地对实际残差信号进行分析,使预测滤波器系数适配于信号特性。此外,可能有必要使滤波器上的信号信息适配于接收机或解码器中的反时域解相关模块。因此,可能有必要在总比特流的无损扩展中包括特定信息。
在解码器侧(图11右侧),基于来自在前的解码级(有损解码器和/或频域解相关)的信息以及可能基于从时域解相关方案的编码器部分接收的辅助信息,计算线性预测滤波器的相同系数。以特定的方式应用该系数来反转在发射机侧获得的预测滤波效果,从而产生相关的时域残差。除了在编码器处使用前馈线性预测滤波之外,可以应用其他预测方案,例如反馈结构或前馈和反馈结构的混合。
有利地,本发明基于利用混合滤波器组(如mp3)的现有有损音频编码方案实现了无损编码。仅有的应当具有独立于平台的实现的重要信号处理模块是多相合成滤波器组。
第一和第二实施例具有以下具体优点:由于在编码器中仅需要计算一组(整数)MDCT变换,因此第一实施例允许编码器的低复杂度实现。另一方面,第二实施例允许编码器的较高质量的版本,其中,以并行地计算两组MDCT变换为代价,使用未修改的mp3编码器来产生嵌入的mp3比特流。
Claims (7)
1.一种使用有损编码数据流和无损扩展数据流对源音频信号(SPCM)进行无损编码的方法,所述有损编码数据流和所述无损扩展数据流共同形成所述源音频信号的无损编码数据流(SDEC),所述方法包括以下步骤:
-对所述源音频信号进行有损编码,其中所述源音频信号依次通过具有抽选功能的子带滤波器组(11)、第一量化(12)、整数变换(13)和第二量化(14),所述有损编码提供所述有损编码数据流,所述第一量化(12)被配置为对具有抽选功能的子带滤波器组(11)的输出进行舍入并向所述整数变换(13)提供输出信号;
-对所述第一量化(12)的输出信号进行插值和反子带滤波器组处理(18);
-在所述源音频信号的相应延迟(17)版本和所述反子带滤波器组处理(18)的输出信号之间形成(152)差值信号;
-对所述差值信号进行时域无损编码(19),以提供所述无损扩展数据流的时域残差信号部分,对所述第二量化(14)的输入信号和量化后的输出信号之间的另一差值信号(151)进行频域无损编码(16),以提供所述无损扩展数据流的频域残差信号部分;
-将所述有损编码数据流和所述无损扩展数据流的两个部分进行组合(10)来形成所述无损编码数据流(SDEC)。
2.一种使用有损编码数据流和无损扩展数据流对源音频信号(SPCM)进行无损编码的设备,所述有损编码数据流和所述无损扩展数据流一同形成所述源音频信号的无损编码数据流(SDEC),所述设备包括:
-适于对所述源音频信号进行有损编码的装置,其中所述源音频信号依次通过具有抽选功能的子带滤波器组(11)、第一量化(12)、整数变换(13)和第二量化(14),所述有损编码提供所述有损编码数据流,所述第一量化(12)被配置为对具有抽选功能的子带滤波器组(11)的输出进行舍入并向所述整数变换(13)提供输出信号;
-适于对所述第一量化(12)的输出信号进行插值和反子带滤波器组处理的装置(18);
-适于在所述源音频信号的相应延迟(17)版本和所述反子带滤波器组处理(18)的输出信号之间形成差值信号的装置(152);
-适于对所述差值信号进行时域无损编码以提供所述无损扩展数据流的时域残差信号部分,并对所述第二量化(14)的输入信号和量化后的输出信号之间的另一差值信号(151)进行频域无损编码以提供所述无损扩展数据流的频域残差信号部分的装置(19、16);
-适于将所述有损编码数据流和所述无损扩展数据流的两个部分进行组合来形成所述无损编码数据流(SDEC)的装置(10)。
3.一种对无损编码的源音频信号(SENC)数据流进行解码的方法,所述数据流是使用根据权利要求1的方法来编码的,所述解码方法包括以下步骤:
-对所述无损编码的源音频信号数据流进行解复用(20),以提供有损编码数据流和无损扩展数据流的时域残差信号部分和频域残差信号部分;
-使用量化解码器(24)、反整数变换(23)以及插值和子带滤波器组(21)来对所述有损编码数据流进行有损解码;
-对所述频域残差信号部分进行频域无损解码(26),并将输出信号与所述量化解码器(24)的相应输出信号进行组合(25),以及对时域残差信号部分进行时域无损解码(29)并将相应延迟(27)的输出信号与所述插值和子带滤波器组(21)的输出信号进行组合(28),从而重建所述源音频信号(SPCM)。
4.一种对无损编码的源音频信号(SENC)数据流进行解码的设备,所述数据流是使用根据权利要求1的方法来编码的,所述设备包括:
-适于对所述无损编码的源音频信号数据流进行解复用以提供有损编码数据流和无损扩展数据流的时域残差信号部分和频域残差信号部分的装置(20);
-适于使用量化解码器、反整数变换以及插值和子带滤波器组来对所述有损编码数据流进行有损解码的装置(24、23、21);
-适于对所述频域残差信号部分进行频域无损解码并将输出信号与所述量化解码器的相应输出信号进行组合、以及对时域残差信号部分进行时域无损解码并将相应延迟的输出信号与所述插值和子带滤波器组的输出信号进行组合,从而重建所述源音频信号(SPCM)的装置(26、25、29、27、28)。
5.根据权利要求1所述的方法,或根据权利要求2所述的设备,其中:
-所述第二量化(14)包括比特分配(505),并由原始输入信号的心理声学分析(502)来控制;
-在形成所述另一差值信号(151、522)之前,所述第二量化(14)的所述输入信号通过反量化器舍入(521)。
6.根据权利要求1所述的方法,或根据权利要求2所述的设备,其中:
-所述整数变换(13)是分段和MDCT(504),不将所述舍入的输出馈送至所述分段和MDCT(504),而将其馈送至分段和整数MDCT(529),分段和整数MDCT(529)的输出信号形成所述另一差值信号(151、522)的输入之一;
-所述第二量化(14)包括比特分配(505);
-在形成所述另一差值信号(151、522)之前,所述第二量化(14)的所述输入信号通过反量化器舍入(521)。
7.根据权利要求3所述的方法,或根据权利要求4所述的设备,其中:
-所述量化解码器(24、217)包括相应的舍入(221)。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP06117720A EP1883067A1 (en) | 2006-07-24 | 2006-07-24 | Method and apparatus for lossless encoding of a source signal, using a lossy encoded data stream and a lossless extension data stream |
EP06117720.0 | 2006-07-24 | ||
PCT/EP2007/057210 WO2008012211A1 (en) | 2006-07-24 | 2007-07-12 | Method and apparatus for lossless encoding of a source signal, using a lossy encoded data stream and a lossless extension data stream |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101490748A CN101490748A (zh) | 2009-07-22 |
CN101490748B true CN101490748B (zh) | 2011-12-07 |
Family
ID=37203831
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2007800275553A Expired - Fee Related CN101490748B (zh) | 2006-07-24 | 2007-07-12 | 使用有损编码数据流和无损扩展数据流对源信号进行无损编码的方法和设备 |
Country Status (9)
Country | Link |
---|---|
US (1) | US20090306993A1 (zh) |
EP (2) | EP1883067A1 (zh) |
JP (1) | JP5123303B2 (zh) |
KR (1) | KR101397736B1 (zh) |
CN (1) | CN101490748B (zh) |
AT (1) | ATE470219T1 (zh) |
BR (1) | BRPI0714835A2 (zh) |
DE (1) | DE602007006957D1 (zh) |
WO (1) | WO2008012211A1 (zh) |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1881485A1 (en) * | 2006-07-18 | 2008-01-23 | Deutsche Thomson-Brandt Gmbh | Audio bitstream data structure arrangement of a lossy encoded signal together with lossless encoded extension data for said signal |
DE102006051673A1 (de) * | 2006-11-02 | 2008-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Nachbearbeiten von Spektralwerten und Encodierer und Decodierer für Audiosignale |
JP4977157B2 (ja) * | 2009-03-06 | 2012-07-18 | 株式会社エヌ・ティ・ティ・ドコモ | 音信号符号化方法、音信号復号方法、符号化装置、復号装置、音信号処理システム、音信号符号化プログラム、及び、音信号復号プログラム |
EP2491553B1 (en) * | 2009-10-20 | 2016-10-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder, method for encoding an audio information, method for decoding an audio information and computer program using an iterative interval size reduction |
CN102792370B (zh) | 2010-01-12 | 2014-08-06 | 弗劳恩霍弗实用研究促进协会 | 使用描述有效状态值及区间边界的散列表的音频编码器、音频解码器、编码音频信息的方法及解码音频信息的方法 |
CN101964188B (zh) | 2010-04-09 | 2012-09-05 | 华为技术有限公司 | 语音信号编码、解码方法、装置及编解码系统 |
FR2961937A1 (fr) * | 2010-06-29 | 2011-12-30 | France Telecom | Codage/decodage predictif lineaire adaptatif |
CN107547899B (zh) * | 2011-04-22 | 2020-03-17 | 杜比国际公司 | 有损压缩编码数据方法和设备及相应重构数据方法和设备 |
GB2490879B (en) | 2011-05-12 | 2018-12-26 | Qualcomm Technologies Int Ltd | Hybrid coded audio data streaming apparatus and method |
CN110234012B (zh) * | 2012-01-17 | 2021-12-31 | 华为技术有限公司 | 用于高性能视频编码中的无损编码模式的环内滤波的装置 |
GB201210373D0 (en) * | 2012-06-12 | 2012-07-25 | Meridian Audio Ltd | Doubly compatible lossless audio sandwidth extension |
US9711150B2 (en) | 2012-08-22 | 2017-07-18 | Electronics And Telecommunications Research Institute | Audio encoding apparatus and method, and audio decoding apparatus and method |
SG10201608613QA (en) * | 2013-01-29 | 2016-12-29 | Fraunhofer Ges Forschung | Decoder For Generating A Frequency Enhanced Audio Signal, Method Of Decoding, Encoder For Generating An Encoded Signal And Method Of Encoding Using Compact Selection Side Information |
EP2956935B1 (en) | 2013-02-14 | 2017-01-04 | Dolby Laboratories Licensing Corporation | Controlling the inter-channel coherence of upmixed audio signals |
TWI618051B (zh) | 2013-02-14 | 2018-03-11 | 杜比實驗室特許公司 | 用於利用估計之空間參數的音頻訊號增強的音頻訊號處理方法及裝置 |
US9830917B2 (en) | 2013-02-14 | 2017-11-28 | Dolby Laboratories Licensing Corporation | Methods for audio signal transient detection and decorrelation control |
TWI618050B (zh) | 2013-02-14 | 2018-03-11 | 杜比實驗室特許公司 | 用於音訊處理系統中之訊號去相關的方法及設備 |
US10468033B2 (en) | 2013-09-13 | 2019-11-05 | Samsung Electronics Co., Ltd. | Energy lossless coding method and apparatus, signal coding method and apparatus, energy lossless decoding method and apparatus, and signal decoding method and apparatus |
ES2934591T3 (es) * | 2013-09-13 | 2023-02-23 | Samsung Electronics Co Ltd | Procedimiento de codificación sin pérdidas |
US10438597B2 (en) | 2017-08-31 | 2019-10-08 | Dolby International Ab | Decoder-provided time domain aliasing cancellation during lossy/lossless transitions |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1357136A (zh) * | 1999-06-21 | 2002-07-03 | 数字剧场系统股份有限公司 | 不损失译码器兼容性下低比特率音频编码系统的音质提高 |
EP1396844A1 (en) * | 2002-09-04 | 2004-03-10 | Microsoft Corporation | Unified lossy and lossless audio compression |
CN1625768A (zh) * | 2002-04-18 | 2005-06-08 | 弗兰霍菲尔运输应用研究公司 | 对时间离散音频信号进行编码的装置和方法以及对已编码的音频数据进行解码的方法 |
CN1650348A (zh) * | 2002-04-26 | 2005-08-03 | 松下电器产业株式会社 | 编码设备、解码设备、编码方法和解码方法 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0756386B1 (en) * | 1995-07-27 | 2003-09-17 | Victor Company Of Japan, Limited | Method and apparatus for coding a digital, acoustic signal |
IL138230A (en) * | 1999-01-07 | 2005-06-19 | Koninkl Philips Electronics Nv | Efficient coding of side information in a lossless encoder |
US6675148B2 (en) * | 2001-01-05 | 2004-01-06 | Digital Voice Systems, Inc. | Lossless audio coder |
DE10236694A1 (de) * | 2002-08-09 | 2004-02-26 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren |
WO2004112400A1 (en) * | 2003-06-16 | 2004-12-23 | Matsushita Electric Industrial Co., Ltd. | Coding apparatus, coding method, and codebook |
KR100561869B1 (ko) * | 2004-03-10 | 2006-03-17 | 삼성전자주식회사 | 무손실 오디오 부호화/복호화 방법 및 장치 |
US7937272B2 (en) * | 2005-01-11 | 2011-05-03 | Koninklijke Philips Electronics N.V. | Scalable encoding/decoding of audio signals |
US7548853B2 (en) * | 2005-06-17 | 2009-06-16 | Shmunk Dmitry V | Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding |
JP4640020B2 (ja) * | 2005-07-29 | 2011-03-02 | ソニー株式会社 | 音声符号化装置及び方法、並びに音声復号装置及び方法 |
US7678984B1 (en) * | 2005-10-13 | 2010-03-16 | Sun Microsystems, Inc. | Method and apparatus for programmatically generating audio file playlists |
US8447691B2 (en) * | 2007-05-30 | 2013-05-21 | Hsbc Card Services, Inc. | Systems and methods for NACHA compliant ACH transfers using an automated voice response system |
-
2006
- 2006-07-24 EP EP06117720A patent/EP1883067A1/en not_active Withdrawn
-
2007
- 2007-07-12 CN CN2007800275553A patent/CN101490748B/zh not_active Expired - Fee Related
- 2007-07-12 KR KR1020097001582A patent/KR101397736B1/ko not_active IP Right Cessation
- 2007-07-12 BR BRPI0714835-6A patent/BRPI0714835A2/pt not_active IP Right Cessation
- 2007-07-12 JP JP2009521205A patent/JP5123303B2/ja not_active Expired - Fee Related
- 2007-07-12 US US12/309,542 patent/US20090306993A1/en not_active Abandoned
- 2007-07-12 AT AT07787481T patent/ATE470219T1/de not_active IP Right Cessation
- 2007-07-12 EP EP07787481A patent/EP2044589B1/en not_active Not-in-force
- 2007-07-12 DE DE602007006957T patent/DE602007006957D1/de active Active
- 2007-07-12 WO PCT/EP2007/057210 patent/WO2008012211A1/en active Application Filing
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1357136A (zh) * | 1999-06-21 | 2002-07-03 | 数字剧场系统股份有限公司 | 不损失译码器兼容性下低比特率音频编码系统的音质提高 |
CN1625768A (zh) * | 2002-04-18 | 2005-06-08 | 弗兰霍菲尔运输应用研究公司 | 对时间离散音频信号进行编码的装置和方法以及对已编码的音频数据进行解码的方法 |
CN1650348A (zh) * | 2002-04-26 | 2005-08-03 | 松下电器产业株式会社 | 编码设备、解码设备、编码方法和解码方法 |
EP1396844A1 (en) * | 2002-09-04 | 2004-03-10 | Microsoft Corporation | Unified lossy and lossless audio compression |
Also Published As
Publication number | Publication date |
---|---|
KR20090043498A (ko) | 2009-05-06 |
JP5123303B2 (ja) | 2013-01-23 |
WO2008012211A1 (en) | 2008-01-31 |
JP2009544993A (ja) | 2009-12-17 |
KR101397736B1 (ko) | 2014-05-20 |
EP2044589A1 (en) | 2009-04-08 |
EP1883067A1 (en) | 2008-01-30 |
DE602007006957D1 (de) | 2010-07-15 |
US20090306993A1 (en) | 2009-12-10 |
ATE470219T1 (de) | 2010-06-15 |
BRPI0714835A2 (pt) | 2013-03-12 |
EP2044589B1 (en) | 2010-06-02 |
CN101490748A (zh) | 2009-07-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101490748B (zh) | 使用有损编码数据流和无损扩展数据流对源信号进行无损编码的方法和设备 | |
EP2016583B1 (en) | Method and apparatus for lossless encoding of a source signal, using a lossy encoded data stream and a lossless extension data stream | |
KR100818268B1 (ko) | 오디오 데이터 부호화 및 복호화 장치와 방법 | |
TWI466106B (zh) | 音訊或視訊編碼器、音訊或視訊解碼器及用以利用可變預測方向來處理多頻道音訊或視訊信號的相關方法 | |
KR101139172B1 (ko) | 스케일러블 음성 및 오디오 코덱들에서 양자화된 mdct 스펙트럼에 대한 코드북 인덱스들의 인코딩/디코딩을 위한 기술 | |
RU2509379C2 (ru) | Устройство и способ квантования и обратного квантования lpc-фильтров в суперкадре | |
EP2201566B1 (en) | Joint multi-channel audio encoding/decoding | |
EP1749296B1 (en) | Multichannel audio extension | |
JP5135330B2 (ja) | ロッシー符号化されたデータ・ストリームおよびロスレス拡張データ・ストリームを使用する、ソース信号のロスレス符号化を行う方法および装置 | |
WO2009059631A1 (en) | Audio coding apparatus and method thereof | |
WO2012053150A1 (ja) | 音声符号化装置および音声復号化装置 | |
JP2005031683A (ja) | ビット率拡張音声符号化及び復号化装置とその方法 | |
JPWO2009057329A1 (ja) | 符号化装置、復号装置およびこれらの方法 | |
JP2011008250A (ja) | ビット率拡張音声符号化及び復号化装置とその方法 | |
WO2009022193A2 (en) | Devices, methods and computer program products for audio signal coding and decoding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20111207 Termination date: 20160712 |
|
CF01 | Termination of patent right due to non-payment of annual fee |