CN101490748A - 使用有损编码数据流和无损扩展数据流对源信号进行无损编码的方法和设备 - Google Patents

使用有损编码数据流和无损扩展数据流对源信号进行无损编码的方法和设备 Download PDF

Info

Publication number
CN101490748A
CN101490748A CNA2007800275553A CN200780027555A CN101490748A CN 101490748 A CN101490748 A CN 101490748A CN A2007800275553 A CNA2007800275553 A CN A2007800275553A CN 200780027555 A CN200780027555 A CN 200780027555A CN 101490748 A CN101490748 A CN 101490748A
Authority
CN
China
Prior art keywords
data stream
signal
lossless
coding
lossy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2007800275553A
Other languages
English (en)
Other versions
CN101490748B (zh
Inventor
彼得·杰克斯
弗洛里安·凯勒
奥利弗·威伯特
斯文·科登
约翰尼斯·伯姆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Deutsche Thomson Brandt GmbH
Thomson Licensing SAS
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Publication of CN101490748A publication Critical patent/CN101490748A/zh
Application granted granted Critical
Publication of CN101490748B publication Critical patent/CN101490748B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M13/00Coding, decoding or code conversion, for error detection or error correction; Coding theory basic assumptions; Coding bounds; Error probability evaluation methods; Channel models; Simulation or testing of codes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing

Abstract

本发明涉及使用有损编码数据流和无损扩展数据流对源信号(SPCM)进行的无损编码,所述有损编码数据流和所述无损扩展数据流共同形成所述源信号的无损编码数据流(SDEC),无损音频压缩是指在解码器输出处具有原始PCM样本的比特精确重现的音频编码。无损编码/解码可以是mp3编码/解码。本发明使用针对基本层有损音频编解码器的残差信号的整数MDCT以及频域解相关(16)和时域解相关(16)。利用来自有损基本层编解码器的辅助信息允许减少总比特流中的冗余,从而提高基于有损的无损编解码器的编码效率。

Description

使用有损编码数据流和无损扩展数据流对源信号进行无损编码的方法和设备
技术领域
本发明涉及一种使用有损编码数据流和无损扩展数据流对源信号进行无损编码的方法和设备,所述有损编码数据流和无损扩展数据流共同形成所述源信号的无损编码数据流。
背景技术
与有损音频编码技术(如mp3、AAC等)相反,无损压缩算法仅可以利用原始音频信号的冗余以减小数据速率。不可能依赖于如现有技术的有损音频编解码器中的心理声学模型所指出的不相关内容。相应地,所有无损音频编码方案的共同技术原理是应用滤波器或变换来解相关(例如预测滤波器或频率变换),然后以无损方式对变换后的信号进行编码。编码比特流包括:变换或滤波器的参数,以及变换后的信号的无损表示。参见例如:J.Makhoul,“Linear prediction:A tutorialreview”,Proceedings of the IEEE,Vol.63,pp.561-580,1975、T.Painter,A.Spanias,“Perceptual coding of digital audio”,Proceedings of the IEEE,Vol.88,No.4,pp.451-513,2000以及M.Hans,R.W.Schafer,“Losslesscompression of digital audio”,IEEE Signal Processing Magazine,July2001,pp.21-32。
图12和图13中描述了基于有损的无损编码的基本原理。在图12左侧的编码部分,PCM音频输入信号SPCM通过有损编码器121到达有损解码器122,并且作为有损比特流到达解码部分(右侧)的有损解码器125。使用有损编码和解码来对信号进行解相关。在减法器123中,将解码器122的输出信号从输入信号SPCM中移除,所产生的差信号通过无损编码器124,作为扩展比特流到达无损解码器127。将解码器125和127的输出信号组合126,以恢复原始信号SPCM
在EP-B-0756386和US-B-6498811中公开了这一基本原理,还在以下文献中讨论了该原理:P.Craven,M.Gerzon,“Lossless Coding forAudio Discs”,J.Audio Eng.Soc.,Vol.44,No.9,September 1996,以及J.Koller,Th.Sporer,K.H.Brandenburg,“Robust Coding of High QualityAudio Signals”,AES 103rd Convention,Preprint 4621,August 1997。
在图13的有损编码器中,PCM音频输入信号SPCM通过分解滤波器组131和子带样本的量化132到达编码和比特流打包133。量化由感知模型计算器134控制,感知模型计算器134从分解滤波器组131接收信号SPCM和相应信息。在解码器侧,编码后的有损比特流进入用于对比特流进行解打包的装置135,接着是用于对子带样本进行解码的装置136,以及输出解码后的有损PCM信号SDec的合成滤波器组137。
在标准ISO/IEC 11172-3(MPEG-1音频)中对有损编码和解码的示例进行了详细描述。
在现有技术中,基于以下三种基本信号处理概念之一进行无损音频编码:
a)使用线性预测技术的时域解相关;
b)使用可逆整数分解-合成滤波器组的频域无损编码;
c)有损基本层编解码器的残差(误差信号)的无损编码。
发明内容
本发明要解决的问题是提供分级的无损音频编码和解码,所述分级的无损音频编码和解码建立在嵌入的有损音频编解码器之上,并提供与现有技术中基于有损的无损音频编码方案相比相同或更高的效率(即压缩比),而在计算复杂度方面可以以更有效的方式来实现。该问题是通过权利要求1和3中公开的方法来解决的。在权利要求2和4中分别公开了利用这些方法的设备。
本发明的另外的优选实施例在相应从属权利要求中公开。
本发明在有损编码之上使用数学上无损的编码和解码。数学上无损的音频压缩是指在解码器输出处具有原始PCM样本的比特精确重现的音频编码。对于一些实施例,假设有损编码使用例如类似MDCT的频率变换或类似滤波器组在变换域中操作。作为示例,在整个描述中,使用mp3标准(ISO/IEC 11172-3层3)作为有损基本层。
所发送或记录的编码比特流包括两个部分:有损音频编解码器的嵌入比特流,以及针对一个或多个附加层的扩展数据,用于获得无损(即比特精确)的原始PCM样本或中间质量。
本发明利用来自概念a)、b)、c)的特征,即来自多种现有技术中无损音频编码方案的技术的相互组合。
本发明以协作的方式来使用频域解相关、时域解相关、或其组合,以准备用于有效无损编码的基本层有损音频编解码器的残差信号(误差信号)。
一些实施例还使用来自有损基本层编解码器的编码器信息。使用来自基本层编解码器的辅助信息允许降低总比特流中的冗余,因此提高了基于有损的无损编解码器的编码效率。
所有实施例的共同之处在于,可以从比特流中提取具有不同质量等级的音频信号的至少两种不同变型。这些变型包括由嵌入的有损编码方案和原始PCM样本的无损解码所表示的信号。对于一些实施例(见以下可选扩展3和4),可以对具有中间质量(在有损编解码器和数学上无损的质量所限定的范围内)的音频信号的一个或多个另外的变型进行解码。
描述了一种具体实现,其中通过整数MDCT在并行数据路径中代替或复制作为混合滤波器组的MDCT部分,整数MDCT使无损编码器模块内的全部有损解码成为多余,从而实现计算复杂度的降低。
此外,本发明允许使用简单的比特丢弃技术来剥离嵌入的有损比特流。
一些实施例可能有效地对嵌入的有效比特流进行重新编码,获得数据速率不同于(低于或高于)嵌入的“有损”比特流的原始数据速率的新‘有损’比特流。
本发明限于采用混合(分解)滤波器组的有损核心编解码器(例如通过利用子带滤波器组(例如多相滤波器组)接着是附加的MDCT/DCT以增加频谱分辨率)。如果子带滤波器组是不可能通过类似分解为“吉文斯旋转”和“提升步(lifting steps)”的技术来进行特定可逆整数实现的类型,即如果不可能通过应用分解和合成子带滤波器组来实现整数输入信号的完美数学重建,则本发明尤为适用。
附图说明
参照附图描述本发明的示例性实施例,在附图中:
图1是基于有损的无损编码器的普通方框图;
图2是基于有损的无损解码器的普通方框图;
图3是mp3编码器的方框图;
图4是应用于mp3核心编解码器的第一实施例编码器的方框图;
图5是第一和第二实施例解码器的方框图;
图6是第二实施例编码器的方框图;
图7是具有附加舍入增益因子处理的第一实施例编码器的方框图;
图8是具有附加舍入增益因子处理的第一实施例解码器的方框图;
图9是用于嵌入的mp3比特流的解码器的方框图;
图10是用于嵌入mp3比特流加频域残差的解码器的方框图;
图11是编码器(左)和解码器(右)的可选时间解相关模块或步骤;
图12是已知的有损编码器和解码器的基本方框图;
图13是已知的基于有损的无损编码器和解码器的基本方框图。
具体实施方式
在图1的基于有损的无损编码器中,PCM音频输入信号SPcM通过子带滤波器组和抽选器(decimator)模块或步骤11、第一量化器12、整数变换13和第二量化器14到达复用器10。第一量化器14的输出提供表示量化器输入信号的量化值的索引值,即其对信号进行编码。量化器14的第二输出信号是量化后的输入信号值,在第一减法器151中从整数变换模块或步骤13的输出信号中减去该量化后的输入信号值(从而表示频域中的误差),第一减法器151的输出信号通过无损编码FD(频域)模块或步骤16到达复用器10。第一量化器12的输出信号通过插值和反子带滤波器组模块或步骤18并在第二减法器152中从相应延迟的(延迟17)输入信号SPCM中减去该信号。第二减法器的输出信号通过无损编码TD(时域)模块或步骤19到达复用器10,该复用器10输出相应复用的编码比特流SDEC。模块/级11、12、13和14共同形成了有损编码器。
在有损解码器内,跟随分解子带滤波器组11之后的变换由舍入/量化步骤12和整数变换13来代替。可选地,原始变换和舍入/量化步骤之后可以接着是整数变换作为并行数据路径。以下将对该选项进行详细描述。整数变换近似传统(浮点)MDCT变换,但在输入处接收整数值并在输出处产生整数值。通过将变换操作分解成可逆的“提升步”序列,可以以数学上无损的方式对完整的整数MDCT近似进行反转。在类似MPGE SLS(可缩放至无损)标准中的无损音频编码方案中,已经将这样的整数MDCT变换应用至原始时域PCM样本。然而,在本发明中,将整数变换应用在混合滤波器组(即如类似mp3的音频编码标准中所使用的混合滤波器组)的子带域中。
子带信号的无损传输可以解释为频域中的解相关。通过从原始频谱系数中减去量化的频谱系数来形成频谱残差。对频谱残差进行无损编码(无损编码FD16)。可选地,这可以以可缩放的方式来进行,以提供中间音频质量(参见EP 06113596和EP06113576以及以下可选扩展4)。
由于在整数变换13之前的舍入/量化步骤12,并且由于子带滤波器组11的可能不完美的重建特性,通过从延迟的原始PCM输入数据减去反子带滤波后的信号18(在舍入/量化步骤之后)来计算时域内的残差。在无损编码TD模块19内对时域中的残差(时间残差)进行无损编码。
这里,如EP06113596(参见以下可选扩展5)所述,可以应用使用线性预测滤波的可选时域解相关。
可以对有损编码比特流和已编码(整数)频谱以及时间残差进行复用以形成单个比特流或形成两个流(有损编码流和携带残差的无损扩展)或形成三个流:有损编码流、已编码频谱残差流和已编码时间残差流)。
在图2的解码器侧,已编码比特流SDEC进入解复用器20,该解复用器20输出有损编码比特流、无损编码的FD比特流和无损编码的TD比特流。有损编码比特流通过解码模块或步骤24(从表示量化值的索引值中恢复量化值,即量化器14的第二输出信号)、第一加法器25、反整数变换模块或步骤23以及插值器和反子带滤波器组模块或步骤21到达第二加法器28的第一输入。无损编码的FD比特流通过无损解码器模块或步骤26到达第一加法器的第二输入。无损编码的TD比特流通过无损解码器TD模块或步骤29和相应的延迟27到达第二加法器的第二输入,第二加法器输出解码的有损PCM信号SPCM
在该无损解码器中,对全部有损的、频谱和时间残差数据进行解打包和解码。将频谱残差加至频域中的解码的有损数据中,并应用反整数变换23。注意,由于可逆整数变换和频谱残差编码方案的完美整数重建属性,反整数变换的结果将精确地是在编码器计算的量化后的子带信号。在恢复这些数据(混合滤波器组11的第一部分的量化后的子带信号)之后,应用反子带滤波器组21来重建时间信号。将解码和延迟后的时间残差加至该时间信号来重建与原始编码的PCM样本SPCM在数学上相同的PCM信号SPCM
最后,在特定应用中,可以重现两级中间质量:完全而完美的重建将应用两种残差。可以仅通过应用频谱残差而忽略时间残差来创建较低一级但感知上无损的质量。使用传统的符合标准的有损解码器,可以仅通过对有损编码流进行解码来创建有损质量。可以仅通过应用频谱残差数据的一部分来创建另外的中间质量级。
在以下附图中,相同的附图标记分别表示相同的功能或模块或信号。
第一优选实施例
该优选实施例将使用公知的mp3标准作为嵌入的有损核心编解码器,在图3中示出了该编解码器的编码部分。原始输入信号SPCM通过多相滤波器组和抽选器503、分段和MDCT 504以及比特分配和量化器505到达复用器507。输入信号SPCM还通过FFT级或步骤501到达心理声学分析502,心理声学分析502控制步骤/级504和量化505中的分段(或加窗)。比特分配和量化器505还提供辅助信息515,该辅助信息515通过辅助信息编码器506到达输出信号517的复用器507。mp3标准应用MDCT变换系数的非均匀(即非整数)量化。
图4中的第一实施例编码器包括图3的mp3标准编码器。然而,采用以下的方式对嵌入的mp3编码器进行了修改:对来自多相滤波器组和抽选器503的子带信号512进行量化(执行舍入),并且已经使用整数MDCT(Int-MDCT)变换504代替了各子带信号的模块或步骤504中的原始MDCT变换。整数MDCT近似于原始非整数MDCT变换的数值行为,以保证由图4的编码器产生的嵌入mp3比特流可以被任何符合标准的mp3解码器解码而不出现质量退化。
除了修改的mp3编码器以外,本发明的编码器信号处理包括针对两个误差信号的无损编码方案:在频域中和在时域中。在频域中,在反量化器舍入模块或步骤521中对量化后的变换系数(从mp3比特流514中获得)进行舍入来获得整数值,在第一减法器522中从原始整数MDCT变换系数513中减去该整数值。在无损编码FD(频域)模块或步骤523中,对产生的整数误差值进行无损编码,并将其复用(使用复用器507)为比特流。在时域中,将量化(舍入)后的子带信号馈送入插值和子带滤波器组模块525中,并且在减法器526中从相应延迟(使用延迟514)的原始PCM样本SPCM中减去产生的时域信号。可选地,对产生的时域误差信号进行时域解相关(见以下时域解相关器527)、无损编码(使用无损编码TD模块或步骤528)并复用(使用复用器507)为比特流。复用器507输出相应编码比特流517。以独立于平台的方式来实现子带滤波器组525。
实质上,在图5的第一实施例无损解码器中,对编码器方框图中的所有步骤进行反转。在解复用器301中,对接收的编码比特流517进行解复用。在“反”量化器模块或步骤217中,对来自嵌入的mp3比特流的MDCT系数215进行解码,并在舍入模块或步骤221中对其进行舍入来获得整数值222。在辅助信息解码器模块或步骤306中对辅助信息进行解码,并且使用辅助信息来控制反量化器217。在无损解码FD模块或步骤305中对频域残差243进行解码,并在第一加法器261中对其执行加法来获得完整的整数MDCT系数。在应用反整数MDCT变换308之后,将子带信号226馈送入插值和多相合成滤波器组232中。在图5的上侧路径中,在无损解码TD模块或步骤302中对时域残差240进行解码,可选地在反TD相关模块或步骤303(即可选的TD解相关527的反过程)中对其进行相关,最后在第二加法器262中将其与多相合成滤波器组232的输出信号相加来获得原始PCM样本SPCM
有利地,任何符合标准的mp3解码器都可以对嵌入的mp3比特流进行解码。
第二优选实施例
在图6的编码器中,编码器方框图的下部包括未修改的传统的符合标准的mp3编码器,参见图3。与嵌入的mp3编码器的分段和MDCT变换模块504并行,在舍入模块或步骤520中对子带信号512(多相滤波器组和抽选模块503的输出)进行舍入来获得整数值,然后将该整数值馈送入分段和整数MDCT模块529以及插值和子带滤波器组模块525。将模块529的输出输入至第一减法器522。模块/步骤521到528具有与图4中类似的相同意义和操作。
实质上,与第一优选实施例的差别在于,以并行于传统MDCT的方式来计算整数MDCT变换而非取代传统MDCT。第二实施例具有的优点在于,通过完全符合标准和传统mp3编码器来获得比特流的mp3部分。即与通常的MDCT相比,不存在通过舍入步骤加整数MDCT的任何近似误差使嵌入的mp3比特流的质量退化的危险。
在编码器方框图的其余部分(模块/步骤521到528)中,信号流包括在频域和时域中针对两个误差信号的无损编码方案。在频域中,对量化后的变换系数(从mp3比特流中获得)进行舍入来获得整数值,随后从整数MDCT变换系数中减去该整数值。对产生的整数误差值进行无损编码(在523中),并复用为比特流。在时域中,将量化(舍入)后的子带信号馈送入插值和子带滤波器组中,并从原始PCM样本SPCM中减去产生的时域信号。可选地,对时域误差信号进行解相关(见以下)、无损编码(在528中)并复用为比特流。以独立于平台的方式来实现子带滤波器组。
第二实施例的解码器与第一实施例解码器相同。
可选扩展1:在对子带信号进行舍入之前应用增益
为了减小由对子带信号进行舍入而产生的量化误差,在舍入操作之前可以应用增益因子g。为了将舍入后的值转换回至原始域,在舍入之后要应用反增益因子1/g。在图7的编码器和图8的解码器中分别示出了所需的缩放。图7中示出的编码器是图4中编码器的附加使用了这些增益因子的增强版本。
在图7中,实质上,所示的模块具有与图4中相应模块相同的功能或操作。在第一乘法器223中,子带信号206乘以增益因子g。在舍入操作225之后,获得可以由整数MDCT 248来处理的整数取值的子带样本226。为了获得多相滤波器组232的重建误差(即时域残差),在第一除法器230中要将舍入后的子带样本226除以g。因此,产生的样本231是原始子带样本206的量化版本。量化后的样本值是1/g的倍数。通过选择更大的值g,可以减小量化误差。整数MDCT 248之后,在第二除法器249中,也要将整数取值的频谱值229除以g以继续标准mp3编码器中的处理。量化和“反”量化后的频谱值255需要放置回到整数域中。因此,在第二乘法器219中,这些值与因子g相乘并且在舍入模块或步骤221中对其进行舍入。产生的值257表示整数域中的量化后的频谱数据,并且在第一减法器247中从整数MDCT 248的输出信号229中减去该值257以产生频域残差258。其余处理类似于图4中的处理。
在图8的相应的解码器中,也要考虑使用增益因子g。在频谱数据的解码(“反”量化器217和辅助信息解码器306)之后,在乘法器219中,量化值与因子g相乘,并在舍入模块或步骤221中将其舍入为如编码器(219、221)中的整数。在加入与编码器中信号258相同解码后的频域残差371、并应用反整数MDCT 308之后,在除法器309中执行使用因子1/g的重新缩放,以便将子带样本转换到原始域。产生的样本231与编码器中合成滤波器组205的输出相同。其余处理类似于图5中的处理。
可选扩展2:有损版本的解码(mp3解码器)
由于所提出的基于有损的无损编码方案的完整比特流包括嵌入的符合标准的mp3比特流,因此可以应用传统的mp3解码。在图9中所示的相应解码器信号流中,丢弃了比特流中描述时域残差240和频域残差243的部分。该丢弃操作也可以在解码器的上游进行,例如在传输网络中。模块或步骤301、306、217和232与图5中相应模块或步骤相同。然而,反MDCT模块或步骤3081可以用于代替反整数MDCT模块或步骤308。
可选扩展3:较高质量有损版本的解码
通过将来自嵌入的mp3比特流的信息和频域解相关进行组合,可以对音频内容的较高高质量而仍为有损的版本进行解码。在图10所示的信号流中,与图5中完全无损解码器相比,丢弃了关于时域残差240的信息。该丢弃操作也可以在解码器的上游进行,例如在传输网络中。
由于该可选解码器不会呈现无损PCM样本,因此没有必要(但可能)使用反整数MDCT 308来代替插值和多相滤波器组232之前的反MDCT 3081。
可选扩展4:用于对频域残差进行编码的分层结构
可以使用多层比特流结构对频域残差258的信息进行编码。例如,可以应用从MPEG SLS草案标准的比特平面算术编码原理或类似方案。因此,结合根据图10的高质量解码器,可以以比特速率级的精细颗粒度(和质量)来实现完全可缩放的编码方案。
可选扩展5:时域残差的解相关
结合图4、图5和图6,如上所述,可以在编码器侧应用时域残差信号的解相关,并在解码器侧应用时域残差信号的相应反解相关。图11示出了模块527(左侧)和模块303(右侧)内的功能。在TD解相关编码器(图11左侧)中,对时域残差应用线性预测滤波器。从残差中减去预测信号来移除任何剩余的短期相关。通过分析来自有损编码器和/或来自编解码器核心的频域解相关模块的信息,并可选地对实际残差信号进行分析,使预测滤波器系数适配于信号特性。此外,可能有必要使滤波器上的信号信息适配于接收机或解码器中的反时域解相关模块。因此,可能有必要在总比特流的无损扩展中包括特定信息。
在解码器侧(图11右侧),基于来自在前的解码级(有损解码器和/或频域解相关)的信息以及可能基于从时域解相关方案的编码器部分接收的辅助信息,计算线性预测滤波器的相同系数。以特定的方式应用该系数来反转在发射机侧获得的预测滤波效果,从而产生相关的时域残差。除了在编码器处使用前馈线性预测滤波之外,可以应用其他预测方案,例如反馈结构或前馈和反馈结构的混合。
有利地,本发明基于利用混合滤波器组(如mp3)的现有有损音频编码方案实现了无损编码。仅有的应当具有独立于平台的实现的重要信号处理模块是多相合成滤波器组。
第一和第二实施例具有以下具体优点:由于在编码器中仅需要计算一组(整数)MDCT变换,因此第一实施例允许编码器的低复杂度实现。另一方面,第二实施例允许编码器的较高质量的版本,其中,以并行地计算两组MDCT变换为代价,使用未修改的mp3编码器来产生嵌入的mp3比特流。

Claims (9)

1、一种使用有损编码数据流和无损扩展数据流对源信号(SPCM)对进行无损编码的方法,所述有损编码数据流和所述无损扩展数据流共同形成所述源信号的无损编码数据流(SDEC),所述方法包括以下步骤:
-使用具有抽选功能的子带滤波器组(11)、第一量化(12)、整数变换(13)和第二量化(14),对所述源信号进行有损编码,其中,所述有损编码提供所述有损编码数据流,
-对所述第一量化(12)的输出信号进行插值和反子带滤波器组处理(18);
-在所述源信号的相应延迟(17)版本和所述反子带滤波器组处理(18)的输出信号之间形成(152)差值信号;
-对所述差值信号进行时域无损编码(19),以提供所述无损扩展数据流的时域残差信号部分,对所述第二量化(14)的输入信号和量化后的输出信号之间的差值信号(151)进行频域无损编码(16),以提供所述无损扩展数据流的频域残差信号部分;
-将所述有损编码数据流和所述无损扩展数据流的两个部分进行组合(10)来形成所述无损编码数据流(SDEC)。
2、一种使用有损编码数据流和无损扩展数据流对源信号(SPCM)对进行无损编码的设备,所述有损编码数据流和所述无损扩展数据流一同形成所述源信号的无损编码数据流(SDEC),所述设备包括:
-适于使用具有抽选功能的子带滤波器组(11)、第一量化(12)、整数变换(13)和第二量化(14)对所述源信号进行有损编码的装置,其中,所述有损编码提供所述有损编码数据流,
-适于对所述第一量化(12)的输出信号进行插值和反子带滤波器组处理的装置(18);
-适于在所述源信号的相应延迟(17)版本和所述反子带滤波器组处理(18)的输出信号之间形成差值信号的装置(152);
-适于对所述差值信号进行时域无损编码以提供所述无损扩展数据流的时域残差信号部分,并对所述第二量化(14)的输入信号和量化后的输出信号之间的差值信号(151)进行频域无损编码以提供所述无损扩展数据流的频域残差信号部分的装置(19、16);
-适于将所述有损编码数据流和所述无损扩展数据流的两个部分进行组合来形成所述无损编码数据流(SDEC)的装置(10)。
3、一种对无损编码的源信号(SENC)数据流进行解码的方法,所述数据流是使用根据权利要求1的方法来编码的,所述解码方法包括以下步骤:
-对所述无损编码的源信号数据流进行解复用(20),以提供有损编码数据流和无损扩展数据流的时域残差信号部分和频域残差信号部分;
-使用量化解码器(24)、反整数变换(23)以及插值和子带滤波器组(21)来对所述有损编码数据流进行有损解码;
-对所述频域残差信号部分进行频域无损解码(26),并将输出信号与所述量化解码器(24)的相应输出信号进行组合(25),以及对时域残差信号部分进行时域无损解码(29)并将相应延迟(27)的输出信号与所述插值和子带滤波器组(21)的输出信号进行组合(28),从而重建所述源信号(SPCM)。
4、一种对无损编码的源信号(SENC)数据流进行解码的设备,所述数据流是使用根据权利要求1的方法来编码的,所述设备包括:
-适于对所述无损编码的源信号数据流进行解复用以提供有损编码数据流和无损扩展数据流的时域残差信号部分和频域残差信号部分的装置(20);
-适于使用量化解码器、反整数变换以及插值和子带滤波器组来对所述有损编码数据流进行有损解码的装置(24、23、21);
-适于对所述频域残差信号部分进行频域无损解码并将输出信号与所述量化解码器的相应输出信号进行组合、以及对时域残差信号部分进行时域无损解码并将相应延迟的输出信号与所述插值和子带滤波器组的输出信号进行组合,从而重建所述源信号(SPCM)的装置(26、25、29、27、28)。
5、根据权利要求1所述的方法,或根据权利要求2所述的设备,其中:
-所述第一量化(12)是舍入(520);
-所述第二量化(14)包括比特分配(505);
-在形成所述差值信号(151、522)之前,所述第二量化(14)的所述输入信号通过反量化器舍入(521)。
6、根据权利要求1所述的方法,或根据权利要求2所述的设备,其中:
-所述第一量化(12)是舍入(520),其中,所述整数变换(13)是分段和MDCT(504),不将所述舍入的输出馈送至所述分段和MDCT(504),而将其馈送至分段和整数MDCT(529),分段和整数MDCT(529)的输出信号形成所述差值信号(151、522)的输入之一;
-所述第二量化(14)包括比特分配(505);
-在形成所述差值信号(151、522)之前,所述第二量化(14)的所述输入信号通过反量化器舍入(521)。
7、根据权利要求3所述的方法,或根据权利要求4所述的设备,其中:
-所述量化解码器(24、217)包括相应的舍入(221)。
8、一种根据权利要求1、5或6之一所述的方法来编码的音频信号。
9、一种存储介质,例如光盘,其上包含或存储或记录有根据权利要求1、5或6之一所述的方法来编码的数字信号。
CN2007800275553A 2006-07-24 2007-07-12 使用有损编码数据流和无损扩展数据流对源信号进行无损编码的方法和设备 Expired - Fee Related CN101490748B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP06117720A EP1883067A1 (en) 2006-07-24 2006-07-24 Method and apparatus for lossless encoding of a source signal, using a lossy encoded data stream and a lossless extension data stream
EP06117720.0 2006-07-24
PCT/EP2007/057210 WO2008012211A1 (en) 2006-07-24 2007-07-12 Method and apparatus for lossless encoding of a source signal, using a lossy encoded data stream and a lossless extension data stream

Publications (2)

Publication Number Publication Date
CN101490748A true CN101490748A (zh) 2009-07-22
CN101490748B CN101490748B (zh) 2011-12-07

Family

ID=37203831

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2007800275553A Expired - Fee Related CN101490748B (zh) 2006-07-24 2007-07-12 使用有损编码数据流和无损扩展数据流对源信号进行无损编码的方法和设备

Country Status (9)

Country Link
US (1) US20090306993A1 (zh)
EP (2) EP1883067A1 (zh)
JP (1) JP5123303B2 (zh)
KR (1) KR101397736B1 (zh)
CN (1) CN101490748B (zh)
AT (1) ATE470219T1 (zh)
BR (1) BRPI0714835A2 (zh)
DE (1) DE602007006957D1 (zh)
WO (1) WO2008012211A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101964188A (zh) * 2010-04-09 2011-02-02 华为技术有限公司 语音信号编码、解码方法、装置及编解码系统
CN109509483A (zh) * 2013-01-29 2019-03-22 弗劳恩霍夫应用研究促进协会 产生频率增强音频信号的译码器和产生编码信号的编码器
CN110225354A (zh) * 2012-01-17 2019-09-10 华为技术有限公司 用于高性能视频编码中的无损编码模式的环内滤波的装置

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1881485A1 (en) * 2006-07-18 2008-01-23 Deutsche Thomson-Brandt Gmbh Audio bitstream data structure arrangement of a lossy encoded signal together with lossless encoded extension data for said signal
DE102006051673A1 (de) * 2006-11-02 2008-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Nachbearbeiten von Spektralwerten und Encodierer und Decodierer für Audiosignale
JP4977157B2 (ja) * 2009-03-06 2012-07-18 株式会社エヌ・ティ・ティ・ドコモ 音信号符号化方法、音信号復号方法、符号化装置、復号装置、音信号処理システム、音信号符号化プログラム、及び、音信号復号プログラム
KR101419151B1 (ko) 2009-10-20 2014-07-11 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 영역-의존 산술 코딩 매핑 규칙을 이용하는 오디오 인코더, 오디오 디코더, 오디오 정보를 인코딩하기 위한 방법, 오디오 정보를 디코딩하기 위한 방법 및 컴퓨터 프로그램
PL2524371T3 (pl) 2010-01-12 2017-06-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Koder audio, dekoder audio, sposób kodowania informacji audio, sposób dekodowania informacji audio i program komputerowy wykorzystujący tabelę skrótów zarówno opisującą znaczące wartości stanów i granice przedziałów
FR2961937A1 (fr) * 2010-06-29 2011-12-30 France Telecom Codage/decodage predictif lineaire adaptatif
CN107547899B (zh) * 2011-04-22 2020-03-17 杜比国际公司 有损压缩编码数据方法和设备及相应重构数据方法和设备
GB2490879B (en) * 2011-05-12 2018-12-26 Qualcomm Technologies Int Ltd Hybrid coded audio data streaming apparatus and method
GB201210373D0 (en) * 2012-06-12 2012-07-25 Meridian Audio Ltd Doubly compatible lossless audio sandwidth extension
KR102204136B1 (ko) * 2012-08-22 2021-01-18 한국전자통신연구원 오디오 부호화 장치 및 방법, 오디오 복호화 장치 및 방법
TWI618051B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於利用估計之空間參數的音頻訊號增強的音頻訊號處理方法及裝置
EP2956935B1 (en) 2013-02-14 2017-01-04 Dolby Laboratories Licensing Corporation Controlling the inter-channel coherence of upmixed audio signals
TWI618050B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於音訊處理系統中之訊號去相關的方法及設備
WO2014126688A1 (en) 2013-02-14 2014-08-21 Dolby Laboratories Licensing Corporation Methods for audio signal transient detection and decorrelation control
KR102270106B1 (ko) 2013-09-13 2021-06-28 삼성전자주식회사 에너지 무손실 부호화방법 및 장치, 신호 부호화방법 및 장치, 에너지 무손실 복호화방법 및 장치, 및 신호 복호화방법 및 장치
CN111179946B (zh) 2013-09-13 2023-10-13 三星电子株式会社 无损编码方法和无损解码方法
US10438597B2 (en) 2017-08-31 2019-10-08 Dolby International Ab Decoder-provided time domain aliasing cancellation during lossy/lossless transitions

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69629986T2 (de) * 1995-07-27 2004-07-15 Victor Company of Japan, Ltd., Yokohama Verfahren und Gerät zum Kodieren digitaler akustischer Signale
JP4482237B2 (ja) * 1999-01-07 2010-06-16 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 無損失エンコーダにおけるサイド情報の効率的な符号化
US6226616B1 (en) * 1999-06-21 2001-05-01 Digital Theater Systems, Inc. Sound quality of established low bit-rate audio coding systems without loss of decoder compatibility
US6675148B2 (en) * 2001-01-05 2004-01-06 Digital Voice Systems, Inc. Lossless audio coder
DE10217297A1 (de) * 2002-04-18 2003-11-06 Fraunhofer Ges Forschung Vorrichtung und Verfahren zum Codieren eines zeitdiskreten Audiosignals und Vorrichtung und Verfahren zum Decodieren von codierten Audiodaten
US7752052B2 (en) * 2002-04-26 2010-07-06 Panasonic Corporation Scalable coder and decoder performing amplitude flattening for error spectrum estimation
DE10236694A1 (de) * 2002-08-09 2004-02-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren
US7424434B2 (en) * 2002-09-04 2008-09-09 Microsoft Corporation Unified lossy and lossless audio compression
JP4382090B2 (ja) * 2003-06-16 2009-12-09 パナソニック株式会社 符号化装置、符号化方法およびコードブック
KR100561869B1 (ko) * 2004-03-10 2006-03-17 삼성전자주식회사 무손실 오디오 부호화/복호화 방법 및 장치
PL1839297T3 (pl) * 2005-01-11 2019-05-31 Koninklijke Philips Nv Skalowalne kodowanie/dekodowanie sygnałów audio
US7548853B2 (en) * 2005-06-17 2009-06-16 Shmunk Dmitry V Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding
JP4640020B2 (ja) * 2005-07-29 2011-03-02 ソニー株式会社 音声符号化装置及び方法、並びに音声復号装置及び方法
US7678984B1 (en) * 2005-10-13 2010-03-16 Sun Microsystems, Inc. Method and apparatus for programmatically generating audio file playlists
US8447691B2 (en) * 2007-05-30 2013-05-21 Hsbc Card Services, Inc. Systems and methods for NACHA compliant ACH transfers using an automated voice response system

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101964188A (zh) * 2010-04-09 2011-02-02 华为技术有限公司 语音信号编码、解码方法、装置及编解码系统
CN101964188B (zh) * 2010-04-09 2012-09-05 华为技术有限公司 语音信号编码、解码方法、装置及编解码系统
US9672830B2 (en) 2010-04-09 2017-06-06 Huawei Technologies Co., Ltd. Voice signal encoding and decoding method, device, and codec system
CN110225354A (zh) * 2012-01-17 2019-09-10 华为技术有限公司 用于高性能视频编码中的无损编码模式的环内滤波的装置
CN109509483A (zh) * 2013-01-29 2019-03-22 弗劳恩霍夫应用研究促进协会 产生频率增强音频信号的译码器和产生编码信号的编码器
CN109509483B (zh) * 2013-01-29 2023-11-14 弗劳恩霍夫应用研究促进协会 产生频率增强音频信号的译码器和产生编码信号的编码器

Also Published As

Publication number Publication date
WO2008012211A1 (en) 2008-01-31
KR20090043498A (ko) 2009-05-06
US20090306993A1 (en) 2009-12-10
EP2044589B1 (en) 2010-06-02
CN101490748B (zh) 2011-12-07
DE602007006957D1 (de) 2010-07-15
ATE470219T1 (de) 2010-06-15
BRPI0714835A2 (pt) 2013-03-12
JP5123303B2 (ja) 2013-01-23
EP1883067A1 (en) 2008-01-30
KR101397736B1 (ko) 2014-05-20
JP2009544993A (ja) 2009-12-17
EP2044589A1 (en) 2009-04-08

Similar Documents

Publication Publication Date Title
CN101490748B (zh) 使用有损编码数据流和无损扩展数据流对源信号进行无损编码的方法和设备
EP2016583B1 (en) Method and apparatus for lossless encoding of a source signal, using a lossy encoded data stream and a lossless extension data stream
KR100818268B1 (ko) 오디오 데이터 부호화 및 복호화 장치와 방법
KR101139172B1 (ko) 스케일러블 음성 및 오디오 코덱들에서 양자화된 mdct 스펙트럼에 대한 코드북 인덱스들의 인코딩/디코딩을 위한 기술
TWI466106B (zh) 音訊或視訊編碼器、音訊或視訊解碼器及用以利用可變預測方向來處理多頻道音訊或視訊信號的相關方法
RU2509379C2 (ru) Устройство и способ квантования и обратного квантования lpc-фильтров в суперкадре
JP5135330B2 (ja) ロッシー符号化されたデータ・ストリームおよびロスレス拡張データ・ストリームを使用する、ソース信号のロスレス符号化を行う方法および装置
WO2006000842A1 (en) Multichannel audio extension
WO2009059631A1 (en) Audio coding apparatus and method thereof
CN101490746A (zh) 有损编码信号及所述信号的无损编码扩展数据的音频比特流数据结构布置
JP2011008250A (ja) ビット率拡張音声符号化及び復号化装置とその方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20111207

Termination date: 20160712