CN101490746A - 有损编码信号及所述信号的无损编码扩展数据的音频比特流数据结构布置 - Google Patents
有损编码信号及所述信号的无损编码扩展数据的音频比特流数据结构布置 Download PDFInfo
- Publication number
- CN101490746A CN101490746A CNA2007800267557A CN200780026755A CN101490746A CN 101490746 A CN101490746 A CN 101490746A CN A2007800267557 A CNA2007800267557 A CN A2007800267557A CN 200780026755 A CN200780026755 A CN 200780026755A CN 101490746 A CN101490746 A CN 101490746A
- Authority
- CN
- China
- Prior art keywords
- data
- file
- lossless
- lossless extension
- header
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M13/00—Coding, decoding or code conversion, for error detection or error correction; Coding theory basic assumptions; Coding bounds; Error probability evaluation methods; Channel models; Simulation or testing of codes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
Abstract
无损压缩算法仅可以利用原始音频信号的冗余以减小数据速率,但不能利用如心理声学所指出的不相关内容。无损音频编码方案应用滤波器或变换来解相关,然后对变换后的信号进行编码。编码比特流包括:变换或滤波器的参数,以及对变换后的信号的无损表示。然而,在基于有损的无损编码的情况下,附加信息量比基本层数据量多出基本层数据量的倍数。因此,不能将附加数据完全打包入基本层数据流,例如作为附属数据。有损编码格式与无损编码扩展的组合所产生的至少两个数据流是:包含有损编码信息的基本层,以及用于重建数学上无损的原始输入信号的增强层。此外,若干中间质量层是可能的。然而,这些数据流不是互相独立的。每个上层依赖于下层,并且仅能够与这些下层相结合来合理解码所述上层。根据本发明,使用在块结构中的一次性报头信息与重复报头信息的特定组合,组合的类型取决于应用类型。指派信息数据标识了属于一个输入信号的无损格式的不同部分或层。使用同步信息数据项来将不同数据流或部分或层组合为单个无损或中间输出信号。以文件格式以及以流格式来使用这些特征。
Description
技术领域
本发明涉及一种针对有损编码信号及所述信号的无损扩展编码数据来布置比特流数据的数据结构。此外,可以在该数据结构中布置中间质量扩展编码的数据。
背景技术
与有损音频编码技术(如mp3、AAC等)相反,无损压缩算法仅可以利用原始音频信号的冗余以减小数据速率。不可能依赖于如目前技术的有损音频编解码器中的心理声学模型所指出的不相关内容。相应地,所有无损音频编码方案的共同技术原理是应用滤波器或变换来解相关(例如预测滤波器或频率变换),然后以无损方式对变换后的信号进行编码。编码比特流包括:变换或滤波器的参数,以及变换后的信号的无损表示。参见例如:J.Makhoul,“Linear prediction:A tutorialreview”,Proceedings of the IEEE,Vol.63,pp.561-580,1975、T.Painter,A.Spanias,“Perceptual coding of digital audio”,Proceedings of the IEEE,Vol.88,No.4,pp.451-513,2000以及M.Hans,R.W.Schafer,“Losslesscompression of digital audio”,IEEE Signal Processing Magazine,July2001,pp.21-32。
图12和图13中描述了基于有损的无损编码的基本原理。在图12左侧的编码部分,PCM音频输入信号SPCM通过有损编码器81到达无损解码器82,并且作为有损比特流到达解码部分(右侧)的有损解码器85。使用有损编码和解码来对信号进行解相关。在减法器83中,将解码器82的输出信号从输入信号SPCM中移除,所产生的差信号通过无损编码器84,作为扩展比特流到达无损解码器87。将解码器85和87的输出信号组合86,以恢复原始信号SPCM。
在EP-B-0756385和US-B-6498811中公开了这一基本原理,还在以下文献中讨论了该原理:P.Craven,M.Gerzon,“Lossless Coding forAudio Discs”,J.Audio Eng.Soc.,Vol.44,No.9,September 1996,以及J.Koller,Th.Sporer,K.H.Brandenburg,“Robust Coding of High QualityAudio Signals”,AES 103rd Convention,Preprint 4621,August 1997。
在图13的有损编码器中,PCM音频输入信号SPCM通过解析滤波器组91和子带样本的量化92到达编码和比特流打包93。量化由感知模型计算器94控制,感知模型计算器94从分解滤波器组91接收信号SPCM和相关信息。在解码器侧,编码后的有损比特流进入用于对比特流进行解打包的装置95,接着是用于对子带样本进行解码的装置96,以及输出解码后的有损PCM信号SDec的合成滤波器组97。
在标准ISO/IEC 11172-3(MPEG-1音频)中详细描述了有损编码和解码的示例。
将要对编码产生的两个或更多个不同信号或比特流进行组合,以形成单个输出信号。例如,对于MPEG环绕、mp3PRO和AAC+存在类似的解决方案。对于后两个示例,要添加至基本层数据流(AAC或mp3)的附加的数据(SBR信息)量小。因此,可以将该附加信息打包入符合标准的AAC或mp3比特流,例如,作为“附属数据”。针对尽管环绕信息的附加数据量大于针对SBR信息的附加数据量,然而仍可以以相同的方式将这些数据打包入符合标准的比特流。
如在http://www.id3.org中描述的,使用类似技术的另一应用是添加至mp3标准音频流的ID3标签。将数据添加至现存mp3文件的起始处或结尾处。使用一种特殊的机制,使得mp3解码器不试图对该附加信息进行解码。
发明内容
然而,在基于有损的无损编码的情况下,附加信息量比基本层数据量多出基本层数据量的倍数。因此,不能将附加数据完全打包入基本层数据流,例如作为附属数据。有损编码格式与无损编码扩展的组合所产生的至少两个数据流是:包含有损编码信息(例如标准编码算法)的基本层,以及用于重建在数学上无损的原始输入信号的增强层。此外,若干中间层是可能的,每个中间层具有其自身的数据流。然而,这些数据流不是独立的。每个上层依赖于下层,并且仅能够与这些下层相结合来合理解码所述上层。
本发明要解决的问题是以文件格式或流格式来提供附加信息,以允许对不同层的同步、标识和兼容性控制以及对真实音频数据的打包。利用在权利要求1、2、4、5、7和8中公开的数据结构解决了该问题。
根据本发明,使用块结构中的一次性报头信息与重复报头信息的特定组合,组合的种类取决于应用类型(流格式或文件格式)。
指派信息数据项标识了属于一个输入信号的无损格式的不同部分/层。一种控制机制指示是否改变了下层数据流,这种改变可能导致层的不兼容。此外,使用同步信息数据项来将不同数据流/部分/层组合为单个无损或中间(在使用中间层的情况下)输出信号。以流格式和组合的输出数据流的文件格式来使用这些特征。
可以用于归档或存储应用的文件格式可以由单个文件或若干文件组成,所述单个文件将不同数据部分/层相组合。打包入单个文件必须考虑以下约束:
-标准有损编码/解码处理与无损扩展的组合必须考虑基础(underlying)有损编码标准的所有限制,以保留对有损编码/解码标准的后向(backwards)兼容性;
-基本层(即有损编码数据)将是可以容易地从完整的无损数据文件中提取出来的,表示独立可解码的数据文件。
原则上,将本发明的数据结构限定为:
针对有损编码信号及所述信号的无损扩展编码数据来布置比特流数据的数据结构,将所述数据结构限定为:
-将有损编码数据和无损扩展编码数据布置在单个文件中,其中将所述有损编码数据布置在所述文件的第一邻接部分中,将所述无损扩展编码数据布置在所述文件的第二邻接部分中;
-所述第一文件部分包括多个数据块,每个数据块以同步数据和辅助信息数据开始,接着是所述有损编码数据的主要数据;
-所述第二文件部分包括单个报头部分,所述报头部分包括:
--报头ID,用于标识相应的无损编码比特流;
--针对报头长度的指示符;
--可选指纹码;
--辅助信息数据;
-提示点表,定义了允许开始对所述有损编码数据及所述无损扩展编码数据进行解码的进入点,
-所述第二文件部分还包括多个数据帧,每个数据帧包括:
--可选同步字,便于找到无损扩展编码数据的连续帧的起始处;
--针对帧长度的指示符;
--所述无损扩展编码数据;
--对所述无损扩展编码数据及所述有损编码数据进行解码所需的辅助信息,
或
针对有损编码信号及所述信号的无损扩展编码数据来布置比特流数据的数据结构,将所述数据结构限定为:
-将有损编码数据布置在第一文件中,将无损扩展编码数据布置在第二文件中;
-所述第一文件包括多个数据块,每个数据块以同步数据和辅助信息数据开始,接着是所述有损编码数据的主要数据;
-所述第二文件包括单个报头部分,所述报头部分包括:
--报头ID,用于标识相应的无损编码比特流;
--针对报头长度的指示符;
--指纹码;
--辅助信息数据;
-提示点表,定义了允许开始对所述有损编码数据及所述无损扩展编码数据进行解码的进入点,
-所述第二文件还包括多个数据帧,每个数据帧包括:
--可选同步字,便于找到无损扩展编码数据的连续帧的起始处;
--针对帧长度的指示符;
--所述无损扩展编码数据;
--对所述无损扩展编码数据及所述有损编码数据进行解码所需的辅助信息,
或
针对有损编码信号及所述信号的无损扩展编码数据来布置比特流数据的数据结构,将所述数据结构限定为:
-将有损编码数据和无损扩展编码数据布置在单个文件中,其中将所述有损编码数据布置在所述文件的第一理解部分中,将所述无损扩展编码数据布置在所述文件的第二邻接部分中;
-所述第一文件部分包括多个数据块,每个数据块以同步数据和辅助信息数据开始,接着是所述有损编码数据的主要数据;
-所述第二文件部分包括单个报头部分,所述报头部分包括:
--报头ID,用于标识相应的无损编码比特流;
--针对报头长度的指示符;
--可选指纹码;
--辅助信息数据;
-所述第二文件部分还包括多个数据帧,每个数据帧包括:
--可选同步字,便于找到无损扩展编码数据的连续帧的起始处;
--针对帧长度的指示符;
--所述无损扩展编码数据;
--对所述无损扩展编码数据及所述有损编码数据进行解码所需的辅助信息,
其中,将提示点表附着到所述第二文件部分的所述报头部分或布置在所述第二文件报头部分与所述多个数据帧中的第一数据帧之间,所述提示点表定义了允许开始对所述有损编码数据及所述无损扩展编码数据进行解码的进入点,
或
针对有损编码信号及所述信号的无损扩展编码数据来布置比特流数据的数据结构,将所述数据结构限定为:
-将有损编码数据布置在第一文件中,将无损扩展编码数据布置在第二文件中;
-所述第一文件包括多个数据块,每个数据块以同步数据和辅助信息数据开始,接着是所述有损编码数据的主要数据;
-所述第二文件包括单个报头部分,所述报头部分包括:
--报头ID,用于标识相应的无损编码比特流;
--针对报头长度的指示符;
--指纹码;
--辅助信息数据;
-所述第二文件还包括多个数据帧,每个数据帧包括:
--可选同步字,便于找到无损扩展编码数据的连续帧的起始处;
--针对帧长度的指示符;
--所述无损扩展编码数据;
--对所述无损扩展编码数据及所述有损编码数据进行解码所需的辅助信息,
其中,将提示点表附着到所述第二文件报头部分或布置在所述第二文件报头部分与所述多个数据帧中的第一数据帧之间,所述提示点表定义了允许开始对所述有损编码数据及所述无损扩展编码数据进行解码的进入点,
或
针对有损编码信号及所述信号的无损扩展编码数据和中间质量扩展编码数据来布置比特流数据的数据结构,将所述数据结构限定为:
-将有损编码数据布置在第一文件中,将中间质量扩展编码数据布置在第二文件中,将无损扩展编码数据布置在第三文件中;
-所述第一文件包括多个数据块,每个数据块以同步数据和辅助信息数据开始,接着是所述有损编码数据的主要数据;
-所述第二文件包括单个报头部分,所述报头部分包括:
--报头ID,用于标识相应的中间质量扩展编码比特流;
--针对报头长度的指示符;
--指纹码;
--辅助信息数据;
-提示点表,定义了允许开始对所述有损编码数据及所述中间质量扩展编码数据进行解码的进入点,
-所述第二文件还包括多个数据帧,每个数据帧包括:
--可选同步字,便于找到中间质量扩展编码数据的连续帧的起始处;
--针对该帧长度的指示符;
--所述中间质量扩展编码数据;
--对所述中间质量扩展编码数据及所述有损编码数据进行解码所需的辅助信息;
-所述第三文件包括单个报头部分,所述报头部分包括:
--报头ID,用于标识相应的无损扩展编码比特流;
--针对该报头长度的指示符;
--指纹码;
--辅助信息数据;
-提示点表,定义了允许开始对所述有损编码数据及所述无损扩展编码数据进行解码的进入点,
-所述第三文件还包括多个数据帧,每个数据帧包括:
--可选同步字,便于找到无损扩展编码数据的连续帧的起始处;
--针对该帧长度的指示符;
--所述无损扩展编码数据;
--对所述无损扩展编码数据及所述有损编码数据进行解码所需的辅助信息,
或
针对比特流布置数据的数据结构,所述比特流布置数据是针对有损编码信号及所述信号的无损扩展编码数据和中间质量扩展编码数据的比特流布置数据,所述数据结构使用连续数据组部分,每个数据组部分包括:
-第一部分,包括无损扩展报头,所述报头包括:
--报头ID,用于标识相应的无损或中间质量编码比特流;
--针对报头长度的指示符;
--可选指纹码;
--辅助信息数据;
--针对无损扩展编码数据帧的帧长度的指示符;
--针对中间质量扩展编码数据部分的数据长度的可选指示符;
--针对有损编码数据部分的数据长度的可选指示符,
-第二部分,包括N个有损编码数据帧,所述第二部分包括N个数据块,每个数据块以同步数据和辅助信息数据开始,接着是有损编码数据帧的主要数据;
-第三部分,包括N个无损扩展编码数据帧,所述第三部分包括:
--所述无损扩展编码数据以及对所述无损扩展编码数据和所述有损编码数据进行解码所需的相关辅助信息,
--可选地,所述中间质量扩展编码数据以及对所述中间质量扩展编码数据和所述有损编码数据进行解码所需的相关辅助信息。
在相应从属权利要求中公开了本发明的、有利的其他实施例。
附图说明
参照附图,描述本发明的示例实施例,附图中:
图1示出了现有mp3比特流结构;
图2示出了容器格式的基本结构的两种可能性;
图3示出了针对容器文件格式的无损扩展数据部分的详细结构;
图4示出了针对容器文件格式的无损扩展数据部分的可选详细结构;
图5示出了使用两个单独文件的mp3无损文件格式的基本结构;
图6示出了无损扩展数据文件(即,图5中的第二文件)的详细结构;
图7示出了无损扩展数据文件(即,图5中的第二文件)的详细可选结构;
图8示出了使用三个单独文件的mp3无损文件格式的基本结构;
图9示出了扩展数据文件(中间质量数据和无损质量数据)的详细结构;
图10示出了mp3无损流格式的基本结构;
图11示出了mp3无损流格式的详细结构;
图12示出了现有基于有损的无损编码器和解码器的基本框图;
图13示出了现有有损编码器和解码器的基本框图。
具体实施方式
以下的描述涉及mp3无损数据格式的具体应用,本领域技术人员可以相应地使其适用于其他无损数据格式。如上所述,mp3无损是mp3编码音频文件与附加信息的组合,所述附加信息允许在数学上对编码后的音频文件的原始输入信号进行精确再生。此外,本发明允许产生针对中间声音质量等级的数据格式,该中间声音质量等级在mp3编码的音频文件与无损编码的质量等级之间。
要考虑的基本条件是基本层的文件格式,即,图1所示的mp3文件格式或比特流。以帧结构来布置编码数据。每个帧包含同步字,使得可以在每次标识出这样的同步字时在每个帧处开始mp3文件的解码过程。同步字之后接着是固定长度的mp3专用辅助信息(side information)数据。其后接着是可变长度主要数据部分,该可变长度主要数据部分包括mp3专用缩放因子、频谱数据(霍夫曼编码的数据或系数)以及一些可选附属数据。在ISO/IEC 11172-3中可以找到更详细的描述。这些帧中的每个帧与音频信号的段或部分相对应,由此,其长度取决于音频信号的采样频率以及取决于mp3文件的目标比特速率。
每一块无损扩展数据与mp3数据的相应帧有关。因此,本发明的文件/流格式提供了对相应数据的明确指派。提出了3种基本实施例:
-以单个容器文件格式存储mp3数据和扩展数据;
-在不同的文件中存储mp3数据和扩展数据;
-流格式。
以单个容器文件格式存储mp3数据和扩展数据
图2示出了两个可选基本比特流结构。为了允许容易提取mp3兼容的独立(stand-alone)文件,以及为了允许mp3解码器从完整的容器文件中解码mp3数据,将附加数据放置在符合mp3的比特流的结尾处或起始处。
mp3比特流也可以包含附加信息,例如ID3标签。然而,应确保附加信息不包含mp3同步字,以防止不能解码mp3无损的mp3解码器试图将附加数据解释为mp3比特流。在6.1节“The unsynchronisation scheme”中的“In depth information/ID3v2.4.0 Main Structure”主题下,在上述地址http://www.id3.org处公开了该问题的解决方案。
该数据结构允许从容器格式(即,组合格式)中容易地剥离(strip)mp3比特流。无损扩展部分包含便于对mp3数据和无损扩展比特流进行组合解码的信息项(例如提示点表(cue points table or tables)、同步字、帧长度或数据长度信息)。解码可以产生mp3质量音频信号、(可缩放的)中间质量音频信号或数学上无损的音频信号。
图3示出了第一无损扩展数据的详细结构,图4中示出了另一结构。在图1中图示了相应的mp3比特流部分。
在第一比特流结构中,使中间质量的数据和无损质量的数据交织在比特流中,包括每种数据在内的一个块构成帧。这些帧具有可变长度,因此包括帧长度指示符。这些块中的数据与N个mp3帧相对应。可以由编码器来选择N的数目,并且作为在mp3无损扩展报头中的辅助信息来发送所述N的数目。
帧包括以下数据:
-可选同步字,便于找到连续数据帧的起始处;
-针对帧长度的指示符;
-针对中间质量数据的长度的可选指示符;
-对中间质量信号数据进行解码所需的辅助信息,以及这些编码数据;
-根据中间质量音频文件数据对数学上无损的音频文件数据进行解码所需的辅助信息,以及这些编码数据。
布置在扩展数据部分的起始处的报头包括以下数据:
-报头ID,用于标识mp3无损比特流;
-针对报头长度的指示符;
-可选指纹码(例如CRC32或任何其他校验和(checksum)),允许对mp3基本层数据的改变进行检测。mp3基本层数据的改变可能导致与其他层的不兼容以及中间和无损数据的不正确解码。不兼容的指纹将导致解码停止。在单文件(single-file)容器格式中,指纹数据项不是必要的,这是因为在不适配扩展数据的情况下mp3数据的非故意改变是非常不可能的;
-模式指示信息块、DRM(数字权利管理)信息、以及在存在ID3标签数据和/或无损扩展数据的情况下的非同步比特(即针对ID3标签而定义的非同步机制也可以用于无损扩展数据)。这用于在无损扩展数据中避免mp3同步字。然后,非同步比特以信号方式来通知是否修改了无损扩展数据。可以指示出以下模式:
模式1
解码器可以在没有无损扩展流的情况下对任何相符的有损比特流进行解码。这种模式还在以下情况下有效:存在扩展比特流,并且不提供使用另一模式的许可(解码器将检查扩展流并且在其权利数据库中查找匹配的许可ID);
模式2
通过在检验扩展流数据的解码器中进行许可检查,还使能中间质量模式。仅对白化数据解打包,并且由有损解码器来使用该白化数据;
模式3
在肯定的许可检查之后开始无损模式;
-辅助信息数据,如编解码器延迟、原始文件长度、PCM字长、采样速率、扩展数据的块大小(N);
-提示点表数据块,包含以下项目中的一个或更多个:例如块长度、帧的间隔信息、表条目的数目、指针表。提示点定义了允许开始解码的进入点。
采用容器文件格式的第二无损扩展数据结构使用两个数据块。一块包含中间质量数据,另一块包含无损质量数据。这与第一方案的区别在于,现在需要两个提示点表,优选地,不将提示点表布置为报头数据,而是将其布置在每个数据块的起始处。一个表包含针对中间质量数据的提示点,另一个表包含针对无损质量数据的提示点。有利地,使用相同的帧作为两种扩展数据的提示点。在可选实施例中,取而代之地,可以将这两个提示点表均指派给报头。
存储在报头中的其他信息保持不变。
在不同的文件中存储mp3数据和扩展数据
要以这种格式存储的基本信息与采用先前的容器文件格式存储的基本信息相同。主要区别在于,现在指纹数据(对容器格式是可选的)是重要的,这是由于mp3比特流存储在单独的、符合标准的mp3文件中。可以使用不知道无损扩展数据存在的传统mp3工具或软件来编辑该文件。然而,基本mp3文件的改变可能导致扩展数据与基本mp3文件之间的不兼容,并且再也不可能对数学上无损的音频文件进行解码。为了拥有确保未改变的mp3基本文件的控制机制,指纹是必要的。例如,这可以是CRC32校验和。如果从mp3文件计算的指纹与无损扩展中存储的指纹不相同,则可以停止解码。图5中示出了两个文件中的mp3无损数据的基本结构,其中文件1是标准mp3文件,该标准mp3文件还可以包含ID3标签。
图6中图示了无损扩展数据的第一结构,图7中示出了可选结构。两种结构与单容器文件格式中的相应结构相似或相同——除了强制出现指纹数据之外。
存储无损扩展数据的另一种可能性是在两个单独文件加上基本mp3文件中存储这些数据,产生图8所示的3个单独文件。中间质量数据和无损质量数据各存储在单独的文件中。在这种格式中,两个指纹是必要的,一个在中间质量数据文件中,另一个在无损质量数据文件中。例如,中间质量文件中的指纹是基本mp3文件的CRC32校验和。在无损质量数据文件中,可以使用中间质量文件的指纹。这具有的优点是,在无损质量数据文件中,废弃了基本mp3文件的第二指纹。中间质量文件中的指纹已经覆盖了mp3指纹,因此,在无损质量数据文件的指纹中包括中间质量文件的指纹。
两种扩展文件的结构是相同的,图9中示出了这两种扩展文件的结构。该结构与图3和图6所示的结构相同—一除了具体的指纹数据项之外。
流格式
对于流应用,采用与文件应用不同的方式来组织数据。以交织的方式来布置mp3比特流数据和无损扩展数据。这意味着无损扩展数据块跟随着相应的mp3数据块,由此将无损扩展报头布置在每个mp3数据块之前。图10图示了这种结构。
这种交织的结构是必要的,这是因为:在流应用中,由于基本层和扩展数据之间的延迟将变得过大,使得不可能首先发送基本层(mp3数据)然后发送扩展数据。在这种方案中,益处在于首先发送基本mp3数据然后发送扩展数据,这是因为:在信道的可用带宽变得过小而无法发送所有数据的情况下,该方案便于质量的适度退化(gracefuldegradation)。这也是使用扩展数据的具体结构的原因,在该结构下,首选发送中间质量数据,然后发送无损质量数据。因此,在信道带宽减小的情况下可以跳过无损数据。
图11图示了mp3无损流的详细结构。按照以下方式组织该流:首先发送报头,该报头基本上包含了与针对文件格式所述的信息相同的信息。在该报头中,可以发送指纹,然而,由于通常这不是必要的,所以可以跳过指纹。此外,报头包括了指向报头结尾的指针、指向中间质量数据结尾的指针以及指向整个块或帧的结尾的指针。报头还包括指向mp3数据的结尾的指针,然而该指针仅在使用可变比特速率(VBR)对mp3数据进行编码的情况下才是必要的。如果以恒定比特速率对mp3数据进行编码,则可以容易地计算出mp3的结尾,因此该指针不是必要的。
报头之后接着是mp3编码的数据块(即mp3数据同步字)。mp3数据块包括以可变比特速率(VBR)或恒定比特速率(CBR)编码的N个mp3帧,N是大于等于“1”的整数。数目N取决于信道的带宽并且取决于mp3数据与无损扩展数据之间的可容许延迟。该数目N也被编码到无损扩展报头中的辅助信息部分中。
在N个mp3数据帧的块之后接着是无损扩展数据块。在这样的无损扩展数据块中,将中间质量数据布置在第一部分,将无损质量数据布置在第二部分,每个部分包含针对N个相应mp3帧的附加数据。在流格式中,由于数据块已经表示了提示点,因此不需要提示点表。
Claims (11)
1.一种针对有损编码信号及所述信号的无损扩展编码数据来布置比特流数据的数据结构,所述数据结构的特征在于:
-将有损编码数据和无损扩展编码数据布置在单个文件中,其中将所述有损编码数据布置在所述文件的第一邻接部分中,将所述无损扩展编码数据布置在所述文件的第二邻接部分中;
-所述第一文件部分包括多个数据块,每个数据块以同步数据(SYNC)和辅助信息数据开始,接着是所述有损编码数据的主要数据;
-所述第二文件部分包括单个报头部分,所述报头部分包括:
--报头ID(ID),用于标识相应的无损编码比特流;
--针对报头长度的指示符;
--可选指纹码;
--辅助信息数据;
-提示点表,定义允许开始对所述有损编码数据及所述无损扩展编码数据进行解码的进入点,
-所述第二文件部分还包括多个数据帧,每个数据帧包括:
--可选同步字(SYNC),便于找到无损扩展编码数据的连续帧的起始处;
--针对帧长度的指示符;
--所述无损扩展编码数据;
--对所述无损扩展编码数据及所述有损编码数据进行解码所需的辅助信息。
2.一种针对有损编码信号及所述信号的无损扩展编码数据来布置比特流数据的数据结构,所述数据结构的特征在于:
-将有损编码数据布置在第一文件中,将无损扩展编码数据布置在第二文件中;
-所述第一文件包括多个数据块,每个数据块以同步数据(SYNC)和辅助信息数据开始,接着是所述有损编码数据的主要数据;
-所述第二文件包括单个报头部分,所述报头部分包括:
--报头ID(ID),用于标识相应的无损编码比特流;
--针对报头长度的指示符;
--指纹码;
--辅助信息数据;
-提示点表,定义允许开始对所述有损编码数据及所述无损扩展编码数据进行解码的进入点,
-所述第二文件还包括多个数据帧,每个数据帧包括:
--可选同步字(SYNC),便于找到无损扩展编码数据的连续帧的起始处;
--针对帧长度的指示符;
--所述无损扩展编码数据;
--对所述无损扩展编码数据及所述有损编码数据进行解码所需的辅助信息。
3.如权利要求1所述的数据结构,其中,所述第二文件部分中的所述多个数据帧各自还包括,或如权利要求2所述的数据结构,其中,所述第二文件中的所述多个数据帧各自还包括:
-针对中间质量扩展编码数据的长度的指示符;
-所述中间质量扩展编码数据;
-对所述中间质量扩展编码数据及所述有损编码数据进行解码所需的辅助信息。
4.一种针对有损编码信号及所述信号的无损扩展编码数据来布置比特流数据的数据结构,所述数据结构的特征在于:
-将有损编码数据和无损扩展编码数据布置在单个文件中,其中将所述有损编码数据布置在所述文件的第一邻接部分中,将所述无损扩展编码数据布置在所述文件的第二邻接部分中;
-所述第一文件部分包括多个数据块,每个数据块以同步数据(SYNC)和辅助信息数据开始,接着是所述有损编码数据的主要数据;
-所述第二文件部分包括单个报头部分,所述报头部分包括:
--报头ID(ID),用于标识相应的无损编码比特流;
--针对报头长度的指示符;
--可选指纹码;
--辅助信息数据;
-所述第二文件部分还包括多个数据帧,每个数据帧包括:
--可选同步字(SYNC),便于找到无损扩展编码数据的连续帧的起始处;
--针对帧长度的指示符;
--所述无损扩展编码数据;
--对所述无损扩展编码数据及所述有损编码数据进行解码所需的辅助信息,
其中,将提示点表附着到所述第二文件部分中的所述报头部分,或布置在所述第二文件报头部分与所述多个数据帧中的第一数据帧之间,所述提示点表定义允许开始对所述有损编码数据及所述无损扩展编码数据进行解码的进入点。
5.一种针对有损编码信号及所述信号的无损扩展编码数据来布置比特流数据的数据结构,所述数据结构的特征在于:
-将有损编码数据布置在第一文件中,将无损扩展编码数据布置在第二文件中;
-所述第一文件包括多个数据块,每个数据块以同步数据(SYNC)和辅助信息数据开始,接着是所述有损编码数据的主要数据;
-所述第二文件包括单个报头部分,所述报头部分包括:
--报头ID(ID),用于标识相应的无损编码比特流;
--针对报头长度的指示符;
--指纹码;
--辅助信息数据;
-所述第二文件还包括多个数据帧,每个数据帧包括:
--可选同步字(SYNC),便于找到无损扩展编码数据的连续帧的起始处;
--针对帧长度的指示符;
--所述无损扩展编码数据;
--对所述无损扩展编码数据及所述有损编码数据进行解码所需的辅助信息,
其中,将提示点表附着到所述第二文件报头部分,或布置在所述第二文件报头部分与所述多个数据帧中的第一数据帧之间,所述提示点表定义允许开始对所述有损编码数据及所述无损扩展编码数据进行解码的进入点。
6.如权利要求4所述的数据结构,其中,将其他多个数据帧布置在所述第二文件部分的报头部分与所述多个数据帧之间,或如权利要求5所述的数据结构,其中,将其他多个数据帧布置在所述第二文件中的报头部分与所述多个数据帧之间,所述其他多个数据帧包括:
-可选同步字,便于找到中间质量扩展编码数据的连续帧的起始处;
-针对所述中间质量扩展编码数据的长度的指示符;
-所述中间质量扩展编码数据;
-对所述中间质量扩展编码数据及所述有损编码数据进行解码所需的辅助信息,
其中,将另外的提示点表附着到该报头部分或布置在该报头部分与所述其他多个数据帧中的第一数据帧之间,所述另外的提示点表定义允许开始对所述有损编码数据及所述中间质量扩展编码数据进行解码的进入点。
7.一种针对有损编码信号及所述信号的无损扩展编码数据和中间质量扩展编码数据来布置比特流数据的数据结构,所述数据结构的特征在于:
-将有损编码数据布置在第一文件中,将中间质量扩展编码数据布置在第二文件中,将无损扩展编码数据布置在第三文件中;
-所述第一文件包括多个数据块,每个数据块以同步数据(SYNC)和辅助信息数据开始,接着是所述有损编码数据的主要数据;
-所述第二文件包括单个报头部分,所述报头部分包括:
--报头ID(ID),用于标识相应的中间质量扩展编码比特流;
--针对该报头长度的指示符;
--指纹码;
--辅助信息数据;
-提示点表,定义允许开始对所述有损编码数据及所述中间质量扩展编码数据进行解码的进入点,
-所述第二文件还包括多个数据帧,每个数据帧包括:
--可选同步字(SYNC),便于找到中间质量扩展编码数据的连续帧的起始处;
--针对该帧长度的指示符;
--所述中间质量扩展编码数据;
--对所述中间质量扩展编码数据及所述有损编码数据进行解码所需的辅助信息;
-所述第三文件包括单个报头部分,所述报头部分包括:
--报头ID(ID),用于标识相应的无损扩展编码比特流;
--针对该报头长度的指示符;
--指纹码;
--辅助信息数据;
-提示点表,定义允许开始对所述有损编码数据及所述无损扩展编码数据进行解码的进入点,
-所述第三文件还包括多个数据帧,每个数据帧包括:
--可选同步字(SYNC),便于找到无损扩展编码数据的连续帧的起始处;
--针对该帧长度的指示符;
--所述无损扩展编码数据;
--对所述无损扩展编码数据及所述有损编码数据进行解码所需的辅助信息。
8.一种针对比特流布置数据的数据结构,所述比特流布置数据是针对有损编码信号及所述信号的无损扩展编码数据和可选中间质量扩展编码数据的比特流布置数据,所述数据结构的特征在于连续数据组部分,每个数据组部分包括:
-第一部分,包括无损扩展报头,所述报头包括:
--报头ID(ID),用于标识相应的无损或中间质量编码比特流;
--针对报头长度的指示符;
--可选指纹码;
--辅助信息数据;
--针对无损扩展编码数据帧的帧长度的指示符;
--针对中间质量扩展编码数据部分的数据长度的可选指示符;
--针对有损编码数据部分的数据长度的可选指示符,
-第二部分,包括N个有损编码数据帧,所述第二部分包括N个数据块,每个数据块以同步数据(SYNC)和辅助信息数据开始,接着是所述有损编码数据帧的主要数据;
-第三部分,包括N个无损扩展编码数据帧,所述第三部分包括:
--所述无损扩展编码数据以及对所述无损扩展编码数据和所述有损编码数据进行解码所需的相关辅助信息,
--可选地,所述中间质量扩展编码数据以及对所述中间质量扩展编码数据和所述有损编码数据进行解码所需的相关辅助信息。
9.根据权利要求1至8中任一项所述的数据结构,其中,所述报头还包括以下一个或更多:指示信息、DRM信息、非同步比特。
10.如权利要求1至9中任一项所述的数据结构,其中,所述信号是音频信号。
11.一种例如在光盘上的存储介质,所述介质包含或存储具有如权利要求1至9中任一项所述的数据结构的音频数据。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP06117375.3 | 2006-07-18 | ||
EP06117375A EP1881485A1 (en) | 2006-07-18 | 2006-07-18 | Audio bitstream data structure arrangement of a lossy encoded signal together with lossless encoded extension data for said signal |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101490746A true CN101490746A (zh) | 2009-07-22 |
Family
ID=37143498
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA2007800267557A Pending CN101490746A (zh) | 2006-07-18 | 2007-07-05 | 有损编码信号及所述信号的无损编码扩展数据的音频比特流数据结构布置 |
Country Status (6)
Country | Link |
---|---|
US (1) | US8326639B2 (zh) |
EP (2) | EP1881485A1 (zh) |
JP (1) | JP5249214B2 (zh) |
KR (1) | KR101386270B1 (zh) |
CN (1) | CN101490746A (zh) |
WO (1) | WO2008009564A1 (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102687509A (zh) * | 2009-10-27 | 2012-09-19 | 英特尔公司 | 使用jpeg-ls的可调节压缩 |
CN102684703A (zh) * | 2012-04-26 | 2012-09-19 | 北京师范大学 | 一种高效的数字高程模型数据无损压缩的方法 |
CN102934162A (zh) * | 2010-06-11 | 2013-02-13 | 汤姆森特许公司 | 搜索随后被重放的包括基本层和至少一个增强层分层分级比特流的方法和设备 |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102007034481A1 (de) | 2007-07-20 | 2009-01-22 | Huf Hülsbeck & Fürst Gmbh & Co. Kg | Verriegelungsvorrichtung mit Arretierungsteil |
CN101256775B (zh) * | 2008-04-09 | 2011-04-20 | 无敌科技(西安)有限公司 | 一种mp3位串排列方法与装置 |
EP2146343A1 (en) * | 2008-07-16 | 2010-01-20 | Deutsche Thomson OHG | Method and apparatus for synchronizing highly compressed enhancement layer data |
US8879895B1 (en) | 2009-03-28 | 2014-11-04 | Matrox Electronic Systems Ltd. | System and method for processing ancillary data associated with a video stream |
CN101964187B (zh) * | 2009-07-24 | 2012-08-08 | 晨星软件研发(深圳)有限公司 | 帧标题的自动检测方法 |
US10382842B2 (en) * | 2012-06-26 | 2019-08-13 | BTS Software Software Solutions, LLC | Realtime telemetry data compression system |
US11128935B2 (en) * | 2012-06-26 | 2021-09-21 | BTS Software Solutions, LLC | Realtime multimodel lossless data compression system and method |
US9953436B2 (en) * | 2012-06-26 | 2018-04-24 | BTS Software Solutions, LLC | Low delay low complexity lossless compression system |
WO2014004486A2 (en) * | 2012-06-26 | 2014-01-03 | Dunling Li | Low delay low complexity lossless compression system |
KR102204136B1 (ko) * | 2012-08-22 | 2021-01-18 | 한국전자통신연구원 | 오디오 부호화 장치 및 방법, 오디오 복호화 장치 및 방법 |
US10140996B2 (en) | 2014-10-10 | 2018-11-27 | Qualcomm Incorporated | Signaling layers for scalable coding of higher order ambisonic audio data |
US9984693B2 (en) | 2014-10-10 | 2018-05-29 | Qualcomm Incorporated | Signaling channels for scalable coding of higher order ambisonic audio data |
JP6876928B2 (ja) * | 2016-03-31 | 2021-05-26 | ソニーグループ株式会社 | 情報処理装置および方法 |
US10438597B2 (en) | 2017-08-31 | 2019-10-08 | Dolby International Ab | Decoder-provided time domain aliasing cancellation during lossy/lossless transitions |
CN109587497B (zh) * | 2018-12-13 | 2021-03-23 | 广州虎牙信息科技有限公司 | Flv流的音频数据传输方法、装置和系统 |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE4202140A1 (de) * | 1992-01-27 | 1993-07-29 | Thomson Brandt Gmbh | Verfahren zur uebertragung digitaler audio-signale |
EP0756386B1 (en) | 1995-07-27 | 2003-09-17 | Victor Company Of Japan, Limited | Method and apparatus for coding a digital, acoustic signal |
KR100261254B1 (ko) * | 1997-04-02 | 2000-07-01 | 윤종용 | 비트율 조절이 가능한 오디오 데이터 부호화/복호화방법 및 장치 |
SE512719C2 (sv) | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
DE19743662A1 (de) * | 1997-10-02 | 1999-04-08 | Bosch Gmbh Robert | Verfahren und Vorrichtung zur Erzeugung eines bitratenskalierbaren Audio-Datenstroms |
JP4267084B2 (ja) | 1998-04-09 | 2009-05-27 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 伝送システムの損失のない符号化/復号化 |
US6226616B1 (en) * | 1999-06-21 | 2001-05-01 | Digital Theater Systems, Inc. | Sound quality of established low bit-rate audio coding systems without loss of decoder compatibility |
KR100908114B1 (ko) * | 2002-03-09 | 2009-07-16 | 삼성전자주식회사 | 스케일러블 무손실 오디오 부호화/복호화 장치 및 그 방법 |
US7536305B2 (en) * | 2002-09-04 | 2009-05-19 | Microsoft Corporation | Mixed lossless audio compression |
US7392195B2 (en) * | 2004-03-25 | 2008-06-24 | Dts, Inc. | Lossless multi-channel audio codec |
US8131134B2 (en) * | 2004-04-14 | 2012-03-06 | Microsoft Corporation | Digital media universal elementary stream |
JP4293115B2 (ja) | 2004-11-12 | 2009-07-08 | Kddi株式会社 | ダウンロードされた音楽コンテンツを再生又は記録する方法、端末及びプログラム |
PL1839297T3 (pl) * | 2005-01-11 | 2019-05-31 | Koninklijke Philips Nv | Skalowalne kodowanie/dekodowanie sygnałów audio |
EP1852849A1 (en) * | 2006-05-05 | 2007-11-07 | Deutsche Thomson-Brandt Gmbh | Method and apparatus for lossless encoding of a source signal, using a lossy encoded data stream and a lossless extension data stream |
EP1852848A1 (en) * | 2006-05-05 | 2007-11-07 | Deutsche Thomson-Brandt GmbH | Method and apparatus for lossless encoding of a source signal using a lossy encoded data stream and a lossless extension data stream |
EP1855436A1 (en) * | 2006-05-12 | 2007-11-14 | Deutsche Thomson-Brandt Gmbh | Method and apparatus for encrypting encoded audio signal |
EP1883067A1 (en) * | 2006-07-24 | 2008-01-30 | Deutsche Thomson-Brandt Gmbh | Method and apparatus for lossless encoding of a source signal, using a lossy encoded data stream and a lossless extension data stream |
EP2131590A1 (en) * | 2008-06-02 | 2009-12-09 | Deutsche Thomson OHG | Method and apparatus for generating or cutting or changing a frame based bit stream format file including at least one header section, and a corresponding data structure |
EP2146343A1 (en) * | 2008-07-16 | 2010-01-20 | Deutsche Thomson OHG | Method and apparatus for synchronizing highly compressed enhancement layer data |
US8374858B2 (en) * | 2010-03-09 | 2013-02-12 | Dts, Inc. | Scalable lossless audio codec and authoring tool |
-
2006
- 2006-07-18 EP EP06117375A patent/EP1881485A1/en not_active Withdrawn
-
2007
- 2007-07-05 CN CNA2007800267557A patent/CN101490746A/zh active Pending
- 2007-07-05 WO PCT/EP2007/056824 patent/WO2008009564A1/en active Application Filing
- 2007-07-05 EP EP07787114A patent/EP2041743A1/en not_active Ceased
- 2007-07-05 US US12/309,370 patent/US8326639B2/en active Active
- 2007-07-05 JP JP2009519911A patent/JP5249214B2/ja not_active Expired - Fee Related
- 2007-07-05 KR KR1020097001007A patent/KR101386270B1/ko not_active IP Right Cessation
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102687509A (zh) * | 2009-10-27 | 2012-09-19 | 英特尔公司 | 使用jpeg-ls的可调节压缩 |
CN102687509B (zh) * | 2009-10-27 | 2016-08-03 | 英特尔公司 | 使用jpeg-ls的可调节压缩 |
CN102934162A (zh) * | 2010-06-11 | 2013-02-13 | 汤姆森特许公司 | 搜索随后被重放的包括基本层和至少一个增强层分层分级比特流的方法和设备 |
CN102934162B (zh) * | 2010-06-11 | 2014-12-10 | 汤姆森特许公司 | 搜索随后被重放的包括基本层和至少一个增强层分层分级比特流的方法和设备 |
US9355644B2 (en) | 2010-06-11 | 2016-05-31 | Thomson Licensing | Method and apparatus for searching in a layered hierarchical bit stream followed by replay, said bit stream including a base layer and at least one enhancement layer |
CN102684703A (zh) * | 2012-04-26 | 2012-09-19 | 北京师范大学 | 一种高效的数字高程模型数据无损压缩的方法 |
Also Published As
Publication number | Publication date |
---|---|
EP2041743A1 (en) | 2009-04-01 |
US8326639B2 (en) | 2012-12-04 |
KR20090040294A (ko) | 2009-04-23 |
JP2009544054A (ja) | 2009-12-10 |
WO2008009564A8 (en) | 2008-05-08 |
JP5249214B2 (ja) | 2013-07-31 |
WO2008009564A1 (en) | 2008-01-24 |
EP1881485A1 (en) | 2008-01-23 |
US20090240506A1 (en) | 2009-09-24 |
KR101386270B1 (ko) | 2014-04-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101490746A (zh) | 有损编码信号及所述信号的无损编码扩展数据的音频比特流数据结构布置 | |
CN101490748B (zh) | 使用有损编码数据流和无损扩展数据流对源信号进行无损编码的方法和设备 | |
KR101404335B1 (ko) | 오디오 소스 신호에 대한 손실 엔코드된 데이터 스트림과 무손실 확장 데이터 스트림으로부터 오디오 소스 신호에 대한 무손실 엔코드된 데이터 스트림을 생성하거나 상기 엔코드된 데이터 스트림을 디코딩하기 위한 방법 및 장치 | |
KR100818268B1 (ko) | 오디오 데이터 부호화 및 복호화 장치와 방법 | |
CN101849258B (zh) | 用于在可缩放音频编解码器中编码/解码的方法和装置 | |
KR101826375B1 (ko) | 재생에 선행하여 베이스 층 및 적어도 하나의 강화 층을 포함하는 층화된 계층적 비트 스트림을 검색하기 위한 방법 및 장치 | |
CN106233380A (zh) | 多对象音频的编码后位速率减少 | |
EP2453437A2 (en) | Method and apparatus for lossless encoding of a source signal, using a lossy encoded data stream and a lossless extension data stream | |
CN1961351A (zh) | 可缩放的无损音频编解码器和创作工具 | |
CN101203907A (zh) | 音频编码装置、音频解码装置以及音频编码信息传输装置 | |
KR20100087661A (ko) | 오디오 신호의 부호화 및 복호화 방법 및 그 장치 | |
TW201209805A (en) | Device and method for efficiently encoding quantization parameters of spectral coefficient coding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Open date: 20090722 |