CN102047336A - 用于产生或截除或改变包括至少一个报头部分在内的基于帧的比特流格式文件的方法和设备以及相应数据结构 - Google Patents
用于产生或截除或改变包括至少一个报头部分在内的基于帧的比特流格式文件的方法和设备以及相应数据结构 Download PDFInfo
- Publication number
- CN102047336A CN102047336A CN2009801205152A CN200980120515A CN102047336A CN 102047336 A CN102047336 A CN 102047336A CN 2009801205152 A CN2009801205152 A CN 2009801205152A CN 200980120515 A CN200980120515 A CN 200980120515A CN 102047336 A CN102047336 A CN 102047336A
- Authority
- CN
- China
- Prior art keywords
- frame
- file
- header
- data
- decoding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
- G11B20/10527—Audio or video recording; Data buffering arrangements
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/00086—Circuits for prevention of unauthorised reproduction or copying, e.g. piracy
- G11B20/00166—Circuits for prevention of unauthorised reproduction or copying, e.g. piracy involving measures which result in a restriction to authorised contents recorded on or reproduced from a record carrier, e.g. music or software
- G11B20/00181—Circuits for prevention of unauthorised reproduction or copying, e.g. piracy involving measures which result in a restriction to authorised contents recorded on or reproduced from a record carrier, e.g. music or software using a content identifier, e.g. an international standard recording code [ISRC] or a digital object identifier [DOI]
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
- G11B20/12—Formatting, e.g. arrangement of data block or words on the record carriers
- G11B20/1262—Formatting, e.g. arrangement of data block or words on the record carriers with more than one format/standard, e.g. conversion from CD-audio format to R-DAT format
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/00007—Time or data compression or expansion
- G11B2020/00014—Time or data compression or expansion the compressed signal being an audio signal
- G11B2020/00021—Time or data compression or expansion the compressed signal being an audio signal lossless audio compression
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/00007—Time or data compression or expansion
- G11B2020/00014—Time or data compression or expansion the compressed signal being an audio signal
- G11B2020/00057—MPEG-1 or MPEG-2 audio layer III [MP3]
Abstract
在基于帧的比特流格式中,用于对当前帧进行解码所需的数据通常存储在针对该帧的数据部分内。一种例外是针对当前帧的数据存储在先前帧中的mp3比特流。如果解码器不接收所需的先前帧,则跳过对当前mp3帧的解码。本发明可以应用于在归档模式中、流传输模式和归档模式的采样精确截除中的这样的比特流。在流传输和截除模式中,建立新报头。在报头中发信号通知对解码器状态进行初始化所需的帧的数目,以及流传输模式中的一致性检查值。这些帧用于解码器初始化,但不用于对采样或系数进行解码。对于采样精确截除,针对应当截除的帧,也在报头中指示要消音的采样或系数的数目。本发明可以应用于hd3音频文件格式,以用于mp3比特流的无损扩展。
Description
技术领域
本发明涉及一种具有可改变格式的基于帧的数据格式,包含用于对当前帧进行解码的已编码信号数据的所述帧需要访问先前帧数据。
背景技术
在基于帧的比特流格式中,用于对当前帧进行解码所需的数据通常存储在针对该帧的数据部分内。
一种例外是具有其比特存储(reservoir)技术的MPEG1音频层III比特流,其中,针对当前帧的数据存储在先前帧中。比特流中数据的位置由指针指向先前帧中主数据的开始的字节的位置。如果解码器没有接收到所需的先前帧,则跳过对当前mp3帧的解码。
发明内容
MPEG1音频层III比特流不具有用于实现采样精确截除(sample-exact cutting)的比特流报头字段。本发明可以应用于数据格式或数据结构,扩展数据流为例如音频信号的有损基本层数据流提供无损扩展,例如针对mp3比特流的无损扩展的hd3音频文件格式,其中,对帧的解码要求对多于一个先前帧的解码,并且比特流格式提供存档模式和流传输模式,以及比特流的采样精确截除特征。
‘归档模式’意味着:文件包括单个比特流报头和已编码或解码信号采样或系数的连续帧(具体地,音频采样),从而解码必须起始于文件开始处,即,以比特流报头之后的帧开始。‘流传输模式’意味着:将连贯比特流分成多于一个数据分组,每个分组以单个比特流报头开始,之后是若干帧,从而解码可以开始于每个分组。采样精确截除意味着,产生来自现有比特流的部分的一部分作为新比特流,从而仅对该现有比特流的采样的子集进行编码或解码,其中,可以任意选择第一和最后可解码采样。
本发明要解决的问题公开一种比特流格式,便于截除文件或流传输分组开始处解码器状态的初始化。根据帧,解码状态恢复中所涉及的先前帧的数目是不同的。流传输模式文件或截除文件可以开始于每个帧,并从而针对解码器状态恢复的先前帧的所需的数目丢失。
该问题可以通过权利要求1和3中所公开的方法以及权利要求2中所公开的数据结构来解决。在权利要求4中公开了利用权利要求3的方法的设备。
可以在编码器侧以及解码器侧处产生或使用本发明的比特流格式。关于解码器侧,本发明涉及一种相应的解码器处理以及用于对截除文件或流分组的开始处的解码器状态进行初始化的所需比特流报头字段。
根据本发明,在比特流中发信号通知对解码器状态进行初始化需要多少个帧。这明确地在比特流报头中通过发信号通知解码器状态恢复所需的帧的数目来执行。这些帧用于解码器初始化,而不用于对采样或系数进行解码。为了采样精确截除,对于应当发生截除的帧而言,在比特流报头中指示要消音的采样或系数的数目,以实现帧边界以外的采样精确截除。
本发明例如可以使用在hd3编码器中,以便允许比特流的两个比特流模式和采样精确截除。这是特定的解决方案,因为对hd3的编码器比特流的第二层的帧的解码需要第一层的多于一个已解码帧,而在大多数公知的基于帧的音频格式中,可以与其他帧无关的对每个帧进行解码。利用后向自适应预测技术的编码器可以使用本发明的处理,这是由于其需要已知所有先前已解码采样,以恢复预测状态。因此,这种已知的比特流在限定数目的已编码采样之后包括用于解码器初始化的预测状态,这对于本发明而言是不可靠的。
原则上,本发明的方法适合于产生包括至少一个比特流报头部分在内的基于帧的比特流格式文件,所述帧包括已编码信号数据,其中对当前帧的数据进行解码或评估所需的数据可以包含在一个或多个先前帧中,并且在所述报头中布置信息项,所述信息项表示:
-针对所述文件的每通道采样的总数;
-针对所述文件的‘归档模式’或‘流传输模式’;
-对所述已编码信号数据的解码是否可以开始于所述文件的第一帧;
-如果对所述已编码信号数据的解码不开始于所述文件的所述第一帧,则初始化解码状态时要消音的初始帧的数目,以及可选地,对于采样精确截除特征,在相应帧中要消音采样的数目;
-在所述流传输模式中,识别先前超帧的值用于一致性检查的值,
在所述归档模式中,所述文件包括单个比特流报头部分,以及所述帧中连续的帧,并且对所述已编码信号数据的解码以所述帧中的第一帧开始,
以及,在所述流传输模式中,所述比特流包含多于一个超帧,所述超帧中的每一个以单个比特流报头部分开始,之后是所述帧中的多个帧,并且可以在所述超帧中的每一个帧处初始化对所述已编码信号数据的解码,
以及,与要消音的初始帧的数目有关的所述信息项发信号通知在当前超帧中需要多少个初始帧,以在实际上从所述当前超帧的后续一个帧或多个帧开始对已编码信号数据的解码之前,建立用于初始化对所述信号数据的解码的状态的数据,这样的初始帧并不用于对其中包含的已编码信号数据进行解码。
原则上,本发明的数据结构适合于包括至少一个比特流报头部分在内的基于帧的比特流格式文件,所述帧包括已编码信号数据,其中对当前帧的数据进行解码或评估所需的数据可以包含在一个或多个先前帧中,并且在所述报头中布置信息项,所述信息项表示:
-针对所述文件的每通道采样的总数;
-针对所述文件的‘归档模式’或‘流传输模式’;
-对所述已编码信号数据的解码是否可以开始于所述文件的第一帧;
-如果对所述已编码信号数据的解码不开始于所述文件的所述第一帧,则初始化解码状态时要消音的初始帧的数目,及可选地,对于采样精确截除特征,在相应帧中要消音采样的数目;
-在所述流传输模式中,识别先前超帧以进行一致性检查的值,
在所述归档模式中,所述文件包括单个比特流报头部分,以及所述帧中连续的帧,并且对所述已编码信号数据的解码要以所述帧中的第一帧开始,
以及,在所述流传输模式中,所述比特流包含多于一个超帧,所述超帧中的每一个以单个比特流报头部分开始,之后是所述帧中的多个帧,并且可以在所述超帧中的每一个帧处初始化对所述已编码信号数据的解码,
以及,与要消音的初始帧的数目有关的所述信息项发信号通知在当前超帧中需要多少个初始帧,以在实际上从所述当前超帧的后续一个帧或多个帧开始对已编码信号数据的解码之前,建立用于初始化对所述信号数据的解码的状态的数据,这样的初始帧并不用于对其中包含的已编码信号数据进行解码。
原则上,一个本发明的方法适合于,从包括比特流报头部分在内的基于帧的比特流格式文件中截除一部分,所述帧包括已编码信号数据,其中对当前帧的数据进行解码或评估所需的数据可以包含在一个或多个先前帧中,并且所述报头包括信息项,所述信息项表示:
-针对所述文件的每通道采样的总数;
-针对所述文件的‘归档模式’;
-对所述已编码信号数据的解码要开始于所述文件的第一帧;
其中,在所述归档模式中,所述文件包括单个比特流报头部分,以及所述帧中连续的帧,
所述方法包括通过以下操作来形成截除文件的步骤:从所述比特流中获取所需帧数据;以及在这些帧数据的前面布置截除报头,
其中,从所述报头中导出所述截除报头,并且在所述截除报头中:
-用针对所述截除文件的每通道采样的数目来代替针对所述文件的每通道采样的所述总数;
-保持所述归档模式;
-将要以所述文件的第一帧开始的对所述已编码信号数据的解码有关的所述信息项改变为要在所述文件中稍后开始的对所述已编码信号数据的解码;
-添加与初始化解码状态时要消音的初始帧的数目有关的信息项。
原则上,一个本发明的设备适合于,从包括比特流报头部分在内的基于帧的比特流格式文件中截除一部分,所述帧包括已编码信号数据,其中对当前帧的数据进行解码或评估所需的数据可以包含在一个或多个先前帧中,并且在所述报头中布置信息项,所述信息项表示:
-针对所述文件的每通道采样的总数;
-针对所述文件的‘归档模式’;
-对所述已编码信号数据的解码开始于所述文件的第一帧;
其中,在所述归档模式中,所述文件包括单个比特流报头部分,以及所述帧中连续的帧,
所述设备包括适于通过以下操作来形成截除文件的装置:从所述比特流中获取所需帧数据;以及在这些帧数据的前面布置截除报头,
其中,从所述报头中导出所述截除报头,并且在所述截除报头中:
-用针对所述截除文件的每通道采样的数目来代替针对所述文件的每通道采样的所述总数;
-保持所述归档模式;
-将要以所述文件的第一帧开始的对所述已编码信号数据的解码有关的所述信息项改变为要在所述文件中稍后开始的对所述已编码信号数据的解码;
-添加与初始化解码状态时要消音的初始帧的数目有关的信息项。
原则上,一个本发明的方法适合于改变基于帧的比特流文件格式,所述比特流包括报头部分,所述帧包括已编码信号数据,其中对当前帧的数据进行解码或评估所需的数据可以包含在一个或多个先前帧中,并且所述报头包括信息项,所述信息项表示:
-针对所述文件的每通道采样的总数;
-针对所述文件的‘归档模式’;
-对所述已编码信号数据的解码要开始于所述文件的第一帧;
其中,在所述归档模式中,所述文件包括单个比特流报头部分,以及所述帧中连续的帧,
所述方法包括通过以下操作从所述归档模式文件中产生‘流传输模式’比特流的步骤:通过从所述归档模式文件中获取所需帧数据、以及在每个超帧的开始处布置超帧报头,来从所述归档模式文件的每个连续帧组中形成所述流传输模式比特流的超帧,其中,从所述报头中导出这些超帧报头,并且在所述超帧报头的第一超帧报头中:
-用针对每通道采样的第一适合数目来代替针对所述文件的每通道采样的所述总数;
-给出针对‘流传输模式’而不是‘归档模式’的信息项;
-保持与对要开始于所述文件的第一帧的所述已编码信号数据的解码有关的所述信息项,
以及,在所述超帧报头的后续超帧报头中:
-用于每通道采样的第二适合数目来代替针对所述文件的每通道采样的所述总数;
-用针对‘流传输模式’的信息项来代替针对‘归档模式’的所述信息项;
-用与对不开始于所述第一帧的所述已编码信号数据的解码有关的信息项,来代替与对要开始于所述文件的第一帧的所述已编码信号数据的解码有关的所述信息项;
-添加与初始化解码状态要消音的初始帧的数目有关的信息项;
-可选地,添加与开始对所述已编码信号数据的解码的帧中要消音的采样的数目有关的信息项,其中数目为‘0’;
-添加与一致性检查数据有关的信息项,其中,从先前超帧的数据中导出所述一致性检查数据的值。
原则上,一个本发明的设备适合于改变基于帧的比特流文件格式,所述比特流包括报头部分,所述帧包括已编码信号数据,其中对当前帧的数据进行解码或评估所需的数据可以包含在一个或多个先前帧中,并且在所述报头包括信息项,所述信息项表示:
-针对所述文件的每通道采样的总数;
-针对所述文件的‘归档模式’;
-对所述已编码信号数据的解码要开始于所述文件的第一帧;
其中,在所述归档模式中,所述文件包括单个比特流报头部分,以及所述帧中连续的帧,
所述方法包括适合于通过以下操作从所述归档模式文件中产生‘流传输模式’比特流的装置:通过从所述归档模式文件中获取所需帧数据、以及在每个超帧的开始处布置超帧报头,来从所述归档模式文件的每个连续帧组中形成所述流传输模式比特流的超帧,其中,从所述报头中导出这些超帧报头,并且在所述超帧报头的第一超帧报头中:
-用每通道采样的第一适合数目来代替针对所述文件的所述每通道采样的总数;
-给出针对‘流传输模式’而不是‘归档模式’的信息项;
-保持与对要开始于所述文件的第一帧的所述已编码信号数据的解码有关的所述信息项,
以及,在所述超帧报头的后续超帧报头中:
-用每通道采样的第二适合数目来代替针对所述文件的所述每通道采样的总数;
-用针对‘流传输模式’的信息项来代替针对‘归档模式’的所述信息项;
-用与对不开始于所述第一帧的所述已编码信号数据的解码有关的信息项,来代替与对要开始于所述文件的第一帧的所述已编码信号数据的解码有关的所述信息项;
-添加与初始化解码状态要消音的初始帧的数目有关的信息项;
-可选地,添加与开始对所述已编码信号数据的解码的帧中要消音的采样的数目有关的信息项,其中数目为‘0’;
-添加与一致性检查数据有关的信息项,其中,从先前超帧的数据中导出所述一致性检查数据的值。
原则上,最后提到的方法可以用于对所述流传输模式比特流进行解码,还包括以下步骤:
-当在所述第一超帧处开始对所述流传输模式比特流的解码时,对已编码信号数据的解码使用缺省解码器状态,开始于超帧的第一帧;
-当没有在所述第一超帧处开始对所述流传输模式比特流的解码时,在解码初始化或重置之后,对应于与初始帧的数目有关的所述信息项的帧数目‘muteFrames’用于初始化解码状态,并且对已编码信号数据的解码开始于使用这些解码状态的当前超帧的帧数目muteFrames+1。
-当没有在所述第一超帧处开始对所述流传输模式比特流的解码时,并且根据先前超帧数据计算的一致性检查数据与根据当前超帧计算的相应一致性检查数据不相一致时,使用后续超帧的帧数目‘muteFrames’来重新初始化解码状态,使用这些解码状态在后续超帧的帧数目‘muteFrames+1’处开始对已编码信号数据的解码;
-当没有在所述第一超帧处开始对所述流传输模式比特流的解码时,并且超帧之前已被解码以及所述一致性检查数据有效时,使用先前已解码超帧的解码器状态来对当前超帧中的帧的已编码信号数据进行解码。
在相应从属权利要求中公开了本发明的有利附加实施例。
以下描述提供了相应比特流信息和具有一个支持流传输模式以及归档模式且便于样本精确截除的比特流格式的解码器处理。
附图说明
参照附图描述本发明的示例实施例,在附图中:
图1是归档模式比特流的结构;
图2是截除归档模式比特流的结构;
图3是流传输模式比特流的结构;
图4是第n个帧的依赖性,从而对framen-4的解码需要存储在先前超帧中的数据,因此其对超帧的孤立解码无效。初始化framen的解码器状态需要framen-3、framen-2和framen-1;
图5是用于处理本发明比特流格式的归档模式、截除模式和流传输模式的流程图;
图6是简要HD3文件格式。
具体实施方式
在hd3编解码器开发期间做出本发明。因此,描述适用于hd3比特流格式的当前版本。然而,本发明相应地可以应用于需要用于对帧进行解码的先前帧的数目的知识的所有基于帧的文件格式,其中,将数目写入到比特流报头中,以初始化解码器状态,或者通过指示已解码帧的要消音的采样的数目来实现采样精确截除。
hd3编解码器在单个文件中实现mp3文件加mp3文件的源的比特精确表示的扩展数据的存储。如图1所示,hd3比特流格式的第一版本是归档格式,具有一个文件报头和连续数据帧Frame0、Frame1、…Framen。为了容易理解,这是没有示出hd3编解码器的不同层,并且假定所描述的编码器需要先前已编码帧的数目来对当前帧进行编码。
对于不同应用而言,将解码器侧的归档格式转换成流传输模式或者从归档格式中截除部分序列是有用的。例如,截除使得能够首先产生短预览,并且流传输格式允许开始解码,而无需具有接收到的完整文件。
然而,对于采样精确截除以及流传输模式和归档模式中操作,要解决的问题是在先前帧丢失的情况下对解码器状态进行初始化。以下描述说明了所需比特流信息和解码器处理。
归档模式
如图1所示的归档模式比特流包括在文件开始处的一个文件报头,之后是被划分成帧的信号数据,其中,每个帧表示对L个已编码信号采样或系数的段加以表示的码。
归档模式比特流解码可以仅开始于第一帧,这是由于仅知道解码器状态(解码器状态在每个解码标准中限定)。例如,针对第一帧将以下提到的mp3中的Main_Data_Begin_Pointer设置为零。通过连续对后续帧进行解码,解码器状态获得初始化,并且获得对采样的正确解码。所描述的格式的主要特点在于,并不需要所有而仅需要k(其中,0≤k≤K)个先前已解码帧,来获得正确结果,其中K是所需已解码帧的最大数目,并且K是编码器和解码器中已知的常值。然而,根据先前帧而不至少其他帧对所需信息的解码必须实际可行。
hd3编解码器通过独立可解码mp3帧提供这样的特征。然而,如欧洲申请08102308.7中所述,比特精确复制的重构(即,无损重构)由于映射处理,需要来自三个先前已解码mp3帧的状态信息。
此外,MPEG1音频层III标准ISO/IEC 11172-3包括上述比特存储技术,允许在先前帧中存储主要数据。使用主要数据开始指针来指向位于先前帧中的主数据的开始。因此,对单个mp3帧的解码也需要来自先前帧的信息。
这些问题由于以下事实使所述比特流格式的截除或流传输变得复杂:在流传输模式文件或截除文件的开始处丢失了来自先前帧的所需信息。图4示出了影响解码侧截除或归档格式(或传输、或记录、或原始的)的编码侧流传输的相关问题。当在比特流的报头处开始解码而不包括来自framen-5的数据时,不能解码framen-4,这是由于framen-4的Main_Data_Begin_Pointer指向非可用framen-5数据。同样,不能对帧n-3至n-1进行正确地解码,这是由于因丢失来自先前帧的数据它们的解码器状态没有被正确初始化。然而,根据来自三个先前帧的数据的可用性(例如,频谱值),尽管没有对帧n-3至n-1进行解码,但是可以通过执行在EP08102308.7中描述的映射过程,可以在解码器状态初始化步骤/阶段DSI中重构后续帧的正确解码器状态。具有正确初始化的解码器状态的第一帧是framen。
为了克服这些问题,根据本发明将一些额外信息项添加至在下表中示出的比特流报头。基于这些附加信息项,解码器可以判定处理是否以已知缺省解码器状态或未知解码器状态开始:
表1:本发明的比特流格式的报头的部分
比特流报头的‘MuteIfFirstSuperFrame’字段指示对后续帧的解码是否需要解码器状态的附加初始化。如果为真(即,设置标志),则将其他信息项插入到比特流报头中,在以下实例中讨论用于截除和流传输的比特流报头。
针对归档模式的比特流报头仅使用‘OFL’、‘FileMode’和‘MuteIfFirstSuperFrame’,其中,将值‘FileMode’和‘MuteIfFirstSuperFrame’设置为零(或者,清除相应标志),以指示非截除归档文件。
归档模式比特流的截除
在解码侧使用截除,以在归档模式中从接收到或重放的完整连贯比特流中分离短子部分。截除文件的比特流模式等于归档模式格式的比特流模式。图2示出了根据图1所示的归档模式文件格式中产生的截除文件。例如,可以使用截除来获得完整文件的短预览。代替对期望部分进行解码和重新编码,刚好从输入文件中截除所需帧,并且将新报头插入到这些截除数据帧的前面。
截除的问题在于,为了对截除数据帧的第一帧进行解码,在预览或截掉部分相应地并不在完整比特流的开始处开始,来自所需先前帧的数据丢失。因此,截除文件对比特流报头的‘MuteIfFirstSuperFrame’数据字段进行评估,以指示第一帧的处理仅初始化解码器状态,并且指示要消音的这些帧的已解码采样。在比特流报头中用‘muteFrames’字段指示要消音的帧的数目,并且在报头中指示要消音的采样的数目‘muteSamples’,以实现采样精确截除而不是纯帧精确截除。
以下示例更详细说明如何根据归档文件创建截除文件:
为了识别截除归档模式文件,将‘FileMode’设置为‘0’,并且将‘MuteIfFirstSuperFrame’设置为‘1’。这些属性指示使用第一‘muteFrames’帧参数对解码器状态进行初始化以及这些帧的已解码采样是无效的解码器。
需要找出多个帧相关值,以执行归档比特流模式文件的截除。然而,第一步骤是找到其中存储了截除文件的第一采样的帧‘Framevalid’。为了计算该第一帧,可以在核心编解码器中引入相应延迟,为了容易理解,在该示例中不考虑相应延迟。接着,获得恢复解码器状态所需的先前帧的数目。因此截除文件必须以保持‘Framevalid’的解码器状态恢复中所涉及的第一帧的数据的帧。将所获得先前帧的数目写入到比特流报头的‘muteFrame’字段中,使得解码器知道这些帧仅用于解码器状态的初始化而不用于对采样进行解码。
为了实现采样精确截除,在报头中也可以指示附加的‘每通道要消音的采样’的数目(‘muteSamples’)。这些采样由解码器来正确解码,但是不呈现给用户。因此,已解码呈现信号可以以位于帧中任何位置的采样开始,而不是在帧开始处开始。
在每种情况下,‘OFL’是可以利用已知解码器状态解码的每通道采样的数目。这在以下流传输比特流模式部分中更详细进行说明。因此,将初始化帧的采样与截除文件的实际采样的数目相加。解码器在解码器处理中自动从‘OFL’值中减去这些附加采样。在解码处理部分中描述其他细节。
流传输模式
使用来自表1所示的比特流报头的信息项,可以在解码侧将归档比特流模式转换成流传输比特流模式。‘流传输模式’意味着:将归档比特流的帧分成连续分组,从而这些分组中的每一个被称作‘超帧’(SF),并具有与归档比特流相同的结构。超帧以相应比特流部分报头(即,超帧报头)开始,之后是数据帧。即,与归档模式相比较,在流传输模式中,在比特流中重复布置分别具有报头的超帧。在图3中示出了流传输模式比特流的示例。
每个超帧的比特流报头的‘FileMode’数据字段携带对流传输模式加以指示的值‘1’,其中,解码器必须对多个连续超帧进行解码,以便重构已编码文件的所有采样。流传输模式流的第一超帧基本上与归档模式文件的开始相同,但是在比特流报头中,数据字段‘FileMode’和‘OFL’携带与归档模式报头中的值不同的值。当解码器开始对第一超帧的解码时,使用缺省解码器状态,并且直接对第一帧进行解码,而无需任何其他信息项。
然而,可以从流传输模式比特流的每一个超帧开始,对流传输模式比特流进行重放或解码。但是在那种情况下,来自于先前帧用于初始化解码器状态的所需数据丢失。因此,流中除了第一超帧以外的所有超帧必须在‘MuteIfFirstSuperFrame’数据字段中指示其帧第一数目‘muteFrames’仅用于解码器状态恢复。
在流传输模式中,必须区分解码状态未知的解码初始阶段与解码阶段,在解码阶段中,根据先前已解码超帧获知解码状态。使用超帧的报头信息,在每个超帧的开始处获得阶段的相应类型。在下文中示出了针对两个阶段的报头属性。
解码初始化阶段
FileMode=1
MuteIfFirstSuperFrame=0
以及流传输模式中,解码在新的连贯比特流的开始处开始。
使用缺省解码器状态,并且采样的解码可以直接开始于超帧的第一帧。
FileMode=1
MuteIfFirstSuperFrame=1
以及这是解码器初始化或重置之后,对第一超帧进行解码。
当前超帧的第一‘muteFrame’帧用于初始化解码器状态,并且对采样的解码可以开始于帧编号(‘muteFrames’+1)。
FileMode=1
MuteIfFirstSuperFrame=1
以及这不是第一已解码超帧,并且先前和当前超帧的一致性检查失败。
对于一致性检查,使用报头的‘StreamingCheckSum’数据字段。该数据字段的值根据先前超帧的数据来获得,并且将其写入到后续超帧的‘StreamingCheckSum’数据字段中,使得可以识别连续超帧。例如,可以使用先前超帧的帧(例如,最后帧)循环冗余校验和(CRC)或散列值。解码器计算先前超帧的CRC,并将其与存储在当前超帧的报头中的值进行比较。如果该比较失败,则当前解码器状态对于下个超帧的解码无效。因此,使用下个超帧的的帧的第一帧数目‘muteFrames’,来重新初始化解码器状态。对采样的解码开始于帧数(‘muteFrames’+1)。
在连贯流传输模式比特流的第一超帧中不使用‘StreamingCheckSum’数据字段,这是由于不需要先前帧,并因此一致性检查不必要。
解码阶段
FileMode=1
MuteIfFirstSuperFrame=1
以及之前已对超帧进行解码,并且一致性检查有效。
因此,先前已解码超帧的解码器状态可以用于对下个超帧的帧进行解码。
典型流传输处理从多个解码阶段之前的初始化阶段开始。在解码阶段中,不使用‘muteFrames’信息,这是由于可以通过来自先前超帧的相应数据对解码器状态进行正确初始化,并且‘Main_Data_Begin_Pointer’所指的数据在先前超帧中可用。如果新的连贯比特流开始(MuteIfFirstSuperFrame=0),或者‘StreamingCheckSum’不正确,解码器仅返回至初始化阶段。在这两种情况下,解码器状态变得无效并应当被重新初始化。
以下示例示出了如何根据现有的归档模式比特流创建流传输模式比特流:
针对文件或比特流的解码处理
图5的解码处理流程图描述了用于归档模式文件和流传输模式比特流的解码处理。在解码处理的开始处,将解码器状态设置为它们的缺省值(例如,将映射缓冲器设置为零,以及将先前已解码值设置为零)。在步骤/阶段1中,输入文件或比特流可用于读取所需数据。步骤/阶段2找到且读取文件或比特流的第一报头,即,设置、存储或加载表1的报头信息项。步骤/阶段3将变量‘SamplesToMute’设置为其缺省值零。
在步骤/阶段4中,检查文件或比特流的‘MuteIfFirstSuperFrame’数据字段,以判定已知解码器状态(MuteIfFirstSuperFrame=0),还是必须初始化解码器状态,以及可以省略采样数目。在步骤/阶段5中计算省略(消音)的采样的数目作为根据要消音的帧数目‘muteFrames’和从文件或比特流报头接收到的要消音的采样的数目‘muteSamples’的SamplesToMute=muteFrames*L+muteSamples。‘L’是根据一个帧解码的采样数目,是已知的解码器常数。步骤/阶段6对也包括第一‘muteFrames’帧的所有接收到的帧进行解码。因此将‘OFL’已解码采样传递至下个步骤/阶段。尽管第一‘SamplesToMute’采样是无效的,但是它们可以用于初始化解码器状态。
因此,后续步骤/阶段7移除无效的‘SamplesToMute’采样,并且仅将剩余的采样返回至步骤/阶段8。剩余采样的数目是值‘SamplesToMute’和已解码采样的总数OFL之间的差。在‘SamplesToMute’大于OFL的情况下,将零采样返回至步骤/阶段8。如果每超帧的帧数目小于要消音的帧的数目,则在流传输模式中会发生上述情况。
因此,将剩余延迟传送至下个超帧。在步骤/阶段9中计算相应变量MuteNextSF=SamplesToMute-OFL,以便将要消音的采样的数目存储在下个超帧中。
在步骤/阶段10中,完成11针对归档模式文件或比特流或截除文件比特流的解码处理,这是由于已经解码了文件的所有OFL采样。因此步骤/阶段10检查‘FileMode’并前进至结束步骤11,以停止归档模式解码处理。否则继续对流传输模式比特流的解码。
因此,在步骤/阶段12中,根据当前已解码帧计算‘StreamingCheckSum’,例如,CRC。用于‘StreamingCheckSum’计算的处理和数据必须在编码器和解码器中产生相同结果。此外,‘StreamingCheckSum’应当表示当前帧的清楚识别,因为其用于验证下个超帧的解码器状态的一致性。因此,所使用的数据应当逐超帧而不同,并且表示超帧的已编码数据。
在切换至下个超帧时,步骤/阶段13搜索和读取下个超帧的报头。该步骤/阶段重新初始化所有比特流报头变量,使得不丢失先前报头信息。在到达文件结尾时,或者在还没有找到有效比特流报头的情况下,解码器前进至步骤11并停止解码。
否则,检查当前解码器状态是否有效,以对下个超帧进行解码。流传输模式比特流文件可以由两个或多个连续连贯比特流组成。因此,检查后续超帧是否是新的连贯比特流的第一超帧,这是由于在这种情况下,当前解码器状态属于不同比特流且将其重置为缺省值。连贯比特流的第一超帧的‘MuteIfFirstSuperFrame’值为零。因此,在步骤/阶段14中对‘MuteIfFirstSuperFrame’值取反,并将其分配至变量‘FirstSuperFrame’,即,FirstSuperFrame=NOT(MuteIfFirstSuperFrame)。
步骤/阶段15检查变量‘FirstSuperFrame’,新连贯比特流是否开始。如果为真,则步骤/阶段17重置解码器状态,并且在步骤/阶段3处开始对下个超帧的解码。这与对新文件的开始解码相同,并且也与本说明书中流传输模式部分的解码器初始阶段1相同。否则,下个超帧属于相同连贯比特流,并在步骤/阶段16中继续处理。
这里,将当前超帧比特流报头的‘StreamingCheckSum’值与步骤/阶段12中根据先前超帧数据计算的‘StreamingCheckSum’值,即,CRC==StreamingCRC?这是必要地,因为当前连贯比特流的超帧可能丢失,或者新连贯比流开始,但是不在其第一超帧处。在步骤/阶段16的一致性检查失败的情况下,步骤/阶段17用于重置解码器状态,然后在步骤/阶段3处开始对下个超帧的解码。因此,处理处于本说明书中流传输模式部分的解码器初始化阶段3中,并且解码开始于缺省解码器状态,导致步骤/阶段4中的解码器初始化阶段2。
否则,当前解码器状态对于当前超帧的解码是有效的,并且在本说明书中当前处理处于流传输模式部分的解码阶段1中。因此,不需要评估当前比特流报头的‘muteFrames’值,这可以通过步骤/阶段18来确保,步骤/阶段18将‘MuteIfFirstSuperFrame’变量设置为零。因此,步骤/阶段4不会前进至步骤/阶段8,并且不使用当前超帧的‘muteFrames’值。
进行步骤/阶段19的判定,以将先前超帧的剩余延迟传送至当前超帧。如果‘muteNextSF’>0,则先前超帧的要消音的采样的数目大于先前超帧的‘OFL’值。因此,当前超帧的要消音的采样的数目‘SamplesToMute’等于先前超帧的要消音的剩余采样的数目‘MuteNextSF’。因此步骤/阶段20设置SamplesToMute=MuteNextSF。相应地,对当前超帧的解码必须在步骤/阶段4处开始,以便省略步骤/阶段3中队‘SamplesToMute’的初始化。
如果在步骤/阶段19中,参数MuteNextSF≤0,不存在要消音的剩余采样,并且解码状态正确,以及对当前超帧的解码可以直接开始于第一帧。在步骤/阶段3中将要消音的采样的数目设置为零。
在流传输模式中,重复对连续超帧的解码,直到步骤/阶段13不再找到比特流报头,并且在步骤11中停止解码处理。
因此,本发明有利于归档模式比特流或传输模式比特流中给予帧的比特流格式的处理,并且实现了归档模式比特流的采样精确截除,即使对一个帧的解码需要来自先前帧的信息。如上所述,在hd3解码器实现中使用本发明的解码处理,并且对这种解码处理进行了成功测试。
以其最简单格式的HD3文件具有图6所示的3个强制(mandatory)数据部分,并且多达4个可选数据部分。强制hd3ID数据部分提供文件模式、长度和CRC信息。在mp3帧的辅助数据部分(静音(silence)PCM)中封装了该hd3ID部分。mp3帧的这种辅助数据部分在hd3ID信息之前还可以包含Xing或VBRi兼容变量比特率报头。
强制mp3数据部分封装mp3数据流或mp3数据流的一部分。可以对mp3流的同步字进行加扰。
强制cd数据部分提供mp3数据的无损扩展,以利用具有与32kHz、44.1kHz或48kHz相对应的时间分辨率和16比特/采样的幅度分辨率的一个或两个音频通道,重构原始音乐的数学无损拷贝。可以使用异步方案,以避免mp3同步报头的出现。
可选hd数据部分(未示出)利用高达24比特/采样和192kHz的采样速率,实现了高清立体声格式的无损重构。
可选ID3/ID3v2数据部分存储与已编码嵌入mp3和无损重构已编码音乐有关的元数据。在HD3文件(未示出)的结束处还可以存在可选ID3v1标签。
本发明还可以用于其它编解码器或例如AAC的比特流,以及用在mp3中,在mp3中,在相应mp3解码器可以评估的mp3辅助数据字段中布置了附加数据(例如,报头)。
Claims (13)
1.一种用于产生包括至少一个比特流报头部分(Header)在内的基于帧的比特流格式文件的方法,所述帧包括已编码信号数据,其中,对当前帧(Frame0、Framen)的数据进行解码或评估所需的数据被包含在一个或多个先前帧(Framen-5、Framen-4)中,其特征在于,在所述报头中布置信息项,所述信息项表示:
-针对所述文件的每通道采样的总数(OFL);
-针对所述文件的‘归档模式’或‘流传输模式’(FileMode)
-对所述已编码信号数据的解码是否要开始于所述文件的第一帧(MuteIfFirstSuperFrame);
-如果对所述已编码信号数据的解码不开始于所述文件的所述第一帧,初始化解码状态时要消音的初始帧的数目(muteFrames),以及可选地,对于采样精确截除特征,初始化相应帧中要消音的采样的数目(muteSample);
-在所述流传输模式中,用于识别先前超帧以进行一致性检查的值(StreamingCheckSum),
其中,在所述归档模式中,所述文件包括单个比特流报头部分(Header)、以及所述帧中连续的帧(Frame0、Frame1、…、Framen),并且对所述已编码信号数据的解码以所述帧中的第一帧(Frame0)开始,
以及,在所述流传输模式中,所述比特流包含多于一个超帧,所述超帧中的每一个以单个比特流报头部分(Header)开始,之后是所述帧中的多个帧,在所述超帧中的每一个帧处能够初始化对所述已编码信号数据的解码,
以及,与要消音的初始帧的数目(muteFrames)有关的所述信息项发信号通知需要当前超帧中的多少个初始帧,来在实际上从所述当前超帧的后续一个帧或多个帧开始对已编码信号数据的解码之前,建立用于初始化对所述信号数据的解码的状态的数据,这样的初始帧不用于对所述后续一个帧或多个帧中包含的已编码信号数据进行解码。
2.一种用于包括至少一个比特流报头部分(Header)在内的基于帧的比特流格式文件的数据结构,所述帧包括已编码信号数据,其中,对当前帧(Frame0、Framen)的数据进行解码或评估所需的数据包含在一个或多个先前帧(Framen-5、Framen-4)中,其特征在于,在所述报头中布置信息项,所述信息项表示:
-针对所述文件的每通道采样的总数(OFL);
-针对所述文件的‘归档模式’或‘流传输模式’(FileMode);
-对所述已编码信号数据的解码是否要开始于所述文件的第一帧(MuteIfFirstSuperFrame);
-如果对所述已编码信号数据的解码不开始于所述文件的所述第一帧,初始化解码状态时要消音的初始帧的数目(muteFrames),以及可选地,对于采样精确截除特征,初始化相应帧中要消音的采样的数目(muteSample);
-在所述流传输模式中,用于识别先前超帧以进行一致性检查的值(StreamingCheckSum),
其中,在所述归档模式中,所述文件包括单个比特流报头部分(Header)、以及所述帧中连续的帧(Frame0、Frame1、…、Framen),并且对所述已编码信号数据的解码以所述帧中的第一帧(Frame0)开始,
以及,在所述流传输模式中,所述比特流包含多于一个超帧,所述超帧中的每一个以单个比特流报头部分(Header)开始,之后是所述帧中的多个帧,并且在所述超帧中的每一个帧处能够初始化对所述已编码信号数据的解码,
以及,与要消音的初始帧的数目(muteFrames)有关的所述信息项发信号通知需要在当前超帧中的多少个初始帧,来在实际上从所述当前超帧的后续一个帧或多个帧开始对已编码信号数据的解码之前,建立用于初始化对所述信号数据的解码的状态的数据,这样的初始帧不用于对所述后续一个帧或多个帧中包含的已编码信号数据进行解码。
3.一种从包括比特流报头部分(Header)在内的基于帧的比特流格式文件中截除一部分的方法,所述帧包括已编码信号数据,其中对当前帧(Frame0、Framen)的数据进行解码或评估所需的数据可以包含在一个或多个先前帧(Framen-5、Framen-4)中,并且所述报头包括信息项,所述信息项表示:
-针对所述文件的每通道采样的总数(OFL);
-针对所述文件的‘归档模式’(FileMode);
-对所述已编码信号数据的解码要开始于所述文件的第一帧(MuteIfFirstSuperFrame);
其中,在所述归档模式中,所述文件包括单个比特流报头部分(Header)、以及所述帧中连续的帧(Frame0、Frame1、…、Framen),
所述方法包括通过以下操作来形成截除文件的步骤:从所述比特流中获取所需帧数据;以及在这些帧数据的前面布置截除报头,
其中,从所述报头中导出所述截除报头,并且在所述截除报头中:
-用针对所述截除文件的每通道采样的数目(OFLCUT)来代替针对所述文件的每通道采样的所述总数(OFL);
-保持所述归档模式(FileMode);
-将与对所述已编码信号数据的解码要开始于所述文件的第一帧有关的信息项(MuteIfFirstSuperFrame)改变为要在所述文件中稍后开始;
-添加与初始化解码状态时要消音的初始帧的数目(muteFrames)有关的信息项。
4.一种从包括比特流报头部分(Header)在内的基于帧的比特流格式文件中截除一部分的设备,所述帧包括已编码信号数据,其中对当前帧(Frame0、Framen)的数据进行解码或评估所需的数据包含在一个或多个先前帧(Framen-5、Framen-4)中,并且所述报头包括信息项,所述信息项表示:
-针对所述文件的每通道采样的总数(OFL);
-针对所述文件的‘归档模式’(FileMode);
-对所述已编码信号数据的解码要开始于所述文件的第一帧(MuteIfFirstSuperFrame);
其中,在所述归档模式中,所述文件包括单个比特流报头部分(Header)、以及所述帧中连续的帧(Frame0、Frame1、…、Framen),
所述设备包括适于通过以下操作来形成截除文件的装置:从所述比特流中获取所需帧数据;以及在这些帧数据的前面布置截除报头,
其中,从所述报头中导出所述截除报头,并且在所述截除报头中:
-用针对所述截除文件的每通道采样的数目(OFLCUT)来代替针对所述文件的每通道采样的所述总数(OFL);
-保持所述归档模式(FileMode);
-将与对所述已编码信号数据的解码要开始于所述文件的第一帧有关的信息项(MuteIfFirstSuperFrame)改变为要在所述文件中稍后开始;
-添加与初始化解码状态时要消音的初始帧的数目(muteFrames)有关的信息项。
5.根据权利要求3所述的方法或权利要求4所述的设备,其中,所述截除报头附加地包括:与开始对所述已编码信号数据进行解码的帧中要消音的采样的数目有关的信息项(muteSamples)。
6.根据权利要求3或5所述的方法或权利要求4或5所述的设备,其中,所述截除报头中的所述信息项计算如下:
-Framevalid=floor(Xstart/L),其中,Xstart是要被解码用于截除文件的归档文件的第一已编码信号采样或系数的编号,L是每帧采样或系数的数目;
-获得映射状态初始化所需的帧的数目kmapping,以及具有已知解码器状态的第一可解码帧Framevalid的Main_Data_Begin_Pointer;
-将无效帧的数目kmp3设置为等于要添加的帧的数目,以便获得有效的Main_Data_Begin_Pointer;
-与要消音的帧的数目有关的所述信息项是muteFrames=kmp3+kmapping;
-针对所述截除文件的所述每通道采样数目是OFLcut=Xend-Xstart+1+L*muteFrames,其中,Xend是要被解码用于截除文件的归档文件的最后已编码信号采样或系数的编号。
7.一种用于改变基于帧的比特流文件格式的方法,所述比特流包括报头部分(Header),所述帧包括已编码信号数据,其中,对当前帧(Frame0、Framen)的数据进行解码或评估所需的数据包含在一个或多个先前帧(Framen-5、Framen-4)中,并且所述报头包括信息项,所述信息项表示:
-针对所述文件的每通道采样的总数(OFL);
-针对所述文件的‘归档模式’;
-对所述已编码信号数据的解码要开始于所述文件的第一帧(MuteIfFirstSuperFrame);
其中,在所述归档模式中,所述文件包括单个比特流报头部分(Header)、以及所述帧中连续的帧(Frame0、Frame1、…、Framen),
所述方法包括通过以下操作从所述归档模式文件中产生‘流传输模式’比特流的步骤:通过从所述归档模式文件中获取所需帧数据、以及在每个超帧的开始处布置超帧报头,来从所述归档模式文件的每个连续帧组中形成所述流传输模式比特流的超帧,其中,从所述报头中导出这些超帧报头,并且在所述超帧报头的第一超帧报头中:
-用每通道采样的第一适合数目来代替针对所述文件的所述每通道采样的总数(OFL);
-给出针对‘流传输模式’而不是‘归档模式’的信息项;
-保持与对所述已编码信号数据的解码要开始于所述文件的第一帧有关的所述信息项(MuteIfFirstSuperFrame),
以及,在所述超帧报头的后续超帧报头中:
-用每通道采样的第二适合数目来代替针对所述文件的所述每通道采样的总数(OFL);
-用针对‘流传输模式’的信息项来代替针对‘归档模式’(FileMode)的所述信息项;
-用与对所述已编码信号数据的解码不开始于所述第一帧有关的信息项,来代替与对所述已编码信号数据的解码要开始于所述文件的第一帧有关的所述信息项(MuteIfFirstSuperFrame);
-添加与初始化解码状态时要消音的初始帧的数目(muteFrames)有关的信息项;
-可选地,添加与开始对所述已编码信号数据进行解码的帧中要消音的采样的数目有关的信息项(muteSamples),其中该数目为‘0’;
-添加与一致性检查数据有关的信息项(StreamingCheckSum),其中,从先前超帧的数据中导出所述一致性检查数据的值。
8.一种用于改变基于帧的比特流文件格式的设备,所述比特流包括报头部分(Header),所述帧包括已编码信号数据,其中,对当前帧(Frame0、Framen)的数据进行解码或评估所需的数据包含在一个或多个先前帧(Framen-5、Framen-4)中,并且所述报头包括信息项,所述信息项表示:
-针对所述文件的每通道采样的总数(OFL);
-针对所述文件的‘归档模式’;
-对所述已编码信号数据的解码要开始于所述文件的第一帧(MuteIfFirstSuperFrame)
其中,在所述归档模式中,所述文件包括单个比特流报头部分(Header)、以及所述帧中连续的帧(Frame0、Frame1、…、Framen),
所述设备包括通过以下操作从所述归档模式文件中产生‘流传输模式’比特流的装置:通过从所述归档模式文件中获取所需帧数据、以及在每个超帧的开始处布置超帧报头,来从所述归档模式文件的每个连续帧组中形成所述流传输模式比特流的超帧,其中,从所述报头中导出这些超帧报头,并且在所述超帧报头的第一超帧报头中:
-用每通道采样的第一适合数目来代替针对所述文件的所述每通道采样的总数(OFL);
-给出针对‘流传输模式’而不是‘归档模式’的信息项;
-保持与对所述已编码信号数据的解码要开始于所述文件的第一帧有关的所述信息项(MuteIfFirstSuperFrame),
以及,在所述超帧报头的后续超帧报头中:
-用每通道采样的第二适合数目来代替针对所述文件的所述每通道采样的总数(OFL);
-用针对‘流传输模式’的信息项来代替针对‘归档模式’(FileMode)的所述信息项;
-用与对所述已编码信号数据的解码不开始于所述第一帧有关的信息项,来代替与对所述已编码信号数据的解码要开始于所述文件的第一帧有关的所述信息项(MuteIfFirstSuperFrame);
-添加与初始化解码状态时要消音的初始帧的数目(muteFrames)有关的信息项;
-可选地,添加与开始对所述已编码信号数据的解码的帧中要消音的采样的数目有关的信息项(muteSamples),其中该数目为‘0’;
-添加与一致性检查数据有关的信息项(StreamingCheckSum),其中,从先前超帧的数据中导出所述一致性检查数据的值。
9.根据权利要求7所述的方法或权利要求8所述的设备,其中,每通道采样的所述第一适合数目是OFL=Mmean*L,其中,L是每通道已解码采样的数目,OFLorig是每通道采样中所述文件的总长度,M是超帧的数目,其中M≤ceil(OFLorig/L),Mmean=ceil(OFLorig/(M*L))。
10.根据权利要求9所述的方法或设备,其中,‘m’是当前超帧的编号,每通道采样的所述第二适合数目是OFL=min((Mmean*L),(OFLorig-m*L*Mmean))。
11.根据权利要求10所述的方法或设备,其中,与一致性检查数据有关的所述信息项(StreamingCheckSum)是先前超帧的预定部分的循环冗余校验和。
12.根据权利要求10所述的方法或设备,其中,与一致性检查数据有关的所述信息项(StreamingCheckSum)是先前超帧的帧的散列值,例如,所述帧是先前超帧的最后帧。
13.根据权利要求7、9和10的方法在所述流传输模式比特流的解码中的应用,还包括以下步骤:
-当在所述第一超帧处开始对所述流传输模式比特流的解码时,使用缺省解码器状态,在所述超帧的第一帧处开始对已编码信号数据的解码;
-当不是在所述第一超帧处开始对所述流传输模式比特流的解码时,在解码初始化或重置之后,使用与要消音的初始帧的数目有关的所述信息项对应的帧数目‘muteFrames’来初始化解码状态,并且使用这些解码状态,在当前超帧的帧编号muteFrames+1处开始对已编码信号数据的解码;
-当不是在所述第一超帧处开始对所述流传输模式比特流的解码,并且根据先前超帧数据计算的一致性检查数据与根据当前超帧计算的相应一致性检查数据不相一致时,使用后续超帧的帧数目‘muteFrames’来重新初始化解码状态,使用这些解码状态在后续超帧的帧编号‘muteFrames+1’处开始对已编码信号数据的解码;
-当不是在所述第一超帧处开始对所述流传输模式比特流的解码,并且先前已有超帧被解码以及所述一致性检查数据有效时,使用先前已解码超帧的解码器状态,来对当前超帧中的帧的已编码信号数据进行解码。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP08157417.0 | 2008-06-02 | ||
EP08157417A EP2131590A1 (en) | 2008-06-02 | 2008-06-02 | Method and apparatus for generating or cutting or changing a frame based bit stream format file including at least one header section, and a corresponding data structure |
PCT/EP2009/055663 WO2009146998A1 (en) | 2008-06-02 | 2009-05-11 | Method and apparatus for generating or cutting or changing a frame based bit stream format file including at least one header section, and a corresponding data structure |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102047336A true CN102047336A (zh) | 2011-05-04 |
CN102047336B CN102047336B (zh) | 2014-05-07 |
Family
ID=40193935
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200980120515.2A Expired - Fee Related CN102047336B (zh) | 2008-06-02 | 2009-05-11 | 用于产生或截除或改变包括至少一个报头部分在内的基于帧的比特流格式文件的方法和设备以及相应数据结构 |
Country Status (10)
Country | Link |
---|---|
US (1) | US8731946B2 (zh) |
EP (2) | EP2131590A1 (zh) |
JP (1) | JP5774983B2 (zh) |
KR (1) | KR20110026445A (zh) |
CN (1) | CN102047336B (zh) |
AT (1) | ATE545281T1 (zh) |
ES (1) | ES2379321T3 (zh) |
PL (1) | PL2289245T3 (zh) |
TW (1) | TWI469134B (zh) |
WO (1) | WO2009146998A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109584891A (zh) * | 2019-01-29 | 2019-04-05 | 乐鑫信息科技(上海)股份有限公司 | 嵌入式环境下的音频解码方法、装置、设备及介质 |
CN111385615A (zh) * | 2015-01-20 | 2020-07-07 | 夏普株式会社 | 服务指南封装 |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1881485A1 (en) * | 2006-07-18 | 2008-01-23 | Deutsche Thomson-Brandt Gmbh | Audio bitstream data structure arrangement of a lossy encoded signal together with lossless encoded extension data for said signal |
EP2395505A1 (en) | 2010-06-11 | 2011-12-14 | Thomson Licensing | Method and apparatus for searching in a layered hierarchical bit stream followed by replay, said bit stream including a base layer and at least one enhancement layer |
JP5749462B2 (ja) * | 2010-08-13 | 2015-07-15 | 株式会社Nttドコモ | オーディオ復号装置、オーディオ復号方法、オーディオ復号プログラム、オーディオ符号化装置、オーディオ符号化方法、及び、オーディオ符号化プログラム |
KR20120074059A (ko) * | 2010-12-27 | 2012-07-05 | 삼성전자주식회사 | 오디오 데이터 출력 방법 및 장치 |
CN102522088B (zh) * | 2011-11-25 | 2013-10-23 | 展讯通信(上海)有限公司 | 音频的解码方法及装置 |
EP2863386A1 (en) * | 2013-10-18 | 2015-04-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder, apparatus for generating encoded audio output data and methods permitting initializing a decoder |
JP6876928B2 (ja) * | 2016-03-31 | 2021-05-26 | ソニーグループ株式会社 | 情報処理装置および方法 |
US10135899B1 (en) * | 2016-12-16 | 2018-11-20 | Amazon Technologies, Inc. | Dynamic archiving of streaming content |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5677918A (en) * | 1995-07-28 | 1997-10-14 | Motorola, Inc. | Method and device for efficient error correction in a packet-switched communication system |
GB0007870D0 (en) * | 2000-03-31 | 2000-05-17 | Koninkl Philips Electronics Nv | Methods and apparatus for making and replauing digital video recordings, and recordings made by such methods |
EP1215663A1 (en) * | 2000-12-15 | 2002-06-19 | BRITISH TELECOMMUNICATIONS public limited company | Encoding audio signals |
JP3932546B2 (ja) * | 2001-01-24 | 2007-06-20 | 日本電気株式会社 | Mpegビデオ編集装置及びmpegビデオ編集方法 |
US6707984B2 (en) * | 2001-10-31 | 2004-03-16 | Thomson Licensing S.A. | Changing a playback speed for video presentation recorded in a modified film format |
JP3871210B2 (ja) * | 2002-09-19 | 2007-01-24 | ソニー株式会社 | 変換装置および変換方法、プログラム、並びにデータ構造 |
WO2005013491A2 (de) * | 2003-07-21 | 2005-02-10 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audiodateiformatumwandlung |
US8233462B2 (en) * | 2003-10-15 | 2012-07-31 | Qualcomm Incorporated | High speed media access control and direct link protocol |
US8131134B2 (en) * | 2004-04-14 | 2012-03-06 | Microsoft Corporation | Digital media universal elementary stream |
KR100846781B1 (ko) * | 2004-06-01 | 2008-10-27 | 삼성전자주식회사 | 고속정보채널(fic)을 이용한 dab 수신장치의 서비스디스플레이 제어방법 및 그 장치 |
US7672743B2 (en) * | 2005-04-25 | 2010-03-02 | Microsoft Corporation | Digital audio processing |
JP2006317575A (ja) * | 2005-05-11 | 2006-11-24 | Matsushita Electric Ind Co Ltd | オーディオ復号装置 |
KR100754197B1 (ko) * | 2005-12-10 | 2007-09-03 | 삼성전자주식회사 | 디지털 오디오 방송(dab)에서의 비디오 서비스 제공및 수신방법 및 그 장치 |
JP4720543B2 (ja) * | 2006-03-01 | 2011-07-13 | ソニー株式会社 | データ処理装置、データ処理方法およびデータ処理プログラム、記録媒体、ならびに、再生装置、再生方法および再生プログラム |
EP1855436A1 (en) * | 2006-05-12 | 2007-11-14 | Deutsche Thomson-Brandt Gmbh | Method and apparatus for encrypting encoded audio signal |
US20070280438A1 (en) * | 2006-05-17 | 2007-12-06 | Recording For The Blind & Dyslexic, Incorporated | Method and apparatus for converting a daisy format file into a digital streaming media file |
JP2008135135A (ja) * | 2006-11-29 | 2008-06-12 | Matsushita Electric Ind Co Ltd | データ管理方法およびテーブル作成方法、データ管理装置、データ管理プログラムならびにこれを利用したデジタル音響機器 |
JP2008185769A (ja) * | 2007-01-30 | 2008-08-14 | Oki Electric Ind Co Ltd | 圧縮オーディオ再生装置 |
US7778839B2 (en) * | 2007-04-27 | 2010-08-17 | Sony Ericsson Mobile Communications Ab | Method and apparatus for processing encoded audio data |
-
2008
- 2008-06-02 EP EP08157417A patent/EP2131590A1/en not_active Withdrawn
-
2009
- 2009-05-11 AT AT09757381T patent/ATE545281T1/de active
- 2009-05-11 WO PCT/EP2009/055663 patent/WO2009146998A1/en active Application Filing
- 2009-05-11 CN CN200980120515.2A patent/CN102047336B/zh not_active Expired - Fee Related
- 2009-05-11 US US12/737,007 patent/US8731946B2/en not_active Expired - Fee Related
- 2009-05-11 EP EP09757381A patent/EP2289245B1/en not_active Not-in-force
- 2009-05-11 PL PL09757381T patent/PL2289245T3/pl unknown
- 2009-05-11 KR KR1020107029770A patent/KR20110026445A/ko not_active Application Discontinuation
- 2009-05-11 ES ES09757381T patent/ES2379321T3/es active Active
- 2009-05-11 JP JP2011510935A patent/JP5774983B2/ja not_active Expired - Fee Related
- 2009-06-02 TW TW98118097A patent/TWI469134B/zh not_active IP Right Cessation
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111385615A (zh) * | 2015-01-20 | 2020-07-07 | 夏普株式会社 | 服务指南封装 |
CN109584891A (zh) * | 2019-01-29 | 2019-04-05 | 乐鑫信息科技(上海)股份有限公司 | 嵌入式环境下的音频解码方法、装置、设备及介质 |
Also Published As
Publication number | Publication date |
---|---|
PL2289245T3 (pl) | 2012-05-31 |
EP2289245B1 (en) | 2012-02-08 |
JP2011523090A (ja) | 2011-08-04 |
KR20110026445A (ko) | 2011-03-15 |
CN102047336B (zh) | 2014-05-07 |
EP2131590A1 (en) | 2009-12-09 |
ES2379321T3 (es) | 2012-04-24 |
TWI469134B (zh) | 2015-01-11 |
US20110158326A1 (en) | 2011-06-30 |
US8731946B2 (en) | 2014-05-20 |
ATE545281T1 (de) | 2012-02-15 |
JP5774983B2 (ja) | 2015-09-09 |
TW200951941A (en) | 2009-12-16 |
EP2289245A1 (en) | 2011-03-02 |
WO2009146998A1 (en) | 2009-12-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102047336B (zh) | 用于产生或截除或改变包括至少一个报头部分在内的基于帧的比特流格式文件的方法和设备以及相应数据结构 | |
CN101189661B (zh) | 用于产生数据流和产生多通道表示的设备和方法 | |
KR100946057B1 (ko) | 데이터 프레임에 코딩된 부가 데이터의 존재 결정 | |
RU2236046C2 (ru) | Эффективное кодирование огибающей спектра с использованием переменного разрешения по времени и по частоте и переключения время/частота | |
KR100462615B1 (ko) | 적은 계산량으로 고주파수 성분을 복원하는 오디오 디코딩방법 및 장치 | |
KR100717600B1 (ko) | 오디오 파일 포맷 변환 | |
CA2578190A1 (en) | Device and method for generating a coded multi-channel signal and device and method for decoding a coded multi-channel signal | |
BR122018077099B1 (pt) | método para decodificação de sinal de áudio e decodificador de sinal de áudio | |
JP2005157390A (ja) | 付加情報の挿入されたmpeg−4bsacオーディオビットストリームの符号化方法および復号化方法ならびに符号化装置および復号化装置 | |
RU2740688C1 (ru) | Обратно совместимая интеграция методов высокочастотного восстановления для аудиосигналов | |
CN102047325A (zh) | 基于核心编码器性能进行选择性信号代码化的方法和装置 | |
KR20100086000A (ko) | 오디오 신호 처리 방법 및 장치 | |
CN101484937A (zh) | 使用缓冲器调节对已预测编码的数据进行解码 | |
US20080288263A1 (en) | Method and Apparatus for Encoding/Decoding | |
WO2006083550A2 (en) | Audio compression using repetitive structures | |
WO2005109403A1 (en) | Audio bitstream format in which the bitstream syntax is described by an ordered transveral of a tree hierarchy data structure | |
JP4359499B2 (ja) | オーディオ信号の編集 | |
EA038268B1 (ru) | Обратно совместимая компоновка гармонического транспозера для реконструкции высоких частот звуковых сигналов | |
CN110739001A (zh) | 支持变换长度切换的频域音频编码器、解码器、编码和解码方法 | |
KR20080010980A (ko) | 부호화/복호화 방법 및 장치. | |
RU2792114C2 (ru) | Интеграция методик реконструкции высоких частот звука | |
CN100386799C (zh) | 音频译码的语音帧计算方法 | |
JP2002368722A (ja) | 符号化装置及び復号化装置 | |
JP2006195066A (ja) | 符号化オーディオ信号の再生装置及び再生方法 | |
JP2001195098A (ja) | 光記録媒体、音声伝送方法及び音声復号方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20140507 Termination date: 20160511 |