DE69732761T2 - Verfahren und Vorrichtung zur kalkulierbaren Audiocodierung bzw.-decodie- rung - Google Patents

Verfahren und Vorrichtung zur kalkulierbaren Audiocodierung bzw.-decodie- rung Download PDF

Info

Publication number
DE69732761T2
DE69732761T2 DE1997632761 DE69732761T DE69732761T2 DE 69732761 T2 DE69732761 T2 DE 69732761T2 DE 1997632761 DE1997632761 DE 1997632761 DE 69732761 T DE69732761 T DE 69732761T DE 69732761 T2 DE69732761 T2 DE 69732761T2
Authority
DE
Germany
Prior art keywords
bit
bits
decoding
data
coding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE1997632761
Other languages
English (en)
Other versions
DE69732761D1 (de
Inventor
Yeon-bae Suwon-city Kim
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of DE69732761D1 publication Critical patent/DE69732761D1/de
Application granted granted Critical
Publication of DE69732761T2 publication Critical patent/DE69732761T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M1/00Analogue/digital conversion; Digital/analogue conversion
    • H03M1/12Analogue/digital converters
    • H03M1/14Conversion in steps with each step involving the same or a different conversion means and delivering more than one bit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/035Scalar quantisation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/665Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using psychoacoustic properties of the ear, e.g. masking effect
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding

Description

  • HINTERGRUND DER ERFINDUNG
  • 1. Gebiet der Erfindung
  • Die vorliegende Erfindung betrifft die Audiocodierung und -decodierung und insbesondere ein Verfahren und eine Vorrichtung zur skalierbaren Audiocodierung bzw. -decodierung, wodurch Daten für Bitraten verschiedener Zusatzschichten auf der Grundlage einer Basisschicht dargestellt werden, statt eine Bitrate innerhalb eines Bitstroms zu bilden.
  • 2. Beschreibung des Stands der Technik
  • Ein Audiosystem speichert ein Signal auf einem Aufzeichnungs-/Speichermedium und gibt das gespeicherte Signal dann nach Bedarf eines Benutzers wieder.
  • Durch die jüngste Entwicklung der digitalen Signalverarbeitungstechnologie wurden die Auf zeichnungs-/Speichermedien von einem herkömmlichen analogen Typ in der Art einer Langspielplatte oder eines Magnetbands zu einem digitalen Typ in der Art einer CD oder eines digitalen Tonbands weiterentwickelt. Das digitale Speicher-/Wiederherstellungsverfahren löst die Verschlechterung der Audioqualität und verbessert diese verglichen mit dem herkömmlichen analogen Verfahren erheblich. Es besteht jedoch weiterhin das Problem des Speicherns oder Übertragens großer Mengen digitaler Daten.
  • Zum Verringern der Menge digitaler Daten wurde DPCM (differenzielle Impulscodemodulation – "Differential Pulse Code Modulation") oder ADPCM (adaptive differenzielle Impulscodemodulation – "Adaptive Differential Pulse Code Modulation") entwickelt, um digitale Audiosignale zu komprimieren. Bei einem solchen Verfahren tritt jedoch der Nachteil auf, dass in Abhängigkeit von den Signaltypen ein großer Effizienzunterschied erzeugt wird. Bei einer vor kurzem von der ISO (International Standard Organization) standardisierten MPEG-(Moving Picture Expert Group)-Audiotechnik, bei der von Phillips Corp. hergestellten DCC (digitale Kompaktkassette – "Digital Compact Cassette"), bei der von Sony Corp. hergestellten MD (Minischeibe – "Mini Disc") und dergleichen wird ein menschliches psychoakustisches Modell zum Verringern der Datenmenge verwendet. Diese herkömmlichen Verfahren haben die Datenmenge, unabhängig von den Signaleigenschaften, erheblich verringert.
  • In dem Dokument "First Ideas ob Scalable Audio Coding" von K. Brandenburg, insbesondere auf Seite 5 "A Simple Scalable Audio Coder" und in 3, sind weitere relevante Informationen in Bezug auf die skalierbare Audiocodierung offenbart.
  • Eine Audiocodiervorrichtung, die die menschliche Psychoakustik berücksichtigt, umfasst einen Zeit/Frequenz-Abbildungsabschnitt 100, einen psychoakustischen Abschnitt 110, einen Bitzuordnungsabschnitt 120, einen Quantisierungsabschnitt 130 zum Ausführen einer Quantisierung entsprechend zugeordneten Bits und einen Bitpaketierungsabschnitt 140, wie in 1 dargestellt ist. Hierbei berechnet der psychoakustische Abschnitt 110 ein Signal-Maskierungs-Verhältnis (SMR) unter Verwendung von Eigenschaften des menschlichen Gehörs, insbesondere eines Maskierungsphänomens, nämlich einer Maskierungsschwelle, d.h. des minimalen Signalbetrags, der durch die Wechselwirkung mit den entsprechenden Signalen nicht wahrnehmbar ist. Der Bitzuordnungsabschnitt 120 ordnet Bits innerhalb des Bereichs begrenzter Bits von dem Teil, der für die Hörbarkeit wichtige Signale enthält, unter Verwendung der Maskierungsschwelle zu, wodurch eine wirksame Datenkompression verwirklicht wird.
  • Bei der Codierung eines digitalen Audiosignals sind wichtige Eigenschaften des menschlichen Gehörs ein Maskierungseffekt und ein Merkmal eines kritischen Bands. Der Maskierungseffekt ist ein Phänomen, bei dem ein Signal (Ton) durch ein anderes Signal (Ton) unhörbar gemacht wird. 2 zeigt das Maskierungsphänomen. Wenn beispielsweise ein leises Gespräch an einem Bahnhof geführt wird und ein Zug durch den Bahnhof fährt, ist das Gespräch infolge des vom Zug erzeugten Geräusches nicht hörbar. Der Betrag des wahrnehmbaren Geräusches kann sich zwischen dem Fall, in dem der Geräuschbetrag im Bereich eines kritischen Bands liegt, und dem Fall, in dem er außerhalb des Bereichs liegt, unterscheiden. Hierbei ist das Geräusch in dem Fall, in dem der Geräuschbetrag den Bereich des kritischen Bands übersteigt, besser als in dem anderen Fall wahrnehmbar.
  • Zum Ausführen einer Codierung unter Verwendung der Eigenschaften des menschlichen Gehörs wird der Betrag der Geräusche, die einem kritischen Band zugeordnet werden können, für diese beiden Merkmale, nämlich den Maskierungseffekt und das kritische Band, berechnet. Beispiele von Anwendungen des digitalen Audiocodierverfahrens sind die digitale Audioübertragung ("Digital Audio Broadcasting") (DAB), das Internettelefon und Audio-auf-Anforderung ("Audio on Demand") (AOD).
  • Die meisten dieser Codierverfahren unterstützen eine feste Bitrate. Mit anderen Worten wird ein Bitstrom mit einer spezifischen Bitrate (beispielsweise 128 kbps, 96 kbps oder 64 kbps) konstruiert. Mit dieser Konstruktion ist kein Problem verbunden, wenn ein Übertragungskanal Audiodaten fest zugewiesen ist. Weil ein fest zugewiesener Kanal unveränderlich eine spezifische Bitrate unterstützt, wird ein mit einer spezifischen Bitrate für den fest zugewiesenen Kanal konstruierter Bitstrom fehlerfrei zu einem Empfangsende übertragen.
  • Falls jedoch ein Übertragungskanal für Audiodaten instabil ist, ist es schwierig, die Daten am Empfangsende mit einer festen Bitrate richtig zu interpretieren. Mit anderen Worten können, abhängig vom Zustand des Übertragungskanals, die Bitströme der gesamten Audiodaten oder nur einige der Bitströme am Empfangsende empfangen werden. Falls nur einige der Bitströme am Empfangsende empfangen werden, ist es schwierig, die ihnen entsprechenden Audiodaten wiederherzustellen, wodurch die Audioqualität erheblich beeinträchtigt wird.
  • Im Allgemeinen enthält beim digitalen Audiocodierverfahren ein Bitstrom in seinem Kopfteil nur die Informationen für eine Bitrate, und die Bitrate wird aufrechterhalten. Falls beispielsweise Kopfteilinformationen eines Bitstroms eine Bitrate von 128 kbps darstellen, wird der 128-kbps-Bitstrom kontinuierlich verwendet, was bei der Darstellung der besten Audioqualität bei der entsprechenden Bitrate vorteilhaft ist. Mit anderen Worten wird der optimale Bitstrom für Audiodaten, beispielsweise mit 64 kbps, 48 kbps oder 32 kbps, für eine spezifische Bitrate gebildet.
  • Ein solches Verfahren ist jedoch sehr empfindlich für den Zustand des Übertragungskanals. Demgemäß können die Daten nicht korrekt wiedergegeben werden, falls der Übertragungskanal sehr instabil ist. Falls ein Audiorahmen beispielsweise aus n Schlitzen besteht, können korrekte Daten rekonstruiert werden, falls die n Schlitze alle innerhalb einer gegebenen Zeit zum Empfangsende übertragen werden. Falls jedoch n – m Schlitze infolge eines instabilen Übertragungskanals übertragen werden, können keine korrekten Daten rekonstruiert werden.
  • Weiterhin wird mit Bezug auf 3 der Fall beschrieben, in dem von einem Übertragungsende zugeführte Daten an mehreren Empfangsenden empfangen werden. Falls die Kapazitäten der jeweiligen Übertragungsenden der Empfangsenden voneinander verschieden sind oder die jeweiligen Empfangsenden unterschiedliche Bitraten benötigen, kann das nur eine feste Bitrate unterstützende Übertragungsende die Anforderung nicht erfüllen. Falls der Audiobitstrom für verschiedene Schichten getrennte Bitraten aufweist, ist es in diesem Fall möglich, einer gegebenen Umgebung oder einer Benutzeranforderung geeignet Rechnung zu tragen.
  • In diesem Zusammenhang gibt es drei Verfahren für das Skalieren von Bitraten. Erstens wird der Bitstrom, weil Informationen für verschiedene Schichten in einem Bitstrom sequenziell angeordnet sind, einfach mit einer gewünschten Bitrate aufgetrennt, um ihn dann zu übertragen. Wie in 4 dargestellt ist, werden die Bitströme sequenziell von der Basisschicht bis zur obersten Schicht aufgebaut. Anschließend werden Seiteninformationen für jede Schicht und Audiodaten in einem Bitstrom aufgezeichnet. Falls daher ein Benutzer nur die Basisschicht anfordert, wird der der Basisschicht entsprechende Bitstrom übertragen. Falls die Informationen für die erste Schicht (Schicht 1) angefordert werden, werden nur die Bitströme bis zur ersten Schicht übertragen. Weiterhin werden alle Bitströme übertragen, falls die Informationen für die oberste Schicht angefordert werden.
  • Zweitens formatiert eine Vorrichtung (beispielsweise ein Wandler) die Bitströme zwischen einem Übertragungsende und einem Empfangsende nach einer Benutzeranforderung um. Das heißt, dass eine in 5 dargestellte Codiervorrichtung einen Bitstrom mit einer Bitrate bildet und der Wandler den Bitstrom dann umformatiert und nach einer Benutzeranforderung mit einer niedrigeren Bitrate überträgt. Dabei muss der von der Codiervorrichtung gebildete Bitstrom Seiteninformationen enthalten, so dass der Wandler einen Bitstrom einer niedrigeren Schicht bilden kann.
  • Drittens führt der Wandler, wie in 6 dargestellt ist, eine Neucodierung aus. Die Neucodierung dient dazu, den Bitstrom bei einer vom Benutzer angeforderten Bitrate durch alle Decodierschritte zur Bildung von PCM-Daten und alle Codierschritte zu bilden und zu übertragen. Wenn beispielsweise ein Bitstrom mit 64 kbps zu einem Hauptübertragungskanal übertragen wird und die Kapazität eines Übertragungskanals für einen Benutzer 32 kbps beträgt, bildet der dazwischen installierte Wandler PCM-Daten unter Verwendung eines Decodierers für 64 kbps und betreibt dann einen Codie rer für 32 kbps, um einen 32-kbps-Bitstrom zu bilden und dann die Daten über den Übertragungskanal zu übertragen.
  • Von den vorstehend beschriebenen Verfahren ist das erste Verfahren am besten geeignet, dieses Verfahren hat jedoch den Nachteil einer geringeren Leistungsfähigkeit infolge der Datenredundanz in den jeweiligen Schichten. Das zweite Verfahren kann die Audioqualität, verglichen mit dem ersten Verfahren, etwas verbessern. Die Formatierung des Bitstroms mit einer niedrigeren Bitrate kann jedoch, abhängig von durch den Codierer übertragenen Seiteninformationen, variieren. Weil die Prozedur weiterhin den Wandler durchläuft, ist dieses Verfahren angesichts der Verzögerungen und der Kosten vorteilhafter als das erste Verfahren. Weil der Wandler beim dritten Verfahren als ein Decodierer und ein Codierer dient, nimmt die Komplexität zu, wodurch die Prozedur kostspielig wird und Verzögerungen infolge der Umformatierung hervorgerufen werden. Weil in den in den Wandler eingegebenen Bitströmen jedoch keine Redundanz vorhanden ist, ist die Audioqualität beim dritten Verfahren besser als beim ersten Verfahren. Wenngleich es recht schwierig ist, zwischen dem zweiten Verfahren (Umformatierung) und dem dritten Verfahren (Neucodierung) zu unterscheiden, wird beim dritten Verfahren bei der Bildung eines niedrigeren Bitstroms eine Entquantisierung verwendet.
  • Weil bei einem skalierbaren System der Wandler dazu dient, einfach den Benutzer mit dem Übertragungsende zu verbinden, muss die Komplexität des Wandlers verringert werden. Weil daher ein weniger komplexer Wandler verwendet wird, der keine Verzögerungen aufweist und weniger kostspielig ist, wurde ein Verfahren eingesetzt, bei dem keine Neucodierung verwendet wird.
  • Im Allgemeinen wird zur Bildung des Bitstroms wie beim ersten Verfahren, wie in 7 dargestellt ist, zuerst eine Codierung für untere Schichten ausgeführt, dann eine Decodierung ausgeführt und die Differenz zwischen dem ursprünglichen Signal und dem decodierten Signal in einen Codierer für die nächste dann zu verarbeitende Schicht eingegeben. Bei diesem Verfahren werden im Allgemeinen mindestens zwei Codierverfahren eingesetzt. Das heißt, dass ein Kerncodec zum Erzeugen einer Basisschicht zusammen mit einem anderen Codec zum Erzeugen anderer Schichten verwendet wird. Ein solches Verfahren erhöht jedoch die Komplexität eines Codiersystems infolge des Vorhandenseins von mindestens zwei Codierern. Die Komplexität eines Decodiersystems nimmt auch bei mehreren Decodierern zu. Weiterhin wird die Codierung umso komplexer, je größer die Anzahl der Schichten ist. Dies liegt daran, dass richtige Zeitbereichsdaten der entsprechenden Schicht durch Summieren der jeweiligen von den jeweiligen Schichten erzeugten Zeitbereichsdaten erhalten werden können.
  • ZUSAMMENFASSUNG DER ERFINDUNG
  • Eine Aufgabe der vorliegenden Erfindung besteht zum Lösen der vorstehenden Probleme darin, ein Verfahren und eine Vorrichtung zur skalierbaren Audiocodierung bzw. -decodierung bereitzustellen, wodurch ermöglicht werden kann, einen Übertragungskanal wirksam zu verwenden, Anforderungen verschiedener Benutzer zu erfüllen und einen Bitstrom mit einer guten Audioqualität durch Kombinieren von Informationen für Bitraten verschiedener Schichten in einem Bitstrom, ohne dass sie überlappen, bereitzustellen.
  • Zum Lösen der Aufgabe ist ein skalierbares Audiocodierverfahren zum Codieren von Audiosignalen zu einem geschichteten Datenstrom mit einer Basisschicht und einer vorbestimmten Anzahl von Zusatzschichten vorgesehen, wobei (a) Eingangsaudiosignale für jedes vorbestimmte Codierband signalverarbeitet und quantisiert werden, (b) die quantisierten Daten, die zu der Basisschicht gehören, innerhalb eines Bandbreitenbereichs codiert werden, (c) die quantisierten Daten, die der nächsten Zusatzschicht entsprechen, codiert werden, und ferner die verbleibenden uncodierten quantisierten Daten, die zu der codierten Basisschicht gehören, innerhalb des Bandbreitenbereichs codiert werden, und (d) die Schichtcodierungsschritte für alle Schichten sequenziell durchgeführt werden, wobei in den Schritten (b), (c) und (d) jeweils (i) Tonumfang-Bitzuordnungsinformationen für die jeweiligen Subbänder einer zu codierenden Schicht erhalten werden, wobei die Tonumfang-Bitzuordnungsinformationen die Anzahl der quantisierten Datenbits angeben, die zum Darstellen des Maximalwerts der entsprechenden Subbänder benötigt werden, (ii) die Anzahl der Bits erhalten wird, die den jeweiligen Subbändern zugeordnet sind, (iii) ein Index erzeugt wird, der das Vorhandensein von quantisierten Daten entsprechend der Anzahl von zugeordneten Bits für vorbestimmte Frequenzkomponenten darstellt, die die Subbänder bilden, und (iv) Bitströme durch Codierung der quantisierten Daten entsprechend der Tonumfang-Bitzuordnungsinformationen, der Quantisierungsschrittgröße, dem Index und der Anzahl von Bits, die den jeweiligen Subbändern zugeordnet sind, durch ein vorbestimmtes Codierverfahren erzeugt werden.
  • Weiterhin ist eine Vorrichtung zum Codieren von Audiosignalen, die geschichtete Bitratendaten mit vorbestimmten Bitraten aufweisen, vorgesehen, mit: einem Quantisierungsabschnitt zur Signalverarbeitung und Quantisierung von Eingangsaudiosignalen für jedes Codierband, und einem Bitpaketierungsabschnitt zum Erzeugen von Bitströmen durch Codierung von Tonumfang-Bitzuordnungsinformationen für jedes Subband einer Basisschicht, wobei die Tonumfang-Bitzuordnungsinformationen die Anzahl quantisierter Datenbits angeben, die zum Darstellen des Maximalwerts jedes Subbands erforderlich sind, und durch Codierung eines Indexes, der das Vorhandensein von Daten entsprechend der Anzahl von Bits darstellt, die den jeweiligen Subbändern für vorbestimmte Frequenzkomponenten der quantisierten Daten zugeordnet sind, sowie ferner durch Codierung der Quantisierungsschrittgröße und der quantisierten Daten, und wobei der Bitpaketierungsabschnitt dazu ausgelegt ist, Tonumfang-Bitzuordnungsinformationen, den Index, die Quantisierungsschrittgröße und quantisierte Daten der nächsten Schicht nach Vollendung der Codierung der Basisschicht zu codieren, um eine Codierung aller Schichten durchzuführen.
  • Gemäß einem weiteren Aspekt der vorliegenden Erfindung ist ein skalierbares Audiodecodierverfahren zum Decodieren von Audiosignalen, die mit geschichteten Bitraten codiert sind, vorgesehen, wobei: Tonumfang-Bitzuordnungsinformationen für jedes Subband einer Basisschicht decodiert werden, wobei die Tonumfang-Bitzuordnungsinformationen die Anzahl quantisierter Datenbits angeben, die zum Darstellen des Maximalwerts der Subbänder erforderlich ist, ferner ein Index decodiert wird, der das Vorhandensein von Daten entsprechend der Anzahl von Bits angibt, die den jeweiligen Subbändern für vorbestimmte Frequenzkomponenten der quantisierten Daten zugeordnet sind, und ferner die Quantisierungsschrittgröße und die quantisierten Daten decodiert werden, wobei die Decodierschritte in der Reihenfolge der Erzeugung der Bitstromschichten ausgeführt wird, das Decodieren durch Erhalten der Anzahl von Bits durchgeführt wird, die den Subbändern zugeordnet sind, und durch Decodieren der quantisierten Daten, die der Anzahl zugeordneter Bits durch Bezugnahme auf den Index entspricht, die decodierte Quantisierungsschrittgröße und die quantisierten Daten in Signale der ursprünglichen Stärken wiederhergestellt werden, und dequantisierte Signale eines Frequenzbereichs in Signale eines Zeitbereichs umgewandelt werden.
  • Gemäß einem weiteren Aspekt der vorliegenden Erfindung ist eine skalierbare Audiodecodiervorrichtung zum Decodieren von Audiodaten, die mit geschichteten Bitraten codiert sind, vorgesehen, mit: einem Bitstromanalyseabschnitt zum Decodieren von Tonumfang-Bitzuordnungsinformationen für jedes Subband einer Basisschicht, wobei die Tonumfang-Bitzuordnungsinformationen die Anzahl quantisierter Datenbits angeben, die zum Darstellen des Maximalwerts jedes Subbands erforderlich sind, und zum Decodieren eines Indexes, der das Vorhandensein von Daten entsprechend der Anzahl von Bits darstellt, die den jeweiligen Subbändern für vorbestimmte Frequenzkomponenten der quantisierten Daten zugeordnet sind, und ferner zum Decodieren der Quantisierungsschrittgröße und der quantisierten Daten in der Reihenfolge der Erzeugung der Schichten der Bitströme, wobei der Bitstromanalyseabschnitt dazu betreibbar ist, die Anzahl von Bits zu erhalten, die den Subbändern zugeordnet sind, und die quantisierten Daten entsprechend der Anzahl zugeordneter Bits durch Bezugnahme auf den Index zu decodieren, einem Umkehrquantisierungsabschnitt zum Wiederherstellen der decodierten Quantisierungsschrittgröße und der quantisierten Daten in Signale der ursprünglichen Stärken, und einem Frequenz/Zeit-Abbildungsabschnitt zum Umwandeln umgekehrt quantisierter Signale in Signale eines Zeitbereichs.
  • Zusätzliche optionale Merkmale, die sich auf die vorliegende Erfindung beziehen, sind in den anliegenden abhängigen Ansprüchen dargestellt.
  • KURZBESCHREIBUNG DER ZEICHNUNG
  • Die vorstehenden Aufgaben und Vorteile der vorliegenden Erfindung werden durch die detaillierte Beschreibung einer bevorzugten Ausführungsform mit Bezug auf die anliegende Zeichnung besser verständlich werden, wobei:
  • 1 ein Blockdiagramm einer allgemeinen Audiodaten-Codiervorrichtung unter Verwendung psychoakustischer Eigenschaften ist,
  • 2 ein Diagramm zur Beschreibung eines Maskierungsphänomens ist,
  • 3 ein Blockdiagramm ist, in dem ein allgemeines Übertragungskanalsystem dargestellt ist,
  • 4 einen Bitstrom zeigt, der Informationen für Bitraten mehrerer Schichten enthält,
  • 5 ein Diagramm ist, das eine Neuformatierung beschreibt,
  • 6 ein Diagramm ist, das eine Neucodierung beschreibt,
  • 7 ein Blockdiagramm einer allgemeinen skalierbaren Codiervorrichtung ist,
  • 8 ein Blockdiagramm einer Codiervorrichtung gemäß einer Ausführungsform der vorliegenden Erfindung ist,
  • die 9A bis 9G das Arbeitsprinzip einer Codiervorrichtung gemäß einer Ausführungsform der vorliegenden Erfindung zeigen,
  • 10 eine Indexextraktion unter Verwendung einer Bitebenenmaske zeigt,
  • die 11A und 11B die Ausführung eines Datenerzeugungsalgorithmus zeigen,
  • 12 eine gemäß einer Ausführungsform der vorliegenden Erfindung gebildete Bitstromstruktur zeigt und
  • 13 ein Blockdiagramm einer Decodiervorrichtung gemäß einer Ausführungsform der vorliegenden Erfindung ist.
  • BESCHREIBUNG DER BEVORZUGTEN AUSFÜHRUNGSFORM(EN)
  • Nachstehend werden bevorzugte Ausführungsformen der vorliegenden Erfindung detailliert mit Bezug auf die anliegende Zeichnung beschrieben. Gemäß der vorliegenden Erfindung wird der Bitstrom für die Bitraten der jeweiligen Schichten einfach umformatiert, um ihn dann entsprechend einer Benutzeranforderung oder entsprechend dem Zustand eines Übertragungskanals zu übertragen, indem die Informationen für die Bitraten mehrerer Schichten in einem Bitstrom dargestellt werden. Wenn die Basisschicht beispielsweise 16 kbps aufweist, die obere Schicht 64 kbps aufweist und jede Zusatzschicht 8 kbps aufweist, sind die Informationen für die jeweiligen Schichten mit 16 kbps, 24 kbps, 32 kbps, 40 kbps, 48 kbps, 56 kbps und 64 kbps in dem Bitstrom für die obere Schicht mit 64 kbps enthalten. Falls ein Benutzer Daten für die obere Schicht anfordert, wird dieser Bitstrom ohne jede Verarbeitung übertragen. Weiterhin wird, falls ein Benutzer Daten für die 16 kbps entsprechende Basisschicht anfordert, nur der Bitstrom des vorderen Teils abgetrennt und übertragen.
  • 8 ist ein Blockdiagramm einer Codiervorrichtung gemäß der vorliegenden Erfindung, welche einen Quantisierungsverarbeitungsabschnitt 830 und einen Bitpaketierungsabschnitt 840 aufweist. Diese Vorrichtung kann in einer oder mehreren programmierten digitalen Signalverarbeitungsvorrichtungen (DSP-Vorrichtungen) verwirklicht werden.
  • Der Quantisierungsverarbeitungsabschnitt 830 zur Signalverarbeitung von Eingangsaudiosignalen und zum Quantisieren von ihnen für vorgegebene Codierbänder weist einen Zeit/Frequenz-Abbildungsabschnitt 800, einen psychoakustischen Abschnitt 810 und einen Quantisierungsabschnitt 820 auf.
  • Der Zeit/Frequenz-Abbildungsabschnitt 800 wandelt die Eingangsaudiosignale des Zeitbereichs in Signale eines Frequenzbereichs um. Die Differenz zwischen vom menschlichen Ohr wahrgenommenen Signaleigenschaften ist zeitlich nicht sehr groß. Gemäß den psychoakustischen Modellen für Menschen wird jedoch eine große Differenz für jedes Band erzeugt. Demgemäß kann die Kompressionswirksamkeit erhöht werden, indem abhängig von Frequenzbändern verschiedene Quantisierungsbits zugeordnet werden.
  • Der psychoakustische Abschnitt 810 koppelt die konvertierten Signale mit Signalen vorgegebener Subbänder des Zeit/Frequenz-Abbildungsabschnitts 800 und berechnet eine Maskierungsschwelle bei jedem Subband unter Verwendung des durch Interaktion mit den jeweiligen Signalen erzeugten Maskierungsphänomens.
  • Der Quantisierungsabschnitt 820 quantisiert die Signale für jedes vorgegebene Codierband, so dass das Quantisierungsrauschen jedes Bands kleiner wird als die Maskierungsschwelle. Mit anderen Worten werden die Frequenzsignale jedes Bands einer skalaren Quantisierung unterzogen, so dass der Betrag des Quantisierungsrauschens jedes Bands kleiner ist als die Maskierungsschwelle, so dass es nicht wahrnehmbar ist. Die Quantisierung wird so ausgeführt, dass der NMR-Wert (Rausch-Maskenverhältnis-Wert), der das Verhältnis zwischen der vom psychoakustischen Abschnitt 810 berechneten Maskierungsschwelle und dem in jedem Band erzeugten Rauschen ist, kleiner oder gleich 0 dB ist. Wenn der NMR-Wert kleiner oder gleich 0 dB ist, bedeutet dies, dass die Maskierungsschwelle höher ist als das Quantisierungsrauschen. Mit anderen Worten ist das Quantisierungsrauschen nicht hörbar.
  • Der Bitpaketierungsabschnitt 840 codiert Seiteninformationen entsprechend einer Basisschicht mit der niedrigsten Bitrate und den quantisierten Daten, codiert anschließend Seiteninformationen entsprechend der der Basisschicht nächstgelegenen Schicht und ihren quantisierten Daten und führt diese Prozedur für alle Schichten aus, wobei er Bitströme erzeugt, die nachstehend in weiteren Einzelheiten beschrieben werden. Tonumfang-Bitzuordnungsinformationen, welche die Anzahl der Bits der quantisierten Daten entsprechend den jeweiligen Schichten darstellen, werden für die jeweiligen Subbänder erhalten, die zu einer zu codierenden betreffenden Schicht gehören. Anschließend wird die Anzahl der den jeweiligen Bändern zugeordneten Bits innerhalb des Bandgrößenbereichs für die jeweiligen Schichten erhalten. Für die quantisierten Daten, die der Anzahl der jedem Band zugeordneten Bits entsprechen, werden die Indizes erzeugt, die das Vorhandensein der quantisierten Daten für vorgegebene Frequenzkomponenten darstellen, die aus den jeweiligen Bändern bestehen. Die quantisierten Daten, die der Anzahl der den jeweiligen Bändern zugeordneten Bits entsprechen, werden vom MSB der quantisierten Daten zu niedrigeren Bits codiert. Die Codierung der quantisierten Daten kann in der Einheit einer vorgegebenen Anzahl von Bits von niedrigeren Frequenzkomponenten zu höheren Frequenzkomponenten ausgeführt werden.
  • Nun wird die Arbeitsweise der vorliegenden Erfindung beschrieben. Wie in 7 dargestellt ist, besteht das am häufigsten verwendete Verfahren für das Aufzeichnen von Informationen mehrerer Schichten in einem Bitstrom im Speichern des Ergebnisses der von hohen Schichten zu niedrigeren Schichten ausgeführten Codierung, in der Decodierung des Ergebnisses und im Verarbeiten und Speichern der Differenz zwischen dem rekonstruierten Signal und dem ursprünglichen Signal in der nächsten Schicht. Wenn die Basisschicht beispielsweise 16 kbps aufweist, wird das 16-kbps-Codierergebnis im Bitstrom gespeichert. Unter der Annahme einer Differenz zwischen dem ursprünglichen Signal und dem Decodierergebnis der codierten 16-kbps-Daten wird die Codierung an der nächsten Schicht ausgeführt. Weil es bei einem solchen Verfahren viele redundante Abschnitte im Bitstrom gibt, ist die Audioqualität beeinträchtigt. Mit anderen Worten sind die Daten niedrigerer Frequenzbänder in mehreren Schichten redundant. Um die Redundanz zu vermeiden, muss eine Kontinuität zwischen Daten gegeben sein, die in den jeweiligen Schichten für die gleiche Frequenzkomponente dargestellt sind. Falls beispielsweise m Bits für die i-te Schicht zugeordnet werden und n Bits für die (i – 1)-te Schicht zugeordnet werden, müssen die durch (n + m) Bits dargestellten Daten als ein Informationsbestandteil wirksam sein.
  • Gemäß der vorliegenden Erfindung werden die Daten, um die Kontinuität zwischen in den jeweiligen Schichten für dieselbe Frequenzkomponente dargestellten Daten aufrechtzuerhalten, vom MSB dargestellt, wie mit Bezug auf die 9A9G beschrieben wird.
  • 9A zeigt das Ergebnis der vom Quantisierungsabschnitt 820 für NMR 0 ausgeführten Quantisierung. Die Daten werden vom MSB in jeder Schicht dargestellt. Mit anderen Worten ist nur das MSB in der Basisschicht dargestellt, wie in 9B dargestellt ist. Falls die Darstellung auf diese Weise bis zur obersten Schicht erfolgt, werden alle Datenbits dargestellt. Wenn die Schicht daher fortschreitet, werden detailliertere Informationen dargestellt. Die zum Decodierer übertragenen Daten umfassen Tonumfang-Bitzuordnungsinformationen, welche die Größe der dem Band, dem Datenindex und Datenbits zugeordneten Bits darstellen. Der Index stellt dar, wo die Datenbits in dem Band positioniert sind. Dieser wird unter Verwendung einer Bitebenenmaske erzeugt. Alle Bits der Bitebenenmaske haben einen Wert von 1. Der Index wird durch Ausführen einer UND-Operation an der Bitebenenmaske und dem MSB der Daten für die Anzahl der Bits der Maske erzeugt, wie in 10 dargestellt ist.
  • Für das Band des in 10 dargestellten Beispiels umfassen die Bitzuordnungsinformationen 7 Bits. Beispielsweise werden die obersten Daten vom Decodierer selbst dann als "1000000" erkannt, wenn es nur eine 1-Bit-Dateneinheit im MSB der Basisschicht gibt. Dadurch, dass das MSB 1 ist, ist der Wert dieses Bands, dessen maximale Bitanzahl 7 ist, größer als "1000000". Dieser Wert wird durch ein Bit der nächsten Schicht als "1100000" erkannt. Der Index stellt einen Datenwert von 1 sowie eine Datenposition dar. Demgemäß wird 1 als der Indexwert aus der "1000001"-Darstellung in den 9A9G ausgeschlossen. Daher wird "1000001" im Decodierer durch Addieren von 1 als Indexwert zu "1000000", welches durch Datenbits dargestellt ist, rekonstruiert. In den 9A9G stellen die auf den zweiten und den fünften Schritt folgenden Daten alle Daten dar, die nicht zum Decodierer übertragen werden. Die Daten werden durch Huffman-Codierung, Lauflängencodierung oder arithmetische Codierung dargestellt. Die Daten werden als das ihnen entsprechende Bit verwendet. Weiterhin kann das Datenbit auch durch den Index dargestellt werden, wenn das Datenbit ein 1-Bit-Datenbit ist. Dies bedeutet, dass das MSB durch den durch Maskierung erzeugten Wert 1 an der entsprechenden Position existiert. Demgemäß kann der gesamte Wert selbst dann dargestellt werden, wenn es kein weiteres Datenbit gibt. Wenn beispielsweise die Bitzuordnungsinformationen 5 sind, stellt 1 als der Indexwert der Basisschicht 1 und "10000" dar. Demgemäß ist der wiederhergestellte Wert "10001".
  • Wie vorstehend beschrieben wurde, ist ein 1-Bit-Datenbit in jeder Schicht dargestellt, welches im Wesentlichen transformiert werden kann, um ein oder mehrere Bits in jeder Schicht darzustellen.
  • Zum Darstellen von Daten für jedes Band wird zuerst das MSB des Bands entsprechend jeder Schicht durch mindestens ein Bit dargestellt, und die Daten werden dann in der Betragsreihenfolge der Bitzuordnungsinformationen von niedrigeren Bändern zu höheren Bändern sequenziell angeordnet. Weil mit anderen Worten das Band mit einer großen Bitzuordnungsinformation ein wichtiges Band ist, wird es zuerst codiert. Weil das Band mit einer kleinen Bitzuordnungsinformation ein weniger wichtiges Band ist, wird es später codiert. Der folgende Algorithmus wird zum Erzeugen von Daten jeder Schicht verwendet, und es werden dadurch die Bitzuordnungsinformationen und Daten jeder Schicht berechnet, um einen skalierbaren Bitstrom zu bilden.
  • Figure 00160001
  • Figure 00170001
  • Figure 00180001
  • Die 11A und 11B zeigen die Ausführung eines Datenerzeugungsalgorithmus für die Basisschicht und eine Schicht 1 als Beispiel. In den 11A und 11B entsprechen anfängliche Bitzuordnungsinformationen einer Hälfte der Tonumfang-Bitzuordnungsinformationen. Dann wird unter den restlichen Bitzuordnungsinformationen [(Tonumfang-Bitzuordnungsinformationen) – (anfängliche Bitzuordnungsinformationen)] die Bitzuordnung in der Reihenfolge der Informationsgröße ausgeführt. Beim vorstehend angegebenen Algorithmus können weitere Bits innerhalb der zulässigen Bits in der Basisschicht nur bis zum zweiten Band eingegeben werden. Nach Abschluss der Verarbeitung der Basisschicht wird das durch Subtrahieren des verarbeiteten Signals vom ursprünglichen Signal erhaltene Signal in der nächsten Schicht verarbeitet.
  • Wenn die Schicht in dieser Weise fortschreitet, kann ein detaillierterer Datenwert dargestellt werden. Auf diese Weise kann die Audioqualität entsprechend der Erweiterung der Schichten verbessert werden.
  • Nun wird das Verfahren zum Bilden skalierbarer Bitströme unter Verwendung so dargestellter Daten beschrieben. Zuerst werden Seiteninformationen für die Bandbreite der Basisschicht aufgezeichnet. Die Seiteninformationen umfassen Bitzuordnungsinformationen für jedes Band und eine zur Dequantisierung erforderliche Quantisierungsschrittgröße. Hier wird die Quantisierungsschrittgröße aufgezeichnet, wenn die Bitzuordnung für das entsprechende Band zum ersten Mal ausgeführt wird. Nach den Seiteninformationen wird der Audiodatenwert für die Basisschicht aufgezeichnet. Die Aufzeichnung des Datenwerts wird nach den MSB-Informationen vom ersten Band bis zu dem Band, das innerhalb der Bitzuteilung darstellbar ist, abhängig von der Bitrate der Basisschicht sequenziell ausgeführt, und der Datenindex wird berechnet. In den 11A und 11B werden der Index und das Datenbit, welche durch mit durchgezogenen Linien angegebene Quadrate angegeben sind, innerhalb des Bitstroms aufgezeichnet. Zu dieser Zeit werden, falls die Bitzuordnungsinformationen für jede Schicht null sind, keine Daten aufgezeichnet. Weiterhin wird, wenn die Bitzuordnungsinformationen nicht für alle Schichten null sind, das Datenbit nicht aufgezeichnet und nur der Index aufgezeichnet, falls es keine Informationen für den Index gibt (d.h. falls die Indizes alle null sind). Nach Abschluss der Aufzeichnung für die Basisschicht werden die Seiteninformationen und der quantisierte Audiodatenwert für die nächste Schicht aufgezeichnet. Auf diese Weise werden die Daten aller Schichten aufgezeichnet. 12 zeigt die Struktur des so aufgezeichneten Bitstroms.
  • Nun wird das Codierverfahren gemäß der vorliegenden Erfindung durch ein Beispiel detailliert beschrieben. Beispielsweise beträgt die Bitrate einer Basisschicht 16 kbps, die Bitrate einer oberen Schicht 64 kbps, und die jeweiligen Zusatzschichten haben eine Bitrate von 8 kbps, so dass der Bitstrom 7 Schichten mit 16 kbps, 24 kbps, 32 kbps, 40 kbps, 48 kbps, 56 kbps und 64 kbps aufweist. Wie in der folgenden Tabelle 1 gezeigt ist, ist die verarbeitete Bandbreite jeder Schicht begrenzt. Die Eingangsdaten sind mit 48 kHz abgetastete PCM-Daten, und die Größe eines Rahmens beträgt 1024 Bits. Die Anzahl der für einen Rahmen für eine Bitrate von 64 kbps verwendbaren Bits beträgt im Durchschnitt 1365 (= 64000 Bits/s·(1024/48000)).
  • Tabelle 1
    Figure 00200001
  • Zuerst werden notwendige Informationen anhand der Eingangsdaten unter Verwendung eines psychoakustischen Modells berechnet. ISO/IEC 11172-3 Model 2 wird zum Berechnen des psychoakustischen Modells verwendet. Die Ausgaben des psychoakustischen Abschnitts 810 sind der Blocktyp eines gegenwärtig verarbeiteten Rahmens (lang, Anfang, kurz oder Stopp), die SMR-Werte der jeweiligen Verarbeitungsbänder, Abschnittsinformationen eines kurzen Blocks und zeitlich verzögerte PCM-Daten zur Synchronisation mit dem psychoakustischen Abschnitt 810 und dem Zeit/Frequenz-Abbildungsabschnitt 800.
  • Tabelle 2
    Figure 00200002
  • Figure 00210001
  • Der Zeit/Frequenz-Abbildungsabschnitt 800 wandelt Daten im Zeitbereich in Daten im Frequenzbereich unter Verwendung der modifizierten diskreten Kosinustransformation (MDCT) entsprechend dem vom psychoakustischen Abschnitt 810 ausgegebenen Blocktyp um. Dabei sind die Blockgrößen im Fall langer/Anfangs-/Stopp-Blöcke bzw. im Fall eines kurzen Blocks 2048 bzw. 256, und die MDCT wird 8 Mal ausgeführt.
  • Die in Daten im Frequenzbereich umgewandelten Daten werden unter Verwendung des vom psychoakustischen Abschnitt 810 ausgegebenen SMR-Werts quantisiert. Hier wird eine skalare Quantisierung ausgeführt, und die grundlegende Quantisierungsschrittgröße ist 21/4. Die Quantisierung wird so ausgeführt, dass der NMR-Wert kleiner oder gleich 0 dB ist. Hier besteht die erhaltene Ausgabe aus Informationen für die quantisierten Daten, den Quantisierungsschrittgrößen für die jeweiligen Verarbeitungsbänder und der Anzahl der Bits, welche den Maximalwert des Bands darstellen können (d.h. den Tonumfang-Bitzuordnungsinformationen).
  • Die Daten für jede Schicht werden unter Verwendung des vorstehend erwähnten Algorithmus, der nun anhand einer bevorzugten Ausführungsform beschrieben wird, erzeugt. Weil die Bandbreite der Basisschicht 3,5 kHz beträgt, reichen die Verarbeitungsbänder bis zum zwölften Band. Zuerst werden unter Verwendung der Tonumfang-Bitzuordnungsinformationen bis zum zwölften Band die Bitzuordnungsinformationen der Basisschicht erzeugt. Daten, die innerhalb der Bits liegen, die die Hälfte der Tonumfang-Bitzuordnungsinformationen ausmachen, werden aus dem 0-ten Band entnommen, und die Daten werden geprüft, um festzustellen, ob sie innerhalb der Bitzuteilung der Basisschicht dargestellt werden können. Falls dies möglich ist, wird die gleiche Prozedur wie diejenige für das 0-te Band an den Daten des nächsten Bands ausgeführt. Während die Prozedur bis zum zwölften Band fortgesetzt wird, wird, falls ein Band kommt, das die Bitzuteilung aller Bänder bis zum zwölften Band übersteigt, die Prüfung fortgesetzt, indem unter den gegenwärtig verarbeiteten Bändern den jeweiligen Bändern von dem Band mit den größeren Bitzuordnungsinformationen sequenziell ein Bit zugeordnet wird. Der kleinere von einem Huffman-codierten Wert und einem lauflängencodierten Wert wird als der Indexwert verwendet. Wenn die Verarbeitung der Basisschicht abgeschlossen ist, wird der durch Subtrahieren des in der Basisschicht verarbeiteten Datenwerts von dem ursprünglichen Datenwert erhaltene Wert als Eingangsdaten für die nächste Schicht verwendet. Die gleiche Verarbeitung wie in der Basisschicht wird an anderen Schichten ausgeführt.
  • Nun wird eine Decodiervorrichtung zum Decodieren von der Codiervorrichtung erzeugter Bitströme detailliert beschrieben. 13 ist ein Blockdiagramm der Decodiervorrichtung, welche einen Bitstromanalyseabschnitt 10, einen Umkehrquantisierungsabschnitt 20 und einen Frequenz/Zeit-Abbildungsabschnitt 30 aufweist.
  • Diese Vorrichtung kann in einer oder mehreren programmierten digitalen Signalverarbeitungsvorrichtungen (DSP-Vorrichtungen) verwirklicht werden.
  • Der Bitstromanalyseabschnitt 10 decodiert die Tonumfang-Bitzuordnungsinformationen der Schichten, die Quantisierungsschrittgröße, den Index und die quantisierten Daten in der Erzeugungsreihenfolge der Bitströme, indem die Anzahl der Bits erhalten wird, die dem zu jeder Schicht gehörenden Band zugeordnet sind, und indem auf den Index für die quantisierten Daten entsprechend der zugeordneten Bitanzahl Bezug genommen wird.
  • Der Umkehrquantisierungsabschnitt 20 stellt die decodierte Quantisierungsschrittgröße und die quantisierten Daten zu Signalen mit den ursprünglichen Beträgen wieder her. Der Frequenz/Zeit-Abbildungsabschnitt 30 wandelt umgekehrt quantisierte Signale in Signale im Zeitbereich um, so dass sie von einem Benutzer wiedergegeben werden können.
  • Als nächstes wird die Arbeitsweise der Decodiervorrichtung beschrieben. Die Reihenfolge des Decodierens der von der Codiervorrichtung erzeugten Bitströme ist umgekehrt zur Codierreihenfolge. Zuerst werden die Informationen für die Basisschicht decodiert. Der Decodierprozess wird kurz beschrieben. Zuerst werden die Seiteninformationen der Basisschicht, d.h. die Tonumfang-Bitzuordnungsinformationen, die Quantisierungsschrittgröße und der Index, decodiert. Anschließend wird die Anzahl der Bits, die den zur Basisschicht gehörenden Bändern zugeordnet sind, erhalten, und die entsprechenden quantisierten Daten werden unter Bezugnahme auf den Index decodiert. Hierbei werden die quantisierten Werte der codierten Bitströme sequenziell von den MSBs zu den LSBs und von niedrigen Frequenzkomponenten zu hohen Frequenzkomponenten decodiert. Die Decodierung wird durch das dem Codierverfahren, das beim Codierprozess verwendet wird, entsprechende Verfahren ausgeführt. Vorzugsweise wird ein verlustfreies Decodierverfahren in der Art eines Huffman-Decodierverfahrens oder eines arithmetischen Decodierverfahrens verwendet.
  • Nach Abschluss der Decodierung der Bitströme für die Basisschicht werden die Seiteninformationen und die quantisierten Werte der Audiodaten für die nächste Schicht decodiert. Auf diese Weise können die Daten aller Schichten decodiert werden. Die durch den Decodierprozess quantisierten Daten werden durch den Umkehrquantisierungsabschnitt 20 und den Frequenz/Zeit-Abbildungsabschnitt 30, die in 13 dargestellt sind, in der zur Codierung entgegengesetzten Reihenfolge als die ursprünglichen Signale wiederhergestellt.
  • Wie vorstehend beschrieben wurde, werden gemäß der vorliegenden Erfindung Daten für die Bitraten verschiedener Schichten innerhalb eines einzigen Bitstroms dargestellt, wodurch der Zustand von Übertragungskanälen und Anforderungen von verschiedenen Benutzern adaptiv erfüllt werden.
  • Weil weiterhin derselbe Codierer für die jeweiligen Schichten verwendet wird, ist die Komplexität des Codierers geringer. Weil weiterhin Daten im Frequenzbereich ohne eine Codierung einer Differenz von Daten im Zeitbereich zwischen jeweiligen Schichten verarbeitet werden, ist die Komplexität des Codierers geringer.
  • Weil in ähnlicher Weise derselbe Decodierer für die jeweiligen Schichten verwendet wird, ist die Komplexität des Decodierers geringer. Weil weiterhin Daten im Zeitbereich nur einmal für jede Schicht erzeugt werden, ist die Komplexität des Decodierers geringer. Weil weiterhin die Bitströme verschiedener Schichten einfach erzeugt werden, ist die Komplexität des Decodierers geringer. Weiterhin gibt es eine Kontinuität zwischen den Datenbits der jeweiligen Schichten, wodurch eine gute Audioqualität bereitgestellt wird und leicht dem Zustand von Übertragungskanälen und Benutzeranforderungen Rechnung getragen wird.
  • Weiterhin werden gemäß der vorliegenden Erfindung zum Erfüllen der Anforderungen verschiedener Benutzer flexible Bitströme gebildet. Mit anderen Worten werden durch die Benutzeranforderungen die Informationen für die Bitraten verschiedener Schichten redundanzfrei mit einem Bitstrom kombiniert, wodurch Bitströme mit einer guten Audioqualität bereitgestellt werden. Weiterhin ist zwischen einem Übertragungsende und einem Empfangsende kein Konvertierer erforderlich. Überdies können jedem beliebigen Übertragungskanalzustand und verschiedenen Benutzeranforderungen Rechnung getragen werden.
  • Die vorliegende Erfindung kann sowohl auf festverdrahtete als auch auf drahtlose Systeme oder Speichersysteme angewendet werden.
  • Die vorliegende Erfindung ist nicht auf die vorstehend beschriebenen Ausführungsformen beschränkt und ermöglicht viele Modifikationen oder Alternativen. Beispielsweise können andere Transformationen, wie die FTT, verwendet werden.

Claims (21)

  1. Skalierbares Audiokodierverfahren zum Kodieren von Audiosignalen in einen geschichteten Datenstrom mit einer Basisschicht und einer vorbestimmten Anzahl von Zusatzschichten, wobei (a) Eingangsaudiosignale für jedes vorbestimmte Kodierband signalverarbeitet und quantisiert werden, (b) die quantisierten Daten, die zu der Basisschicht gehören, innerhalb eines Bandbreitenbereichs kodiert werden, (c) die quantisierten Daten, die der nächsten Zusatzschicht entsprechen, kodiert werden, und ferner die verbleibenden unkodierten quantisierten Daten, die zu der kodierten Basisschicht gehören, innerhalb des Bandbreitenbereichs kodiert werden, und (d) die Schichtkodierungsschritte für alle Schichten sequentiell durchgeführt werden, wobei in den Schritten (b), (c) und (d) jeweils (i) Tonumfang-Bitzuordnungsinformationen für die jeweiligen Subbänder einer zu kodierenden Schicht erhalten werden, wobei die Tonumfang-Bitzuordnungsinformationen die Anzahl der quantisierten Datenbits angeben, die zum Darstellen des Maximalwerts der entsprechenden Subbänder benötigt werden, (ii) die Anzahl der Bits erhalten wird, die den jeweiligen Subbändern zugeordnet sind, (iii) ein Index erzeugt wird, der das Vorhandensein von quantisierten Daten entsprechend der Anzahl von zugeordneten Bits für vorbestimmte Frequenzkomponenten darstellt, die die Subbänder bilden, und (iv) Bitströme durch Kodierung der quantisierten Daten entsprechend der Tonumfang-Bitzuordnungsinformationen, der Quantisierungsschrittgröße, dem Index und der Anzahl von Bits, die den jeweiligen Subbändern zugeordnet sind, durch ein vorbestimmtes Kodierverfahren erzeugt werden.
  2. Verfahren nach Anspruch 1, wobei die quantisierten Daten entsprechend der Anzahl zugeordneter Bits vom signifikantesten Bit zum am wenigsten signifikanten Bit quantisiert werden.
  3. Verfahren nach Anspruch 2, wobei das Kodieren der quantisierten Daten entsprechend der Anzahl von zugeordneten Bits in Schritt (iv) an einer vorbestimmten Anzahl quantisierter Biteinheiten gleichzeitig durchgeführt wird.
  4. Verfahren nach Anspruch 2, wobei ein Bit in Schritt (ii) zugeordnet wird und in Schritt (iv) die Tonumfang-Bitzuordnungsinformationen und der Index als Bitströme durch ein vorbestimmtes Kodierverfahren erzeugt werden.
  5. Verfahren nach Anspruch 1, wobei das vorbestimmte Kodierverfahren in einer verlustfreien Kodierung besteht.
  6. Verfahren nach Anspruch 5, wobei die verlustfreie Kodierung in einer Huffman-Kodierung besteht.
  7. Verfahren nach Anspruch 5, wobei die verlustfreie Kodierung in einer arithmetischen Kodierung besteht.
  8. Verfahren nach Anspruch 1, wobei in Schritt (a) die Eingangsaudiosignale eines Zeitbereichs in Signale eines Frequenzbereichs umgewandelt werden, die umgewandelten Signale als Signale von vorbestimmten Subbändern durch Zeit/Frequenz-Abbildung und Berechnung einer Maskierungsschwelle an jedem Subband gekoppelt werden, und die Signale für jedes vorbestimmte Kodierband so quantisiert werden, daß das Quantisierungsrauschen jedes Bandes kleiner ist als die Maskierungsschwelle.
  9. Gerät zum Kodieren von Audiosignalen, die geschichtete Bitratendaten mit vorbestimmten Bitraten aufweisen, mit einem Quantisierungsabschnitt zur Signalverarbeitung und Quantisierung von Eingangsaudiosignalen für jedes Kodierband, und einem Bitpaketierungsabschnitt zum Erzeugen von Bitströmen durch Kodierung von Tonumfang-Bitzuordnungsinformationen für jedes Subband einer Basisschicht, wobei die Tonumfang-Bitzuordnungsinformationen die Anzahl quantisierter Datenbits angeben, die zum Darstellen des Maximalwerts jedes Subbands erforderlich sind, und durch Kodierung eines Indexes, der das Vorhandensein von Daten entsprechend der Anzahl von Bits darstellt, die den jeweiligen Subbändern für vorbestimmte Frequenzkomponenten der quantisierten Daten zugeordnet sind, sowie ferner durch Kodierung der Quantisierungsschrittgröße und der quantisier ten Daten, und wobei der Bitpaketierungsabschnitt dazu ausgelegt ist, Tonumfang-Bitzuordnungsinformationen, den Index, die Quantisierungsschrittgröße und quantisierte Daten der nächsten Schicht nach Vollendung der Kodierung der Basisschicht zu kodieren, um eine Kodierung aller Schichten durchzuführen.
  10. Gerät nach Anspruch 9, ferner dazu ausgelegt, die quantisierten Daten entsprechend der Anzahl der zugeordneten Bits für jedes Subband sequentiell vom signifikantesten Bit zu weniger signifikanten Bits zu kodieren.
  11. Gerät nach Anspruch 10, ferner dazu ausgelegt, Bits in einer vorbestimmten Zahleinheit zu koppeln, wenn der Bitpaketierungsabschnitt die Bits gemäß ihrer Signifikanz sammelt und kodiert.
  12. Gerät nach Anspruch 10, wobei die Anzahl der zugeordneten Bits des Bitpaketierungsabschnitts eins beträgt und das Gerät dazu ausgelegt ist, die Tonumfang-Bitzuordnungsinformationen und den Index durch ein vorbestimmtes Kodierverfahren zu kodieren.
  13. Gerät nach Anspruch 10, wobei der Bitpaketierungsabschnitt dazu betreibbar ist, die Kodierung sequentiell von niedrigen Frequenzkomponenten zu hohen Frequenzkomponenten durchzuführen.
  14. Gerät nach Anspruch 9 oder 10, wobei der Quantisierungsabschnitt aufweist: einen Frequenz/Zeit-Abbildungsabschnitt zum Umwandeln der Eingangsaudiosignale eines Zeitbereichs in Signale eines Frequenzbereichs, einen Psychoakustikabschnitt zum Koppeln der umgewandelten Signale durch Signale von vorbestimmten Subbändern durch Zeit/Frequenz-Abbildung und Berechnung einer Maskierungsschwelle an jedem Subband, und einen Quantisierungsabschnitt zum Quantisieren der Signale für jedes vorbestimmte Kodierband, so daß das Quantisierungsrauschen jedes Bandes kleiner ist als die Maskierungsschwelle.
  15. Skalierbares Audiodekodierverfahren zum Dekodieren von Audiodaten, die mit geschichteten Bitraten kodiert sind, wobei Tonumfang-Bitzuondnungsinformationen für jedes Subband einer Basisschicht dekodiert werden, wobei die Tonumfangs-Bitzuondnungsinformationen die Anzahl quantisierter Datenbits angeben, die zum Darstellen des Maximalwerts der Subbänder erforderlich sind, ferner ein Index dekodiert wird, der das Vorhandensein von Daten entsprechend der Anzahl von Bits darstellt, die den jeweiligen Subbändern für vorbestimmte Frequenzkomponenten der quantisierten Daten zugeordnet sind, und ferner die Quantisierungsschrittgröße und die quantisierten Daten dekodiert werden, wobei die Dekodierschritte in der Reihenfolge der Erzeugung der Bitstromschichten ausgeführt wird, das Dekodieren durch Erhalten der Anzahl von Bits durchgeführt wird, die den Subbändern zugeordnet sind, und durch Dekodieren der quantisierten Daten, die der Anzahl zugeordneter Bits durch Bezugnahme auf den Index entspricht, die dekodierte Quantisierungsschnittgröße und die quantisierten Daten in Signale der ursprünglichen Stärken wiederhergestellt werden, und dequantisierte Signale eines Frequenzbereichs in Signale eines Zeitbereichs umgewandelt werden.
  16. Verfahren nach Anspruch 15, wobei das Dekodieren in dem Dekodierungsschritt vom signifikantesten Bit zu weniger signifikanten Bits durchgeführt wird.
  17. Verfahren nach Anspruch 15, wobei das Dekodieren der quantisierten Daten in dem Dekodierungsschritt an einer vorbestimmten Anzahl von Bitvektoreinheiten durchgeführt wird.
  18. Verfahren nach Anspruch 15, wobei der Dekodierungsschritt durch eine arithmetische Dekodierung durchgeführt wird.
  19. Verfahren nach Anspruch 15, wobei der Dekodierungsschritt durch eine Huffman-Dekodierung durchgeführt wird.
  20. Skalierbanes Audiodekodiergenät zum Dekodieren von Audiodaten, die mit geschichteten Bitraten kodiert sind, mit einem Bitstnomanalyseabschnitt zum Dekodieren von Tonumfang-Bitzuordnungsinformationen für jedes Subband einer Basisschicht, wobei die Tonumfang-Bitzuordnungsinformationen die Anzahl quantisierter Datenbits angeben, die zum Darstellen des Maximalwerts jedes Subbands erforderlich sind, und zum Dekodie ren eines Indexes, der das Vorhandensein von Daten entsprechend der Anzahl von Bits darstellt, die den jeweiligen Subbändern für vorbestimmte Frequenzkomponenten der quantisierten Daten zugeordnet sind, und ferner zum Dekodieren der Quantisierungsschrittgröße und der quantisierten Daten in der Reihenfolge der Erzeugung der Schichten der Bitströme, wobei der Bitstromanalyseabschnitt dazu betreibbar ist, die Anzahl von Bits zu erhalten, die den Subbändern zugeordnet sind, und die quantisierten Daten entsprechend der Anzahl zugeordneter Bits durch Bezugnahme auf den Index zu dekodieren, einem Umkehrquantisierungsabschnitt zum Wiederherstellen der dekodierten Quantisierungsschrittgröße und der quantisierten Daten in Signale der ursprünglichen Stärken, und einem Frequenz/Zeit-Abbildungsabschnitt zum Umwandeln umgekehrt quantisierter Signale in Signale eines Zeitbereichs.
  21. Gerät nach Anspruch 20, ferner dazu ausgelegt, die quantisierten Daten in dem Dekodierungsschritt vom signifikantesten Bit zu weniger signifikanten Bits zu dekodieren.
DE1997632761 1997-04-02 1997-12-23 Verfahren und Vorrichtung zur kalkulierbaren Audiocodierung bzw.-decodie- rung Expired - Lifetime DE69732761T2 (de)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
KR9712233 1997-04-02
KR19970012233 1997-04-02
KR1019970061300A KR100261254B1 (ko) 1997-04-02 1997-11-19 비트율 조절이 가능한 오디오 데이터 부호화/복호화방법 및 장치
KR9761300 1997-11-19

Publications (2)

Publication Number Publication Date
DE69732761D1 DE69732761D1 (de) 2005-04-21
DE69732761T2 true DE69732761T2 (de) 2006-04-13

Family

ID=26632642

Family Applications (1)

Application Number Title Priority Date Filing Date
DE1997632761 Expired - Lifetime DE69732761T2 (de) 1997-04-02 1997-12-23 Verfahren und Vorrichtung zur kalkulierbaren Audiocodierung bzw.-decodie- rung

Country Status (12)

Country Link
US (2) US6094636A (de)
EP (1) EP0869622B1 (de)
JP (1) JP3354863B2 (de)
KR (1) KR100261254B1 (de)
CN (1) CN1154085C (de)
BR (1) BR9705838B1 (de)
DE (1) DE69732761T2 (de)
EG (1) EG21303A (de)
ID (1) ID19832A (de)
IL (1) IL122669A (de)
MY (1) MY117039A (de)
RU (1) RU2224302C2 (de)

Families Citing this family (105)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19706516C1 (de) * 1997-02-19 1998-01-15 Fraunhofer Ges Forschung Verfahren und Vorricntungen zum Codieren von diskreten Signalen bzw. zum Decodieren von codierten diskreten Signalen
JP2000509873A (ja) * 1997-02-21 2000-08-02 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ビデオ画像を記録し及び再生する方法及び装置
KR100482282B1 (ko) * 1997-07-03 2005-07-11 주식회사 팬택앤큐리텔 신축형(스케일러블)부호화시고위계층(EnhancementLayer)부호화방법
US6405338B1 (en) * 1998-02-11 2002-06-11 Lucent Technologies Inc. Unequal error protection for perceptual audio coders
KR100548891B1 (ko) * 1998-06-15 2006-02-02 마츠시타 덴끼 산교 가부시키가이샤 음성 부호화 장치 및 음성 부호화 방법
JP3515903B2 (ja) * 1998-06-16 2004-04-05 松下電器産業株式会社 オーディオ符号化のための動的ビット割り当て方法及び装置
US6185525B1 (en) * 1998-10-13 2001-02-06 Motorola Method and apparatus for digital signal compression without decoding
GB9910002D0 (en) * 1999-05-01 1999-06-30 King S College London Audio signal encoders and decoders
US6446037B1 (en) * 1999-08-09 2002-09-03 Dolby Laboratories Licensing Corporation Scalable coding method for high quality audio
US6654723B1 (en) * 1999-08-27 2003-11-25 Koninklijke Philips Electronics N.V. Transmission system with improved encoder and decoder that prevents multiple representations of signal components from occurring
DE19947877C2 (de) * 1999-10-05 2001-09-13 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Einbringen von Informationen in einen Datenstrom sowie Verfahren und Vorrichtung zum Codieren eines Audiosignals
US6778953B1 (en) * 2000-06-02 2004-08-17 Agere Systems Inc. Method and apparatus for representing masked thresholds in a perceptual audio coder
US6718507B1 (en) * 2000-09-12 2004-04-06 At&T Corp. System and method for representing compressed information
KR100887165B1 (ko) * 2000-10-11 2009-03-10 코닌클리케 필립스 일렉트로닉스 엔.브이. 멀티미디어 오브젝트를 코딩하는 방법 및 장치, 비트 스트림을 제어 및 수신하는 방법, 비트 스트림을 제어하는 제어기, 비트 스트림을 수신하는 수신기, 및 멀티플레서
EP1199711A1 (de) * 2000-10-20 2002-04-24 Telefonaktiebolaget Lm Ericsson Kodierung von Audiosignalen unter Verwendung von Vergrösserung der Bandbreite
GB0027931D0 (en) * 2000-11-16 2001-01-03 Sgs Thomson Microelectronics Solid state imaging device
DE10102155C2 (de) * 2001-01-18 2003-01-09 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Erzeugen eines skalierbaren Datenstroms und Verfahren und Vorrichtung zum Decodieren eines skalierbaren Datenstroms
DE10102154C2 (de) * 2001-01-18 2003-02-13 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Erzeugen eines skalierbaren Datenstroms und Verfahren und Vorrichtung zum Decodieren eines skalierbaren Datenstroms unter Berücksichtigung einer Bitsparkassenfunktion
US7237032B2 (en) * 2001-02-16 2007-06-26 Microsoft Corporation Progressive streaming media rendering
US20020133246A1 (en) * 2001-03-02 2002-09-19 Hong-Kee Kim Method of editing audio data and recording medium thereof and digital audio player
US7062429B2 (en) * 2001-09-07 2006-06-13 Agere Systems Inc. Distortion-based method and apparatus for buffer control in a communication system
US7333929B1 (en) 2001-09-13 2008-02-19 Chmounk Dmitri V Modular scalable compressed audio data stream
BR0206395A (pt) * 2001-11-14 2004-02-10 Matsushita Electric Ind Co Ltd Dispositivo de codificação, dispositivo de decodificação e sistema dos mesmos
DE10200653B4 (de) 2002-01-10 2004-05-27 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Skalierbarer Codierer, Verfahren zum Codieren, Decodierer und Verfahren zum Decodieren für einen skalierten Datenstrom
US20040071083A1 (en) * 2002-02-22 2004-04-15 Koninklijke Philips Electronics N.V. Method for streaming fine granular scalability coded video over an IP network
KR100908114B1 (ko) * 2002-03-09 2009-07-16 삼성전자주식회사 스케일러블 무손실 오디오 부호화/복호화 장치 및 그 방법
AU2002246280A1 (en) * 2002-03-12 2003-09-22 Nokia Corporation Efficient improvements in scalable audio coding
JP4404180B2 (ja) * 2002-04-25 2010-01-27 ソニー株式会社 データ配信システム、データ処理装置及びデータ処理方法、並びにコンピュータ・プログラム
CA2485104A1 (en) * 2002-05-09 2003-11-20 Herman Cardenas Audio network distribution system
US9137035B2 (en) * 2002-05-09 2015-09-15 Netstreams Llc Legacy converter and controller for an audio video distribution system
GB2388502A (en) * 2002-05-10 2003-11-12 Chris Dunn Compression of frequency domain audio signals
DE10236694A1 (de) * 2002-08-09 2004-02-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren
EP3468044A1 (de) * 2002-09-20 2019-04-10 Ntt Docomo, Inc. Verfahren und vorrichtung zur arithmetischen codierung
US8204079B2 (en) * 2002-10-28 2012-06-19 Qualcomm Incorporated Joint transmission of multiple multimedia streams
EP1559101A4 (de) * 2002-11-07 2006-01-25 Samsung Electronics Co Ltd Mpeg-audiocodierungsverfahren und vorrichtung
KR100477701B1 (ko) * 2002-11-07 2005-03-18 삼성전자주식회사 Mpeg 오디오 인코딩 방법 및 mpeg 오디오 인코딩장치
KR100908116B1 (ko) * 2002-12-12 2009-07-16 삼성전자주식회사 비트율 조절가능한 오디오 부호화 방법, 복호화 방법,부호화 장치 및 복호화 장치
KR100908117B1 (ko) * 2002-12-16 2009-07-16 삼성전자주식회사 비트율 조절가능한 오디오 부호화 방법, 복호화 방법,부호화 장치 및 복호화 장치
KR100923301B1 (ko) * 2003-03-22 2009-10-23 삼성전자주식회사 대역 확장 기법을 이용한 오디오 데이터의 부호화 방법,그 장치, 복호화 방법 및 그 장치
KR101015497B1 (ko) * 2003-03-22 2011-02-16 삼성전자주식회사 디지털 데이터의 부호화/복호화 방법 및 장치
US20040208169A1 (en) * 2003-04-18 2004-10-21 Reznik Yuriy A. Digital audio signal compression method and apparatus
US7742926B2 (en) * 2003-04-18 2010-06-22 Realnetworks, Inc. Digital audio signal compression method and apparatus
DE10328777A1 (de) * 2003-06-25 2005-01-27 Coding Technologies Ab Vorrichtung und Verfahren zum Codieren eines Audiosignals und Vorrichtung und Verfahren zum Decodieren eines codierten Audiosignals
KR100629997B1 (ko) * 2004-02-26 2006-09-27 엘지전자 주식회사 오디오 신호의 인코딩 방법
DE102004009955B3 (de) * 2004-03-01 2005-08-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Ermitteln einer Quantisierer-Schrittweite
KR100561869B1 (ko) * 2004-03-10 2006-03-17 삼성전자주식회사 무손실 오디오 부호화/복호화 방법 및 장치
WO2005098823A2 (en) * 2004-03-25 2005-10-20 Digital Theater Systems, Inc. Lossless multi-channel audio codec
US7392195B2 (en) * 2004-03-25 2008-06-24 Dts, Inc. Lossless multi-channel audio codec
KR100695125B1 (ko) * 2004-05-28 2007-03-14 삼성전자주식회사 디지털 신호 부호화/복호화 방법 및 장치
US8670988B2 (en) * 2004-07-23 2014-03-11 Panasonic Corporation Audio encoding/decoding apparatus and method providing multiple coding scheme interoperability
JP4859670B2 (ja) * 2004-10-27 2012-01-25 パナソニック株式会社 音声符号化装置および音声符号化方法
KR100657916B1 (ko) * 2004-12-01 2006-12-14 삼성전자주식회사 주파수 대역간의 유사도를 이용한 오디오 신호 처리 장치및 방법
KR100829558B1 (ko) * 2005-01-12 2008-05-14 삼성전자주식회사 스케일러블 오디오 데이터 산술 복호화 방법 및 장치와스케일러블 오디오 비트스트림 절단 방법
US8619860B2 (en) 2005-05-03 2013-12-31 Qualcomm Incorporated System and method for scalable encoding and decoding of multimedia data using multiple layers
US7548853B2 (en) * 2005-06-17 2009-06-16 Shmunk Dmitry V Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding
US8270439B2 (en) * 2005-07-08 2012-09-18 Activevideo Networks, Inc. Video game system using pre-encoded digital audio mixing
US8074248B2 (en) 2005-07-26 2011-12-06 Activevideo Networks, Inc. System and method for providing video content associated with a source image to a television in a communication network
KR100738077B1 (ko) 2005-09-28 2007-07-12 삼성전자주식회사 계층적 오디오 부호화 및 복호화 장치와 방법
KR100754389B1 (ko) * 2005-09-29 2007-08-31 삼성전자주식회사 음성 및 오디오 신호 부호화 장치 및 방법
KR20070037945A (ko) * 2005-10-04 2007-04-09 삼성전자주식회사 오디오 신호의 부호화/복호화 방법 및 장치
KR100888474B1 (ko) * 2005-11-21 2009-03-12 삼성전자주식회사 멀티채널 오디오 신호의 부호화/복호화 장치 및 방법
KR100793287B1 (ko) * 2006-01-26 2008-01-10 주식회사 코아로직 비트율 조절이 가능한 오디오 복호화 장치 및 그 방법
US7894477B2 (en) * 2006-02-22 2011-02-22 Jds Uniphase Corporation Framing mobile communication signals for analysis
US7835904B2 (en) * 2006-03-03 2010-11-16 Microsoft Corp. Perceptual, scalable audio compression
CN101395661B (zh) * 2006-03-07 2013-02-06 艾利森电话股份有限公司 音频编码和解码的方法和设备
EP1988544B1 (de) * 2006-03-10 2014-12-24 Panasonic Intellectual Property Corporation of America Kodieranordnung und kodiermethode
FR2898443A1 (fr) * 2006-03-13 2007-09-14 France Telecom Procede de codage d'un signal audio source, dispositif de codage, procede et dispositif de decodage, signal, produits programme d'ordinateur correspondants
EP1855271A1 (de) * 2006-05-12 2007-11-14 Deutsche Thomson-Brandt Gmbh Verfahren und Vorrichtung zur Wiederkodierung von Signalen
EP1881485A1 (de) * 2006-07-18 2008-01-23 Deutsche Thomson-Brandt Gmbh Audiobitstromdatenstruktur eines verlustbehafteten kodierten Signals mit verlustfreien Erweiterungkodierungsdaten für ein solches Signal.
US8041042B2 (en) * 2006-11-30 2011-10-18 Nokia Corporation Method, system, apparatus and computer program product for stereo coding
US9826197B2 (en) 2007-01-12 2017-11-21 Activevideo Networks, Inc. Providing television broadcasts over a managed network and interactive content over an unmanaged network to a client device
WO2008088741A2 (en) 2007-01-12 2008-07-24 Ictv, Inc. Interactive encoded content system including object models for viewing on a remote device
BRPI0802614A2 (pt) 2007-02-14 2011-08-30 Lg Electronics Inc métodos e aparelhos para codificação e decodificação de sinais de áudio baseados em objeto
RU2406166C2 (ru) * 2007-02-14 2010-12-10 ЭлДжи ЭЛЕКТРОНИКС ИНК. Способы и устройства кодирования и декодирования основывающихся на объектах ориентированных аудиосигналов
JP4708446B2 (ja) * 2007-03-02 2011-06-22 パナソニック株式会社 符号化装置、復号装置およびそれらの方法
US20080294446A1 (en) * 2007-05-22 2008-11-27 Linfeng Guo Layer based scalable multimedia datastream compression
CN101325059B (zh) * 2007-06-15 2011-12-21 华为技术有限公司 语音编解码收发方法及装置
US20090076828A1 (en) * 2007-08-27 2009-03-19 Texas Instruments Incorporated System and method of data encoding
KR101435411B1 (ko) * 2007-09-28 2014-08-28 삼성전자주식회사 심리 음향 모델의 마스킹 효과에 따라 적응적으로 양자화간격을 결정하는 방법과 이를 이용한 오디오 신호의부호화/복호화 방법 및 그 장치
KR20100134623A (ko) * 2008-03-04 2010-12-23 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
CN101281748B (zh) * 2008-05-14 2011-06-15 武汉大学 用编码索引实现的空缺子带填充方法及编码索引生成方法
ES2654433T3 (es) 2008-07-11 2018-02-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codificador de señal de audio, método para codificar una señal de audio y programa informático
WO2010003543A1 (en) 2008-07-11 2010-01-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for calculating bandwidth extension data using a spectral tilt controlling framing
US20100303046A1 (en) * 2009-05-27 2010-12-02 Netstreams, Llc Wireless video and audio network distribution system
KR20100136890A (ko) * 2009-06-19 2010-12-29 삼성전자주식회사 컨텍스트 기반의 산술 부호화 장치 및 방법과 산술 복호화 장치 및 방법
US8194862B2 (en) * 2009-07-31 2012-06-05 Activevideo Networks, Inc. Video game system with mixing of independent pre-encoded digital audio bitstreams
CN101800050B (zh) * 2010-02-03 2012-10-10 武汉大学 基于感知自适应比特分配的音频精细分级编码方法及系统
US8392201B2 (en) * 2010-07-30 2013-03-05 Deutsche Telekom Ag Method and system for distributed audio transcoding in peer-to-peer systems
WO2012051528A2 (en) 2010-10-14 2012-04-19 Activevideo Networks, Inc. Streaming digital video between video devices using a cable television system
EP2695388B1 (de) 2011-04-07 2017-06-07 ActiveVideo Networks, Inc. Latenzreduktion in videoverteilungsnetzwerken mit adaptiver bitrate
RU2648595C2 (ru) 2011-05-13 2018-03-26 Самсунг Электроникс Ко., Лтд. Распределение битов, кодирование и декодирование аудио
EP2815582B1 (de) 2012-01-09 2019-09-04 ActiveVideo Networks, Inc. Wiedergabe einer interaktiven vereinfachten benutzerschnittstelle auf einem fernsehgerät
US9800945B2 (en) 2012-04-03 2017-10-24 Activevideo Networks, Inc. Class-based intelligent multiplexing over unmanaged networks
US9123084B2 (en) 2012-04-12 2015-09-01 Activevideo Networks, Inc. Graphical application integration with MPEG objects
JP6160072B2 (ja) * 2012-12-06 2017-07-12 富士通株式会社 オーディオ信号符号化装置および方法、オーディオ信号伝送システムおよび方法、オーディオ信号復号装置
EP2933799B1 (de) * 2012-12-13 2017-07-12 Panasonic Intellectual Property Corporation of America Stimmenaudiocodierungsvorrichtung, stimmenaudiodecodierungsvorrichtung, stimmenaudiocodierungsverfahren und stimmenaudiodecodierungsverfahren
LT3537437T (lt) * 2013-03-04 2021-06-25 Voiceage Evs Llc Kvantavimo triukšmo mažinimo laikiniame dekoderyje įrenginys ir būdas
US10275128B2 (en) 2013-03-15 2019-04-30 Activevideo Networks, Inc. Multiple-mode system and method for providing user selectable video content
US9219922B2 (en) 2013-06-06 2015-12-22 Activevideo Networks, Inc. System and method for exploiting scene graph information in construction of an encoded video sequence
US9294785B2 (en) 2013-06-06 2016-03-22 Activevideo Networks, Inc. System and method for exploiting scene graph information in construction of an encoded video sequence
US9326047B2 (en) 2013-06-06 2016-04-26 Activevideo Networks, Inc. Overlay rendering of user interface onto source video
CN105723454B (zh) * 2013-09-13 2020-01-24 三星电子株式会社 能量无损编码方法和设备、信号编码方法和设备、能量无损解码方法和设备及信号解码方法和设备
KR101805630B1 (ko) * 2013-09-27 2017-12-07 삼성전자주식회사 멀티 디코딩 처리 방법 및 이를 수행하기 위한 멀티 디코더
US9788029B2 (en) 2014-04-25 2017-10-10 Activevideo Networks, Inc. Intelligent multiplexing using class-based, multi-dimensioned decision logic for managed networks
CN116800978A (zh) * 2019-06-11 2023-09-22 Lg电子株式会社 图像编码/解码方法、图像数据发送方法和存储介质

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5109417A (en) * 1989-01-27 1992-04-28 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
US5357594A (en) * 1989-01-27 1994-10-18 Dolby Laboratories Licensing Corporation Encoding and decoding using specially designed pairs of analysis and synthesis windows
US5752225A (en) * 1989-01-27 1998-05-12 Dolby Laboratories Licensing Corporation Method and apparatus for split-band encoding and split-band decoding of audio information using adaptive bit allocation to adjacent subbands
EP0525809B1 (de) * 1991-08-02 2001-12-05 Sony Corporation Digitaler Kodierer mit dynamischer Quantisierungsbitverteilung
US5327520A (en) * 1992-06-04 1994-07-05 At&T Bell Laboratories Method of use of voice message coder/decoder
JP3186292B2 (ja) * 1993-02-02 2001-07-11 ソニー株式会社 高能率符号化方法及び装置
JP3259428B2 (ja) * 1993-03-24 2002-02-25 ソニー株式会社 ディジタル画像信号のコンシール装置及び方法
KR950008637B1 (ko) * 1993-04-08 1995-08-03 삼성전자주식회사 부밴드 코딩시스템의 신호처리장치
US5737720A (en) * 1993-10-26 1998-04-07 Sony Corporation Low bit rate multichannel audio coding methods and apparatus using non-linear adaptive bit allocation
JPH07202820A (ja) * 1993-12-28 1995-08-04 Matsushita Electric Ind Co Ltd ビットレート制御システム
KR950022321A (ko) * 1993-12-29 1995-07-28 김주용 음성신호의 고속 비트할당 방법
KR960012475B1 (ko) * 1994-01-18 1996-09-20 대우전자 주식회사 디지탈 오디오 부호화장치의 채널별 비트 할당 장치
KR0134318B1 (ko) * 1994-01-28 1998-04-29 김광호 채널간의 마스킹특성을 고려한 비트할당장치 및 그 방법과 복호화장치
US5761636A (en) * 1994-03-09 1998-06-02 Motorola, Inc. Bit allocation method for improved audio quality perception using psychoacoustic parameters
JP3830106B2 (ja) * 1994-05-19 2006-10-04 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴイ 広帯域ディジタル信号の信号スペクトルを規定し、かつこの信号スペクトルに応じてビット配置情報を得る機構
DE69522187T2 (de) * 1994-05-25 2002-05-02 Sony Corp Verfahren und vorrichtung zur kodierung, dekodierung und kodierung-dekodierung
KR970011727B1 (en) * 1994-11-09 1997-07-14 Daewoo Electronics Co Ltd Apparatus for encoding of the audio signal
EP0721257B1 (de) * 1995-01-09 2005-03-30 Daewoo Electronics Corporation Bitverteilung für Mehrkanal-Audiokodierer auf Grund von wahrnehmungsgebundener Entropie
US5621660A (en) * 1995-04-18 1997-04-15 Sun Microsystems, Inc. Software-based encoder for a software-implemented end-to-end scalable video delivery system
US5794179A (en) * 1995-07-27 1998-08-11 Victor Company Of Japan, Ltd. Method and apparatus for performing bit-allocation coding for an acoustic signal of frequency region and time region correction for an acoustic signal and method and apparatus for decoding a decoded acoustic signal
KR100346734B1 (ko) * 1995-09-22 2002-11-23 삼성전자 주식회사 고속분석필터및합성필터를구비한오디오부호화기및복호화기

Also Published As

Publication number Publication date
US6108625A (en) 2000-08-22
CN1195160A (zh) 1998-10-07
BR9705838B1 (pt) 2010-06-29
EP0869622A2 (de) 1998-10-07
DE69732761D1 (de) 2005-04-21
EP0869622A3 (de) 2000-09-06
IL122669A0 (en) 1998-08-16
EP0869622B1 (de) 2005-03-16
RU2224302C2 (ru) 2004-02-20
BR9705838A (pt) 1999-07-13
MY117039A (en) 2004-04-30
EG21303A (en) 2001-07-31
ID19832A (id) 1998-08-06
KR19980079476A (ko) 1998-11-25
JP3354863B2 (ja) 2002-12-09
IL122669A (en) 2000-12-06
US6094636A (en) 2000-07-25
KR100261254B1 (ko) 2000-07-01
JPH10285042A (ja) 1998-10-23
CN1154085C (zh) 2004-06-16

Similar Documents

Publication Publication Date Title
DE69732761T2 (de) Verfahren und Vorrichtung zur kalkulierbaren Audiocodierung bzw.-decodie- rung
DE69833834T2 (de) Skalierbares Audiokodier-und Dekodierverfahren und Gerät
EP0931386B1 (de) Verfahren zum signalisieren einer rauschsubstitution beim codieren eines audiosignals
DE60310716T2 (de) System für die audiokodierung mit füllung von spektralen lücken
DE60214027T2 (de) Kodiervorrichtung und dekodiervorrichtung
DE602004013031T2 (de) Verfahren zum codieren eines digitalen signals in einen skalierbaren bitstrom, verfahren zum decodieren eines skalierbaren bitstroms
DE69834010T2 (de) Skalierbares stereo Tonkodierungs- und Tondekodierungsverfahren und Vorrichtung dafür
EP0954909B1 (de) Verfahren zum codieren eines audiosignals
DE60208426T2 (de) Vorrichtung zur signalkodierung, signaldekodierung und system zum verteilen von audiodaten
DE602004005197T2 (de) Vorrichtung und verfahren zum kodieren eines audiosignals und vorrichtung und verfahren zum dekodieren eines kodierten audiosignals
DE4320990B4 (de) Verfahren zur Redundanzreduktion
DE69927505T2 (de) Verfahren zum einfügen von zusatzdaten in einen audiodatenstrom
DE19747132C2 (de) Verfahren und Vorrichtungen zum Codieren von Audiosignalen sowie Verfahren und Vorrichtungen zum Decodieren eines Bitstroms
DE69432538T2 (de) Digitales Signalkodierungsgerät, dazugehöriges Dekodiergerät und Aufzeichnungsträger
DE60225276T2 (de) Codierungsvorrichtung und -verfahren, decodierungsvorrichtung und -verfahren und programm
DE602004010885T2 (de) Audio-transkodierung
DE60002483T2 (de) Skalierbares kodierungsverfahren für hochqualitätsaudio
DE69737489T2 (de) Formung des erkennbaren Rauschsignals in der Zeitdomäne mittels LPC-Voraussage im Frequenzraum
DE69533500T2 (de) Verfahren und vorrichtung zum kodieren und dekodieren von nachrichten
DE69534140T2 (de) Verfahren und vorrichtung zur signalkodierung und -dekodierung, aufzeichnungsmedium und signalübertragungsverfahren
DE69826529T2 (de) Schnelle datenrahmen-optimierung in einem audio-kodierer
EP0910928A1 (de) Codieren und decodieren von audiosignalen unter verwendung von intensity-stereo und prädiktion
WO1998003036A1 (de) Verfahren zum codieren und decodieren von stereoaudiospektralwerten
EP0611516B1 (de) Verfahren zur reduzierung von daten bei der übertragung und/oder speicherung digitaler signale mehrerer abhängiger kanäle
DE69835990T2 (de) Audio-Codierer/-decodierer hoher Qualität

Legal Events

Date Code Title Description
8364 No opposition during term of opposition