DE602004005197T2 - Vorrichtung und verfahren zum kodieren eines audiosignals und vorrichtung und verfahren zum dekodieren eines kodierten audiosignals - Google Patents

Vorrichtung und verfahren zum kodieren eines audiosignals und vorrichtung und verfahren zum dekodieren eines kodierten audiosignals Download PDF

Info

Publication number
DE602004005197T2
DE602004005197T2 DE602004005197T DE602004005197T DE602004005197T2 DE 602004005197 T2 DE602004005197 T2 DE 602004005197T2 DE 602004005197 T DE602004005197 T DE 602004005197T DE 602004005197 T DE602004005197 T DE 602004005197T DE 602004005197 T2 DE602004005197 T2 DE 602004005197T2
Authority
DE
Germany
Prior art keywords
audio signal
output signal
signal
encoder
encoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
DE602004005197T
Other languages
English (en)
Other versions
DE602004005197D1 (de
Inventor
Holger HÖRICH
Michael Schug
Matthias Neusinger
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Coding Technologies Sweden AB
Original Assignee
Coding Technologies Sweden AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Coding Technologies Sweden AB filed Critical Coding Technologies Sweden AB
Publication of DE602004005197D1 publication Critical patent/DE602004005197D1/de
Application granted granted Critical
Publication of DE602004005197T2 publication Critical patent/DE602004005197T2/de
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation

Description

  • Die vorliegende Erfindung bezieht sich auf Codierungstechniken und insbesondere auf Audiocodierungstechniken. Audiocodierer und insbesondere solche Codierer, die unter dem Stichwort „mp3", „AAC" oder „mp3PRO" bekannt sind, erlangten in letzter Zeit breite Akzeptanz. Sie ermöglichen die Kompression von Audiosignalen, die eine beträchtliche Datenmenge erfordern, wenn sie beispielsweise in einem PCM-Format auf einer Audio-CD vorliegen, zu „tolerierbaren" Datenraten, die für die Übertragung der Audiosignale über Kanäle mit einer begrenzten Bandbreite hinweg geeignet sind. Zum Übertragen von Daten im PCM-Format sind somit Datenraten von bis zu 1,4 Mbit/s erforderlich. „mp3"-codierte Audiodaten erreichen bereits einen Stereoton mit hoher Qualität bei Datenraten von 128 kbit/s.
  • Ferner ist die Spektralbandvervielfältigung (SBR – spectral band replication) ein bekanntes Verfahren, das die Effizienz von existierenden an das Hörvermögen angepassten Wahrnehmungs-Audiocodierern bedeutend erhöht. Die SBR-Technik ist in der WO 98/57436 beschrieben und im „mp3PRO"-Format implementiert. Hier wird eine gute Stereoqualität bereits mit Datenraten von 64 kbit/s erzielt.
  • Die europäische Patentschrift EP 0 846 375 B1 offenbart ein Verfahren und eine Vorrichtung zur skalierbaren Codierung von Audiosignalen. Ein Audiosignal wird mittels eines ersten Codierers codiert, um den Bitstrom für den ersten Codierer zu erhalten. Dieses Signal wird anschließend erneut decodiert, mit einem Decodierer, der an den ersten Codierer angepasst ist. Das Decodier-Ausgangssignal wird zusammen mit dem verzögerten ursprünglichen Audiosignal an eine Differenzstufe geliefert, um ein Differenzsignal zu erzeugen. Dieses Differenzsignal wird Band für Band mit dem ursprünglichen Audiosignal verglichen, um für Spektralbänder zu ermitteln, ob die Energie des Differenzsignals größer als die Energie des Audiosignals ist. Falls dies der Fall ist, wird das ursprüngliche Audiosignal an einen zweiten Codierer geliefert, wohingegen das Differenzsignal an den zweiten Codierer geliefert wird, wenn die Energie des Differenzsignals geringer ist als die Energie des ursprünglichen Audiosignals. Der zweite Codierer ist ein Transformationscodierer, der auf der Basis eines psychoakustischen Modells fungiert. Wie der Bitstrom des ersten Codierers wird auch der Bitstrom auf der AusgangsSeite des zweiten Codierers einem Bitstrommultiplexer zugeführt, der auf der Ausgangsseite einen so genannten skalierten Bitstrom liefert. In diesem Zusammenhang bedeutet Skalierbarkeit, dass ein Decodierer je nach Entwurf in der Lage ist, entweder lediglich den Bitstrom des ersten Codierers aus dem Bitstrom auf der Decodiererseite zu extrahieren, oder, sowohl den Bitstrom des ersten Codierers als auch den Bitstrom des zweiten Codierers zu extrahieren, um im ersten Fall eine Reproduktion einer geringeren Qualität und im zweiten Fall eine qualitativ hochwertige Reproduktion des ursprünglichen Audiosignals zu erhalten.
  • Ein üblicherweise transformationsbasierter Codierer ist in 4a veranschaulicht. Das Audiosignal wird an eine Analysefilterbank 400 geliefert, die an ihrem Eingang einen Block mit einer bestimmten Anzahl von Abtastwerten des Audiosignals aus dem Strom von Abtastwerten mittels eines Blockierens bzw. Fensterns bildet und ihn in eine spektrale Darstellung umwandelt. Die spektralen Koeffizienten bzw. Teilbandsignale, die an dem Ausgang der Analysefilterbank erzeugt werden, werden quantisiert. Die Quantisiererschrittgröße hängt von verschiedenen Faktoren ab. Ein bedeutender Faktor ist eine psychoakustische Maskierungsschwelle, die durch ein psychoakustisches Modell 402 aus dem ursprünglichen Audiosignal berechnet wird. Der Quantisierer in einem Block „Quantisieren und Codieren 404" versucht immer, so grob wie möglich zu quantisieren, um eine gute Kompression zu erhalten. Dagegen versucht er jedoch auch, so fein wie möglich zu quantisieren, so dass das durch das Quantisieren bewirkte Quantisierungsrauschen unterhalb der durch den Block 402 gelieferten psychoakustischen Maskierungsschwelle liegt, was in der Technik hinreichend bekannt ist. Die auf diese Weise quantisierten Spektralwerte werden dann einer Entropiecodierung unterzogen, wobei üblicherweise eine Huffman-Codierung als Entropiecodierung verwendet wird, die üblicherweise mit vordefinierten Huffman-Codebüchern bzw. Huffman-Codetabellen arbeitet. Dann werden die entropiecodierten quantisierten Spektralwerte an den Ausgang des Blocks 404 angelegt, die zusammen mit den Nebeninformationen, die für das Decodieren mittels eines Blocks 406 benötigt werden, in einen Bitstrom 408 geschrieben werden, wobei dieser Bitstrom gespeichert oder, je nach dem Anwendungsgebiet, über einen Übertragungskanal hinweg an einen Decodierer übertragen werden kann, der in 4b veranschaulicht ist. Zunächst umfasst der Decodierer einen Block 410 zum Lesen des Bitstroms, um einerseits die Nebeninformationen und andererseits die entropiecodierten quantisierten Spektralwerte aus dem Bitstrom zu extrahieren. Dann werden die entropiecodierten quantisierten Spektralwerte zuerst einer Entropiedecodierung und anschließend einer Umkehr-Quantisierung zugeführt, um Umkehr-quantisierte Spektralwerte (Block 412) zu erhalten, die anschließend über eine Synthesefilterbank 414, die an die Analysefilterbank 400 angepasst ist, geliefert werden, um ein zeitdiskretes decodiertes Audiosignal auf der Ausgangsseite zu erhalten. Dieses zeitdiskrete Audiosignal an dem Ausgang der Synthesefilterbank kann anschließend nach einer entsprechenden Interpolation und Digital/Analog-Umwandlung und, falls notwendig, einer Verstärkung an einen Lautsprecher geliefert werden und dadurch hörbar gemacht werden. Blockbasierte Codierer/Decodierer, wie sie bei dem in 4a und 4b gezeigten bekannten Szenario verwendet werden, beruhen auf der Tatsache, dass üblicherweise ein Block von Abtastwerten, z. B. 1024 und 2048, mit einem in der Technik bekannten MDCT mit Überlappen- und Addieren-(Overlap and Add) zeitdiskreten Abtastwerten eines Audiosignals in den Spektralbereich umgewandelt werden. Sogar bei weniger stark frequenzauflösenden Filterbänken wie z. B. der SBR-Filterbank mit 64 Kanälen wird immer auch ein Block von Abtastwerten mit einer bestimmten Anzahl von Abtastwerten verwendet und in eine Spektraldarstellung umgewandelt, hier nämlich die einzelnen Teilbandsignale. Dann wird die spektrale Darstellung, wie erörtert wurde, entsprechend quantisiert, üblicherweise mit Hilfe eines psychoakustischen Modells, das die psychoakustische Maskierungsschwelle auf die in der Technik bekannte Weise berechnet.
  • Derartige Transformationen weisen inhärent eine bestimmte Zeit-/Frequenzauflösung auf. Dies bedeutet, dass, wenn eine große Anzahl von Abtastwerten in einen Block eingeführt wird, eine auf den Block angewendete Transformation inhärent eine hohe Frequenzauflösung aufweist. Dagegen wird die Zeitauflösung entsprechend verringert. Wenn die kürzeren Abschnitte des Audiosignals in den Spektralbereich umgewandelt würden, um die Zeitauflösung zu erhöhen, würde dies dazu führen, dass die Frequenzlösung entsprechend Schaden nimmt.
  • Somit besteht ein Problem darin, dass Audiosignale nur für sehr kurze Zeiträume als ortsfest erachtet werden können. Es gibt gewiss kurzfristige starke Energieanstiege, die als Einschwingvorgang bzw. Transiente bezeichnet werden, während derer das Audiosignal nicht ortsfest ist.
  • Um dieses Problem der Zeit-/Frequenzauflösung anzugehen, wird beispielsweise bei dem AAC-Codierer (AAC = advanced audio coding, hochentwickeltes Audiocodieren) ein Blockschalten verwendet, das durch einen Transientendetektor gesteuert wird. Hier wird das zu codierende Audiosignal vor einem Fenstern bzw. Blockieren geprüft, um zu bestimmen, ob das Audiosignal eine derartige Transiente aufweist oder nicht. Falls eine Transiente ermittelt wird, werden zum Codieren kurze Blöcke verwendet. Wenn jedoch ein Signalabschnitt ohne Transiente erfasst wird, wird eine lange Blocklänge verwendet. Somit wird bei derartigen üblichen Transformationscodierungsverfahren ein Blockschalten verwendet, um die Transformationslänge an das Signal anzupassen. Besonders dann, wenn niedrige Bitraten erzielt werden sollen, werden vorzugsweise sehr lange Transformationslängen verwendet, da das Verhältnis von Seiteninformationen zu nützlichen Informationen üblicherweise relativ unabhängig von der Blocklänge ist. Das bedeutet, dass die Menge an Seiteninformationen meistens dieselbe ist, unabhängig davon, ob der Block eine große Anzahl von Zeitabtastwerten des Audiosignals darstellt oder ob ein Block kurz ist, d. h. eine geringe Anzahl von Abtastwerten darstellt. Somit zielt man aus Gründen der Codierungseffizienz darauf ab, immer so lange Blocklängen wie möglich bzw. lange Transformationslängen in einem Transformationscodierer zu verwenden.
  • Dagegen muss für eine Transientenerfassung und ein Umschalten zu kurzen Fenstern bei dem Auftreten von nichtortsfesten Bereichen des Audiosignals eine Verarbeitungsanstrengung akzeptiert werden, die jedoch trotzdem dazu führt, dass das Signal in seiner codierten Form entweder nur mit einer guten Frequenzauflösung oder nur mit einer guten Zeitauflösung existiert.
  • Die Aufgabe der vorliegenden Erfindung besteht darin, ein verbessertes Konzept zum Codieren bzw. Decodieren zu liefern, um ein eine höhere Qualität aufweisendes und trotzdem effizientes Audiocodieren/-decodieren zu erhalten.
  • Diese Aufgabe wird durch eine Vorrichtung zum Codieren eines Audiosignals gemäß Anspruch 1, ein Verfahren zum Codieren eines Audiosignals gemäß Anspruch 7, eine Vorrichtung zum Decodieren eines codierten Audiosignals gemäß Anspruch 8, ein Verfahren zum Decodieren eines codierten Audiosignals gemäß Anspruch 9 oder ein Computerprogramm gemäß Anspruch 10 gelöst.
  • Die vorliegende Erfindung beruht auf dem Wissen, dass eine gute Codierungsqualität sowohl einer guten Frequenzauflösung als auch einer guten Zeitauflösung dadurch erzielt wird, dass im Sinn des Skalierbarkeitskonzepts ein erster Codierer eine erste Zeit-/Frequenzauflösung aufweist und dass ein zweiter Codierer eine zweite Zeit-/Frequenzauflösung aufweist, die sich voneinander unterscheiden, so dass der erste Codierer das ursprüngliche Audiosignal mit einer bestimmten Auflösung codiert, und dass der zweite Codierer dann mit einer bestimmten verschiedenen Auflösung bezüglich der Zeit bzw. der Frequenz arbeitet, so dass zwei Datenströme erhalten werden, die, wenn sie zusammen betrachtet werden, sowohl eine gute Zeitauflösung als auch eine gute Frequenzauflösung darstellen.
  • Außerdem wird nicht das ursprüngliche Audiosignal an den zweiten Codierer geliefert, sondern die Differenz zwischen dem ursprünglichen Audiosignal und dem codierten und wieder decodierten Ergebnis des ersten Codierers/Decodierers. Der Auflösungsfehler, den der erste Codierer machte, erscheint dann automatisch in dem Restsignal, das beispielsweise durch eine Differenzbildung erhalten wird, wobei das Restsignal üblicherweise Fehler aufweist, beispielsweise aufgrund der schlechten Zeitauflösung des Erstcodier-/-decodier-Pfades. Im Gegensatz dazu weist das Restsignal kaum diesbezügliche Frequenzfehler auf, da der Erstcodier-/-decodier-Pfad eine gute Frequenzauflösung aufwies. Somit kann das Restsignal ohne weiteres mit einem Codierer mit einer hohen Zeitauflösung (und somit einer schlechten Frequenzauflösung) codiert werden, um ein Signal als Zweitcodierungsausgangssignal zu erhalten, das eine gute Zeitauflösung, jedoch eine schlechte Frequenzauflösung aufweist, was jedoch nichts ausmacht, da das Erstcodier-Ausgangssignal bereits eine gute Frequenzauflösung aufweist und somit die bezüglich der Frequenz betrachtete Struktur des Audiosignals sehr gut reproduziert.
  • Bei einem bevorzugten Ausführungsbeispiel der vorliegenden Erfindung sind sowohl der erste Codierer als auch der zweite Codierer Transformationscodierer. Ferner ist bevorzugt, dass der erste Codierer mit einer hohen Frequenzauflösung (und somit einer schlechten Zeitauflösung), d. h. mit einer hohen Transformationslänge, betrieben wird, wohingegen der zweite Codierer mit einer hohen Zeitauflösung (und somit einer schlechten Frequenzauflösung) betrieben wird.
  • Gemäß der Erfindung hat man festgestellt, dass Artefakte im Zeitbereich, was Artefakte bedeutet, die auf eine schlechte Zeitauflösung zurückzuführen sind, in vielen Fällen eher akzeptiert werden als Artefakte im Frequenzbereich, d. h. Artefakte, die auf eine schlechte Frequenzauflösung zurückzuführen sind. Somit ist bevorzugt, den ersten Codierer mit einer hohen Frequenzauflösung zu betreiben, da dann lediglich das Erstcodier-Ausgangssignal von einem jeweiligen Decodierer ausreichend ist, um eine einigermaßen gute Audioausgabe zu erhalten, was in dem Skalierbarkeitskonzept enthalten ist.
  • Gemäß der Erfindung wird die Qualität des Erstcodierverfahrens durch den zweiten Codierer verbessert, indem eine Differenzbildung zwischen dem Ausgangssignal des Erstcodier-/-decodier-Pfades und dem ursprünglichen Audiosignal durchgeführt wird, und dass das resultierende Restsignal dann mit dem zweiten Codierer, der eine gute Zeitauflösung aufweist, codiert wird. Dieses Codieren ist besonders für das Restsignal günstig, da es bereits wenige tonale Elemente umfasst, da sie bereits durch das Erstcodierungsverfahren sehr gut und effizient festgehalten wurden.
  • Das bedeutende Defizit dieses Restsignals ist jedoch die schlechte Zeitauflösung, die sich in der Erzeugung eines Rauschens vor oder nach einer Transiente, d. h. eines Vorechos oder eines Nachechos, zeigt. Vorechos stören noch mehr als Nachechos, da sie für ein Subjekt ohne weiteres erfassbar sind. Dieses Rauschen ist sozusagen das Quantisierungsrauschen der Transiente und entspricht in seinem Spektralgehalt hauptsächlich der einen der Transiente und ist somit nicht tonal. Somit wird die Zeitauflösung auf effiziente Weise beträchtlich verbessert, indem das Transformationscodierungsverfahren mit kürzeren Blöcken, d. h. mit einer hohen Zeitauflösung, verwendet wird.
  • Somit wird gemäß der Erfindung ein Audiocodierungsverfahren mit einer hohen und höchsten Qualität erhalten, indem die Abschnitte des Audiosignals, die nicht tonal oder eher tonal sind, mit einem frequenzselektiven Transformationscodierungsverfahren mit langen Transformationslängen erfasst werden, während ein in Verarbeitungsrichtung nachgelagertes Codierungsverfahren mit einer kurzen Transformationslänge eine hohe Zeitauflösung für das Restsignal ermöglicht.
  • Bevorzugte Ausführungsbeispiele der vorliegenden Erfindung werden nachfolgend Bezug nehmend auf die beiliegenden Zeichnungen ausführlicher erörtert. Es zeigen:
  • 1 ein Blockdiagramm eines erfindungsgemäßen Codierungskonzepts;
  • 2 ein Blockdiagramm eines erfindungsgemäßen Codierungskonzepts gemäß einem bevorzugten Ausführungsbeispiel der vorliegenden Erfindung;
  • 3 ein Blockdiagramm eines erfindungsgemäßen Decodiererkonzepts;
  • 4a einen bekannten Transformationscodierer; und
  • 4b einen bekannten Transformationsdecodierer.
  • 1 zeigt eine Vorrichtung zum Codieren eines Audiosignals, das über einen Eingang 10 bereitgestellt wird. Zuerst wird das Audiosignal in einem ersten Codierer 12 mit einer ersten Zeit-/Frequenzauflösung zugeführt. Der erste Codierer 12 ist dahin gehend gebildet, ein Erstcodier-Ausgangssignal an einem Ausgang 14 zu erzeugen. Das Erstcodier-Ausgangssignal an dem Ausgang 14 des ersten Codierers 12 wird einerseits an einen Multiplexer 16 und andererseits an einen Decodierer 18 geliefert, der an den ersten Codierer angepasst ist und das Erstcodier-Ausgangssignal decodiert, um an einem Ausgang 20 des Decodierers 18 ein decodiertes Audiosignal zu liefern. Das decodierte Ausgangssignal 20 sowie das ursprüngliche Audiosignal 10 wird an eine Vergleichseinrichtung 22 geliefert. Die Vergleichseinrichtung 22 ist dahin gehend gebildet, das Audiosignal an dem Eingang 10 mit dem decodierten Audiosignal an dem Ausgang 20 zu vergleichen, was bedeutet nach dem Pfad von dem ersten Codierer 12 und dem Decodierer 18. Die Vergleichseinrichtung 22 ist besonders dahin gehend geformt, ein Restsignal an einem ihrer Ausgänge 24 zu liefern, wobei das Restsignal eine Differenz zwischen dem Audiosignal und dem decodierten Audiosignal umfasst. Dieses Restsignal 24 wird an einen zweiten Codierer 26 geliefert, der dahin gehend gebildet ist, das Restsignal an dem Ausgang 24 der Vergleichseinrichtung 22 zu codieren, um ein Zweitcodier-Ausgangssignal an einem Ausgang 28 zu liefern, das auch an den Multiplexer 16 geliefert wird. Der Multiplexer 16 ist dahin gehend gebildet, das Erstcodier-Ausgangssignal und das Zweitcodier-Ausgangssignal zu kombinieren und daraus ein codiertes Audiosignal an einem Ausgang 30 zu erzeugen, falls nötig unter Berücksichtigung entsprechender Nebeninformationen und Bitstromsyntax-Konventionen.
  • Gemäß der Erfindung weist der erste Codierer eine erste Zeit- oder Frequenzauflösung auf, und der zweite Codierer weist eine zweite Zeit- oder Frequenzauflösung auf. Gemäß der vorliegenden Erfindung unterscheiden sich die erste Auflösung des ersten Codierers und die zweite Auflösung des zweiten Codierers, so dass das Erstcodier-Ausgangssignal entweder bezüglich der Zeit oder der Frequenz gut codiert ist und dass das Zweitcodier-Ausgangssignal bezüglich der Frequenz oder der Zeit gut codiert ist, so dass das codierte Audiosignal an dem Ausgang des Multiplexers 16 sowohl eine hohe Zeitauflösung als auch eine hohe Frequenzauflösung aufweist.
  • Nachstehend wird unter Bezugnahme auf 2 ein bevorzugtes Ausführungsbeispiel der vorliegenden Erfindung veranschaulicht. Hier wird ein Audiosignal 10 einer Verzögerung durch ein Verzögerungsbauglied 32 unterworfen, bevor es an die Vergleichseinrichtung 22 geliefert wird, die in 2 als Differenzbauglied veranschaulicht ist, so dass bei dem in 2 gezeigten bevorzugten Ausführungsbeispiel durch das Differenzbauglied 22 eine auf den Abtastwert bezogene Differenzbildung in Echtzeit zwischen dem decodierten Audiosignal an dem Ausgang des Decodierers 18 und dem (verzögerten) Audiosignal an dem Ausgang des Verzögerungsbauglieds 32 durchgeführt werden kann.
  • Bei dem in 2 gezeigten Ausführungsbeispiel sind ferner der erste Codierer, d. h. der Codierer 12 in 2, und der zweite Codierer 26, der in 2 als Differenzcodierer bezeichnet wird, dahin gehend gebildet, eine Transformationscodierung durchzuführen.
  • Ferner ist bevorzugt, dass der erste Codierer 12 eine Codierung mit einer langen Transformationslänge, d. h. einer hohen Frequenzauflösung und somit einer geringen Zeitauflösung, durchführt, während der zweite Codierer 26 eine Codierung mit einer kurzen Transformationslänge, was eine hohe Zeitauflösung und einhergehend damit eine geringe Frequenzauflösung bedeutet, durchführt.
  • Obwohl der erste Codierer im Prinzip auch mit kurzen Transformationslängen und der Differenzcodierer mit langen Transformationslängen arbeiten könnten, ist es trotzdem bevorzugt, den ersten Codierer mit langen Transformationslängen zu betreiben, da, wie bereits erläutert wurde, Zeitartefakte eher weniger problematisch für einen Zuhörer sind als Frequenzartefakte. Somit kann ein Codierer, der lediglich das Erstcodier-Ausgangssignal an dem Ausgang 14, jedoch nicht das Zweitcodier-Ausgangssignal an dem Ausgang 28 verarbeiten kann, eine angenehmere Reproduktion erzeugen, wenn der erste Codierer mit langen Transformationslängen arbeitet als wenn der erste Codierer mit kurzen Transformationslängen arbeiten würde.
  • Jegliche Einrichtung zum Umwandeln eines Blocks von Zeitabtastwerten in eine spektrale Darstellung kann als Transformationsalgorithmus in dem ersten Codierer und/oder dem zweiten Codierer der 2 verwendet werden, z. B. eine Fourier-Transformation, eine diskrete Fourier-Transformation, eine schnelle Fourier-Transformation, eine diskrete Cosinus-Transformation, eine modifizierte diskrete Cosinus-Transformation usw. Alternativ dazu kann eine Filterbank mit einer geringen Anzahl von Kanälen verwendet werden, z. B. eine 64-Kanal-Filterbank, eine 128-Kanal-Filterbank oder eine Filterbank mit mehr oder weniger Kanälen.
  • Bei einem anderen Ausführungsbeispiel der vorliegenden Erfindung kann der erste Codierer 12 ein SBR-Codierer sein, der dahin gehend gebildet ist, ein Erstcodier-Ausgangssignal zu liefern, das lediglich Informationen bis zu einer Grenzfrequenz umfasst, die geringer ist als die Grenzfrequenz des Audiosignals an dem Audioeingang 10. Typische SBR-Codierer extrahieren Nebeninformationen aus dem Audiosignal, die für eine Hochfrequenz-Rekonstruktion in einem SBR-Decodierer verwendet werden können, um das hohe Band, d. h. das Band des Audiosignals, das über der Grenzfrequenz des Erstcodier-Ausgangssignals liegt, mit einer so hohen Qualität wie möglich zu rekonstruieren. Jedoch ist der Decodierer 18 in 2 kein derartiger SBR-Decodierer mit einer Hochfrequenz-Rekonstruktion, sondern ein üblicher Transformationsdecodierer, der an den ersten Codierer 12 angepasst ist, um das Codierausgangssignal unabhängig davon, dass dasselbe Band begrenzt ist, einfach zu decodieren, so dass das Ausgangssignal des Decodierers 18 an dem Ausgang 20 ebenfalls eine geringere Grenzfrequenz aufweist als das ursprüngliche Audiosignal.
  • In diesem Fall würde das Restsignal bis zu der Grenzfrequenz den Codier-/Decodierfehler des Pfades des Codierers 12 und des Decodierers umfassen, wäre jedoch das vollständige Audiosignal oberhalb der Grenzfrequenz.
  • In diesem Fall könnte das Restsignal entweder auch mit einem Differenzcodierer 26 codiert werden, der kurze Transformationslängen verwendet, da es dem ursprünglichen Audiosignal oberhalb der Grenzfrequenz des Erstcodier-Ausgangssignals entspricht. Alternativ könnte jedoch lediglich der Spektralbereich des Restsignals bis zu der Grenzfrequenz des Erstcodier-Ausgangssignals mit dem Differenzcodierer 26 codiert werden, während der hochfrequente Abschnitt des Restsignals erneut mit dem ersten Codierer 12 mit den langen Transformationslängen codiert wird, um auch eine Hochfrequenzauflösung in dem hochfrequenten Teil des Audiosignals zu erhalten.
  • Das Ausgangssignal des Codierers 12 für das Hochfrequenzband kann anschließend erneut mit dem jeweiligen Band des ursprünglichen Audiosignals verglichen werden, um das Differenzsignal erneut mit dem Differenzcodierer 26 zu codieren, so dass am Ende vier Datenströme an den Multiplexer 16 geliefert werden, die, wenn sie alle miteinander decodiert werden, eine transparente Reproduktion, d. h. eine Reproduktion ohne Artefakte, ermöglichen.
  • Gemäß der Erfindung ist es nicht von Bedeutung, dass der erste Codierer und der zweite Codierer unter Verwendung eines psychoakustischen Modells arbeiten. Jedoch ist es aus Gründen der Dateneffizienz bevorzugt, dass zumindest der erste Codierer 12 unter Verwendung eines psychoakustischen Modells arbeitet. In Abhängigkeit von den Ressourcen könnte der zweite Codierer dann auf verlustfreie Weise codieren, wenn jeweilige Übertragungskanalressourcen vorliegen, so dass eine vollständig transparente Reproduktion erzielt wird. Alternativ dazu könnte der zweite Codierer ebenfalls unter Verwendung eines psychoakustischen Modells arbeiten, wobei bevorzugt ist, dass das psychoakustische Modell in diesem Fall nicht erneut vollständig für den zweiten Codierer berechnet wird, sondern dass zumindest Teile desselben bzw. die ganze psychoakustische Maskierungsschwelle unter Berücksichtigung der unterschiedlichen Transformationslängen des ersten Codierers im Vergleich zu dem zweiten Codierer „wieder verwendet" werden kann bzw. können. Dies kann beispielsweise dadurch erfolgen, dass die psychoakustische Maskierungsschwelle, die durch den ersten Codierer berechnet wird, unmittelbar für den zweiten Codierer verwendet wird, wobei jedoch beispielsweise eine „Sicherheits-Überlast" von z. B. 3 dB verwendet wird, um die kürzeren Transformationslängen des zweiten Codierers zu berücksichtigen, so dass die psychoakustische Maskierungsschwelle für den zweiten Codierer um z. B. 3 dB oder einen anderen vorbestimmten Betrag geringer ist als die psychoakustische Maskierungsschwelle für den ersten Codierer 12.
  • Bezüglich der Transformationslängen ist bevorzugt, dass die Transformationslänge des ersten Codierers eine ganzzahlige Vielzahl der Transformationslänge des zweiten Codierers ist. Auf diese Weise kann die Transformationslänge des ersten Codierers beispielsweise doppelt so viele, dreimal so viele, viermal so viele oder fünfmal so viele Abtastwerte des Audiosignals aufweisen wie die Transformationslänge des zweiten Codierers 26. Diese ganzzahlige Beziehung zwischen der Transformationslänge des ersten und des zweiten Codierers ist deshalb bevorzugt, da eine relativ gute Wiederverwendung von Codierdaten des ersten Codierers für den zweiten Codierer möglich wird. Dagegen wäre auch eine nicht-ganzzahlige Beziehung zwischen der Transformations länge unproblematisch, da der erste Codierer 12 und der zweite Codierer 26 auch auf eine nicht aufeinander synchronisierte Weise laufen können, solange dies entsprechend einem Decodierer berichtet wird, so dass derselbe die Summierung mit den korrekten Abtastwerten durchführt, was die Umkehrung der auf Abtastwerte bezogenen Differenzbildung bei dem Element 22 der 2 bedeutet.
  • 3 zeigt einen Decodierer zum Decodieren eines codierten Audiosignals gemäß der vorliegenden Erfindung. Das codierte Audiosignal, das an dem Ausgang 30 der 1 bzw. der 2 ausgegeben wird, wird nach einer Übertragung, Speicherung usw. an einen Eingang 40 des Decodierers in 3 geliefert. Der Eingang 40 ist zuerst mit einer Extraktionseinrichtung 42 gekoppelt, die die Funktionalität eines Bitstromdemultiplexers aufweist, um zuerst das Erstcodier-Ausgangssignal aus dem codierten Audiosignal zu extrahieren und es an einem Ausgang 44 bereitzustellen, und die ferner dahin gehend gebildet ist, das codierte Restsignal bzw. das Differenzsignal bzw. das zweite codierte Audiosignal an einem Ausgang 46 bereitzustellen. Das Erstcodier-Ausgangssignal wird an einen ersten Decodierer geliefert, der an den ersten Codierer 12 der erfindungsgemäßen Vorrichtung zum Codieren, die in 1 gezeigt ist, angepasst ist und im Prinzip identisch mit dem Decodierer 18 der 1 sein kann. Dies bedeutet, dass der erste Decodierer 48 erneut dieselbe Zeit-/Frequenzauflösung aufweist, was bedeutet, dass er beispielsweise mit derselben Transformationslänge arbeitet wie der Codierer 12 der 1. Das Zweitcodier-Ausgangssignal an dem Ausgang 46 der Extraktionseinrichtung wird an einen zweiten Decodierer 50 geliefert, der an den zweiten Codierer 26 der 1 angepasst ist und somit die zweite Zeit-/Frequenzauflösung aufweist, was eine Zeit-/Frequenzauflösung bedeutet, die identisch mit der Zeit-/Frequenzauflösung des zweiten Codierers 26 in 1 ist.
  • Auf der Ausgangsseite stellt der erste Codierer 48 das decodierte Audiosignal, das identisch mit dem Signal an dem Ausgang 20 der 2 sein kann, bereit. Analog dazu stellt der zweite Decodierer 50 das decodierte Restsignal an seinem Ausgang bereit. Es ist zu beachten, dass beide Decodierer im Prinzip gemäß der Veranschaulichung in Bezug auf 4b gebildet sein können, wobei sich dieselben jedoch bezüglich ihrer Transformationslängen und somit bezüglich der verwendeten Synthesefilterbänke unterscheiden können.
  • Sowohl das decodierte Audiosignal an dem Ausgang 52 in 3 als auch das decodierte Restsignal an dem Ausgang 54 der 3 werden an eine Kombinationseinrichtung 56 geliefert, die bei einem bevorzugten Ausführungsbeispiel der vorliegenden Erfindung eine auf Abtastwerte bezogene Summierung durchführt, was allgemein eine Operation bedeutet, die umgekehrt zu der Vergleichsoperation ist, die bei dem Codierer in dem Element 22 der 1 durchgeführt wurde. Auf der Ausgangsseite stellt die Kombinationseinrichtung 56 an einem Ausgang 58 der Decodiervorrichtung der 3 ein Ausgangssignal bereit, das aufgrund der vorliegenden Erfindung sowohl durch eine gute Zeitauflösung als auch eine gute Frequenzauflösung herausragt, d. h. es umfasst sowohl wenige Frequenzartefakte als auch wenige Zeitartefakte.
  • Je nach den Umständen kann das erfindungsgemäße Verfahren zum Codieren, wie es unter Bezug auf 1 veranschaulicht ist, oder das erfindungsgemäße Verfahren zum Decodieren, wie es unter Bezug auf 3 veranschaulicht ist, in Hardware oder in Software implementiert sein. Die Implementierung kann an einem digitalen Speicherungsmedium, besonders einer Platte oder einer CD mit elektronisch lesbaren Steuersignalen, durchgeführt werden, die mit einem programmierbaren Computersystem interagieren kann, so dass das jeweilige Verfahren ausgeführt wird. Somit besteht die Erfindung allgemein auch aus einem Computerprogrammprodukt mit einem Programmcode, der auf einem maschinenlesbaren Träger gespeichert ist, zum Durchführen des erfindungsgemäßen Verfahrens, wenn das Computerprogrammprodukt auf einem Computer läuft. Mit anderen Worten kann die Erfindung auch als Computerprogramm mit einem Programmcode zum Durchführen des Verfahrens verwirklicht werden, wenn das Computerprogramm auf einem Computer läuft.

Claims (10)

  1. Vorrichtung zum Codieren eines Audiosignals, die folgende Merkmale aufweist: einen ersten Transformationscodierer (12) zum Erzeugen eines Erstcodier-Ausgangssignals aus dem Audiosignal, wobei der erste Transformationscodierer dahin gehend angepasst ist, einen Block mit einer ersten Anzahl von Zeitabtastwerten des Audiosignals in eine spektrale Darstellung umzuwandeln, um das Erstcodier-Ausgangssignal zu erhalten; einen Decodierer (18), der an den ersten Codierer (12) angepasst ist, zum Decodieren des Erstcodier-Ausgangssignals, um ein decodiertes Audiosignal bereitzustellen; eine Vergleichseinrichtung (22) zum Vergleichen des Audiosignals mit dem decodierten Audiosignal, wobei die Vergleichseinrichtung (22) dahin gehend angepasst ist, ein Restsignal bereitzustellen, wobei das Restsignal eine Differenz zwischen dem Audiosignal und dem decodierten Audiosignal umfasst; einen zweiten Transformationscodierer (26) zum Codieren des Restsignals, um ein Zweitcodier-Ausgangssignal bereitzustellen, wobei der zweite Transformationscodierer dahin gehend angepasst ist, einen Block mit einer zweiten Anzahl von Zeitabtastwerten des Audiosignals in eine spektrale Darstellung umzuwandeln, um das Zweitcodier-Ausgangssignal zu erhalten, wobei der erste Transformationscodierer und der zweite Transformationscodierer angepasst sind, so dass die erste Anzahl von Zeitabtastwerten des Audiosignals größer ist als die zweite Anzahl von Zeitabtastwerten des Audiosignals, und dass der erste Codierer (12) eine geringe Zeitauflösung und eine hohe Frequenzauflösung aufweist und dass der zweite Codierer (26) eine hohe Zeitauflösung und eine geringe Frequenzauflösung aufweist; und einen Multiplexer (16) zum Kombinieren des Erstcodier-Ausgangssignals und des Zweitcodier-Ausgangssignals, um ein codiertes Audiosignal zu erhalten.
  2. Vorrichtung gemäß Anspruch 1, bei der der erste Codierer (12) und der zweite Codierer (26) eine Filterbank oder einen Transformationsalgorithmus aufweisen, die beziehungsweise der eine Fourier-Transformation, eine diskrete Fourier-Transformation, eine schnelle Fourier-Transformation, eine diskrete Cosinus-Transformation oder eine modifizierte diskrete Cosinus-Transformation umfasst.
  3. Vorrichtung gemäß Anspruch 1 oder Anspruch 2, bei der der Decodierer (18) dahin gehend angepasst ist, ein zeitdiskretes decodiertes Audiosignal mit einer Sequenz von Abtastwerten bereitzustellen, wobei das Audiosignal ein zeitdiskretes Audiosignal mit einer Sequenz von Abtastwerten ist, und wobei die Vergleichseinrichtung (22) dahin gehend ausgelegt ist, eine auf Abtastwerte bezogene Differenzbildung durchzuführen, um das Restsignal zu erhalten.
  4. Vorrichtung gemäß einem der vorhergehenden Ansprüche, die ferner folgendes Merkmal aufweist: ein Verzögerungsbauglied (32) zum Verzögern des Audiosignals, wobei das Verzögerungsbauglied (32) dahin ge hend angepasst ist, eine Verzögerung aufzuweisen, die von einer Verzögerung abhängt, die dem ersten Codierer (12) und dem Decodierer (18) zugeordnet ist.
  5. Vorrichtung gemäß einem der vorhergehenden Ansprüche, bei der der Multiplexer (16) dahin gehend angepasst ist, das codierte Audiosignal zu erzeugen, so dass das Erstcodier-Ausgangssignal unabhängig von dem Zweitcodier-Ausgangssignal decodiert werden kann.
  6. Vorrichtung gemäß einem der vorhergehenden Ansprüche, bei der der erste Codierer (12) dahin gehend angepasst ist, das Audiosignal einer Bandbegrenzung zu unterwerfen, so dass das Erstcodier-Ausgangssignal eine obere Grenzfrequenz aufweist, die geringer ist als eine obere Grenzfrequenz des Audiosignals, wobei die Vergleichseinrichtung (22) ein Restsignal liefert, das dem Audiosignal oberhalb der oberen Grenzfrequenz des Erstcodier-Ausgangssignals entspricht, und wobei der zweite Codierer (26) dahin gehend angepasst ist, einen Abschnitt des Restsignals oberhalb der oberen Grenzfrequenz des ersten Codierers mit einer Zeit- oder Frequenzauflösung zu codieren, die sich von der zweiten Auflösung unterscheidet oder gleich der zweiten Auflösung ist.
  7. Verfahren zum Codieren eines Audiosignals, das folgende Schritte umfasst: Erzeugen (12) eines ersten Ausgangssignals mit einer ersten Zeit- oder Frequenzauflösung aus dem Audiosignal, wobei der Schritt des Erzeugens (12) den Schritt des Umwandelns eines Blocks mit einer ersten Anzahl von Zeitabtastwerten des Audiosignals in eine spektrale Darstellung, um das erste Ausgangssignal zu erhalten, umfasst; Decodieren des Erstcodier-Ausgangssignals, um ein decodiertes Audiosignal bereitzustellen; Vergleichen (22) des Audiosignals mit dem decodierten Audiosignal, um ein Restsignal bereitzustellen, wobei das Restsignal eine Differenz zwischen dem Audiosignal und den decodierten Audiosignalen umfasst; Codieren (26) des Restsignals mit einer zweiten Zeit- oder Frequenzauflösung, um ein zweites Ausgangssignal zu liefern, wobei der Schritt des Codierens (26) den Schritt des Umwandelns eines Blocks mit einer zweiten Anzahl von Zeitabtastwerten des Audiosignals in eine spektrale Darstellung, um das zweite Ausgangssignal zu erhalten, umfasst; wobei der Schritt des Erzeugens (12) und der Schritt des Codierens (26) dahin gehend angepasst sind, dass die erste Anzahl von Zeitabtastwerten des Audiosignals größer ist als die zweite Anzahl von Zeitabtastwerten des Audiosignals, und dass das erste Ausgangssignal eine geringe Zeitauflösung und eine hohe Frequenzauflösung aufweist und dass das zweite Ausgangssignal eine hohe Zeitauflösung und eine geringe Frequenzauflösung aufweist; und Kombinieren (16) des Erstcodier-Ausgangssignals und des Zweitcodier-Ausgangssignals, um ein codiertes Audiosignal zu erhalten.
  8. Vorrichtung zum Decodieren eines codierten Audiosignals, um ein Ausgangssignal zu erhalten, wobei das codierte Audiosignal ein Erstcodier-Ausgangssignal aufweist, das mit einer geringen Zeitauflösung und einer hohen Frequenzauflösung codiert ist, und wobei das codierte Audiosignal ferner ein Zweitcodier-Ausgangssignal aufweist, das ein Restsignal darstellt, das mit einer hohen Zeitauflösung und einer geringen Frequenzauflösung codiert ist, was einen Unterschied zwischen einem ursprünglichen Audiosignal und einem decodierten Audiosignal darstellt, wobei das decodierte Audiosignal durch ein Decodieren des Erstcodier-Ausgangssignals erhalten wird, wobei das Erstcodier-Ausgangssignal unter Verwendung eines ersten Transformationscodierers erzeugt wurde, wobei der erste Transformationscodierer dahin gehend angepasst ist, einen Block mit einer hohen Anzahl von Zeitabtastwerten des Audiosignals in eine spektrale Darstellung umzuwandeln, um das Erstcodier-Ausgangssignal zu erhalten, wobei das Zweitcodier-Ausgangssignals unter Verwendung eines zweiten Transformationscodierers erzeugt wurde, und wobei der zweite Transformationscodierer dahin gehend angepasst ist, einen Block mit einer geringen Anzahl von Zeitabtastwerten des Audiosignals in eine spektrale Darstellung umzuwandeln, um das Zweitcodier-Ausgangssignal zu erhalten, wobei die Vorrichtung folgende Merkmale aufweist: eine Extraktionseinrichtung (42) zum Extrahieren des Erstcodier-Ausgangssignals und des Zweitcodier-Ausgangssignals aus dem codierten Audiosignal; einen ersten Transformationsdecodierer (48), der an den ersten Transformationscodierer angepasst ist, zum Decodieren des Erstcodier-Ausgangssignals, um das decodierte Audiosignal zu erhalten, wobei der erste Decodierer (48) dahin gehend angepasst ist, mit der geringen Zeitauflösung und der hohen Frequenzauflösung zu arbeiten, und wobei der erste Transformationsdecodierer (48) dahin gehend angepasst ist, einen Block mit einer ersten Anzahl von Spektralwerten in eine zeitliche Darstellung umzuwandeln; einen zweiten Transformationsdecodierer (50), der an den zweiten Transformationscodierer angepasst ist, zum Decodieren des Zweitcodier-Ausgangssignals, um ein de codiertes Restsignal zu erhalten, wobei der zweite Decodierer dahin gehend angepasst ist, mit der hohen Zeitauflösung und der geringen Frequenzauflösung zu arbeiten, und wobei der zweite Transformationsdecodierer (50) dahin gehend angepasst ist, einen Block mit einer zweiten Anzahl von Spektralwerten in eine zeitliche Darstellung umzuwandeln, wobei die zweite Anzahl geringer ist als die erste Anzahl, und eine Kombinationseinrichtung (56) zum Kombinieren des decodierten Audiosignals und des decodierten Restsignals, um das Ausgangssignal zu erhalten.
  9. Verfahren zum Decodieren eines codierten Audiosignals, um ein Ausgangssignal zu erhalten, wobei das codierte Audiosignal ein Erstcodier-Ausgangssignal aufweist, das mit einer geringen Zeitauflösung und einer hohen Frequenzauflösung codiert ist, und wobei das codierte Audiosignal ferner ein Zweitcodier-Ausgangssignal aufweist, das ein Restsignal darstellt, das mit einer hohen Zeitauflösung und einer geringen Frequenzauflösung codiert ist, was einen Unterschied zwischen einem ursprünglichen Audiosignal und einem decodierten Audiosignal darstellt, wobei das decodierte Audiosignal durch ein Decodieren des Erstcodier-Ausgangssignals erhalten wird, wobei das Erstcodier-Ausgangssignal unter Verwendung eines ersten Transformationscodierers erzeugt wurde, wobei der erste Transformationscodierer dahin gehend angepasst ist, einen Block mit einer hohen Anzahl von Zeitabtastwerten des Audiosignals in eine spektrale Darstellung umzuwandeln, um das Erstcodier-Ausgangssignal zu erhalten, wobei das Zweitcodier-Ausgangssignal unter Verwendung eines zweiten Transformationscodierers erzeugt wurde, und wobei der zweite Transformationscodierer dahin gehend angepasst ist, einen Block mit einer geringen Anzahl von Zeitabtastwerten des Audiosignals in eine spektrale Darstellung umzuwandeln, um das Zweitcodier-Ausgangssignal zu erhalten, wobei das Verfahren folgende Schritte umfasst: Extrahieren (42) des Erstcodier-Ausgangssignals und des Zweitcodier-Ausgangssignals aus dem codierten Audiosignal; Decodieren (48), angepasst an den ersten Transformationscodierer, des Erstcodier-Ausgangssignals, um das decodierte Audiosignal zu erhalten, wobei der Schritt des Decodierens (48) dahin gehend angepasst ist, mit der geringen Zeitauflösung und der hohen Frequenzauflösung zu arbeiten, und wobei der Schritt des Decodierens (98) dahin gehend angepasst ist, einen Block mit einer ersten Anzahl von Spektralwerten in eine zeitliche Darstellung umzuwandeln; Decodieren (50), angepasst an den zweiten Transformationscodierer, des Zweitcodier-Ausgangssignals, um ein decodiertes Restsignal zu erhalten, wobei der Schritt des Decodierens dahin gehend angepasst ist, mit der hohen Zeitauflösung und der geringen Frequenzauflösung zu arbeiten, und wobei der Schritt des Decodierens (50) dahin gehend angepasst ist, einen Block mit einer zweiten Anzahl von Spektralwerten in eine zeitliche Darstellung umzuwandeln, wobei die zweite Anzahl geringer ist als die erste Anzahl, und Kombinieren (56) des decodierten Audiosignals und des decodierten Restsignals, um das Ausgangssignal zu erhalten.
  10. Computerprogramm mit einem Programmcode, der alle Schritte des Verfahrens gemäß Anspruch 7 oder 9 durchführt, wenn das Programm auf einem Computer läuft.
DE602004005197T 2003-06-25 2004-06-24 Vorrichtung und verfahren zum kodieren eines audiosignals und vorrichtung und verfahren zum dekodieren eines kodierten audiosignals Active DE602004005197T2 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
DE10328777 2003-06-25
DE10328777A DE10328777A1 (de) 2003-06-25 2003-06-25 Vorrichtung und Verfahren zum Codieren eines Audiosignals und Vorrichtung und Verfahren zum Decodieren eines codierten Audiosignals
PCT/EP2004/006850 WO2005001813A1 (en) 2003-06-25 2004-06-24 Apparatus and method for encoding an audio signal and apparatus and method for decoding an encoded audio signal

Publications (2)

Publication Number Publication Date
DE602004005197D1 DE602004005197D1 (de) 2007-04-19
DE602004005197T2 true DE602004005197T2 (de) 2007-06-28

Family

ID=33546670

Family Applications (2)

Application Number Title Priority Date Filing Date
DE10328777A Withdrawn DE10328777A1 (de) 2003-06-25 2003-06-25 Vorrichtung und Verfahren zum Codieren eines Audiosignals und Vorrichtung und Verfahren zum Decodieren eines codierten Audiosignals
DE602004005197T Active DE602004005197T2 (de) 2003-06-25 2004-06-24 Vorrichtung und verfahren zum kodieren eines audiosignals und vorrichtung und verfahren zum dekodieren eines kodierten audiosignals

Family Applications Before (1)

Application Number Title Priority Date Filing Date
DE10328777A Withdrawn DE10328777A1 (de) 2003-06-25 2003-06-25 Vorrichtung und Verfahren zum Codieren eines Audiosignals und Vorrichtung und Verfahren zum Decodieren eines codierten Audiosignals

Country Status (7)

Country Link
US (1) US7275031B2 (de)
EP (1) EP1636791B1 (de)
JP (1) JP2009513992A (de)
CN (1) CN1809872B (de)
DE (2) DE10328777A1 (de)
HK (1) HK1083664A1 (de)
WO (1) WO2005001813A1 (de)

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7539870B2 (en) * 2004-02-10 2009-05-26 Microsoft Corporation Media watermarking by biasing randomized statistics
CN101124626B (zh) * 2004-09-17 2011-07-06 皇家飞利浦电子股份有限公司 用于最小化感知失真的组合音频编码
US9626973B2 (en) * 2005-02-23 2017-04-18 Telefonaktiebolaget L M Ericsson (Publ) Adaptive bit allocation for multi-channel audio encoding
ATE521143T1 (de) 2005-02-23 2011-09-15 Ericsson Telefon Ab L M Adaptive bitzuweisung für die mehrkanal- audiokodierung
US7548853B2 (en) * 2005-06-17 2009-06-16 Shmunk Dmitry V Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding
WO2007090988A2 (fr) * 2006-02-06 2007-08-16 France Telecom Procede et dispositif de codage hierarchique d'un signal audio source, procede et dispositif de decodage, programmes et signal correspondants
EP1855271A1 (de) * 2006-05-12 2007-11-14 Deutsche Thomson-Brandt Gmbh Verfahren und Vorrichtung zur Wiederkodierung von Signalen
GB2443911A (en) * 2006-11-06 2008-05-21 Matsushita Electric Ind Co Ltd Reducing power consumption in digital broadcast receivers
JP5103880B2 (ja) * 2006-11-24 2012-12-19 富士通株式会社 復号化装置および復号化方法
KR101422745B1 (ko) * 2007-03-30 2014-07-24 한국전자통신연구원 다채널로 구성된 다객체 오디오 신호의 인코딩 및 디코딩장치 및 방법
EP2015293A1 (de) * 2007-06-14 2009-01-14 Deutsche Thomson OHG Verfahren und Vorrichtung zur Kodierung und Dekodierung von Audiosignalen über adaptiv geschaltete temporäre Auflösung in einer Spektraldomäne
US20090006081A1 (en) * 2007-06-27 2009-01-01 Samsung Electronics Co., Ltd. Method, medium and apparatus for encoding and/or decoding signal
KR101303441B1 (ko) * 2007-10-17 2013-09-10 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 다운믹스를 이용한 오디오 코딩
KR101441897B1 (ko) * 2008-01-31 2014-09-23 삼성전자주식회사 잔차 신호 부호화 방법 및 장치와 잔차 신호 복호화 방법및 장치
CN101527138B (zh) * 2008-03-05 2011-12-28 华为技术有限公司 超宽带扩展编码、解码方法、编解码器及超宽带扩展系统
EP2139000B1 (de) * 2008-06-25 2011-05-25 Thomson Licensing Verfahren und Vorrichtung zur Kodierung und Dekodierung von Sprache bzw. Nicht-Sprache-Audioeingabesignalen
PT3300076T (pt) 2008-07-11 2019-07-17 Fraunhofer Ges Forschung Codificador de áudio e descodificador de áudio
CN101729198B (zh) * 2008-10-27 2014-04-02 华为技术有限公司 一种编解码方法、装置及系统
RU2523035C2 (ru) * 2008-12-15 2014-07-20 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Аудио кодер и декодер, увеличивающий полосу частот
EP3364414B1 (de) 2008-12-15 2022-04-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audiobandbreitenerweiterungsdecodierer, korrespondierendes verfahren und computerprogramm
WO2011047887A1 (en) * 2009-10-21 2011-04-28 Dolby International Ab Oversampling in a combined transposer filter bank
AU2010332925B2 (en) * 2009-12-16 2013-07-11 Dolby International Ab SBR bitstream parameter downmix
EP2524979B1 (de) 2010-01-15 2016-11-02 Mitsubishi Chemical Corporation Einkristall-substrat und verfahren zur herstellung eines gruppe-iii-element-nitridkristalls
CN102263771B (zh) * 2010-05-26 2014-03-19 中国移动通信集团公司 移动终端、适配器及多媒体数据的播放方法和系统
SG10201503004WA (en) 2010-07-02 2015-06-29 Dolby Int Ab Selective bass post filter
CN106409299B (zh) * 2012-03-29 2019-11-05 华为技术有限公司 信号编码和解码的方法和设备
EP2688066A1 (de) * 2012-07-16 2014-01-22 Thomson Licensing Verfahren und Vorrichtung zur Codierung von Mehrkanal-HOA-Audiosignalen zur Rauschreduzierung sowie Verfahren und Vorrichtung zur Decodierung von Mehrkanal-HOA-Audiosignalen zur Rauschreduzierung
CN110010140B (zh) * 2013-04-05 2023-04-18 杜比国际公司 立体声音频编码器和解码器
EP3704863B1 (de) * 2017-11-02 2022-01-26 Bose Corporation Audioverteilung mit niedriger latenzzeit
CN111444382B (zh) * 2020-03-30 2021-08-17 腾讯科技(深圳)有限公司 一种音频处理方法、装置、计算机设备以及存储介质
CN112104952B (zh) * 2020-11-19 2021-05-11 首望体验科技文化有限公司 应用于720度球幕全景影院的全景声音频系统
EP4303872A1 (de) * 2022-07-07 2024-01-10 Technische Universität München Kodierungsvorrichtung und kodierungsverfahren zur mehrkanalkodierung von vibrotaktilen signalen sowie dekodierung und dekodierungsverfahren

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02143735A (ja) * 1988-11-25 1990-06-01 Victor Co Of Japan Ltd 音声多段符号化伝送方式
JP2906646B2 (ja) * 1990-11-09 1999-06-21 松下電器産業株式会社 音声帯域分割符号化装置
US5732391A (en) * 1994-03-09 1998-03-24 Motorola, Inc. Method and apparatus of reducing processing steps in an audio compression system using psychoacoustic parameters
JPH07261799A (ja) * 1994-03-18 1995-10-13 Pioneer Electron Corp 直交変換符号化装置及び方法
JP3186413B2 (ja) * 1994-04-01 2001-07-11 ソニー株式会社 データ圧縮符号化方法、データ圧縮符号化装置及びデータ記録媒体
JPH0846517A (ja) * 1994-07-28 1996-02-16 Sony Corp 高能率符号化及び復号化システム
JP3139602B2 (ja) * 1995-03-24 2001-03-05 日本電信電話株式会社 音響信号符号化方法及び復号化方法
DE19549621B4 (de) * 1995-10-06 2004-07-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung zum Codieren von Audiosignalen
JP3246715B2 (ja) * 1996-07-01 2002-01-15 松下電器産業株式会社 オーディオ信号圧縮方法,およびオーディオ信号圧縮装置
US6092041A (en) * 1996-08-22 2000-07-18 Motorola, Inc. System and method of encoding and decoding a layered bitstream by re-applying psychoacoustic analysis in the decoder
TW384434B (en) * 1997-03-31 2000-03-11 Sony Corp Encoding method, device therefor, decoding method, device therefor and recording medium
KR100261254B1 (ko) * 1997-04-02 2000-07-01 윤종용 비트율 조절이 가능한 오디오 데이터 부호화/복호화방법 및 장치
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
DE19743662A1 (de) * 1997-10-02 1999-04-08 Bosch Gmbh Robert Verfahren und Vorrichtung zur Erzeugung eines bitratenskalierbaren Audio-Datenstroms
US6263312B1 (en) * 1997-10-03 2001-07-17 Alaris, Inc. Audio compression and decompression employing subband decomposition of residual signal and distortion reduction
US6446037B1 (en) * 1999-08-09 2002-09-03 Dolby Laboratories Licensing Corporation Scalable coding method for high quality audio
EP1131815A1 (de) * 1999-09-20 2001-09-12 Cellon France SAS Verarbeitungsschaltkreis für fehlerkorrektur von audiosignalen, empfänger, fernmeldesystem, mobiles endgerät, sowie verfahren hierfür
US6377916B1 (en) * 1999-11-29 2002-04-23 Digital Voice Systems, Inc. Multiband harmonic transform coder
JP3609323B2 (ja) * 2000-05-08 2005-01-12 日本電信電話株式会社 楽音符号化方法および楽音復号化方法、符号生成方法およびこれらの方法を実行するプログラムを記録した記録媒体
US7171355B1 (en) * 2000-10-25 2007-01-30 Broadcom Corporation Method and apparatus for one-stage and two-stage noise feedback coding of speech and audio signals
SE0004187D0 (sv) * 2000-11-15 2000-11-15 Coding Technologies Sweden Ab Enhancing the performance of coding systems that use high frequency reconstruction methods
DE10102159C2 (de) * 2001-01-18 2002-12-12 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Erzeugen bzw. Decodieren eines skalierbaren Datenstroms unter Berücksichtigung einer Bitsparkasse, Codierer und skalierbarer Codierer
JP4506039B2 (ja) * 2001-06-15 2010-07-21 ソニー株式会社 符号化装置及び方法、復号装置及び方法、並びに符号化プログラム及び復号プログラム
US6658383B2 (en) * 2001-06-26 2003-12-02 Microsoft Corporation Method for coding speech and music signals

Also Published As

Publication number Publication date
EP1636791B1 (de) 2007-03-07
CN1809872A (zh) 2006-07-26
HK1083664A1 (en) 2006-07-07
DE10328777A1 (de) 2005-01-27
US20060167683A1 (en) 2006-07-27
US7275031B2 (en) 2007-09-25
DE602004005197D1 (de) 2007-04-19
EP1636791A1 (de) 2006-03-22
JP2009513992A (ja) 2009-04-02
CN1809872B (zh) 2010-06-02
WO2005001813A1 (en) 2005-01-06

Similar Documents

Publication Publication Date Title
DE602004005197T2 (de) Vorrichtung und verfahren zum kodieren eines audiosignals und vorrichtung und verfahren zum dekodieren eines kodierten audiosignals
EP0954909B1 (de) Verfahren zum codieren eines audiosignals
EP0931386B1 (de) Verfahren zum signalisieren einer rauschsubstitution beim codieren eines audiosignals
DE19747132C2 (de) Verfahren und Vorrichtungen zum Codieren von Audiosignalen sowie Verfahren und Vorrichtungen zum Decodieren eines Bitstroms
DE60110679T3 (de) Perzeptuelle Kodierung von Audiosignalen unter Verwendung von getrennter Reduzierung von Irrelevanz und Redundanz
EP1145227B1 (de) Verfahren und vorrichtung zum verschleiern eines fehlers in einem codierten audiosignal und verfahren und vorrichtung zum decodieren eines codierten audiosignals
DE60214599T2 (de) Skalierbare audiokodierung
DE19549621B4 (de) Vorrichtung zum Codieren von Audiosignalen
DE60310716T2 (de) System für die audiokodierung mit füllung von spektralen lücken
DE60225276T2 (de) Codierungsvorrichtung und -verfahren, decodierungsvorrichtung und -verfahren und programm
DE60214027T2 (de) Kodiervorrichtung und dekodiervorrichtung
DE69731677T2 (de) Verbessertes Kombinationsstereokodierverfahren mit zeitlicher Hüllkurvenformgebung
DE4320990B4 (de) Verfahren zur Redundanzreduktion
EP1495464B1 (de) Vorrichtung und verfahren zum codieren eines zeitdiskreten audiosignals und vorrichtung und verfahren zum decodieren von codierten audiodaten
EP1016319B1 (de) Verfahren und vorrichtung zum codieren eines zeitdiskreten stereosignals
DE102006051673A1 (de) Vorrichtung und Verfahren zum Nachbearbeiten von Spektralwerten und Encodierer und Decodierer für Audiosignale
DE602004007550T2 (de) Verbesserte frequenzbereichs-fehlerverbergung
EP1023777B1 (de) Verfahren und vorrichtung zur erzeugung eines bitratenskalierbaren audio-datenstroms
DE60112407T2 (de) Verfahren und vorrichtung zur konvertierung eines audiosignals zwischen unterschiedlichen datenkompressionsformaten
DE102007029381A1 (de) Digitalsignal-Verarbeitungsvorrichtung, Digitalsignal-Verarbeitungsverfahren, Digitalsignal-Verarbeitungsprogramm, Digitalsignal-Wiedergabevorrichtung und Digitalsignal-Wiedergabeverfahren
DE60217612T2 (de) Verfahren und Vorrichtung zur Kodierung und Dekodierung von Sprachsignalen
EP1277346B1 (de) Vorrichtung und Verfahren zum Analysieren der spektralen Darstellung eines decodierten Zeitsignales
DE19829284C2 (de) Verfahren und Vorrichtung zum Verarbeiten eines zeitlichen Stereosignals und Verfahren und Vorrichtung zum Decodieren eines unter Verwendung einer Prädiktion über der Frequenz codierten Audiobitstroms
DE4209382C1 (de)
DE10119980C1 (de) Verfahren zur Codierung von Audiodaten

Legal Events

Date Code Title Description
8364 No opposition during term of opposition