DE69821089T2 - Verbesserung von quellenkodierung unter verwendung von spektralbandreplikation - Google Patents

Verbesserung von quellenkodierung unter verwendung von spektralbandreplikation Download PDF

Info

Publication number
DE69821089T2
DE69821089T2 DE69821089T DE69821089T DE69821089T2 DE 69821089 T2 DE69821089 T2 DE 69821089T2 DE 69821089 T DE69821089 T DE 69821089T DE 69821089 T DE69821089 T DE 69821089T DE 69821089 T2 DE69821089 T2 DE 69821089T2
Authority
DE
Germany
Prior art keywords
signal
spectral
subband samples
spectral coefficients
band
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE69821089T
Other languages
English (en)
Other versions
DE69821089D1 (de
Inventor
Gustaf Lars LILJERYD
Rune Per EKSTRAND
Fredrik Lars HENN
Magnus Hans KJÖRLING
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby International AB
Original Assignee
Coding Technologies Sweden AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from SE9702213A external-priority patent/SE9702213D0/xx
Priority claimed from SE9704634A external-priority patent/SE9704634D0/xx
Application filed by Coding Technologies Sweden AB filed Critical Coding Technologies Sweden AB
Application granted granted Critical
Publication of DE69821089D1 publication Critical patent/DE69821089D1/de
Publication of DE69821089T2 publication Critical patent/DE69821089T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/667Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using a division in frequency subbands

Description

  • Bei Quellcodierungssystemen werden digitale Daten vor einer Übertragung oder Speicherung komprimiert, um die erforderliche Bitrate oder Speicherkapazität zu reduzieren. Die vorliegende Erfindung bezieht sich auf ein neues Verfahren und eine Vorrichtung zu der Verbesserung von Quellcodierungssystemen mittels einer Spektralbandreplikation (SBR). Es wird eine wesentliche Bitratenreduzierung erreicht, während die gleiche Wahrnehmungsqualität beibehalten wird oder umgekehrt eine Verbesserung bei einer Wahrnehmungsqualität bei einer gegebenen Bitrate erreicht wird. Dies wird mittels einer Spektralbandbreitenreduzierung an der Codiererseite und einer nachfolgenden Spektralbandreplikation bei dem Decodierer erzielt, wodurch die Erfindung neue Konzepte einer Signalredundanz in dem Spektralbereich verwertet.
  • Audioquellcodierungstechniken können in zwei Klassen eingeteilt werden: natürliche Audiocodierung und Sprachcodierung. Natürliche Audiocodierung wird allgemein für Musik oder beliebige Signale bei mittleren Bitraten verwendet und bietet allgemein eine breite Audiobandbreite. Sprachcodierer sind im Grunde auf eine Sprachreproduktion begrenzt, können aber jedoch bei sehr niedrigen Bitraten verwendet werden, wenn auch mit einer niedrigen Audiobandbreite. Eine Breitbandsprache bietet eine größere subjektive Qualitätsverbesserung gegenüber einer Schmalbandsprache. Ein Erhöhen der Bandbreite verbessert nicht nur eine Verständlichkeit und Natürlichkeit einer Sprache, sondern erleichtert auch eine Sprechererkennung. Eine Breitbandsprachcodierung ist somit ein wichtiger Punkt bei Telefonsystemen der nächsten Generation. Ferner ist aufgrund des enormen Wachstums des Multimediagebiets eine Übertragung von Musik und anderen Nicht-Sprachsignalen mit einer hohen Qualität über Telefonsysteme ein erwünschtes Merkmal.
  • Ein lineares PCM-Signal mit hoher Wiedergabetreue ist hinsichtlich einer Bitrate gegenüber der Wahrnehmungsentropie sehr ineffizient. Der CD-Standard diktiert eine Abtastfrequenz von 44,1 kHz, eine Auflösung von 16 Bits pro Abtastwert und Stereo. Dies kommt einer Bitrate von 1411 kbit/s gleich. Um die Bitrate drastisch zu reduzieren, kann eine Quellcodierung unter Verwendung von Splitband-Wahrnehmungsaudiocodecs durchgeführt werden. Diese natürlichen Audiocodecs verwerten eine Wahrnehmungsirrelevanz und statistische Redundanz bei dem Signal. Unter Verwendung der besten Codec-Technologie kann bei einem Standard-CD-Format-Signal eine Datenreduzierung von näherungsweise 90% praktisch ohne wahrnehmbare Verschlechterung erreicht werden. Es ist somit eine sehr hohe Klangqualität in Stereo bei etwa 96 kbit/s möglich, d. h. einem Komprimierungsfaktor von näherungsweise 15 : 1. Einige Wahrnehmungscodecs bieten sogar höhere Komprimierungsverhältnisse. Um dies zu erreichen, ist es allgemein üblich, die Abtastrate und somit die Audiobandbreite zu reduzieren. Es ist auch üblich, die Anzahl von Quantisierungspegeln zu verringern, was eine gelegentlich hörbare Quantisierungsverzerrung ermöglicht, und eine Verschlechterung des Stereofelds zu verwenden, durch ein Intensitätscodieren. Eine übermäßige Verwendung derartiger Verfahren resultiert in einer störenden Wahrnehmungsverschlechterung. Eine gegenwärtige Codectechnologie befindet sich nahe einer Sättigung und ein weiterer Fortschritt bei einem Codiergewinn wird nicht erwartet. Um das Codierverhalten weiter zu verbessern ist ein neuer Ansatz notwendig.
  • Die menschliche Stimme und die meisten Musikinstrumente erzeugen quasistationäre Signale, die aus oszillierenden Systemen hervorgehen. Gemäß der Fourier-Theorie kann ein jegliches periodisches Signal als eine Summe von Sinuswellen mit den Frequenzen f, 2f, 3f, 4f, 5f etc. ausgedrückt werden, wobei f die Grundfrequenz ist. Die Frequenzen bilden eine harmonische Reihe. Eine Bandbreitenbegrenzung eines derartigen Signals ist äquivalent zu einer Abschneidung der harmonischen Reihe. Eine derartige Abschneidung ändert das wahrgenommene Timbre, die Klangfarbe, eines Musikinstruments oder einer Stimme und ergibt ein Audiosignal, das „gedämpft" oder „dumpf" klingt, und eine Verständlichkeit kann reduziert sein. Die hohen Frequenzen sind somit wichtig für den subjektiven Eindruck einer Klangqualität.
  • Bekannte Verfahren sind hauptsächlich zu einer Verbesserung einer Sprachcodecleistung bestimmt und insbesondere zu einer Hochfrequenzregenerierung (HFR) bestimmt, ein Punkt bei einem Sprachcodieren. Derartige Verfahren verwenden lineare Breitbandfrequenzverschiebungen, Nichtlinearitäten oder ein Aliasing [US-Patent 5,127,054], ein Erzeugen von Intermodulationsprodukten oder anderen nicht-harmonischen Frequenzkomponenten, die eine ernste Dissonanz bewirken, wenn dieselben auf Musiksignale angewendet werden. Eine derartige Dissonanz wird in der Sprachcodierungsliteratur als „scharf"- und „rauh"-klingend bezeichnet. Andere synthetische Sprach-HFR-Verfahren erzeugen sinusförmige Oberschwingungen, die auf einer Grundtonhöhenschätzung basieren und somit auf tonale stationäre Klänge begrenzt sind [US-Patent 4,771,465]. Obwohl dieselben für Sprachanwendungen mit niedriger Qualität nützlich sind, arbeiten derartige bekannte Verfahren nicht bei Sprach- oder Musiksignalen mit hoher Qualität. Einige Verfahren versuchen die Leistung von Audioquellcodecs mit hoher Qualität zu verbessern. Eines verwendet synthetische Rauschsignale, die bei dem Decodierer erzeugt werden, um rauschähnliche Signale bei einer Sprache oder einer Musik zu substituieren, die vorhergehend durch den Codierer ausgesondert wurden [„Improving Audio Codecs by Noise Substitution" D. Schultz, JAES, Bd. 44, Nr. 7/8, 1996]. Dies wird innerhalb eines anderweitig normal übertragenen Hochbands auf einer intermittierenden Basis durchgeführt, wenn Rauschsignale vorhanden sind. Ein anderes Verfahren erzeugt einige fehlende Hochbandoberschwingungen wieder, die bei dem Codierungsprozeß verloren wurden [„Audio Spectral Coder" A. J. S. Ferreira, AES Preprint 4201, 100th Convention, 11.–14. Mai 1996, Kopenhagen], und ist wieder abhängig von tonalen Signalen und einer Tonhöhener fassung. Beide Verfahren sind auf einer Basis eines niedrigen Belastungszyklus wirksam, was einen vergleichsweise begrenzten Codierungs- oder Leistungsgewinn bietet.
  • Das US-Patent Nr. 5,127,054 offenbart eine Sprachqualitätsverbesserung für Stimmcodierer und -synthesizer. Ein Codierer erzeugt ein codiertes Signal, das wesentliche Spektralinformationen aufweist, die aus dezimierten Abtastwerten der erheblichsten Spektralsubbänder bestehen. Diese Abtastwerte sind auf eine geeignete Weise in eine Mehrzahl von Rekonstruktionsfiltern interpoliert. Das Ausgangssignal der Filter wird summiert und einerseits einem Endsummierer zugeführt und andererseits in ein nicht-lineares Gerät zu einem Erzeugen eines harmonischen Signals eingegeben, das eine Mehrzahl von harmonischen Signalen aufweist, die aus den wesentlichen Spektralinformationen erzeugt werden, die in den ausgewählten Sprachsubbändern enthalten sind. Das harmonische Signal wird zu einer Mehrzahl von Subbandfiltern geleitet, die das harmonische Signal mit den speziellen interessierenden Bändern bandbegrenzen. Die gefilterten harmonischen Signale werden durch eine optionale Gewinnstufe eingestellt.
  • Das US-Patent Nr. 4,667,340 offenbart ein Sprachbenachrichtigungssystem mit einer tonhöhenkongruenten Basisbandcodierung. Ein Codierer erzeugt LPC-Parameter plus ein Restsignal, die übertragen werden. Um eine Bandbreite einzusparen, wird das Restsignal gefiltert, so daß lediglich ein Bruchteil der gesamten Bandbreite desselben von dem Codierer zu dem Decodierer übertragen wird. Bei dem Decodierer wird das übertragene Restsignal auf kopiert oder anderweitig zu höheren Frequenzen vergrößert, um das Anregungssignal zu liefern, das gemäß den LPC-Parametern gefiltert wird, um den wiedergebildeten Sprachausgang zu liefern.
  • Es ist die Aufgabe der vorliegenden Erfindung, ein Konzept zu einer verbesserten Spektralbandreplikation zu schaffen. Diese Aufgabe wird durch ein Verfahren zum Decodieren eines codierten Signals gemäß Anspruch 1 oder eine Vorrichtung zum Decodieren eines codierten Signals gemäß Anspruch 21 gelöst.
  • Die vorliegende Erfindung stellt ein neues Verfahren und eine Vorrichtung zu wesentlichen Verbesserungen von digitalen Quellcodierungssystemen und insbesondere zu den Verbesserungen von Audiocodecs bereit. Das Ziel umfaßt eine Bitratenreduzierung oder eine verbesserte Wahrnehmungsqualität oder eine Kombination derselben. Die Erfindung basiert auf neuen Verfahren, die eine harmonische Redundanz verwerten, was die Möglichkeit bietet, Durchlaßbänder eines Signals vor einer Übertragung oder Speicherung auszusondern. Es wird keine Wahrnehmungsverschlechterung wahrgenommen, falls der Decodierer eine Spektralreplikation mit hoher Qualität gemäß der Erfindung durchführt. Die ausgesonderten Bits stellen den Codiergewinn bei einer festen Wahrnehmungsqualität dar. Alternativ können mehr Bits zu einem Codieren der Tiefbandinformationen bei einer festen Bitrate zugeteilt werden, wodurch eine höhere Wahrnehmungsqualität erreicht ist.
  • Die vorliegende Erfindung postuliert, daß eine abgeschnittene harmonische Reihe basierend auf der direkten Beziehung zwischen Tiefband- und Hochband-Spektralkomponenten erweitert werden kann. Diese erweiterte Reihe gleicht dem Original in einem Wahrnehmungssinn, falls bestimmte Regeln befolgt werden: Erstens müssen die extrapolierten Spektralkomponenten harmonisch auf die abgeschnittene harmonische Reihe bezogen sein, um dissonanzbezogene Artefakte zu vermeiden. Die vorliegende Erfindung verwendet eine Transposition als eine Einrichtung für den Spektralreplikationsprozeß, was sicherstellt, daß dieses Kriterium eingehalten wird. Für eine erfolgreiche Operation ist es jedoch nicht notwendig, daß die Tiefbandspektralkomponenten eine harmonische Reihe bilden, da neue replizierte Komponenten, die harmonisch auf dieselben des Tiefbands bezogen sind, die rauschähnliche oder transiente Beschaffenheit des Signals nicht ändern. Eine Transposition ist als ein Transfer von Partialen von einer Position zu einer anderen auf der Musikskala definiert, während die Frequenzverhältnisse der Partialen beibehalten sind. Zweitens muß die Spektralhüllkurve, d. h. die grobe Spektralverteilung, des replizierten Hochbands derselben des ursprünglichen Signals ziemlich gut gleichen. Die vorliegende Erfindung bietet zwei Betriebsmodi, SBR-1 und SBR-2, die sich in der Weise unterscheiden, auf die die Spektralhüllkurve eingestellt ist.
  • SBR-1, für die Verbesserung von Codecanwendungen einer mittleren Qualität vorgesehen, ist ein unsymmetrischer Prozeß, der sich ausschließlich auf die Informationen stützt, die in einem bei dem Decodierer empfangenen Tiefband- oder Tiefpaßsignal enthalten sind. Die Spektralhüllkurve dieses Signals wird bestimmt und extrapoliert, z. B. unter Verwendung von Polynomen zusammen mit einem Regelsatz oder einem Codebuch. Diese Informationen werden verwendet, um das replizierte Hochband kontinuierlich einzustellen und zu entzerren. Das vorliegende SBR-1-Verfahren bietet den Vorteil eines Nachverarbeitens, d. h. an der Codiererseite sind keine Modifizierungen notwendig. Ein Sender wird in einer Kanalbelegung gewinnen oder in der Lage sein, eine verbesserte Wahrnehmungsqualität anzubieten, oder eine Kombination von beiden. Eine existierende Bitstromsyntax und Standards können ohne eine Modifizierung verwendet werden.
  • SBR-2, für die Verbesserung von Codecsanwendungen mit hoher Qualität vorgesehen, ist ein symmetrischer Prozeß, bei dem zusätzlich zu dem gesendeten Tiefbandsignal gemäß SBR-1 die Spektralhüllkurve des Hochbands codiert und gesendet wird. Da die Variationen der Spektralhüllkurve eine viel niedrigere Rate aufweisen als die Hochbandsignalkomponenten, muß lediglich eine begrenzte Größe von Informationen gesendet werden, um die Spektralhüllkurve erfolgreich darzustellen. SBR-2 kann verwendet werden, um die Leistung von gegenwärtigen Codectechnologien ohne oder mit kleineren Modifizie rungen einer existierenden Syntax oder Protokollen zu verbessern, und als ein wertvolles Werkzeug für eine zukünftige Codecentwicklung.
  • Sowohl SBR-1 als auch SBR-2 können verwendet werden, um kleinere Durchlaßbänder des Tiefbands zu replizieren, wenn derartige Bänder durch den Codierer heruntergefahren werden, wie es durch das psychoakustische Modell unter Bitknappen Bedingungen festgesetzt ist. Dies resultiert in einer Verbesserung der Wahrnehmungsqualität durch eine Spektralreplikation innerhalb des Tiefbands zusätzlich zu einer Spektralreplikation außerhalb des Tiefbands. Ferner können SBR-1 und SBR-2 auch bei Codecs verwendet werden, die eine Bitratenskalierbarkeit verwenden, wobei die Wahrnehmungsqualität des Signals bei dem Empfänger abhängig von Sendekanalbedingungen variiert. Dies bringt gewöhnlich lästige Variationen der Audiobandbreite bei dem Empfänger mit sich. Unter derartigen Bedingungen können die SBR-Verfahren erfolgreich verwendet werden, um eine konstant hohe Bandbreite beizubehalten, wobei wiederum die Wahrnehmungsqualität verbessert wird.
  • Die vorliegende Erfindung ist auf einer kontinuierlichen Basis wirksam und repliziert einen jeglichen Typ von Signalinhalten, d. h. tonal oder nicht-tonal (rauschähnliche und transiente Signale). Zusätzlich erzeugt das vorliegende Spektralreplikationsverfahren eine wahrnehmungsmäßig genaue Nachbildung der ausgesonderten Bänder aus bei dem Decodierer verfügbaren Frequenzbändern. Somit bietet das SBR-Verfahren einen wesentlich höheren Pegel eines Codiergewinns oder einer Wahrnehmungsqualitätsverbesserung verglichen mit bekannten Verfahren. Die Erfindung kann mit derartigen bekannten Codecverbesserungsverfahren kombiniert werden; aufgrund derartiger Kombinationen wird jedoch kein Leistungsgewinn erwartet.
  • Das SBR-Verfahren weist die folgenden Schritte auf:
    • – Codieren eines Signals, das von einem ursprünglichen Signal abgeleitet ist, wobei Frequenzbänder des Signals ausgesondert werden und das Aussondern vor oder während einem Codieren durchgeführt wird, wobei ein erstes Signal gebildet wird,
    • – während oder nach einem Decodieren des ersten Signals, Transponieren von Frequenzbändern des ersten Signals, wobei ein zweites Signal gebildet wird.
    • – Durchführen einer Spektralhüllkurveneinstellung, und
    • – Kombinieren des decodierten Signals und des zweiten Signals, wobei ein Ausgangssignal gebildet wird.
  • Die Paßbänder des zweiten Signals können festgelegt sein, um die Paßbänder des ersten Signals nicht zu überlappen oder teilweise zu überlappen, und können in Abhängigkeit von den zeitlichen Charakteristika des ursprünglichen Signals und/oder des ersten Signals oder Sendekanalbedingungen festgelegt sein. Die Spektralhüllkurveneinstellung wird basierend auf einer Schätzung der ursprünglichen Spektralhüllkurve von dem ersten Signal oder auf gesendeten Hüllkurveninformationen des ursprünglichen Signals durchgeführt.
  • Die vorliegende Erfindung umfaßt grundlegende Typen von Transponierern: Mehrbandtransponierer und zeitvariante Mustersuchvoraussagetransponierer, die unterschiedliche Eigenschaften aufweisen. Eine grundlegende Mehrbandtransposition kann gemäß der vorliegenden Erfindung durch das Folgende durchgeführt werden:
    • – Filtern des zu transponierenden Signals durch einen Satz von N ≥ 2 Bandpaßfilter mit Durchlaßbändern, die die jeweiligen Frequenzen [f1, ... fN] aufweisen, wobei N Bandpaßsignale gebildet werden,
    • – Verschieben der Bandpaßsignale frequenzmäßig in Regionen, die die Frequenzen M[f1, ... fN] aufweisen, wobei M ≠ 1 der Transpositionsfaktor ist, und
    • – Kombinieren der verschobenen Bandpaßsignale, wobei das transponierte Signal gebildet wird.
  • Alternativ kann diese grundlegende Mehrbandtransposition gemäß der vorliegenden Erfindung durch das Folgende durchgeführt werden:
    • – Bandpaßfiltern des Signals, um ein transponiertes Signal zu sein, unter Verwendung einer Analysefilterbank oder einer Transformation einer solchen Art, daß reell- oder komplexwertige Subbandsignale eines Tiefpaßtyps erzeugt werden,
    • – eine beliebige Anzahl von Kanälen k der Analysefilterbank oder der Transformation werden mit Kanälen Mk, M ≠ 1 in einer Synthesefilterbank oder einer Transformation verbunden, und
    • – das transponierte Signal wird unter Verwendung der Synthesefilterbank oder der Transformation gebildet.
  • Eine verbesserte Mehrbandtransposition gemäß der Erfindung umfaßt Phaseneinstellungen, wobei die Leistung der grundlegenden Mehrbandtranspositionen verbessert wird.
  • Die zeitvariante Mustersuchvoraussagetransposition gemäß der vorliegenden Erfindung kann durch das Folgende durchgeführt werden:
    • – Durchführen einer Transientenerfassung bei dem ersten Signal,
    • – Bestimmen, welches Segment des ersten Signals verwendet werden soll, wenn Teile des ersten Signals dupli ziert/ausgesondert werden, abhängig von dem Ergebnis der Transientenerfassung,
    • – Einstellen von Zustandsvektor- und Codebucheigenschaften abhängig von dem Ergebnis der Transientenerfassung, und
    • – Suchen nach Synchronisationspunkten bei einem gewählten Segment des ersten Signals basierend auf dem Synchronisationspunkt, der bei der vorhergehenden Synchronisationspunktsuche gefunden wurde.
  • Die SBR-Verfahren und -Vorrichtungen gemäß der vorliegenden Erfindung bieten die folgenden Merkmale:
    • 1. Die Verfahren und Vorrichtungen werten neue Konzepte einer Signalredundanz in dem Spektralbereich aus.
    • 2. Die Verfahren und Vorrichtungen sind auf beliebige Signale anwendbar.
    • 3. Jeder harmonische Satz ist einzeln erzeugt und gesteuert.
    • 4. Alle replizierten Oberschwingungen sind auf eine derartige Weise erzeugt, um eine Fortführung der existierenden harmonischen Reihe zu bilden.
    • 5. Der Spektralreplikationsprozeß basiert auf einer Transposition und erzeugt keine oder nicht wahrnehmbare Artefakte.
    • 6. Die Spektralreplikation kann mehrere kleinere Bänder und/oder einen breiten Frequenzbereich abdecken.
    • 7. Bei dem SBR-1-Verfahren wird die Verarbeitung lediglich an der Decodiererseite durchgeführt, d. h. alle Standards und Protokolle können ohne eine Modifizierung verwendet werden.
    • 8. Das SBR-2-Verfahren kann gemäß den meisten Standards und Protokollen ohne oder mit kleineren Modifizierungen implementiert werden.
    • 9. Das SBR-2-Verfahren bietet dem Codec-Entwickler ein neues leistungsstarkes Komprimierungswerkzeug.
    • 10. Der Codiergewinn ist erheblich.
  • Die anziehendste Anmeldung bezieht sich auf die Verbesserung von verschiedenen Typen von Codecs mit niedriger Bitrate, wie beispielsweise MPEG 1/2 Layer I/II/III [US-Patent. 5,040,217], MPEG 2/4 AAC, Dolby AC-2/3, NTT Twin VQ [US-Patent 5,684,920], AT & T/Lucent PAC etc. Die Erfindung ist auch bei Sprachcodecs mit hoher Qualität nützlich, wie beispielsweise Breitband-CELP und SB-ADPCM G.722, um eine Wahrnehmungsqualität zu verbessern. Die obigen Codecs sind bei Multimedia, in der Telefonindustrie, im Internet sowie bei professionellen Anwendungen in breiter Verwendung. T-DAB- (Terrestrial Digital Audio Broadcasting) Systeme verwenden Protokolle mit niedriger Bitrate, die durch ein Verwenden des vorliegenden Verfahrens in einer Kanalbelegung gewinnen oder eine Qualität bei FM und AM DAB verbessern. Satelliten-S-DAB gewinnt aufgrund der betroffenen übermäßigen Systemkosten durch ein Verwenden des vorliegenden Verfahrens, um die Anzahl von Programmkanälen in dem DAB-Multiplex zu erhöhen, erheblich. Ferner ist zum ersten Mal ein Audio-Streamen mit voller Bandbreite in Echtzeit über das Internet unter Verwendung von Telefonmodems mit niedriger Bitrate erreichbar.
  • Die vorliegende Erfindung wird nun durch darstellende Beispiele mit Bezug auf die zugehörigen Zeichnungen beschrieben, in denen:
  • 1 eine SBR darstellt, die in einem Codiersystem gemäß der vorliegenden Erfindung enthalten ist;
  • 2 eine Spektralreplikation von oberen Oberschwingungen gemäß der vorliegenden Erfindung darstellt;
  • 3 eine Spektralreplikation von Inbandoberschwingungen gemäß der vorliegenden Erfindung darstellt;
  • 4 ein Blockdiagramm für eine Zeit-Bereich-Implementierung eines Transponierers gemäß der vorliegenden Erfindung ist;
  • 5 ein Flußdiagramm ist, das einen Betriebszyklus für den Mustersuchvorhersagetransponierer gemäß der vorliegenden Erfindung darstellt;
  • 6 ein Flußdiagramm ist, das die Suche nach einem Synchronisationspunkt gemäß der vorliegenden Erfindung darstellt;
  • 7a7b das Codebuch-Positionieren während Transienten gemäß der vorliegenden Erfindung darstellt;
  • 8 ein Blockdiagramm für eine Implementierung von mehreren Zeit-Bereich-Transponierern in Verbindung mit einer geeigneten Filterbank für eine SBR-Operation gemäß der vorliegenden Erfindung ist;
  • 9a9c Blockdiagramme sind, die ein Gerät für eine STFT-Analyse und -Synthese darstellen, konfiguriert zu einer Erzeugung von Oberschwingungen zweiter Ordnung, gemäß der vorliegenden Erfindung;
  • 10a10b Blockdiagramme eines Subbands mit einer linearen Frequenzverschiebung bei dem STFT-Gerät gemäß der vorliegenden Erfindung sind;
  • 11 ein Subband zeigt, das einen Phasenmultiplizierer gemäß der vorliegenden Erfindung verwendet;
  • 12 darstellt, wie Oberschwingungen dritter Ordnung gemäß der vorliegenden Erfindung erzeugt werden;
  • 13 darstellt, wie Oberschwingungen zweiter und dritter Ordnung simultan gemäß der vorliegenden Erfindung erzeugt werden;
  • 14 eine Erzeugung einer nicht-überlappenden Kombination von mehreren Oberschwingungsordnungen gemäß der vorliegenden Erfindung darstellt;
  • 15 eine Erzeugung einer verschachtelten Kombination von mehreren Oberschwingungsordnungen gemäß der vorliegenden Erfindung darstellt;
  • 16 eine Erzeugung von linearen Breitbandfrequenzverschiebungen darstellt;
  • 17 darstellt, wie Suboberschwingungen gemäß der vorliegenden Erfindung erzeugt werden;
  • 18a18b Blockdiagramme eines Wahrnehmungscodecs sind;
  • 19 eine Grundstruktur einer maximal dezimierten Filterbank zeigt;
  • 20 eine Erzeugung von Oberschwingungen zweiter Ordnung in einer maximal dezimierten Filterbank gemäß der vorliegenden Erfindung darstellt;
  • 21 ein Blockdiagramm für die verbesserte Mehrbandtransposition bei einer maximal dezimierten Filterbank ist, die an Subbandsignalen wirksam ist, gemäß der vorliegenden Erfindung;
  • 22 ein Flußdiagramm ist, das die verbesserte Mehrbandtransposition bei einer maximal dezimierten Filterbank darstellt, die an Subbandsignalen wirksam ist, gemäß der vorliegenden Erfindung;
  • 23 Subbandabtastwerte und Skalierungsfaktoren eines typischen Codec darstellt;
  • 24 Subbandabtastwerte und Hüllkurveninformationen für SBR-2 gemäß der vorliegenden Erfindung darstellt;
  • 25 eine versteckte Übertragung von Hüllkurveninformationen bei SBR-2 gemäß der vorliegenden Erfindung darstellt;
  • 26 ein Redundanzcodieren bei SBR-2 gemäß der vorliegenden Erfindung darstellt;
  • 27 eine Implementierung eines Codec unter Verwendung des SBR-1-Verfahrens gemäß der vorliegenden Erfindung darstellt;
  • 28 eine Implementierung eines Codec unter Verwendung des SBR-2-Verfahrens gemäß der vorliegenden Erfindung darstellt; und
  • 29 ein Blockdiagramm eines „Pseudo-Stereo"-Generators gemäß der vorliegenden Erfindung ist.
  • Überall in der Erläuterung der Ausführungsbeispiele werden hierin Natürliche-Audioquelle-Codieranwendungen betont. Es ist jedoch klar, daß die vorliegende Erfindung auf einen anderen Bereich von Quellcodierungsanwendungen als auf denselben eines Codierens und Decodierens von Audiosignalen anwendbar ist.
  • Transpositionsgrundlagen
  • Eine Transposition, wie dieselbe gemäß der vorliegenden Erfindung definiert ist, ist das ideale Verfahren zu einer Spektralreplikation und weist mehrere größere Vorteile gegenüber dem Stand der Technik auf, wie beispielsweise: es ist keine Tonhöhenerfassung erforderlich, es wird eine gleich hohe Leistung für einstimmiges und polyphones Programmaterial erhalten und die Transposition arbeitet gleich gut bei tonalen und nicht-tonalen Signalen. Im Gegensatz zu anderen Verfahren kann die Transposition gemäß der Erfindung bei beliebigen Audioquellcodierungssystemen für beliebige Signaltypen verwendet werden.
  • Eine exakte Transposition eines Faktors M eines diskreten Zeitsignals x(n) in der Form einer Summe von Kosinussen mit zeitvariablen Amplituden ist definiert durch die Beziehung
    Figure 00150001
    wobei N die Anzahl von Sinuskurven ist, hierin im folgenden als Partiale bezeichnet, fi, ei(n), αi die einzelnen Eingangsfrequenzen, Zeithüllkurven bzw. Phasenkonstanten sind, βi die beliebigen Ausgangsphasenkonstanten sind und fs die Abtastfrequenz ist, und 0 ≤ Mfi ≤ + fs/2.
  • In 2 ist die Erzeugung von Oberschwingungen der M-ten Ordnung gezeigt, wobei M eine Ganzzahl ≥ 2 ist. Der Ausdruck Oberschwingungen M-ter Ordnung wird zu einer Einfach heit verwendet, obgleich der Prozeß Oberschwingungen M-ter Ordnung zu allen Signalen in einer bestimmten Frequenzregion erzeugt, die in den meisten Fällen selbst Oberschwingungen einer unbekannten Ordnung sind. Das Eingangssignal mit der Frequenzbereichsdarstellung X(f) ist auf den Bereich 0 bis fmax bandbegrenzt 201. Der Signalgehalt in dem Bereich fmax/M bis Qfmax/M, wobei Q der erwünschte Bandbreitenexpansionsfaktor 1 < Q ≤ M ist, wird mittels eines Bandpaßfilters extrahiert, wobei ein Bandpaßsignal mit einem Spektrum XBP(f) gebildet wird 203. Das Bandpaßsignal wird einen Faktor M transponiert, wobei ein zweites Bandpaßsignal mit einem Spektrum XT(f), das den Bereich Qfmax bis Qfmax abdeckt, gebildet wird 205. Die Spektralhüllkurve dieses Signals wird mittels eines programmgesteuerten Entzerrers eingestellt, wobei ein Signal mit einem Spektrum XE(f) gebildet wird 207. Dieses Signal wird dann mit einer verzögerten Version des Eingangssignals kombiniert, um die Verzögerung zu kompensieren, die durch das Bandpaßfilter und den Transponierer auferlegt wurde, wodurch ein Ausgangssignal mit einem Spektrum Y(f), das den Bereich 0 bis Qfmax abdeckt, gebildet wird 209. Alternativ kann ein Bandpaßfiltern nach der Transposition M unter Verwendung von Grenzfrequenzen fmax und Qfmax durchgeführt werden. Durch ein Verwenden von mehreren Transponierern ist natürlich eine simultane Erzeugung von unterschiedlichen Oberschwingungsordnungen möglich. Das obige Schema kann auch verwendet werden, um Sperrbänder innerhalb des Eingangssignals „auszufüllen", wie es in 3 gezeigt ist, wo das Eingangssignal ein Sperrband aufweist, das sich von f0 bis Qf0 erstreckt 301. Ein Paßband [f0/M, Qf0/M] wird dann extrahiert 303, einen Faktor M zu [f0, Qf0] transponiert 305, hüllkurveneingestellt 307 und mit dem verzögerten Eingangssignal kombiniert, wobei das Ausgangssignal mit einem Spektrum Y(f) gebildet wird 309.
  • Eine Annäherung einer exakten Transposition kann verwendet werden. Gemäß der vorliegenden Erfindung ist die Qualität derartiger Annäherungen unter Verwendung einer Dissonanz theorie bestimmt. Ein Kriterium für eine Dissonanz ist durch Plomp präsentiert [„Tonal Consonance and Critical Bandwidth" R. Plomp, W. J. M. Levelt JASA, Bd. 38, 1965] und legt dar, daß zwei Partiale als Dissonanz betrachtet werden, falls der Frequenzunterschied innerhalb näherungsweise 5 bis 50% der Bandbreite des kritischen Bands gelegen ist, in dem die Partiale positioniert sind. Zu einer Bezugnahme kann die kritische Bandbreite für eine gegebene Frequenz angenähert werden durch
    Figure 00170001
    mit f und cb in Hz. Ferner legt Plomp dar, daß das menschliche Hörsystem zwei Partiale nicht unterscheiden kann, falls dieselben sich in einer Frequenz um näherungsweise weniger als 5% der kritischen Bandbreite unterscheiden, in der dieselben positioniert sind. Die exakte Transposition in Gl. 2 wird angenähert durch
    Figure 00170002
    wobei Δfi die Abweichung von der exakten Transposition ist. Falls die Eingangspartialen eine harmonische Reihe bilden, legt eine Hypothese der Erfindung dar, daß die Abweichungen von der harmonischen Reihe der transponierten Partialen 5% der kritischen Bandbreite nicht überschreiten dürfen, in der dieselben positioniert sind. Dies würde erklären, warum bekannte Verfahren unzufriedenstellende „scharfe" und „rauhe" Ergebnisse ergeben, da lineare Breitbandfrequenzverschiebungen eine viel größere Abweichung ergeben, als es akzeptabel ist. Wenn bekannte Verfahren mehr als eine Partiale für lediglich eine Eingangspartiale erzeugen, müssen die Partialen dennoch innerhalb der oben dargelegten Abweichungsbegrenzung liegen, um als eine Partiale wahrgenommen zu werden. Dies erklärt wiederum die dürftigen Ergebnisse, die mit bekannten Verfahren unter Verwendung von Nichtli nearitäten etc. erhalten werden, da dieselben Intermodulationspartiale erzeugen, die nicht innerhalb der Abweichungsbegrenzung liegen.
  • Wenn das obige transpositionsbasierte Verfahren einer Spektralreplikation gemäß der vorliegenden Erfindung verwendet wird, werden die folgenden wichtigen Eigenschaften erreicht.
    • – Normalerweise tritt zwischen replizierten Oberschwingungen und existierenden Partialen keine Frequenzbereichsüberlappung auf.
    • – Die replizierten Partiale sind harmonisch mit den Partialen des Eingangssignals verwandt und rufen keine störende Dissonanz oder Artefakte hervor.
    • – Die Spektralhüllkurve der replizierten Oberschwingungen bildet eine glatte Fortführung der Eingangssignal-Spektralhüllkurve und stimmt wahrnehmungsmäßig mit der ursprünglichen Hüllkurve überein.
  • Transposition basierend auf einer zeitvarianten Mustersuchvoraussage
  • Es existieren verschiedene Wege, um die erforderlichen Transponierer zu entwerfen. Typische Zeit-Bereich-Implementierungen erweitern das Signal in einer Zeit durch ein Duplizieren von Signalsegmenten basierend auf der Tonhöhenperiode. Dieses Signal wird nachfolgend bei einer unterschiedlichen Rate ausgelesen. Leider sind derartige Verfahren streng von einer Tonhöhenerfassung zu einem genauen Zeitspleißen der Signalsegmente abhängig. Ferner macht die Beschränkung, an Tonhöhenperiode-basierten Signalsegmenten zu arbeiten, dieselben empfindlich für Transienten. Da die erfaßte Tonhöhenperiode viel länger sein kann als die tatsächliche Transiente, ist das Risiko des Duplizierens der gesamten Transiente und nicht nur eines Expandierens derselben in einer Zeit offensichtlich. Ein anderer Typ von Zeit-Bereich-Algorithmen erhält eine Zeitausdehnung/-komprimierung von Sprachsignalen durch ein Verwenden einer Mustersuchvoraussage des Ausgangssignals [„Pattern Search Prediction of Speech" R. Bogner, T. Li, Proc. ICASSP '89, Bd. 1, Mai 1989, „Time-Scale Modification of Speech based on a nonlinear Oscillator Model" G. Kubin, W. B. Kleijn, IEEE, 1994]. Dies ist eine Form einer granularen Synthese, bei der das Eingangssignal in kleine Teile, Granalien, geteilt wird, die verwendet werden, um das Ausgangssignal zu generieren. Diese Synthese wird gewöhnlich durch ein Durchführen einer Korrelation von Signalsegmenten vorgenommen, um die besten Spleißpunkte zu bestimmen. Dies bedeutet, daß die Segmente, die verwendet werden, um das Ausgangssignal zu bilden, nicht von der Tonhöhenperiode abhängig sind, und somit die nicht-triviale Aufgabe einer Abstandserfassung nicht erforderlich ist. Dennoch bleiben Probleme bei sich schnell ändernden Signalamplituden bei diesen Verfahren und eine Transposition mit hoher Qualität neigt dazu, einen hohen Berechnungsbedarf hervorzurufen. Es wird jedoch nun ein verbesserter Zeit-Bereich-Abstandsverschieber/-transponierer vorgelegt, bei dem die Verwendung einer Transientenerfassung und dynamischen Systemparametern eine genauere Transposition für hohe Transpositionsfaktoren während sowohl stationären (tonal oder nicht tonal) als auch transienten Klängen bei niedrigen Berechnungskosten erzeugt.
  • Unter Bezugnahme auf die Zeichnungen, bei denen gleiche Bezugszeichen gleiche Elemente angeben, sind in 4 neun getrennte Module gezeigt: ein Transientendetektor 401, ein Fensterpositionseinsteller 403, ein Codebuchgenerator 405, ein Synchronisationssignalselektor 407, ein Synchronisationspositionsspeicher 409, ein Minimaldifferenzestimator 411, ein Ausgangssegmentspeicher 413, eine Mischeinheit 415 und ein Abwärtsabtaster 417. Das Eingangssignal wird sowohl dem Codebuchgenerator 405 als auch dem Transientendetektor 401 zugeführt. Falls eine Transiente erfaßt wird, wird die Position derselben zu dem Fensterpositionsmodul 403 gesendet. Dieses Modul setzt die Größe und Position des Fensters fest, das bei einem Erzeugen des Codebuchs mit dem Eingangssignal multipliziert wird. Der Codebuchgenerator 405 empfängt eine Synchronisationsposition von dem Synchronisationsauswahlmodul 407, vorausgesetzt, dasselbe wurde mit einem anderen Transponierer verbunden. Falls diese Synchronisationsposition innerhalb des Codebuchs liegt, wird dieselbe verwendet und ein Ausgangssegment wird erzeugt. Andernfalls wird das Codebuch zu dem Minimaldifferenzestimator 411 gesendet, der eine neue Synchronisationsposition zurückgibt. Das neue Ausgangssegment wird mit dem vorhergehenden Ausgangssegment in dem Mischmodul 415 zusammengefenstert und nachfolgend in dem Modul 417 abwärtsabgetastet.
  • Um die Erklärung zu verdeutlichen, ist eine Zustand-Raum-Darstellung eingebracht. Hier stellen die Zustandsvektoren oder Granalien die Eingangs- und Ausgangssignale dar. Das Eingangssignal ist durch einen Zustandsvektor x(n) dargestellt: x(n) =[x(n), x(n – D), x(n – 2D), ..., x(n – (N – 1)D)] (5)der aus N verzögerten Abtastwerten des Eingangssignals erhalten wird, wobei N die Abmessung des Zustandsvektors ist und D die Verzögerung zwischen den Eingangsabtastwerten ist, die verwendet werden, um den Vektor zu bauen. Die granulare Abbildung ergibt den Abtastwert x(n), der jedem Zustandsvektor x(n – 1) folgt. Dies ergibt Gl. 6, wobei a(•) die Abbildung ist: x(n) = α(x(n – 1)) (6)
  • Bei dem vorliegenden Verfahren wird die granulare Abbildung verwendet, um den nächsten Ausgang basierend auf dem vorigen Ausgang zu bestimmen, wobei ein Zustandsübergang-Codebuch verwendet wird. Das Codebuch einer Länge L wird kontinuierlich wieder aufgebaut und enthält die Zustandsvektoren und den nächsten Abtastwert, der jedem Zustandsvektor folgt. Jeder Zustandsvektor ist von dem Nachbar desselben durch K Abtastwerte getrennt; dies ermöglicht es, daß das System die Zeitauflösung abhängig von den Charakteristika des aktuell verarbeiteten Signals einstellt, wobei K gleich 1 die feinste Auflösung darstellt. Das Eingangssignalsegment, das verwendet wird, um das Codebuch zu bauen, ist basierend auf der Position einer möglichen Transiente und der Synchronisationsposition bei dem vorhergehenden Codebuch gewählt.
  • Dies bedeutet, daß die Abbildung a(•) theoretisch für alle in dem Codebuch enthaltenen Übergänge ausgewertet wird:
  • Figure 00210001
  • Bei diesem Übergangscodebuch wird der neue Eingang y(n) durch ein Suchen nach dem Zustandsvektor in dem Codebuch berechnet, der dem aktuellen Zustandsvektor y(n – 1) am ähnlichst ist. Diese Nächster-Nachbar-Suche wird durch ein Berechnen der minimalen Differenz vorgenommen und ergibt den neuen Ausgangsabtastwert: y(n) = α(y(n – 1)) (8)
  • Das System ist jedoch nicht begrenzt, um auf einer Basis Abtastwert für Abtastwert zu arbeiten, sondern ist vorzugsweise auf einer Basis Segment für Segment betrieben. Das neue Ausgangssegment wird gefenstert und addiert, mit dem vorhergehenden Ausgangssegment gemischt und nachfolgend nach abwärtsabgetastet. Der Tonhöhentranspositionsfaktor ist durch das Verhältnis der Eingangssegmentlänge, die durch das Codebuch dargestellt ist, und der Ausgangssegmentlänge bestimmt, die aus dem Codebuch gelesen wird.
  • Unter erneuter Bezugnahme auf die Zeichnungen sind in 5 und 6 Flußdiagramme vorgelegt, die den Betriebszyklus des Transponierers anzeigen. Bei 501 werden die Eingangsdaten dargestellt, eine Transientenerfassung 503 wird an einem Segment des Eingangssignals durchgeführt; die Suche nach Transienten wird an einer Signallänge durchgeführt, die gleich der Ausgangssignallänge ist. Falls eine Transiente gefunden wird 505, wird die Position der Transiente gespeichert 507 und die Parameter L (der die Codebuchlänge darstellt), K (der den Abstand in Abtastwerten zwischen jedem Zustandsvektor darstellt) und D (der die Verzögerung zwischen Abtastwerten bei jedem Zustandsvektor darstellt) werden eingestellt 509. Die Position der Transiente wird mit der Position des vorhergehenden Ausgangssegments verglichen 511, um zu bestimmen, ob die Transiente verarbeitet wurde. Falls dem so ist 513, werden die Position des Codebuchs (Fenster L) und die Parameter K, L und D eingestellt 515. Nach den notwendigen Parametereinstellungen findet basierend auf dem Ergebnis der Transientenerfassung die Suche nach einem neuen Synchronisations- oder Spleißpunkt statt 517. Diese Prozedur ist in 6 angezeigt. Zuerst wird basierend auf dem vorhergehenden ein neuer Synchronisationspunkt berechnet 601, gemäß: Sync_pos = Sync_pos_old + S·M – S, (9)wobei Sync_pos und Sync_pos_old die neue bzw. die alte Synchronisationsposition sind, S die Länge des Eingangssegments ist, das verarbeitet wird, und M der Transpositionsfaktor ist. Dieser Synchronisationspunkt wird verwendet, um die Genauigkeit des neuen Spleißpunkts mit der Genauigkeit des alten Spleißpunkts zu vergleichen 603. Falls die Übereinstimmung so gut wie oder besser als die vorhergehende ist 605, wird dieser neue Synchronisationspunkt zurückgegeben 607, vorausgesetzt, derselbe befindet sich innerhalb des Codebuchs. Falls nicht, wird in der Schleife nach einem neuen Synchronisationspunkt gesucht 609. Dies wird mit einem Ähnlichkeitsmaß, bei diesem Fall einer Minimaldiffe renzfunktion, durchgeführt 611, es ist jedoch auch möglich, eine Korrelation bei dem Zeit- oder Frequenzbereich zu verwenden. Falls die Position eine bessere Übereinstimmung ergibt, als dieselbe der vorhergehend gefundenen Position 613, wird die Synchronisationsposition gespeichert 615. Wenn alle Positionen ausprobiert sind 617, kehrt das System zu dem Flußdiagramm in 5 zurück 619. Der erhaltene neue Synchronisationspunkt wird gespeichert 519 und ein neues Segment wird von dem Codebuch beginnend bei dem gegebenen Synchronisationspunkt ausgelesen 521. Dieses Segment wird gefenstert und zu dem vorhergehenden addiert 523, durch den Transpositionsfaktor abwärtsabgetastet 525 und in dem Ausgangspuffer gespeichert 527.
  • In 7 ist das Verhalten des Systems unter transienten Bedingungen mit Bezug auf die Position des Codebuchs dargestellt. Vor der Transiente ist das Codebuch 1, das das Eingangssegment 1 darstellt, „zu der Linken" des Segments 1 positioniert. Das Korrelationssegment 1 stellt einen Teil des vorhergehenden Ausgangs dar und wird verwendet, um einen Synchronisationspunkt 1 in dem Codebuch 1 zu finden. Wenn die Transiente erfaßt ist und der Punkt der Transiente verarbeitet ist, wird das Codebuch gemäß 7a bewegt und ist stationär, bis das aktuell verarbeitete Eingangssegment sich wieder „zu der Rechten" des Codebuchs befindet. Dies macht es unmöglich, die Transiente zu duplizieren, da das System vor der Transiente nicht nach Synchronisationspunkten suchen darf.
  • Die meisten Tonhöhentransponierer oder Zeitexpandierer ergeben basierend auf einer Mustersuchvoraussage zufriedenstellende Ergebnisse bei einer Sprache und bei Einzeltonhöhenmaterial. Die Leistung derselben verschlechtert sich jedoch bei Signalen hoher Komplexität, wie beispielsweise Musik insbesondere bei großen Transpositionsfaktoren schnell. Die vorliegende Erfindung bietet mehrere Lösungen zu einer verbesserten Leistung und erzeugt daher hervorragende Ergebnisse für einen jeglichen Typ eines Signals. Entge gen anderen Entwürfen ist das System zeitvariant und die Systemparameter basieren auf den Eigenschaften des Eingangssignals und den während des vorhergehenden Betriebszyklus verwendeten Parametern. Die Verwendung eines Transientendetektors, der nicht nur die Codebuchgröße und -position steuert, sondern auch die Eigenschaften der enthaltenen Zustandsvektoren, ist ein sehr robustes und berechnungsmäßig effizientes Verfahren, um eine hörbare Verschlechterung während sich schnell verändernden Signalsegmenten zu vermeiden. Ferner ist eine Änderung der Länge des Signalsegments, das verarbeitet wird, was einen höheren Berechnungsbedarf hervorrufen würde, nicht erforderlich. Ferner verwendet die vorliegende Erfindung eine verbesserte Codebuchsuche basierend auf den Ergebnissen auf der vorhergehenden Suche. Dies bedeutet, daß entgegen einer gewöhnlichen Korrelation von zwei Signalsegmenten, wie es gewöhnlich bei Zeit-Bereich-Systemen vorgenommen wird, die auf einer Mustersuchvoraussage basieren, die wahrscheinlichsten Synchronisationspositionen zuerst ausprobiert werden, anstelle eines aufeinanderfolgenden Ausprobierens aller Positionen. Dieses neue Verfahren zu einem Reduzieren der Codebuchsuche reduziert die Berechnungskomplexität des Systems drastisch. Wenn mehrere Transponierer verwendet werden, können ferner Synchronisationspositionsinformationen unter den Transponierern zu einer weiteren Reduzierung der Rechenkomplexität gemeinschaftlich verwendet werden, wie es in der folgenden Implementierung gezeigt ist.
  • Die Zeit-Bereich-Transponierer, wie dieselben oben erläutert sind, werden verwendet, um die SBR-1- und SBR-2-Systeme gemäß dem folgenden darstellenden aber nicht begrenzenden Beispiel zu verwenden. In 8 werden drei Ausdehnungsmodule verwendet, um Oberschwingungen zweiten, dritten und vierten Grades zu erzeugen. Da bei diesem Beispiel jeder Zeit-Bereich-Expander/-Transponierer auf einem Breitbandsignal arbeitet, ist es vorteilhaft, die Spektralhüllkurve des Quellfrequenzbereichs vor einer Transposition einzustellen, unter der Betrachtung, daß es nach den Transpositionen keine Einrichtung geben wird, um dies zu tun, ohne ein getrenntes Entzerrersystem hinzuzufügen. Die Spektralhüllkurveneinsteller 801, 803 und 805 arbeiten jeweils auf mehreren Filterbankkanälen. Der Gewinn jedes Kanals bei den Hüllkurveneinstellern muß festgelegt sein, so daß die Summe 813, 815, 817 bei dem Ausgang nach einer Transposition die erwünschte Spektralhüllkurve ergibt. Die Transponierer 807, 809 und 811 sind verbunden, um Synchronisationspositionsinformationen gemeinschaftlich zu verwenden. Dies basiert auf der Tatsache, daß unter bestimmten Bedingungen eine hohe Korrelation zwischen den Synchronisationspositionen auftritt, die während einer Korrelation in den getrennten Transponiereinheiten in dem Codebuch gefunden werden. Man nehme als ein Beispiel und wieder ohne ein Begrenzen des Schutzbereichs der Erfindung an, der Transponierer der Oberschwingung vierter Ordnung arbeitet auf einer Zeitrahmenbasis, die die Hälfte derselben des Transponierers der Oberschwingung der zweiten Ordnung ist, aber mit dem doppelten Belastungszyklus. Man nehme ferner an, daß die Codebücher, die für die zwei Expander verwendet werden, die gleichen sind und daß die Synchronisationspositionen der zwei Zeit-Bereich-Expander sync_pos4 bzw. sync_pos2 etikettiert sind. Dies ergibt die folgende Beziehung: sync_pos2 = sync_pos4 – n·4·S – sync_offset, für n = 1, 2, 3, 4 (10)wobei sync_offset = sync_pos4 – sync_pos2, für n = 0 (11)und S die Länge des Eingangssegments ist, das durch das Codebuch dargestellt ist. Dies ist gültig, solange keiner der Synchronisationspositionszeiger das Ende des Codebuchs erreicht. Während eines normalen Betriebs wird n für jeden Zeitrahmen um 1 erhöht, der durch den Transponierer der Oberschwingung zweiter Ordnung verarbeitet wird, und wenn das Codebuchende durch einen der Zeiger unausweichlich er reicht ist, wird der Zähler n auf n = 0 gesetzt und sync_pos2 und sync_pos4 werden einzeln berechnet. Ähnliche Ergebnisse werden für den Transponierer der Oberschwingung dritter Ordnung erhalten, wenn derselbe mit dem Transponierer der Oberschwingung vierter Ordnung verbunden ist.
  • Die oben vorgelegte Verwendung von mehreren verbundenen Zeit-Bereich-Transponierern zu der Erzeugung von Oberschwingungen höherer Ordnung bringt eine wesentliche Berechnungsreduzierung ein. Ferner präsentiert die vorgeschlagene Verwendung von Zeit-Bereich-Transponierern in Verbindung mit einer geeigneten Filterbank die Möglichkeit, die Hüllkurve des erzeugten Spektrums einzustellen, während die Einfachheit und die geringen Berechnungskosten eines Zeit-Bereich-Transponierers beibehalten sind, da diese mehr oder weniger unter Verwendung einer Festkommaarithmetik und nur additiven/subtraktiven Operationen implementiert sein können.
  • Andere darstellende aber nicht begrenzende Beispiele der vorliegenden Erfindung sind:
    • – die Verwendung eines Zeit-Bereich-Transponierers innerhalb jedes Subbands in einer Subbandfilterbank, wobei so die Signalkomplexität für jeden Transponierer reduziert ist.
    • – die Verwendung eines Zeit-Bereich-Transponierers in Kombination mit einem Frequenz-Bereich-Transponierer, wobei es so ermöglicht ist, daß das System unterschiedliche Verfahren zu einer Transposition verwendet, abhängig von den Charakteristika des Eingangssignals, das verarbeitet wird.
    • – die Verwendung eines Zeit-Bereich-Transponierers bei einem Breitband-Sprachcodec, der z. B. an dem Restsignal wirksam ist, das nach einer linearen Voraussage erhalten wird.
  • Es ist zu erkennen, daß das oben umrissene Verfahren lediglich durch ein Weglassen der Abtastratenumwandlung vorteilhaft zu einer Zeitskalierungsmodifikation verwendet werden kann. Es ist ferner klar, daß, obwohl das umrissene Verfahren auf ein Tonhöhentransponieren zu einer höheren Tonhöhe fokussiert, d. h. eine Zeitausdehnung, die gleichen Prinzipien gelten, wenn zu einer niedrigeren Tonhöhe transponiert wird, d. h. eine Zeitkomprimierung, wie es Fachleuten auf dem Gebiet offensichtlich ist.
  • Filterbankbasierte Transposition
  • Verschiedene neue und innovative filterbankbasierte Transpositionstechniken werden nun beschrieben. Das zu transponierende Signal ist in eine Reihe von BP- oder Subbandsignalen geteilt. Die Subbandsignale werden dann exakt oder näherungsweise transponiert, was vorteilhafterweise durch eine Wiederverbindung von Analyse- und Synthesesubbändern erzielt wird, was hierin im folgenden als ein „Patch" bezeichnet wird. Das Verfahren ist zuerst unter Verwendung einer Kurzzeit-Fourier-Transformation (STFT = Short Time Fourier Transform) gezeigt.
  • Der N-Punkt STFT eines Diskretzeitsignals x(n) ist definiert durch
    Figure 00270001
    wobei k = 0, 1, ..., N – 1 und ωk = 2πk/N und h(n) ein Fenster ist. Falls das Fenster die folgenden Bedingungen erfüllt
    Figure 00270002
    existiert eine inverse Transformation und ist gegeben durch
  • Figure 00280001
  • Die direkte Transformation kann als ein Analysator interpretiert werden, siehe 9a, der eine Bank von N BP-Filtern mit Impulsantworten h(n)exp(jωkn) 901, gefolgt durch eine Bank von N Multiplizierern mit Trägern exp(–jωkn) 903 umfaßt, die die BP-Signale nach unten zu Regionen um 0 Hz verschieben, wobei die N Analysesignale Xk(n) gebildet werden. Das Fenster wirkt als ein Prototyp-LP-Filter. Xk(n) weisen kleine Bandbreiten auf und sind normalerweise abwärtsabgetastet 905. Gl. 12 muß somit nur bei n = rR ausgewertet werden, wobei R der Dezimierungsfaktor ist und r die neue Zeitvariable ist. Xk(n) kann aus Xk(rR) durch ein Aufwärtsabtasten wiedergewonnen werden, siehe 9b, d. h. eine Einbringung von Nullen 907, gefolgt durch ein LP-Filtern 909. Die inverse Transformation kann als ein Synthesizer interpretiert werden, der eine Bank von N Multiplizierern mit Trägern (1/N)exp(jωkn) 911, die die Signale Xk(n) zu den ursprünglichen Frequenzen derselben hinauf verschiebt, gefolgt durch Stufen 913, 9c , umfaßt, die die Beiträge yk(n) von allen Kanälen addieren. Die STFT und ISTFT können umgeordnet werden, um die DFT und IDFT zu verwenden, was die Verwendung von FFT-Algorithmen möglich macht [„Implementation of the Phase Vocoder using the Fast Fourier Transform" M. R. Portnoff, IEEE ASSP, Bd. 24, Nr. 3, 1976].
  • 9c zeigt ein Patch 915 zu einer Erzeugung von zweiten Oberschwingungen, M = 2, mit N = 32. Der Einfachheit halber sind lediglich Kanäle 0 bis 16 gezeigt. Die Mittenfrequenz von BP 16 ist gleich der Nyquist-Frequenz, Kanäle 17 bis 31 entsprechen negativen Frequenzen. Die P 917 bezeichneten Blöcke und die Gewinnblöcke 919 werden später beschrieben und sollten gegenwärtig als überbrückt betrachtet werden. Das Eingangssignal ist bei diesem Beispiel bandbegrenzt, so daß lediglich Kanäle 0 bis 7 Signale enthalten. Analysator kanäle 8 bis 16 sind somit leer und müssen nicht zu dem Synthesizer abgebildet werden. Analysatorkanäle 0 bis 7 sind mit Synthesizerkanälen 0 bis 7 verbunden, was einem Eingangssignalverzögerungsweg entspricht. Analysekanäle k, wobei 4 ≤ k 7, sind ebenfalls mit Synthesekanälen Mk, M = 2, verbunden, die die Signale zu Frequenzregionen bei zweimal den Mittenfrequenzen von BP-Filtern k verschieben. Somit sind die Signale zu den ursprünglichen Bereichen derselben nach oben verschoben sowie eine Oktave nach oben transponiert. Um die harmonische Erzeugung hinsichtlich reellwertiger Filterantworten und Modulatoren zu untersuchen, müssen die negativen Frequenzen ebenfalls betrachtet werden, siehe die untere Verzweigung von 10a. Daher muß der kombinierte Ausgang der Neuabbildung 1 -> Mk 1001 und N – k -> N – Mk 1003 wobei 4 ≤ k ≤ 7 ausgewertet werden.
  • Dies ergibt
    Figure 00290001
    wobei M = 2. Gl. 15 kann als ein BP-Filtern des Eingangssignals, gefolgt durch eine lineare Frequenzverschiebung oder eine Oberes-Seitenband-(OSB-)Modulation interpretiert werden, d. h. eine Einseitenbandmodulation unter Verwendung des oberen Seitenbands, siehe 10b, wobei 1005 und 1007 einen Hilbert-Transformator bilden, 1009 und 1011 Multiplizierer mit Cosinus- und Sinusträgern sind und 1013 eine Differenzstufe ist, die das obere Seitenband auswählt. Natürlich kann ein derartiges BP- und SSB-Mehrbandverfahren explizit implementiert sein, d. h. ohne ein Filterbank-Patchen in dem Zeit- oder Frequenz-Bereich, was eine beliebige Auswahl von einzelnen Durchlaßbändern und Oszillatorfrequenzen ermöglicht.
  • Gemäß Gleichung 15 ergibt eine Sinuskurve mit der Frequenz ωi innerhalb des Durchlaßbands des Analysekanals k eine Oberschwingung bei der Frequenz Mωk + (ωi – ωk). Daher erzeugt das Verfahren, auf das als eine grundlegende Mehrbandtransposition Bezug genommen wird, lediglich exakte Oberschwingungen für Eingangssignale mit Frequenzen ωi = ωk, wobei 4 ≤ k ≤ 7. Falls jedoch die Anzahl von Filtern ausreichend groß ist, ist die Abweichung von einer exakten Transposition vernachlässigbar, siehe Gl. 4. Ferner ist die Transposition für quasistationäre Tonalsignale von beliebigen Frequenzen durch ein Einbringen der Blöcke exakt gemacht, die P 917 bezeichnet sind (9c), vorausgesetzt jeder Analysekanal enthält maximal eine Partiale. In diesem Fall sind Xk(rR) komplexe Exponentiale mit Frequenzen gleich den Frequenzen zwischen den Partialfrequenzen ωi und den Mittenfrequenzen ωk der Analysefilter. Um die exakte Transposition M zu erhalten, müssen diese Frequenzen durch einen Faktor M erhöht werden, wobei die obige Frequenzbeziehung zu ωi -> Mωk + M(ωi – ωk) = Mωi modifiziert ist. Die Frequenzen von Xk(rR) sind gleich den Zeitableitungen der jeweiligen ausgewickelten Phasenwinkel derselben und können unter Verwendung von Differenzen erster Ordnung von aufeinanderfolgenden Phasenwinkeln geschätzt werden. Die Frequenzschätzwerte werden mit M multipliziert und Synthesephasenwinkel werden unter Verwendung dieser neuen Frequenzen berechnet. Abgesehen von einer Phasenkonstante wird das gleiche Ergebnis jedoch auf eine vereinfachte Weise durch ein Multiplizieren der Analyseargumente direkt mit M erhalten, was den Bedarf nach einer Frequenzschätzung eliminiert. Dies ist in 11 beschrieben, die die Blöcke 917 darstellt. Somit werden Xk(rR), wobei bei diesem Beispiel 4 ≤ k ≤ 7, von Rechteck- zu Polarkoordinaten umgewandelt, was durch die Blöcke R → P, 1101 dargestellt ist. Die Argumente werden mit M = 2 multipliziert 1103 und die Beträge sind unverändert. Die Signale werden dann zurück zu Rechteckkoordinaten umgewandelt (P → R) 1105, wobei die Signale YMk(rR) gebildet werden, und werden gemäß 9c Synthesizerkanälen zugeführt. Dieses verbesserte Mehrband transpositionsverfahren weist somit zwei Stufen auf: das Patch liefert eine grobe Transposition, wie bei dem grundlegenden Verfahren, und die Phasenmultiplizierer liefern feine Frequenzkorrekturen. Die obigen Mehrbandtranspositionsverfahren unterscheiden sich von herkömmlichen Tonhöhenverschiebungstechniken, die STFT verwenden, bei der Nachschlagtabellenoszillatoren für die Synthese verwendet werden oder, wenn die ISTFT für die Synthese verwendet wird, das Signal zeitgestreckt und dezimiert wird, d. h. kein Patch verwendet wird.
  • Das harmonische Patch von 9c ist ohne weiteres für andere Transpositionsfaktoren als 2 modifiziert. 12 zeigt ein Patch 1203 zu einer Erzeugung von Oberschwingungen dritter Ordnung, wobei 1201 die Analysekanäle sind und 1205 die Synthesekanäle sind. Unterschiedliche Oberschwingungsordnungen können simultan erzeugt werden, wie es in 13 gezeigt ist, wobei Oberschwingungen zweiter und dritter Ordnung verwendet werden. 14 stellt eine nicht-überlappende Kombination von Oberschwingungen zweiter, dritter und vierter Ordnung dar. Die niedrigstmögliche Oberschwingungsanzahl wird bei einer möglichst hohen Frequenz verwendet. Über der oberen Begrenzung des Bestimmungsbereichs der Oberschwingung M, wird eine Oberschwingung M + 1 verwendet. 15 zeigt ein Verfahren zu einem Abbilden aller Synthesizerkanäle (N = 64, gezeigte Kanäle 0–32). Alle Hochbandkanäle mit Nicht-Primzahl-Indizes werden gemäß der folgenden Beziehung zwischen Quell- und Bestimmungskanalanzahl abgebildet: kdest = Mksource, wobei M die kleinste Ganzzahl ≥ 2 ist, die die Bedingung erfüllt, daß ksource in dem Tiefband und kdest in dem Hochband liegt. Daher empfängt kein Synthesizerkanal ein Signal von mehr als einem Analysekanal. Primzahl-Hochbandkanäle können zu ksource = 1 oder Tiefbandkanälen ksource > 1 abgebildet werden, die gute Annäherungen der obigen Beziehung ergeben (in 15 sind lediglich Nicht-Primzahl-Verbindungen mit M = 2, 3, 4, 5 gezeigt).
  • Es ist auch möglich, Amplituden- und Phaseninformationen von unterschiedlichen Analysatorkanälen zu kombinieren. Die Amplitudensignale |Xi(rR)| können gemäß 16 verbunden werden, während die Phasensignale gemäß dem Prinzip von 15 verbunden werden. Auf diese Weise werden die Tiefbandfrequenzen immer noch transponiert, wodurch eine periodische Wiederholung der Quellregionhüllkurve anstelle der gestreckten Hüllkurve erzeugt wird, die aus einer Transposition gemäß Gleichung 2 resultiert. Ein Ausblenden oder eine andere Einrichtung kann eingegliedert sein, um eine Verstärkung von „leeren" Quellkanälen zu vermeiden. 17 stellt eine andere Anwendung dar, die Erzeugung von Suboberschwingungen zu einem hochpaßgefilterten oder baßbegrenzten Signal durch ein Verwenden von Verbindungen von höheren zu niedrigeren Subbändern. Wenn die obigen Transpositionen verwendet werden, kann es vorteilhaft sein, ein adaptives Schalten eines Patch basierend auf den Charakteristika des Signals zu verwenden.
  • Bei der obigen Beschreibung wurde angenommen, daß die höchste Frequenz, die in dem Eingangssignal enthalten ist, erheblich niedriger als die Nyquist-Frequenz war. Somit war es möglich, eine Bandbreitenerweiterung ohne eine Erhöhung bei einer Abtastrate durchzuführen. Dies ist jedoch nicht immer der Fall, warum ein vorhergehendes Aufwärtsabtasten notwendig sein kann. Wenn Filterbankverfahren zu einer Transposition verwendet werden, ist es möglich, ein Aufwärtsabtasten in den Prozeß zu integrieren.
  • Die meisten Wahrnehmungscodecs verwenden in der Zeit maximal dezimierte Filterbanken zu einer Frequenzabbildung [„Introduction to Perceptual Coding" K. Brandenburg, AES, Collected Papers on Digital Audio Bitrate Reduction, 1996]. 18a zeigt die Grundstruktur eines Wahrnehmungscodierersystems. Die Analysefilterbank 1801 teilt das Eingangssignal in mehrere Subbandsignale. Die Subbandabtastwerte werden einzeln quantisiert 1803, wobei eine reduzierte Anzahl von Bits verwendet wird, wobei die Anzahl von Quanti sierungspegeln aus einem Wahrnehmungsmodell bestimmt sind 1807, das die minimale Maskierungsschwelle schätzt. Die Subbandabtastwerte werden normalisiert, mit optionalen Redundanzcodierungsverfahren codiert und mit Seiteninformationen kombiniert, die aus den Normalisierungsfaktoren, Bitzuweisungsinformationen und anderen Codec-spezifischen Daten bestehen 1805, um den Reihenbitstrom zu bilden. Der Bitstrom wird dann gespeichert oder gesendet. Bei dem Decodierer, 18b, wird der codierte Bitstrom gedemultiplext 1809, decodiert und die Subbandabtastwerte werden wieder zu der gleichen Anzahl von Bits quantisiert 1811. Eine Synthesefilterbank kombiniert die Subbandabtastwerte, um das ursprüngliche Signal wieder zu erzeugen 1813. Implementierungen, die maximal dezimierte Filterbanken verwenden, reduzieren Berechnungskosten drastisch. Bei den folgenden Beschreibungen wird auf Cosinus-modulierte Filterbanken fokussiert. Es ist jedoch zu erkennen, daß die Erfindung unter Verwendung anderer Typen von Filterbanken oder Transformationen implementiert werden kann, einschließlich Filterbankinterpretationen der Wavelet-Transformation, anderer Filterbanken oder Transformationen mit nicht-gleicher Bandbreite und mehrdimensionale Filterbanken oder Transformationen.
  • Bei den folgenden darstellenden aber nicht begrenzenden Beschreibungen wird angenommen, daß eine Cosinus-modulierte L-Kanal-Filterbank das Eingangssignal x(n) in L Subbandsignale teilt. Die allgemeine Struktur einer maximal dezimierten Filterbank ist in 19 gezeigt. Die Analysefilter sind mit Hk(z) 1901 bezeichnet, wobei k = 0, 1, ..., L – 1. Die Subbandsignale vk(n) sind maximal dezimiert 1903, jeweils von einer Abtastfrequenz fs/L, wobei fs die Abtastfrequenz von x(n) ist. Der Syntheseabschnitt fügt die Subbandsignale nach einer Interpolation 1905 und einem Filtern 1907 wieder zusammen, um x ^(n) zu erzeugen. Die Synthesefilter sind mit Fk(z) bezeichnet. Zusätzlich führt die vorliegende Erfindung eine Spektralreplikation an x ^(n) durch, was ein verbessertes Signal y(n) ergibt.
  • Ein Generieren der Subbandsignale mit einer QL-Kanal-Filterbank, wobei lediglich die L-Tiefbandkanäle verwendet werden und der Bandbreitenausdehnungsfaktor Q gewählt ist, so daß QL ein ganzzahliger Wert ist, resultiert in einem Ausgangsbitstrom mit einer Abtastfrequenz Qfs. Daher wirkt die erweiterte Filterbank, als ob sie eine L-Kanal-Filterbank gefolgt von einem Aufwärtsabtaster ist. Da in diesem Fall die L(Q – 1)-Hochbandfilter ungenutzt (mit Nullen gespeist) sind, verändert sich die Audiobandbreite nicht – die Filterbank baut lediglich eine aufwärtsabgetastete Version von x ^(n) wieder auf. Falls jedoch die L-Subbandsignale zu den Hochbandfiltern gepatcht werden, wird die Bandbreite von x ^(n) um einen Faktor Q erhöht, was y(n) erzeugt. Dies ist die maximal dezimierte Filterbankversion des grundlegenden Mehrbandtransponierers gemäß der Erfindung. Unter Verwendung dieses Schemas ist der Aufwärtsabtastprozeß in das Synthesefiltern integriert, wie es später erläutert ist. Es ist zu bemerken, daß eine jegliche Größe der Synthesefilterbank verwendet werden kann, was in unterschiedlichen Abtastraten des Ausgangssignals und somit unterschiedlichen Bandbreitenausdehnungsfaktoren resultiert. Ein Durchführen einer Spektralreplikation an x ^(n) gemäß der vorliegenden Erfindung des grundlegenden Mehrbandtranspositionsverfahrens mit einem ganzzahligen Transpositionsfaktor M ist erzielt durch ein Patchen der Subbandsignale als νMk(n) = eMk(n)(– 1)(M–1)knνk(n) (16)wobei k ∊ [0, L – 1] und gewählt ist, so daß Mk ∊ [L, QL – 1], eMk(n) die Hüllkurvenkorrektur ist und (–1)(M–1)kn ein Korrekturfaktor für spektralinvertierte Subbänder ist. Eine Spektralinversion resultiert aus einer Dezimierung von Subbandsignalen und die invertierten Signale können durch ein Ändern eines Vorzeichens bei jedem zweiten Abtastwert in diesen Kanälen reinvertiert werden. Unter Bezugnahme auf 20 betrachte man eine 16-Kanal-Synthesefilterbank, gepatcht 2009 für einen Transpositionsfaktor M = 2, mit Q = 2. Die Blöcke 2001 und 2003 bezeichnen die Analysefilter Hk(z) bzw. die Dezimatoren von 19. Auf eine ähnliche Weise sind 2005 und 2007 die Interpolatoren und Synthesefilter Fk(z). Gl. 16 vereinfacht sich dann zu einem Patchen der vier oberen Frequenzsubbandsignale der empfangenen Daten in jeden zweiten der acht obersten Kanäle in der Synthesefilterbank. Aufgrund einer Spektralinversion muß jedes zweite gepatchte Subbandsignal vor der Synthese frequenzinvertiert werden. Zusätzlich müssen die Beträge der gepatchten Signale gemäß den Prinzipien von SBR-1 oder SBR-2 eingestellt werden 2011.
  • Unter Verwendung des grundlegenden Mehrbandtranspositionsverfahrens gemäß der vorliegenden Erfindung sind die erzeugten Oberschwingungen im allgemeinen keine exakten Mehrfachen der Fundamentalen. Alle Frequenzen außer der niedrigsten in jedem Subband unterscheiden sich zu einem gewissen Ausmaß von einer exakten Transposition. Ferner enthält das replizierte Spektrum Nullen, da das Zielintervall einen breiten Frequenzbereich als das Quellintervall abdeckt. Außerdem verschwinden die Aliasaufhebungseigenschaften der Cosinus-modulierten Filterbank, da die Subbandsignale in einer Frequenz in dem Zielintervall getrennt sind. Das heißt, benachbarte Subbandsignale überlappen sich in dem Hochbandbereich nicht. Es können jedoch Aliasingreduzierungsverfahren verwendet werden, die Fachleuten auf dem Gebiet bekannt sind, um diesen Typ von Artefakten zu reduzieren. Vorteile dieses Transpositionsverfahrens sind eine leichte Implementierung und die sehr niedrigen Berechnungskosten.
  • Um eine perfekte Transposition von Sinuskurven zu erreichen, wird nun eine wirksame maximal dezimierte Filterbanklösung des verbesserten Mehrbandtranspositionsverfahrens präsentiert. Das System verwendet eine zusätzliche modifizierte Analysefilterbank, während die Synthesefilterbank Cosinus-moduliert ist, wie es durch Vaidyanathan [„Multirate Systems and Filter Banks" P. P. Vaidyanathan, Prentice Hall, Englewood Cliffs, New Jersey, 1993, ISBN 0-13-605718- 7] beschrieben ist. Die Schritte zu einer Operation, wobei das verbesserte Mehrbandtranspositionsverfahren gemäß der vorliegenden Erfindung verwendet wird, basieren auf maximal dezimierten Filterbanken, sind schematisch in 21 und in dem Flußdiagramm von 22 gezeigt und sind wie folgt:
    • 1. Die L empfangenen Subbandsignale werden mit einer QL-Kanal-Filterbank generiert 2101, 2201, 2203, wobei die L(Q – 1) oberen Kanäle mit Nullen gespeist werden, um ein Signal x1(n) zu bilden, das somit durch den Bandbreitenerweiterungsfaktor Q überabgetastet wird.
    • 2. x1(n) wird durch einen Faktor Q abwärtsabgetastet, um ein Signal x2(n') zu bilden 2103, 2205, d. h. x2(n') = x1(Qn').
    • 3. Ein ganzzahlwertiges K wird als die Größe einer Synthesefilterbank gewählt, eingeschränkt, so daß T = KM/Q eine Ganzzahl ist, wobei T die Größe der modifizierten Analysefilterbank ist und M der Transpositionsfaktor ist 2207, 2209, 2211. K sollte vorzugsweise für stationäre (tonale) Signale groß und für dynamische (transiente) Signale kleiner gewählt sein.
    • 4. x2(n') wird durch eine T-Kanal-modifizierte Analysefilterbank gefiltert 2107, 2213, wobei die T Analysefilter exponentiell moduliert sind, was einen Satz von komplexwertigen Subbandsignalen erzeugt. Die Subbandsignale werden durch einen Faktor T/M abwärtsabgetastet, was Subbandsignale vk (M)(n''), k = 0, 1, ..., T – 1 ergibt. Daher wird die Filterbank durch einen Faktor M überabgetastet.
    • 5. Die Abtastwerte k (M)(n'') werden in eine polare Darstellung (Betrag und Phasenwinkel) umgewandelt. Die Phasenwinkel werden mit dem Faktor M multipliziert und die Abtastwerte werden gemäß dem Schema von 11 zurück zu einer rechteckigen Darstellung umgewandelt. Die reellen Teile der komplexwertigen Abtastwerte werden genommen, was die Signale sk (M)(n'') ergibt 2109, 2215. Nach dieser Operation werden die Signale sk (M)(n'') kritisch abgetastet.
    • 6. Die Gewinne der Signale sk (M)(n'') werden gemäß den Prinzipien von SBR-1 oder SBR-2 eingestellt 2111, 2217.
    • 7. Die Subbandsignale sk (M)(n''), wobei k ∊ [T/M, min(K, T) – 1] werden mit einer gewöhnlichen Cosinusmodulierten K-Kanal-Filterbank generiert, wobei die Kanäle 0 bis T/M – 1 mit Nullen gespeist werden 2105, 2221. Dies erzeugt das Signal x3 (M)(n).
    • 8. x3 (M)(n) wird schließlich zu x1(n) addiert, um y(n) zu ergeben 2223, was das erwünschte spektralreplizierte Signal ist.
  • Die Schritte 3 bis 6 können für unterschiedliche Werte des Transpositionsfaktors M wiederholt werden, wobei so mehrere Oberschwingungen zu x1(n) addiert werden. Dieser Betriebsmodus ist durch die gepunkteten Figuren von 21 und in 22 durch ein iteratives Wiederholen der Schleife über den Kästen 22112219 dargestellt. In diesem Fall ist k gewählt, um T für alle Auswahlmöglichkeiten von M ganzzahlwertig zu machen – für ein ganzzahlwertiges M : s; man wähle K vorzugsweise aus, um aus K/Q eine positive Ganzzahl zu machen. Alle Subbandsignale
    Figure 00370001
    wobei i = 1, 2, ..., m, und m die Anzahl von Transpositionsfaktoren ist, werden gemäß
    Figure 00370002
    für jedes anwendbare k addiert. Bei der ersten Iteration der Schleife von 22 können die Signale sk(n'') als Subbandabtastwerte von lediglich Nullen betrachtet werden, wobei k = 0, 1, ..., K – 1. Bei jeder Schleife werden die neuen Abtastwerte zu sk(n'') addiert 2219 als
    Figure 00380001
    wobei k = K/Q, K/Q + 1, ..., min (K, Ti) – 1. Die Subbandsignale sk(n'') werden einmal mit einer K-Kanal-Filterbank gemäß Schritt 7 generiert.
  • Die modifizierte Analysefilterbank von Schritt 4 ist durch die Theorie von Cosinus-modulierten Filterbanken abgeleitet, wobei die modulierte überlappte Transformation (MLT = modulated lapped transform) [„Lapped Transforms for Efficient Transform/Subband Coding" H. S. Malvar, IEEE Trans ASSP, Bd. 38, Nr. 6, 1990) ein spezieller Fall ist. Die Impulsantworten hk(n) der Filter in einer Cosinus-modulierten T-Kanal-Filterbank können geschrieben werden
    Figure 00380002
    wobei k = 0, 1, ..., T – 1, N die Länge des Tiefpaßprototypfilters p0(n) ist, C eine Konstante ist und Φk ein Phasenwinkel ist, der eine Aliasaufhebung zwischen benachbarten Kanälen sicherstellt. Die Beschränkungen auf Φk sind
    Figure 00380003
    die vereinfacht werden können zu dem geschlossenen Ausdruck
  • Figure 00380004
  • Bei dieser Auswahl von Φk können perfekte Rekonstruktionssysteme oder näherungsweise Rekonstruktionssysteme (Pseudo- QMF-Systeme) erhalten werden, die Synthesefilterbanken verwenden mit Impulsantworten wie
  • Figure 00390001
  • Man betrachte die Filter
    Figure 00390002
    wobei h'k(n) die Sinus-modulierten Versionen des Prototypfilters p0(n) sind. Die Filter H'k(z) und Hk(z) weisen identische Durchlaßbandträger auf, aber die Phasenantworten unterscheiden sich. Die Durchlaßbänder der Filter sind tatsächlich Hilbert-Transformationen voneinander (dies gilt nicht für Frequenzen nahe an ω = 0 und ω = π). Ein Kombinieren von Gleichung 19 und Gleichung 23 gemäß
    Figure 00390003
    ergibt Filter, die die gleiche Form der Betragsantworten wie Hk(z) für positive Frequenzen aufweisen, aber für negative Frequenzen 0 sind. Ein Verwenden einer Filterbank mit Impulsantworten wie in Gl. 24 ergibt einen Satz von Subbandsignalen, die als die analytischen (komplexen) Signale entsprechend den Subbandsignalen interpretiert werden können, die von einer Filterbank mit Impulsantworten wie in Gl. 19 erhalten werden. Analytische Signale sind zu einer Manipulation geeignet, da die komplexwertigen Abtastwerte in einer polaren Form geschrieben sein können, d. h. z(n) = r(n) – ji(n) = |z(n)|exp{j arg(z(n))}. Wenn jedoch die komplexe Filterbank zu einer Transposition verwendet wird, muß die Beschränkung auf Φk verallgemeinert werden, um die Aliasaufhebungseigenschaft zu behalten. Die neue Beschränkung auf Φk, um eine Aliasaufhebung in Kombination mit ei ner Synthesefilterbank mit Impulsantworten wie in Gl. 22 sicherzustellen, ist
    Figure 00400001
    was sich zu Gl. 21 vereinfacht, wenn M = 1. Bei dieser Auswahl weisen transponierte Partiale die gleichen relativen Phasen auf, wie sie dieselben aufweisen würden, wenn M = 1 (keine Transposition).
  • Ein Kombinieren von Gl. 24 und Gl. 25 resultiert in
    Figure 00400002
    was die Filter sind, die bei der modifizierten Filterbank von Schritt 4 verwendet werden, gemäß der vorliegenden Erfindung.
  • Einige Klarstellungen bezüglich Schritt 5: ein Abwärtsabtasten der komplexwertigen Subbandsignale durch einen Faktor T/M macht dieselben durch M überabgetastet, was ein wesentliches Kriterium ist, wenn die Phasenwinkel nachfolgend mit dem Transpositionsfaktor M multipliziert werden. Das Überabtasten zwingt die Anzahl von Subbandabtastwerten pro Bandbreite nach einer Transposition zu dem Zielbereich, gleich der des Quellbereichs zu sein. Die einzelnen Bandbreiten der transponierten Subbandsignale sind aufgrund das Phasenmultiplizierers M-mal größer als dieselben in dem Quellbereich. Dies macht die Subbandsignale nach Schritt 5 kritisch abgetastet und zusätzlich gibt es keine Nullen in dem Spektrum bei einem Transponieren von tonalen Signalen.
  • Um trigonometrische Berechnungen zu vermeiden, d. h., die neuen Subbandsignale berechnen zu müssen als
    Figure 00410001
    wobei |vk (M)(n'')| der absolute Wert von vk (M)(n'') ist, wird die folgende trigonometrische Beziehung verwendet:
    Figure 00410002
    Angenommen
    Figure 00410003
    und anmerkend, daß
    Figure 00410004
    und
    Figure 00410005
    können die Berechnungen von Schritt 5 ohne trigonometrische Berechnungen erzielt werden, was eine Berechnungskomplexität reduziert.
  • Wenn Transpositionen verwendet werden, bei denen M gerade ist, können Hindernisse bei dem Phasenmultiplizierer entstehen, abhängig von den Charakteristika des Tiefpaßprototypfilters p0(n). Alle anwendbaren Prototypfilter weisen Nullen auf dem Einheitskreis in der z-Ebene auf. Eine 0 auf dem Einheitskreis erlegt eine 180°-Verschiebung bei der Phasenantwort des Filters auf. Für M gerade, translatiert der Phasenmultiplizierer diese Verschiebungen zu 360°-Verschiebungen; d. h. die Phasenverschiebungen verschwinden. Die Partiale, die so in einer Frequenz positioniert sind, daß derartige Phasenverschiebungen verschwinden, rufen ein Aliasing bei dem generierten Signal hervor. Das Ungünstigster-Fall-Szenario ist, wenn eine Partiale an einem Punkt in einer Frequenz positioniert ist, der dem oberen Ende des ersten Seitenlappens eines Analysefilters entspricht. Abhängig von der Unterdrückung dieses Lappens bei der Betragsantwort, wird das Aliasing mehr oder weniger hörbar sein. Beispielsweise wird der erste Seitenlappen des Prototypfilters, das bei dem ISO/MPEG-Schicht-1 und -2-Standard verwendet wird, 96 dB unterdrückt, während die Unterdrückung für den ersten Seitenlappen des Sinusfensters, das bei dem MDCT-Schema des ISO/MPEG-Schicht-3-Standard verwendet wird, lediglich 23 dB beträgt. Es ist klar, daß dieser Typ eines Aliasing unter Verwendung des Sinusfensters hörbar sein wird. Eine Lösung zu diesem Problem wird präsentiert und wird als eine relative Phasenverriegelung bezeichnet.
  • Die Filter ha k(n) weisen alle lineare Phasenantworten auf. Die Phasenwinkel Φk bringen relative Phasendifferenzen zwischen benachbarten Kanälen ein und die Nullen auf dem Einheitskreis bringen 180°-Phasenverschiebungen bei Positionen in einer Frequenz ein, die zwischen Kanälen unterschiedlich sein kann. Durch ein Überwachen der Phasendifferenz zwischen benachbarten Subbandsignalen bevor der Phasenmultiplizierer aktiviert ist, ist es einfach, die Kanäle zu erfassen, die phaseninvertierte Informationen enthalten. Unter Betrachtung von tonalen Signalen beträgt die Phasendifferenz näherungsweise π/2M, gemäß Gl. 25, für nichtinvertierte Signale und folglich näherungsweise π(1 – 1/2M) für Signale, bei denen eines der Signale invertiert ist. Die Erfassung von invertierten Signalen kann einfach durch ein Berechnen des Punktprodukts von Abtastwerten in benachbarten Subbändern erzielt werden als ν(M)k (n'')·ν(M)k+1 (n'') = real{ν(M)k (n'')}real{ν(M)k+1 (n'') + imag{ν(M)k (n'')}imag{ν(M)k+1 (n'')} (32)
  • Falls das Produkt in Gleichung 32 negativ ist, ist die Phasendifferenz größer als 90° und eine Phaseninversionsbedingung liegt vor. Die Phasenwinkel der komplexwertigen Subbandsignale werden mit M multipliziert, gemäß dem Schema von Schritt 5, und schließlich werden die inversionsetikettierten Signale negiert. Das Relative-Phasenverriegelung-Verfahren zwingt somit die 180°-verschobenen Subbandsignale, diese Verschiebung nach der Phasenmultiplikation zu behalten und somit die Aliasingaufhebungseigenschaften beizubehalten.
  • Spektralhüllkurveneinstellung
  • Die meisten Klänge, wie eine Sprache und eine Musik, sind als Produkte von langsam variierenden Hüllkurven und schnell variierenden Trägern mit einer konstanten Amplitude charakterisiert, wie es durch Stockham [„The Application of Generalized Linearity to Automatic Gain Control" T. G. Stockham, Jr, IEEE Trans. on Audio and Electroacoustics, Bd. AU-16, Nr. 2, Juni 1968] und Gl. 1 beschrieben ist.
  • Bei Splitband-Wahrnehmungsaudiocodierern wird das Audiosignal in Rahmen segmentiert und in mehrere Frequenzbänder geteilt, wobei Subbandfilter oder eine Zeit-zu-Frequenz-Bereich-Transformation verwendet wird. Bei den meisten Codectypen wird das Signal nachfolgend in zwei größere Signalkomponenten zu einer Übertragung oder Speicherung getrennt, die Spektralhüllkurvendarstellung und die normalisierten Subbandabtastwerte oder Koeffizienten. Überall in der folgenden Beschreibung bezieht sich der Ausdruck „Subbandabtastwerte" oder „Koeffizienten" auf Abtastwerte, die von Subbandfiltern erhalten werden, sowie Koeffizienten, die von einer Zeit-zu-Frequenz-Transformation erhalten wer den. Der Ausdruck „Spektralhüllkurve" oder „Skalierungsfaktoren" stellt Werte der Subbänder auf einer Zeit-Rahmen-Basis dar, wie beispielsweise den durchschnittlichen oder maximalen Betrag in jedem Subband, verwendet für eine Normalisierung der Subbandabtastwerte. Die Spektralhüllkurve kann jedoch auch unter Verwendung einer linearen Voraussage erhalten werden LPC, [US-Pat. 5,684,920]. Bei einem typischen Codec erfordern die normalisierten Subbandabtastwerte ein Codieren bei einer hohen Bitrate (ein Verwenden von näherungsweise 90% der verfügbaren Bitrate) verglichen mit den langsam variierenden zeitlichen Hüllkurven und somit den Spektralhüllkurven, die bei einer sehr reduzierten Rate (ein Verwenden von näherungsweise 10% der verfügbaren Bitrate) codiert werden können.
  • Eine genaue Spektralhüllkurve der replizierten Bandbreite ist wichtig, falls die Klangfarbenqualitäten des ursprünglichen Signals bewahrt werden sollen. Die wahrgenommene Klangfarbe eines Musikinstruments oder einer Stimme ist hauptsächlich durch die Spektralverteilung unter einer Frequenz flim bestimmt, die in den höchsten Höroktaven positioniert ist. Die Spektraldetails über flim sind somit von geringerer Bedeutung und folglich erfordern die Hochband-Feinstrukturen, die durch die obigen Transpositionsverfahren erhalten werden, keine Einstellung, während die groben Strukturen dasselbe allgemein tun. Um eine derartige Einstellung zu ermöglichen, ist es nützlich, die Spektraldarstellung des Signals zu filtern, um die grobe Hüllkurvenstruktur von der feinen Struktur zu trennen.
  • Bei der SBR-1-Implementierung gemäß der vorliegenden Erfindung wird die grobe Hochbandspektralhüllkurve aus den bei dem Decodierer verfügbaren Tiefbandinformationen geschätzt. Diese Schätzung wird durch ein kontinuierliches Überwachen der Hüllkurve des Tiefbands und ein Einstellen der Hochbandspektralhüllkurve gemäß spezifischen Regeln durchgeführt. Ein neuartiges Verfahren, um die Hüllkurvenschätzung zu erzielen, verwendet Asymptoten in einem logarithmischen Frequenz-Betrag-Raum, was äquivalent zu einem Kurvenanpassen mit Polynomen einer variierenden Ordnung in dem linearen Raum ist. Der Pegel und die Steigung eines oberen Abschnitts des Tiefbandspektrums werden geschätzt und die Schätzwerte werden verwendet, um den Pegel und die Steigung eines oder mehrerer Segmente zu definieren, die die neue Hochbandhüllkurve darstellen. Die Asymptotenschnittpunkte sind in einer Frequenz fest und wirken als Schwenkpunkte. Obwohl es nicht immer notwendig ist, ist es vorteilhaft, Beschränkungen festzusetzen, um die Hochbandhüllkurvenauslenkungen innerhalb realistischer Grenzen zu halten. Ein alternativer Ansatz zu einer Schätzung der Spektralhüllkurve besteht darin, eine Vektorquantisierung, VQ, einer großen Anzahl von repräsentativen Spektralhüllkurven zu verwenden und dieselben in einer Nachschlagtabelle und einem Codebuch zu speichern. Eine Vektorquantisierung wird durch ein Trainieren der erwünschten Anzahl von Vektoren an einer großen Anzahl von Trainingsdaten durchgeführt, bei diesem Fall Audiospektralhüllkurven. Das Trainieren wird gewöhnlich mit dem verallgemeinerten Lloyd-Algorithmus (Generalised Lloyd Algorithm) [„Vector Quantization and Signal Compression" A. Gersho, R. M. Gray, Kluwer Academic Publishers, USA 1992, ISBN 0-7923-9181-0] vorgenommen und ergibt Vektoren, die die Inhalte der Trainingsdaten optimal abdecken. Unter Betrachtung eines VQ-Codebuchs, das aus A Spektralhüllkurven besteht, die durch B Hüllkurven trainiert sind (B >> A), dann stellen die A Hüllkurven die A wahrscheinlichsten Übergänge von der Tiefbandhüllkurve zu der Hochbandhüllkurve basierend auf B Beobachtungen einer breiten Vielfalt von Klängen dar. Das heißt theoretisch die A optimalen Regeln zu einem Voraussagen der Hüllkurve basierend auf den B Beobachtungen. Wenn eine neue Hochbandspektralhüllkurve geschätzt wird, wird die ursprüngliche Tiefbandhüllkurve verwendet, um das Codebuch zu durchsuchen, und der Hochbandteil des am besten übereinstimmenden Codebucheintrags wird angewendet, um das neue Hochbandspektrum zu erzeugen.
  • In 23 sind die normalisierten Subbandabtastwerte durch 2301 dargestellt und die Spektralhüllkurven sind durch die Skalierungsfaktoren 2305 dargestellt. Zu darstellenden Zwecken ist die Übertragung zu einem Decodierer 2303 in einer parallelen Form gezeigt. Bei dem SBR-2-Verfahren von 24 werden die Spektralhüllkurveninformationen gemäß 23 erzeugt und übertragen, wodurch lediglich die Tiefbandsubbandabtastwerte übertragen werden. Übertragene Skalierungsfaktoren überspannen somit den vollen Frequenzbereich, während die Subbandabtastwerte lediglich einen beschränkten Frequenzbereich überspannen, ausschließlich des Hochbands. Bei dem Decodierer werden die Tiefbandsubbandabtastwerte 2401 transponiert 2403 und mit den empfangenen Hochbandspektralhüllkurveninformationen 2405 kombiniert. Auf diese Weise ist die synthetische Hochbandspektralhüllkurve identisch mit derselben des Originals, während eine erhebliche Bitratenreduzierung beibehalten ist.
  • Bei einigen Codecs ist es möglich, die Skalierungsfaktoren für die gesamte Spektralhüllkurve zu übertragen, während die Hochbandsubbandabtastwerte weggelassen werden, wie es in 24 gezeigt ist. Andere Codecstandards setzen fest, daß Skalierungsfaktoren und Subbandabtastwerte den gesamten Frequenzbereich abdecken müssen, d. h. Skalierungsfaktoren können nicht übertragen werden, falls die Subbandabtastwerte weggelassen sind. In derartigen Fällen gibt es mehrere Lösungen; die Hochbandspektralhüllkurveninformationen können in getrennten Rahmen übertragen werden, wobei die Rahmen eigene Kopfblöcke derselben und einem wahlweisen Fehlerschutz aufweisen, gefolgt durch die Daten. Reguläre Decodierer, die die vorliegende Erfindung nicht ausnutzen, werden die Kopfblöcke nicht erkennen und daher die zusätzlichen Rahmen aussondern. Bei einer zweiten Lösung werden die Hochbandspektralhüllkurveninformationen als Hilfsdaten innerhalb des codierten Bitstroms übertragen. Das verfügbare Hilfsdatenfeld muß jedoch groß genug sein, um die Hüllkurveninformationen zu halten. In Fällen, bei denen keine der zwei ersten Lösungen anpaßbar ist, kann eine dritte Lö sung angewendet werden, bei der die Hochbandspektralhüllkurveninformationen als Subbandabtast-werte versteckt werden. Subbandskalierungsfaktoren decken einen großen Dynamikbereich ab, typischerweise mehr als 100 dB. Es ist somit möglich, eine beliebige Anzahl von Subbandskalierungsfaktoren, 2505 in 25, zu sehr niedrigen Werten zu setzen und die Hochbandskalierungsfaktoren „getarnt" als Subbandabtastwerte, 2501, zu übertragen. Diese Weise eines Übertragens der Hochbandskalierungsfaktoren zu dem Decodierer 2503 stellt eine Kompatibilität zu der Bitstrom-Syntax sicher. Daher können beliebige Daten auf diese Weise übertragen werden. Es existiert ein verwandtes Verfahren, bei dem Informationen in den Subbandabtaststrom codiert werden [US-Pat. 5,687,191]. Eine vierte Lösung, 26, kann angewendet werden, wenn ein Codiersystem Huffman- oder eine andere Redundanzcodierung 2603 verwendet. Die Subbandabtastwerte für das Hochband sind dann auf null 2601 oder einen konstanten Wert gesetzt, um eine hohe Redundanz zu erreichen.
  • Transientenantwortverbesserungen
  • Transientenbezogene Artefakte sind allgemeine Probleme bei Audiocodecs und ähnliche Artefakte treten bei der vorliegenden Erfindung auf. Im allgemeinen erzeugt ein Patchen spektrale „Nullen" oder Einkerbungen, die voreilenden und nacheilenden Zeit-Bereich-Echos, d. h. störenden Transienten vor und nach „echten" Transienten entsprechen. Obwohl die P-Blöcke bei langsam variierenden tonalen Signalen „die Nullen ausfüllen", bleiben die voreilenden und nacheilenden Echos. Das verbesserte Mehrbandverfahren soll an diskreten Sinuskurven arbeiten, wobei die Anzahl von Sinuskurven auf eine pro Subband beschränkt ist. Transienten oder ein Rauschen in einem Subband kann als eine große Anzahl von diskreten Sinuskurven innerhalb dieses Subbands betrachtet werden. Dies erzeugt eine Intermodulationsverzerrung. Diese Artefakte werden als zusätzliche Quantisierungsrauschquellen betrachtet, die mit den replizierten Hochbandkanälen während Transientenintervallen verbunden sind. Herkömmliche Verfahren, um Artefakte eines voreilenden und nacheilenden Echos bei Wahrnehmungsaudiocodierern zu vermeiden, z. B. ein adaptives Fensterschalten, können somit verwendet werden, um die subjektive Qualität des verbesserten Mehrbandverfahrens zu verbessern. Durch ein Verwenden der Transientenerfassung, die durch den Codec oder einen getrennten Detektor bereitgestellt ist, und ein Reduzieren der Anzahl von Kanälen unter transienten Bedingungen ist das „Quantisierungsrauschen" gezwungen, die zeitabhängige Maskierungsschwelle nicht zu überschreiten. Eine kleinere Anzahl von Kanälen wird während Transientendurchgängen verwendet, während eine größere während Tonaldurchgängen verwendet wird. Ein derartiges adaptives Fensterschalten wird allgemein bei Codecs verwendet, um eine Frequenzauflösung mit einer Zeitauflösung zu tauschen. Unterschiedliche Verfahren können bei Anwendungen verwendet werden, bei denen die Filterbandgröße fest ist. Ein Ansatz besteht darin, das „Quantisierungsrauschen" in einer Zeit über eine lineare Voraussage in dem Spektralbereich zu formen. Die Transposition wird dann an dem Restsignal durchgeführt, das der Ausgang des linearen Voraussagefilters ist. Nachfolgend wird simultan ein Inversvoraussagefilter auf die ursprünglichen und die spektral replizierten Kanäle angewendet. Ein anderer Ansatz verwendet ein Kompandersystem, d. h. eine dynamische Amplitudenkomprimierung des transienten Signals vor einer Transposition oder einem Codieren und eine komplementäre Ausdehnung nach einer Transposition. Es ist auch möglich, zwischen Transpositionsverfahren auf eine signalabhängige Weise zu schalten, z. B. wird ein hochauflösendes Filterbanktranspositionsverfahren für stationäre Signale verwendet und ein zeitvariantes Mustersuchvoraussageverfahren wird für transiente Signale verwendet.
  • Praktische Implementierungen
  • Unter Verwendung eines Standardsignalprozessors oder eines leistungsstarken PCs ist eine Echtzeitoperation eines SBR-verbesserten Codec möglich. Der SBR-verbesserte Codec kann auch auf einem kundenspezifischen Chip fest codiert sein. Derselbe kann auch in verschiedenen Arten von Systemen zu einer Speicherung oder Übertragung von Signalen, analog oder digital, unter Verwendung von beliebigen Codecs, 27 und 28, implementiert sein. Das SBR-1-Verfahren kann in einen Decodierer integriert sein oder als ein hinzufügbares Hardware- oder Softwarenachverarbeitungsmodul geliefert sein. Das SBR-2-Verfahren benötigt eine zusätzliche Modifizierung des Codierers. In 27 wird das analoge Eingangssignal dem A/D-Wandler 2701 zugeführt, wobei ein digitales Signal gebildet wird, das einem beliebigen Codierer 2703 zugeführt wird, wo ein Quellcodieren durchgeführt wird. Das in das System eingespeiste Signal kann von einem derartigen Tiefpaßtyp sein, daß Spektralbänder innerhalb des Hörbereichs bereits ausgesondert wurden oder Spektralbänder in dem beliebigen Codierer ausgesondert werden. Die resultierenden Tiefbandsignale werden dem Multiplexer 2705 zugeführt, wobei ein Reihenbitstrom gebildet wird, der übertragen oder gesendet wird 2707. Der Demultiplexer 2709 stellt die Signale wieder her und führt dieselben einem beliebigen Decodierer 2711 zu. Die Spektralhüllkurveninformationen 2715 werden bei dem Decodierer 2713 geschätzt und der SBR-1-Einheit 2713 zugeführt, die das Tiefbandsignal zu einem Hochbandsignal transponiert und ein Hüllkurveneingestelltes Breitbandsignal erzeugt. Schließlich wird das digitale Breitbandsignal in ein analoges Ausgangssignal umgewandelt 2717.
  • Das SBR-2-Verfahren benötigt eine zusätzliche Modifizierung des Codierers. In 28 wird das analoge Eingangssignal dem A/D-Wandler 2801 zugeführt, wobei ein digitales Signal gebildet wird, das einem beliebigen Codierer 2803 zugeführt wird, wo ein Quellcodieren durchgeführt wird. Die Spektralhüllkurveninformationen werden extrahiert 2805. Die resultierenden Signale, Tiefbandsubbandabtastwerte oder Koeffi zienten und Breitbandhüllkurveninformationen, werden dem Multiplexer 2807 zugeführt, wobei ein Reihenbitstrom gebildet wird, der gesendet oder gespeichert wird 2809. Der Demultiplexer 2811 stellt die Signale wieder her, Tiefbandsubbandabtastwerte oder Koeffizienten und Breitbandhüllkurveninformationen, und führt dieselben einem beliebigen Decodierer 2815 zu. Die Spektralhüllkurveninformationen 2813 werden von dem Demultiplexer 2811 der SBR-2-Einheit 2817 zugeführt, die das Tiefbandsignal zu einem Hochbandsignal transponiert und ein hüllkurveneingestelltes Breitbandsignal erzeugt. Schließlich wird das digitale Breitbandsignal zu einem analogen Ausgangssignal umgewandelt 2819.
  • Wenn lediglich sehr niedrige Bitraten verfügbar sind, (Internet und langsame Telefonmodems, AM-Rundsenden etc.) ist ein Mono-Codieren des Audioprogrammaterials unvermeidbar. Um die wahrgenommene Qualität zu verbessern und das Programm angenehmer klingend zu machen, wird ein einfacher „Pseudo-Stereo"-Generator, 29, durch die Einbringung einer abgegriffenen Verzögerungsleitung 2901 erhalten. Dies kann um 10 ms und 15 ms verzögerte Signale bei näherungsweise –6 dB 2903 zusätzlich zu dem ursprünglichen Monosignal 2905 jedem Ausgangskanal zuführen. Der Pseudo-Stereo-Generator bietet eine wertvolle Wahrnehmungsverbesserung bei niedrigen Berechnungskosten.
  • Die oben beschriebenen Ausführungsbeispiele sind lediglich darstellend für die Prinzipien der vorliegenden Erfindung zu einer Audioquellcodierungsverbesserung. Es ist klar, daß Modifizierungen und Variationen der hierin beschriebenen Anordnungen und Details Fachleuten auf dem Gebiet offensichtlich sind. Es ist daher die Absicht, lediglich durch den Schutzbereich der folgenden Patentansprüche und nicht durch die spezifischen Details begrenzt zu sein, die durch eine Beschreibung und Erläuterung der Ausführungsbeispiele hierin präsentiert sind.

Claims (17)

  1. Ein Verfahren zum Decodieren eines codierten Signals, wobei das codierte Signal von einem ursprünglichen Signal abgeleitet ist und lediglich einen Abschnitt von Frequenzbändern darstellt, die in dem ursprünglichen Signal enthalten sind, das folgende Schritte aufweist: Bereitstellen von Subbandabtastwerten für eine Mehrzahl von Subbändern oder einer Mehrzahl von Spektralkoeffizienten, wobei die Subbandabtastwerte oder Spektralkoeffizienten einen Frequenzgehalt des codierten Signals (201, 301) darstellen; Extrahieren eines Bandpaßsignals (203, 303), wobei das Bandpaßsignal Subbandabtastwerte von einer vorbestimmten Anzahl von Analysesubbändern aufweist oder eine vorbestimmte Anzahl von Analysespektralkoeffizienten aufweist, wobei die vorbestimmte Anzahl kleiner ist als eine Gesamtanzahl von Subbändern oder Spektralkoeffizienten, die den Frequenzgehalt des codierten Signals (201, 301) darstellen; Transponieren (205, 305) der Subbandabtastwerte der Analysesubbänder oder der Analysespektralkoeffizienten, die in dem Bandpaßsignal (203, 303) enthalten sind, in ein Rekonstruktionsfrequenzband (205, 305), das in dem ursprünglichen Signal enthalten ist und das in dem codierten Signal nicht enthalten ist, wobei das Rekonstruktionsfrequenzband Synthesesubbänder oder Synthesespektralkoeffizienten aufweist, wobei der Schritt des Transponierens ein Wiederverbinden von Analysesubbändern mit Synthesesubbändern oder ein Wiederverbinden von Analysespektralkoeffizienten mit Synthesespektralkoeffizienten umfaßt; wobei die Subbandabtastwerte oder Spektralkoeffizienten, die in dem Bandpaßsignal (203, 303) enthalten sind, vor oder nach dem Schritt des Transponierens spektralhüllkurveneingestellt werden (207, 307), wobei Spektralhüllkurveninformationen verwendet werden, die von dem ursprünglichen Signal oder dem codierten Signal abgeleitet sind, um spektralhüllkurveneingestellte transponierte Subbandabtastwerte oder spektralhüllkurveneingestellte transponierte Spektralkoeffizienten zu erhalten, wobei die Spektralhüllkurveninformationen das Spektralhüllkurveneinstellen steuern, so daß eine Spektralhüllkurve des Rekonstruktionsfrequenzbands durch die Spektralhüllkurveninformationen bestimmt ist; und Kombinieren der Subbandabtastwerte und der eingestellten transponierten Subbandabtastwerte, oder der Spektralkoeffizienten und der eingestellten transponierten Spektralkoeffizienten, um ein decodiertes Ausgangssignal (209, 309) zu erhalten, wobei das decodierte Ausgangssignal einen Frequenzgehalt aufweist, der den Frequenzgehalt des codierten Signals und den Frequenzgehalt des Rekonstruktionsfrequenzbands umfaßt.
  2. Ein Verfahren gemäß Anspruch 1, bei dem ein Durchlaßband (Durchlaßbänder) der eingestellten transponierten Subbandabtastwerte oder der eingestellten transponierten Spektralkoeffizienten festgelegt sind, um ein Durchlaßband (Durchlaßbänder) der Subbandabtastwerte oder Spektralkoeffizienten, die den Frequenzgehalt des codierten Signals darstellen, nicht zu überlappen oder lediglich teilweise zu überlappen.
  3. Ein Verfahren gemäß Anspruch 1, das ferner den Schritt eines Schätzens der Spektralhüllkurveninformationen des Rekonstruktionsfrequenzbands unter Verwendung des codierten Signals aufweist.
  4. Ein Verfahren gemäß Anspruch 1, bei dem das codierte Signal ferner übertragene Spektralhüllkurveninformationen auf dem Rekonstruktionsfrequenzband umfaßt, das bei einem Codieren des ursprünglichen Signals ausgesondert wurde, wobei das Verfahren ferner den Schritt eines Extrahierens der übertragenen Hüllkurveninformationen des ausgesonderten Frequenzbands (der ausgesonderten Frequenzbänder) des ursprünglichen Signals aufweist.
  5. Ein Verfahren gemäß Anspruch 4, bei dem die Spektralhüllkurveninformationen als Skalierungsfaktoren ohne eine Übertragung der entsprechenden Subbandabtastwerte in dem codierten Signal übertragen werden.
  6. Ein Verfahren gemäß Anspruch 4, bei dem die Spektralhüllkurveninformationen als Skalierungsfaktoren übertragen werden und die entsprechenden Subbandabtastwerte auf 0 oder einen konstanten Wert in dem codierten Signal festgelegt sind; wodurch die Entropie der Subbandabtastwerte reduziert wird.
  7. Ein Verfahren gemäß Anspruch 1, bei dem das decodierte Ausgangssignal ein monophones Audiosignal ist, wobei das Verfahren ferner folgenden Schritt aufweist: Zerlegen des decodierten Ausgangssignals in zwei Signale, wobei jedes aus dem Ausgangssignal und verzögerten Versionen desselben zusammengesetzt ist, um ein Pseudostereosignal zu erhalten.
  8. Ein Verfahren gemäß Anspruch 1, bei dem der Schritt des Bereitstellens einen Schritt eines Filterns eines Signals durch einen Satz von N ≥ 2 Bandpaßfiltern mit Durchlaßbändern umfaßt, die jeweils die Frequenzen [f1, ..., fN] aufweisen, wobei N Bandpaßsignale gebildet werden; bei dem der Schritt des Transponierens den Schritt eines Verschiebens der Bandpaßsignale frequenzmäßig in Regionen umfaßt, die die Frequenzen M[f1, ..., fN] aufweisen, wobei M ≠ 1 der Transpositionsfaktor ist.
  9. Ein Verfahren gemäß Anspruch 8, bei dem der Schritt des Verschiebens durch eine USB-Modulation (USB = upper side band = oberes Seitenband) erhalten wird.
  10. Ein Verfahren gemäß Anspruch 1, bei dem der Schritt des Bereitstellens den Schritt eines Bandpaßfilterns eines Signals unter Verwendung einer Analysefilterbank oder einer Transformation einer solchen Art, daß reell- oder komplexwertige Subbandsignale eines Tiefpaßtyps erzeugt werden, umfaßt; bei dem der Schritt des Transponierens den Schritt eines Einfügens einer willkürlichen Anzahl von Kanälen k der Analysefilterbank oder der Transformation zu Kanälen Mk, M ≠ 1, in einer Synthesefilterbank oder einer Transformation umfaßt, wobei M ein Transpositionsfaktor ist; und bei dem die Synthesefilterbank oder die Transformation bei dem Schritt des Kombinierens verwendet wird.
  11. Ein Verfahren gemäß Anspruch 10, bei dem die Filterbank maximal dezimiert ist und der Schritt des Einfügens gemäß der folgenden Beziehung durchgeführt wird vMk(n) = (–1)(M–1)knvk(n),wobei (–1)(M–1)kn ein Korrekturfaktor ist, vk(n) das Subbandsignal des Kanals k ist und vMk(n) das Subbandsignal des Kanals Mk ist, wodurch eine Kompensation von spektralinvertierten Subbandsignalen erhalten wird.
  12. Ein Verfahren gemäß Anspruch 1, bei dem der Schritt des Transponierens folgende Schritte umfaßt: Einfügen von Phasen der Subbandabtastwerte der Analysesubbänder oder der Analysefrequenzkoeffizienten von Kanälen k einer Analysefilterbank oder Transformation als Phasen von Subbandabtastwerten, die Synthesekanälen Mk zugeordnet sind, wobei M ein Transpositionsfaktor und eine Ganzzahl ≠ 1 ist und wobei k eine Kanalanzahl ist; und Einfügen von Beträgen der Subbandabtastwerte der Analysesubbänder oder der Analysespektralkoffizienten von aufeinanderfolgenden Kanälen 1 einer Analysefilterbank oder Transformation als Beträge von Subbandabtastwerten oder Spektralkoeffizienten, die aufeinanderfolgenden Synthesekanälen 1 + S zugeordnet sind, wobei S eine Ganzzahl ≠ 1 ist, und wobei 1 eine Kanalanzahl ist.
  13. Ein Verfahren gemäß Anspruch 10 oder 12, bei dem bei dem Schritt des Transponierens Phasen der Subbandabtastwerte der Kanäle k durch den Faktor M multipliziert werden, bevor die Synthesefilterbank oder Transformation bei dem Schritt des Kombinierens verwendet wird.
  14. Ein Verfahren gemäß Anspruch 12, bei dem M = K±1, wobei K eine Ganzzahl > 1 ist.
  15. Ein Verfahren gemäß Anspruch 10, bei dem bei dem Schritt des Einfügens mehrere Werte des Transpositionsfaktors M verwendet werden.
  16. Eine Vorrichtung zum Decodieren eines codierten Signals, wobei das codierte Signal von einem ursprüngli chen Signal abgeleitet ist und lediglich einen Teil von Frequenzbändern darstellt, die in dem ursprünglichen Signal enthalten sind, die folgende Merkmale aufweist: eine Einrichtung zum Bereitstellen von Subbandabtastwerten für eine Mehrzahl von Subbändern oder einer Mehrzahl von Spektralkoeffizienten, wobei die Subbandabtastwerte oder Spektralkoeffizienten einen Frequenzgehalt des codierten Signals (201, 301) darstellen; eine Einrichtung zum Extrahieren eines Bandpaßsignals (203, 303), wobei das Bandpaßsignal Subbandabtastwerte von einer vorbestimmten Anzahl von Analysesubbändern aufweist oder eine vorbestimmte Anzahl von Analysespektralkoeffizienten aufweist, wobei die vorbestimmte Anzahl kleiner ist als eine Gesamtanzahl von Subbändern oder Spektralkoeffizienten, die den Frequenzgehalt des codierten Signals (201, 301) darstellen; eine Einrichtung zum Transponieren (205, 305) der Subbandabtastwerte der Analysesubbänder oder der Analysespektralkoeffizienten, die in dem Bandpaßsignal (203, 303) enthalten sind, in ein Rekonstruktionsfrequenzband (205, 305), das in dem ursprünglichen Signal enthalten ist und das in dem codierten Signal nicht enthalten ist, wobei das Rekonstruktionsfrequenzband Synthesesubbänder oder Synthesespektralkoeffizienten aufweist, wobei der Schritt des Transponierens ein Wiederverbinden von Analysesubbändern mit Synthesesubbändern oder ein Wiederverbinden von Analysespektralkoeffizienten mit Synthesespektralkoeffizienten umfaßt; wobei die Subbandabtastwerte oder Spektralkoeffizienten, die in dem Bandpaßsignal (203, 303) enthalten sind, bevor oder nachdem dieselben durch die Einrichtung zum Transponieren verarbeitet wurden, spektralhüllkurveneingestellt werden (207, 307), wobei Spek tralhüllkurveninformationen verwendet werden, die von dem ursprünglichen Signal oder dem codierten Signal abgeleitet sind, um spektralhüllkurveneingestellte transponierte Subbandabtastwerte oder spektralhüllkurveneingestellte transponierte Spektralkoeffizienten zu erhalten, wobei die Spektralhüllkurveninformationen das Spektralhüllkurveneinstellen steuern, so daß eine Spektralhüllkurve des Rekonstruktionsfrequenzbands durch die Spektralhüllkurveninformationen bestimmt ist; und eine Einrichtung zum Kombinieren der Subbandabtastwerte und der eingestellten transponierten Subbandabtastwerte, oder der Spektralkoeffizienten und der eingestellten transponierten Spektralkoeffizienten, um ein decodiertes Ausgangssignal (209, 309) zu erhalten, wobei das decodierte Ausgangssignal einen Frequenzgehalt aufweist, der den Frequenzgehalt des codierten Signals und den Frequenzgehalt des Rekonstruktionsfrequenzbands umfaßt.
  17. Ein Decoder gemäß Anspruch 16, bei dem das codierte Ausgangssignal ein monophones Audiosignal ist, wobei der Decoder ferner folgende Merkmale aufweist: eine erste Verzögerung und ein erstes Dämpfungsglied zum Bilden eines ersten verzögerten Signals aus dem decodierten Ausgangssignal; eine zweite Verzögerung, die sich von der ersten Verzögerung unterscheidet, und ein zweites Dämpfungsglied zum Bilden eines zweiten verzögerten Signals aus dem decodierten Ausgangssignal; einen ersten Addierer zum Addieren des decodierten Ausgangssignals und des ersten verzögerten Signals, wobei ein Links-Kanal-Ausgangssignal gebildet wird; und einen zweiten Addierer zum Addieren des decodierten Ausgangssignals und des zweiten verzögerten Signals, wobei ein Rechts-Kanal-Ausgangssignal gebildet wird; wodurch ein pseudostereophones Signal erhalten wird.
DE69821089T 1997-06-10 1998-06-09 Verbesserung von quellenkodierung unter verwendung von spektralbandreplikation Expired - Lifetime DE69821089T2 (de)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
SE9702213 1997-06-10
SE9702213A SE9702213D0 (sv) 1997-06-10 1997-06-10 A method and a device for bit-rate reduction using synthetic bandwidth expansion
SE9704634 1997-12-12
SE9704634A SE9704634D0 (sv) 1997-12-12 1997-12-12 Synthetic bandwidth expansion of audio signals
SE9800268 1998-01-30
SE9800268A SE512719C2 (sv) 1997-06-10 1998-01-30 En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
PCT/IB1998/000893 WO1998057436A2 (en) 1997-06-10 1998-06-09 Source coding enhancement using spectral-band replication

Publications (2)

Publication Number Publication Date
DE69821089D1 DE69821089D1 (de) 2004-02-19
DE69821089T2 true DE69821089T2 (de) 2004-11-11

Family

ID=27355877

Family Applications (2)

Application Number Title Priority Date Filing Date
DE69821089T Expired - Lifetime DE69821089T2 (de) 1997-06-10 1998-06-09 Verbesserung von quellenkodierung unter verwendung von spektralbandreplikation
DE69831435T Expired - Lifetime DE69831435T2 (de) 1997-06-10 1998-06-09 Verbesserung von Quellenkodierung unter Verwendung von Spektralbandreplikation

Family Applications After (1)

Application Number Title Priority Date Filing Date
DE69831435T Expired - Lifetime DE69831435T2 (de) 1997-06-10 1998-06-09 Verbesserung von Quellenkodierung unter Verwendung von Spektralbandreplikation

Country Status (14)

Country Link
US (4) US6680972B1 (de)
EP (2) EP1367566B1 (de)
JP (2) JP3871347B2 (de)
CN (2) CN1206816C (de)
AT (2) ATE303679T1 (de)
AU (1) AU7446598A (de)
BR (1) BR9805989B1 (de)
DE (2) DE69821089T2 (de)
DK (2) DK0940015T3 (de)
ES (2) ES2247466T3 (de)
HK (2) HK1030843A1 (de)
PT (2) PT940015E (de)
SE (1) SE512719C2 (de)
WO (1) WO1998057436A2 (de)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102008015702A1 (de) * 2008-01-31 2009-08-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals

Families Citing this family (413)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2251743T3 (es) * 1996-11-07 2006-05-01 Koninklijke Philips Electronics N.V. Procesamiento de datos de una señal de flujo de bits.
JP4193243B2 (ja) * 1998-10-07 2008-12-10 ソニー株式会社 音響信号符号化方法及び装置、音響信号復号化方法及び装置並びに記録媒体
SE9903552D0 (sv) * 1999-01-27 1999-10-01 Lars Liljeryd Efficient spectral envelope coding using dynamic scalefactor grouping and time/frequency switching
SE9903553D0 (sv) 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
US7085377B1 (en) * 1999-07-30 2006-08-01 Lucent Technologies Inc. Information delivery in a multi-stream digital broadcasting system
US6978236B1 (en) 1999-10-01 2005-12-20 Coding Technologies Ab Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching
CA2362776C (en) * 2000-01-18 2008-09-23 Brent R. Carlson Parallel correlator architecture
FI119576B (fi) * 2000-03-07 2008-12-31 Nokia Corp Puheenkäsittelylaite ja menetelmä puheen käsittelemiseksi, sekä digitaalinen radiopuhelin
ES2292581T3 (es) * 2000-03-15 2008-03-16 Koninklijke Philips Electronics N.V. Funcion laguerre para la codificacion de audio.
FR2807897B1 (fr) * 2000-04-18 2003-07-18 France Telecom Methode et dispositif d'enrichissement spectral
US7742927B2 (en) 2000-04-18 2010-06-22 France Telecom Spectral enhancing method and device
US7330814B2 (en) * 2000-05-22 2008-02-12 Texas Instruments Incorporated Wideband speech coding with modulated noise highband excitation system and method
SE0001926D0 (sv) * 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
US6718300B1 (en) * 2000-06-02 2004-04-06 Agere Systems Inc. Method and apparatus for reducing aliasing in cascaded filter banks
JP3538122B2 (ja) * 2000-06-14 2004-06-14 株式会社ケンウッド 周波数補間装置、周波数補間方法及び記録媒体
JP3576935B2 (ja) * 2000-07-21 2004-10-13 株式会社ケンウッド 周波数間引き装置、周波数間引き方法及び記録媒体
JP3576941B2 (ja) * 2000-08-25 2004-10-13 株式会社ケンウッド 周波数間引き装置、周波数間引き方法及び記録媒体
US20020049586A1 (en) * 2000-09-11 2002-04-25 Kousuke Nishio Audio encoder, audio decoder, and broadcasting system
SE0004163D0 (sv) 2000-11-14 2000-11-14 Coding Technologies Sweden Ab Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering
SE0004187D0 (sv) * 2000-11-15 2000-11-15 Coding Technologies Sweden Ab Enhancing the performance of coding systems that use high frequency reconstruction methods
SE0004818D0 (sv) * 2000-12-22 2000-12-22 Coding Technologies Sweden Ab Enhancing source coding systems by adaptive transposition
US20020087315A1 (en) * 2000-12-29 2002-07-04 Lee Victor Wai Leung Computer-implemented multi-scanning language method and system
US6845170B2 (en) 2001-01-11 2005-01-18 Sony Corporation Watermark resistant to resizing and rotation
US20020128839A1 (en) * 2001-01-12 2002-09-12 Ulf Lindgren Speech bandwidth extension
CN1327409C (zh) * 2001-01-19 2007-07-18 皇家菲利浦电子有限公司 提供信号重建的宽带音频信号发送机、接收机、系统和方法
US7660424B2 (en) 2001-02-07 2010-02-09 Dolby Laboratories Licensing Corporation Audio channel spatial translation
FR2821501B1 (fr) * 2001-02-23 2004-07-16 France Telecom Procede et dispositif de reconstruction spectrale d'un signal a spectre incomplet et systeme de codage/decodage associe
FR2821475B1 (fr) * 2001-02-23 2003-05-09 France Telecom Procede et dispositif de reconstruction spectrale de signaux a plusieurs voies, notamment de signaux stereophoniques
FR2821476B1 (fr) * 2001-02-23 2003-04-11 France Telecom Procede de reconstruction spectrale de signal audio a spectre incomplet et dispositif correspondant
JP4008244B2 (ja) * 2001-03-02 2007-11-14 松下電器産業株式会社 符号化装置および復号化装置
US7602936B2 (en) * 2001-03-08 2009-10-13 Sony Corporation Method to make wavelet watermarks resistant to affine transformations
US6865273B2 (en) * 2002-06-05 2005-03-08 Sony Corporation Method and apparatus to detect watermark that are resistant to resizing, rotation and translation
SE0101175D0 (sv) * 2001-04-02 2001-04-02 Coding Technologies Sweden Ab Aliasing reduction using complex-exponential-modulated filterbanks
AUPR433901A0 (en) 2001-04-10 2001-05-17 Lake Technology Limited High frequency signal construction method
US7711123B2 (en) * 2001-04-13 2010-05-04 Dolby Laboratories Licensing Corporation Segmenting audio signals into auditory events
US7400651B2 (en) 2001-06-29 2008-07-15 Kabushiki Kaisha Kenwood Device and method for interpolating frequency components of signal
US8605911B2 (en) 2001-07-10 2013-12-10 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
JP2003108197A (ja) * 2001-07-13 2003-04-11 Matsushita Electric Ind Co Ltd オーディオ信号復号化装置およびオーディオ信号符号化装置
US7260541B2 (en) 2001-07-13 2007-08-21 Matsushita Electric Industrial Co., Ltd. Audio signal decoding device and audio signal encoding device
WO2003019533A1 (fr) * 2001-08-24 2003-03-06 Kabushiki Kaisha Kenwood Dispositif et procede d'interpolation adaptive de composantes de frequence d'un signal
KR20040048978A (ko) * 2001-10-25 2004-06-10 코닌클리케 필립스 일렉트로닉스 엔.브이. 감소된 대역폭을 가진 전송 채널 상에 광대역 오디오신호들을 전송하는 방법
DE60204039T2 (de) * 2001-11-02 2006-03-02 Matsushita Electric Industrial Co., Ltd., Kadoma Vorrichtung zur kodierung und dekodierung von audiosignalen
DE10154932B4 (de) * 2001-11-08 2008-01-03 Grundig Multimedia B.V. Verfahren zur Audiocodierung
EP1701340B1 (de) 2001-11-14 2012-08-29 Panasonic Corporation Dekodiervorrichtung, -verfahren und -programm
JP4308229B2 (ja) * 2001-11-14 2009-08-05 パナソニック株式会社 符号化装置および復号化装置
JP3926726B2 (ja) * 2001-11-14 2007-06-06 松下電器産業株式会社 符号化装置および復号化装置
US20030108108A1 (en) * 2001-11-15 2003-06-12 Takashi Katayama Decoder, decoding method, and program distribution medium therefor
WO2003042648A1 (fr) * 2001-11-16 2003-05-22 Matsushita Electric Industrial Co., Ltd. Codeur de signal vocal, decodeur de signal vocal, procede de codage de signal vocal et procede de decodage de signal vocal
US7317811B2 (en) * 2001-11-28 2008-01-08 Sony Electronics Inc. Method to decode temporal watermarks in compressed video
US7433489B2 (en) * 2001-11-28 2008-10-07 Sony Electronics Inc. Method to ensure temporal synchronization and reduce complexity in the detection of temporal watermarks
PT1423847E (pt) 2001-11-29 2005-05-31 Coding Tech Ab Reconstrucao de componentes de frequencia elevada
JP4317355B2 (ja) * 2001-11-30 2009-08-19 パナソニック株式会社 符号化装置、符号化方法、復号化装置、復号化方法および音響データ配信システム
US7240001B2 (en) 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US6934677B2 (en) 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
EP1470550B1 (de) 2002-01-30 2008-09-03 Matsushita Electric Industrial Co., Ltd. Verfahren und vorrichtung zur audio-kodierung und -dekodierung
JP3751001B2 (ja) * 2002-03-06 2006-03-01 株式会社東芝 オーディオ信号再生方法および再生装置
CN1625876B (zh) * 2002-03-20 2011-01-26 伊哥·玻利索维奇·多尼夫 传输离散信号的方法和系统
US20030187663A1 (en) * 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
CN1308913C (zh) 2002-04-11 2007-04-04 松下电器产业株式会社 编码设备、解码设备及其方法
JP4296752B2 (ja) 2002-05-07 2009-07-15 ソニー株式会社 符号化方法及び装置、復号方法及び装置、並びにプログラム
US7447631B2 (en) 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
US7921445B2 (en) * 2002-06-06 2011-04-05 International Business Machines Corporation Audio/video speedup system and method in a server-client streaming architecture
TWI288915B (en) * 2002-06-17 2007-10-21 Dolby Lab Licensing Corp Improved audio coding system using characteristics of a decoded signal to adapt synthesized spectral components
KR100462615B1 (ko) 2002-07-11 2004-12-20 삼성전자주식회사 적은 계산량으로 고주파수 성분을 복원하는 오디오 디코딩방법 및 장치
US7376280B2 (en) * 2002-07-14 2008-05-20 Apple Inc Video encoding and decoding
US7379956B2 (en) * 2002-07-14 2008-05-27 Apple Inc. Encoding and decoding data arrays
JP4313993B2 (ja) * 2002-07-19 2009-08-12 パナソニック株式会社 オーディオ復号化装置およびオーディオ復号化方法
JP4227772B2 (ja) * 2002-07-19 2009-02-18 日本電気株式会社 オーディオ復号装置と復号方法およびプログラム
KR100602975B1 (ko) 2002-07-19 2006-07-20 닛본 덴끼 가부시끼가이샤 오디오 복호 장치와 복호 방법 및 프로그램을 기록한 컴퓨터 판독가능 기록매체
JP3646938B1 (ja) 2002-08-01 2005-05-11 松下電器産業株式会社 オーディオ復号化装置およびオーディオ復号化方法
JP3861770B2 (ja) 2002-08-21 2006-12-20 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
US7502743B2 (en) 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
JP3881943B2 (ja) * 2002-09-06 2007-02-14 松下電器産業株式会社 音響符号化装置及び音響符号化方法
TW564375B (en) * 2002-09-17 2003-12-01 Ind Tech Res Inst Amplitude phase shift information embedding and detecting method based on phase features
AU2006235813B2 (en) * 2002-09-18 2009-03-12 Dolby International Ab Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks
SE0202770D0 (sv) 2002-09-18 2002-09-18 Coding Technologies Sweden Ab Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks
US7069212B2 (en) 2002-09-19 2006-06-27 Matsushita Elecric Industrial Co., Ltd. Audio decoding apparatus and method for band expansion with aliasing adjustment
US7191136B2 (en) * 2002-10-01 2007-03-13 Ibiquity Digital Corporation Efficient coding of high frequency signal information in a signal using a linear/non-linear prediction model based on a low pass baseband
JP4041385B2 (ja) * 2002-11-29 2008-01-30 株式会社ケンウッド 信号補間装置、信号補間方法及びプログラム
KR100501930B1 (ko) 2002-11-29 2005-07-18 삼성전자주식회사 적은 계산량으로 고주파수 성분을 복원하는 오디오 디코딩방법 및 장치
AU2002953284A0 (en) * 2002-12-12 2003-01-02 Lake Technology Limited Digital multirate filtering
KR100524065B1 (ko) * 2002-12-23 2005-10-26 삼성전자주식회사 시간-주파수 상관성을 이용한 개선된 오디오 부호화및/또는 복호화 방법과 그 장치
US20040252772A1 (en) * 2002-12-31 2004-12-16 Markku Renfors Filter bank based signal processing
TWI220753B (en) * 2003-01-20 2004-09-01 Mediatek Inc Method for determining quantization parameters
US7318027B2 (en) 2003-02-06 2008-01-08 Dolby Laboratories Licensing Corporation Conversion of synthesized spectral components for encoding and low-complexity transcoding
JP4380174B2 (ja) * 2003-02-27 2009-12-09 沖電気工業株式会社 帯域補正装置
KR100917464B1 (ko) * 2003-03-07 2009-09-14 삼성전자주식회사 대역 확장 기법을 이용한 디지털 데이터의 부호화 방법,그 장치, 복호화 방법 및 그 장치
KR100923300B1 (ko) * 2003-03-22 2009-10-23 삼성전자주식회사 대역 확장 기법을 이용한 오디오 데이터의 부호화 방법,그 장치, 복호화 방법 및 그 장치
KR100923301B1 (ko) * 2003-03-22 2009-10-23 삼성전자주식회사 대역 확장 기법을 이용한 오디오 데이터의 부호화 방법,그 장치, 복호화 방법 및 그 장치
RU2244386C2 (ru) * 2003-03-28 2005-01-10 Корпорация "Самсунг Электроникс" Способ восстановления высокочастотной составляющей аудиосигнала и устройство для его реализации
RU2005135650A (ru) * 2003-04-17 2006-03-20 Конинклейке Филипс Электроникс Н.В. (Nl) Синтез аудиосигнала
ATE359687T1 (de) * 2003-04-17 2007-05-15 Koninkl Philips Electronics Nv Audiosignalgenerierung
US7318035B2 (en) * 2003-05-08 2008-01-08 Dolby Laboratories Licensing Corporation Audio coding systems and methods using spectral component coupling and spectral component regeneration
JP2005010621A (ja) * 2003-06-20 2005-01-13 Matsushita Electric Ind Co Ltd 音声帯域拡張装置及び帯域拡張方法
DE10328777A1 (de) * 2003-06-25 2005-01-27 Coding Technologies Ab Vorrichtung und Verfahren zum Codieren eines Audiosignals und Vorrichtung und Verfahren zum Decodieren eines codierten Audiosignals
JP2005024756A (ja) * 2003-06-30 2005-01-27 Toshiba Corp 復号処理回路および移動端末装置
ES2354427T3 (es) * 2003-06-30 2011-03-14 Koninklijke Philips Electronics N.V. Mejora de la calidad de audio decodificado mediante la adición de ruido.
FI118550B (fi) * 2003-07-14 2007-12-14 Nokia Corp Parannettu eksitaatio ylemmän kaistan koodaukselle koodekissa, joka käyttää kaistojen jakoon perustuvia koodausmenetelmiä
US7082573B2 (en) 2003-07-30 2006-07-25 America Online, Inc. Method and system for managing digital assets
US7724827B2 (en) * 2003-09-07 2010-05-25 Microsoft Corporation Multi-layer run level encoding and decoding
US7844992B2 (en) * 2003-09-10 2010-11-30 Thomson Licensing Video on demand server system and method
EP1657710B1 (de) 2003-09-16 2009-05-27 Panasonic Corporation Kodier- und dekodierapparat
US7844451B2 (en) * 2003-09-16 2010-11-30 Panasonic Corporation Spectrum coding/decoding apparatus and method for reducing distortion of two band spectrums
JP4679049B2 (ja) 2003-09-30 2011-04-27 パナソニック株式会社 スケーラブル復号化装置
DE602004030594D1 (de) * 2003-10-07 2011-01-27 Panasonic Corp Verfahren zur entscheidung der zeitgrenze zur codierung der spektro-hülle und frequenzauflösung
US7461003B1 (en) * 2003-10-22 2008-12-02 Tellabs Operations, Inc. Methods and apparatus for improving the quality of speech signals
BRPI0415464B1 (pt) 2003-10-23 2019-04-24 Panasonic Intellectual Property Management Co., Ltd. Aparelho e método de codificação de espectro.
ATE354160T1 (de) 2003-10-30 2007-03-15 Koninkl Philips Electronics Nv Audiosignalcodierung oder -decodierung
US7672838B1 (en) 2003-12-01 2010-03-02 The Trustees Of Columbia University In The City Of New York Systems and methods for speech recognition using frequency domain linear prediction polynomials to form temporal and spectral envelopes from frequency domain representations of signals
KR100587953B1 (ko) * 2003-12-26 2006-06-08 한국전자통신연구원 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치 및 그를 이용한 비트스트림 복호화 시스템
US7460990B2 (en) 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
US6980933B2 (en) * 2004-01-27 2005-12-27 Dolby Laboratories Licensing Corporation Coding techniques using estimated spectral magnitude and phase derived from MDCT coefficients
WO2005083677A2 (en) * 2004-02-18 2005-09-09 Philips Intellectual Property & Standards Gmbh Method and system for generating training data for an automatic speech recogniser
US7668711B2 (en) 2004-04-23 2010-02-23 Panasonic Corporation Coding equipment
EP1755109B1 (de) * 2004-04-27 2012-08-15 Panasonic Corporation Skalierbare kodierungs- und dekodierungsgeräte und verfahren
US8629836B2 (en) 2004-04-30 2014-01-14 Hillcrest Laboratories, Inc. 3D pointing devices with orientation compensation and improved usability
JP2007535773A (ja) 2004-04-30 2007-12-06 ヒルクレスト・ラボラトリーズ・インコーポレイテッド 自由空間ポインティングデバイスおよびポインティング方法
CN101656075B (zh) * 2004-05-14 2012-08-29 松下电器产业株式会社 音频解码装置、音频解码方法以及通信终端和基站装置
KR101213840B1 (ko) 2004-05-14 2012-12-20 파나소닉 주식회사 복호화 장치 및 복호화 방법, 및 복호화 장치를 구비하는 통신 단말 장치 및 기지국 장치
EP3118849B1 (de) 2004-05-19 2020-01-01 Fraunhofer Gesellschaft zur Förderung der Angewand Codierungsvorrichtung, decodierungsvorrichtung und verfahren dafür
WO2006000951A1 (en) 2004-06-21 2006-01-05 Koninklijke Philips Electronics N.V. Method of audio encoding
GB2416285A (en) 2004-07-14 2006-01-18 British Broadcasting Corp Transmission of a data signal in an audio signal
KR100608062B1 (ko) * 2004-08-04 2006-08-02 삼성전자주식회사 오디오 데이터의 고주파수 복원 방법 및 그 장치
EP1782419A1 (de) * 2004-08-17 2007-05-09 Koninklijke Philips Electronics N.V. Skalierbare tonkodierung
KR100640893B1 (ko) * 2004-09-07 2006-11-02 엘지전자 주식회사 음성 인식용 베이스밴드 모뎀 및 이동통신용 단말기
CN1969318B (zh) * 2004-09-17 2011-11-02 松下电器产业株式会社 音频编码装置、解码装置以及方法
US7630902B2 (en) * 2004-09-17 2009-12-08 Digital Rise Technology Co., Ltd. Apparatus and methods for digital audio coding using codebook application ranges
US7620675B1 (en) * 2004-09-23 2009-11-17 Texas Instruments Incorporated Image and audio transform methods
JP4618634B2 (ja) * 2004-10-07 2011-01-26 Kddi株式会社 圧縮オーディオデータ処理方法
JP4815780B2 (ja) * 2004-10-20 2011-11-16 ヤマハ株式会社 オーバーサンプリングシステム、デコードlsi、およびオーバーサンプリング方法
US7555081B2 (en) * 2004-10-29 2009-06-30 Harman International Industries, Incorporated Log-sampled filter system
SE0402652D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Methods for improved performance of prediction based multi- channel reconstruction
CN102148035B (zh) * 2004-11-02 2014-06-18 皇家飞利浦电子股份有限公司 使用复值滤波器组的音频信号的编码和解码
EP2752843A1 (de) * 2004-11-05 2014-07-09 Panasonic Corporation Encoder, Decoder, Kodierungsverfahren und Dekodierungsverfahren
US8137195B2 (en) 2004-11-23 2012-03-20 Hillcrest Laboratories, Inc. Semantic gaming and application transformation
KR100657916B1 (ko) * 2004-12-01 2006-12-14 삼성전자주식회사 주파수 대역간의 유사도를 이용한 오디오 신호 처리 장치및 방법
US20060143013A1 (en) * 2004-12-28 2006-06-29 Broadcom Corporation Method and system for playing audio at an accelerated rate using multiresolution analysis technique keeping pitch constant
WO2006075563A1 (ja) 2005-01-11 2006-07-20 Nec Corporation オーディオ符号化装置、オーディオ符号化方法およびオーディオ符号化プログラム
US20060187770A1 (en) * 2005-02-23 2006-08-24 Broadcom Corporation Method and system for playing audio at a decelerated rate using multiresolution analysis technique keeping pitch constant
US7970602B2 (en) * 2005-02-24 2011-06-28 Panasonic Corporation Data reproduction device
JP4761506B2 (ja) * 2005-03-01 2011-08-31 国立大学法人北陸先端科学技術大学院大学 音声処理方法と装置及びプログラム並びに音声システム
JP4645241B2 (ja) * 2005-03-10 2011-03-09 ヤマハ株式会社 音声処理装置およびプログラム
KR100707186B1 (ko) * 2005-03-24 2007-04-13 삼성전자주식회사 오디오 부호화 및 복호화 장치와 그 방법 및 기록 매체
KR100956876B1 (ko) * 2005-04-01 2010-05-11 콸콤 인코포레이티드 고대역 여기 생성을 위한 시스템들, 방법들, 및 장치들
KR100818268B1 (ko) * 2005-04-14 2008-04-02 삼성전자주식회사 오디오 데이터 부호화 및 복호화 장치와 방법
US7627481B1 (en) 2005-04-19 2009-12-01 Apple Inc. Adapting masking thresholds for encoding a low frequency transient signal in audio data
US7813931B2 (en) * 2005-04-20 2010-10-12 QNX Software Systems, Co. System for improving speech quality and intelligibility with bandwidth compression/expansion
US8086451B2 (en) 2005-04-20 2011-12-27 Qnx Software Systems Co. System for improving speech intelligibility through high frequency compression
US8249861B2 (en) 2005-04-20 2012-08-21 Qnx Software Systems Limited High frequency compression integration
ES2705589T3 (es) 2005-04-22 2019-03-26 Qualcomm Inc Sistemas, procedimientos y aparatos para el suavizado del factor de ganancia
EP1742509B1 (de) 2005-07-08 2013-08-14 Oticon A/S Vorrichtung und Verfahren zum Eliminieren von Feedback-Rauschen in einem Hörgerät
DE102005032724B4 (de) * 2005-07-13 2009-10-08 Siemens Ag Verfahren und Vorrichtung zur künstlichen Erweiterung der Bandbreite von Sprachsignalen
KR100803205B1 (ko) * 2005-07-15 2008-02-14 삼성전자주식회사 저비트율 오디오 신호 부호화/복호화 방법 및 장치
US7630882B2 (en) * 2005-07-15 2009-12-08 Microsoft Corporation Frequency segmentation to obtain bands for efficient coding of digital media
US7562021B2 (en) * 2005-07-15 2009-07-14 Microsoft Corporation Modification of codewords in dictionary used for efficient coding of digital media spectral data
US20070030923A1 (en) * 2005-08-02 2007-02-08 Xiaoming Yu High accuracy non data-aided frequency estimator for M-ary phase shift keying modulation
US8599925B2 (en) * 2005-08-12 2013-12-03 Microsoft Corporation Efficient coding and decoding of transform blocks
JP4715385B2 (ja) * 2005-08-19 2011-07-06 株式会社ケンウッド 補間装置、オーディオ再生装置、補間方法および補間プログラム
WO2007028407A1 (en) 2005-09-06 2007-03-15 Nero Ag Method for signing a data package and signing apparatus
JP4627548B2 (ja) * 2005-09-08 2011-02-09 パイオニア株式会社 帯域拡張装置、帯域拡張方法および帯域拡張プログラム
RU2008112137A (ru) 2005-09-30 2009-11-10 Панасоник Корпорэйшн (Jp) Устройство кодирования речи и способ кодирования речи
US7953605B2 (en) * 2005-10-07 2011-05-31 Deepen Sinha Method and apparatus for audio encoding and decoding using wideband psychoacoustic modeling and bandwidth extension
US20070118361A1 (en) * 2005-10-07 2007-05-24 Deepen Sinha Window apparatus and method
US8069035B2 (en) * 2005-10-14 2011-11-29 Panasonic Corporation Scalable encoding apparatus, scalable decoding apparatus, and methods of them
KR100739180B1 (ko) * 2005-10-20 2007-07-13 엘지전자 주식회사 이동 통신 단말기의 멀티미디어 데이터를 송수신하는 장치및 그 방법
EP1943643B1 (de) * 2005-11-04 2019-10-09 Nokia Technologies Oy Audio-komprimierung
WO2007063913A1 (ja) * 2005-11-30 2007-06-07 Matsushita Electric Industrial Co., Ltd. サブバンド符号化装置およびサブバンド符号化方法
JP5034228B2 (ja) * 2005-11-30 2012-09-26 株式会社Jvcケンウッド 補間装置、音再生装置、補間方法および補間プログラム
US7489111B2 (en) 2005-12-08 2009-02-10 Robert W. Wise Holstered cordless power tool
US7536299B2 (en) * 2005-12-19 2009-05-19 Dolby Laboratories Licensing Corporation Correlating and decorrelating transforms for multiple description coding systems
TWI311856B (en) * 2006-01-04 2009-07-01 Quanta Comp Inc Synthesis subband filtering method and apparatus
KR100739786B1 (ko) * 2006-01-20 2007-07-13 삼성전자주식회사 다중 채널 디지털 앰프 시스템 및 그 신호 처리 방법
US8190425B2 (en) * 2006-01-20 2012-05-29 Microsoft Corporation Complex cross-correlation parameters for multi-channel audio
US7953604B2 (en) * 2006-01-20 2011-05-31 Microsoft Corporation Shape and scale parameters for extended-band frequency coding
US7831434B2 (en) * 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
WO2007098258A1 (en) * 2006-02-24 2007-08-30 Neural Audio Corporation Audio codec conditioning system and method
US7590523B2 (en) * 2006-03-20 2009-09-15 Mindspeed Technologies, Inc. Speech post-processing using MDCT coefficients
US8116459B2 (en) * 2006-03-28 2012-02-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Enhanced method for signal shaping in multi-channel audio reconstruction
JP4976381B2 (ja) * 2006-03-31 2012-07-18 パナソニック株式会社 音声符号化装置、音声復号化装置、およびこれらの方法
US8392176B2 (en) * 2006-04-10 2013-03-05 Qualcomm Incorporated Processing of excitation in audio coding and decoding
JP5190359B2 (ja) * 2006-05-10 2013-04-24 パナソニック株式会社 符号化装置及び符号化方法
JP2007310298A (ja) * 2006-05-22 2007-11-29 Oki Electric Ind Co Ltd 帯域外信号生成装置及び周波数帯域拡張装置
US9159333B2 (en) 2006-06-21 2015-10-13 Samsung Electronics Co., Ltd. Method and apparatus for adaptively encoding and decoding high frequency band
US8010352B2 (en) 2006-06-21 2011-08-30 Samsung Electronics Co., Ltd. Method and apparatus for adaptively encoding and decoding high frequency band
KR101390188B1 (ko) * 2006-06-21 2014-04-30 삼성전자주식회사 적응적 고주파수영역 부호화 및 복호화 방법 및 장치
CN101479790B (zh) * 2006-06-29 2012-05-23 Nxp股份有限公司 噪声合成
EP3739752B1 (de) * 2006-07-04 2021-12-15 Dolby International AB Filtersystem mit einem filterwandler und einem filterverdichter und verfahren zum betrieb des filtersystems
EP1881485A1 (de) 2006-07-18 2008-01-23 Deutsche Thomson-Brandt Gmbh Audiobitstromdatenstruktur eines verlustbehafteten kodierten Signals mit verlustfreien Erweiterungkodierungsdaten für ein solches Signal.
US8000960B2 (en) * 2006-08-15 2011-08-16 Broadcom Corporation Packet loss concealment for sub-band predictive coding based on extrapolation of sub-band audio waveforms
JP2008066851A (ja) * 2006-09-05 2008-03-21 Sony Corp 情報処理装置および情報処理方法、記録媒体、並びに、プログラム
CN101140759B (zh) * 2006-09-08 2010-05-12 华为技术有限公司 语音或音频信号的带宽扩展方法及系统
US8126721B2 (en) * 2006-10-18 2012-02-28 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding an information signal
US8417532B2 (en) * 2006-10-18 2013-04-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding an information signal
US8041578B2 (en) * 2006-10-18 2011-10-18 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding an information signal
JP5141180B2 (ja) * 2006-11-09 2013-02-13 ソニー株式会社 周波数帯域拡大装置及び周波数帯域拡大方法、再生装置及び再生方法、並びに、プログラム及び記録媒体
US8295507B2 (en) * 2006-11-09 2012-10-23 Sony Corporation Frequency band extending apparatus, frequency band extending method, player apparatus, playing method, program and recording medium
JP5103880B2 (ja) * 2006-11-24 2012-12-19 富士通株式会社 復号化装置および復号化方法
JP4967618B2 (ja) * 2006-11-24 2012-07-04 富士通株式会社 復号化装置および復号化方法
EP1927981B1 (de) * 2006-12-01 2013-02-20 Nuance Communications, Inc. Spektrale Verfeinerung von Audiosignalen
JPWO2008084688A1 (ja) * 2006-12-27 2010-04-30 パナソニック株式会社 符号化装置、復号装置及びこれらの方法
KR101379263B1 (ko) * 2007-01-12 2014-03-28 삼성전자주식회사 대역폭 확장 복호화 방법 및 장치
EP1947644B1 (de) * 2007-01-18 2019-06-19 Nuance Communications, Inc. Verfahren und vorrichtung zur bereitstellung eines tonsignals mit erweiterter bandbreite
CA2623823A1 (en) * 2007-03-02 2008-09-02 Sean C. Carroll Non-orthogonal frequency-division multiplexed communication through a non-linear transmission medium
GB0704622D0 (en) * 2007-03-09 2007-04-18 Skype Ltd Speech coding system and method
US8983830B2 (en) * 2007-03-30 2015-03-17 Panasonic Intellectual Property Corporation Of America Stereo signal encoding device including setting of threshold frequencies and stereo signal encoding method including setting of threshold frequencies
US7761290B2 (en) 2007-06-15 2010-07-20 Microsoft Corporation Flexible frequency and time partitioning in perceptual transform coding of audio
US7774205B2 (en) * 2007-06-15 2010-08-10 Microsoft Corporation Coding of sparse digital media spectral data
US8046214B2 (en) * 2007-06-22 2011-10-25 Microsoft Corporation Low complexity decoder for complex transform coding of multi-channel sound
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
JP5098492B2 (ja) * 2007-07-30 2012-12-12 ソニー株式会社 信号処理装置及び信号処理方法、並びにプログラム
US20090198500A1 (en) * 2007-08-24 2009-08-06 Qualcomm Incorporated Temporal masking in audio coding based on spectral dynamics in frequency sub-bands
US8428957B2 (en) 2007-08-24 2013-04-23 Qualcomm Incorporated Spectral noise shaping in audio coding based on spectral dynamics in frequency sub-bands
CN101790757B (zh) 2007-08-27 2012-05-30 爱立信电话股份有限公司 语音与音频信号的改进的变换编码
US8315856B2 (en) * 2007-10-24 2012-11-20 Red Shift Company, Llc Identify features of speech based on events in a signal representing spoken sounds
WO2009055718A1 (en) * 2007-10-24 2009-04-30 Red Shift Company, Llc Producing phonitos based on feature vectors
US8249883B2 (en) 2007-10-26 2012-08-21 Microsoft Corporation Channel extension coding for multi-channel source
JP5147851B2 (ja) * 2007-10-26 2013-02-20 株式会社ディーアンドエムホールディングス オーディオ信号補間装置及びオーディオ信号補間方法
CN101842832B (zh) * 2007-10-31 2012-11-07 松下电器产业株式会社 编码装置和解码装置
JP5547081B2 (ja) * 2007-11-02 2014-07-09 華為技術有限公司 音声復号化方法及び装置
KR101238239B1 (ko) * 2007-11-06 2013-03-04 노키아 코포레이션 인코더
WO2009059632A1 (en) * 2007-11-06 2009-05-14 Nokia Corporation An encoder
CA2704807A1 (en) * 2007-11-06 2009-05-14 Nokia Corporation Audio coding apparatus and method thereof
KR100970446B1 (ko) * 2007-11-21 2010-07-16 한국전자통신연구원 주파수 확장을 위한 가변 잡음레벨 결정 장치 및 그 방법
CN101836250B (zh) * 2007-11-21 2012-11-28 Lg电子株式会社 用于处理信号的方法及装置
US8688441B2 (en) 2007-11-29 2014-04-01 Motorola Mobility Llc Method and apparatus to facilitate provision and use of an energy value to determine a spectral envelope shape for out-of-signal bandwidth content
CN101903944B (zh) * 2007-12-18 2013-04-03 Lg电子株式会社 用于处理音频信号的方法和装置
JP5404418B2 (ja) * 2007-12-21 2014-01-29 パナソニック株式会社 符号化装置、復号装置および符号化方法
US20100280833A1 (en) * 2007-12-27 2010-11-04 Panasonic Corporation Encoding device, decoding device, and method thereof
EP2077551B1 (de) * 2008-01-04 2011-03-02 Dolby Sweden AB Audiokodierer und -dekodierer
KR101413968B1 (ko) * 2008-01-29 2014-07-01 삼성전자주식회사 오디오 신호의 부호화, 복호화 방법 및 장치
US8433582B2 (en) * 2008-02-01 2013-04-30 Motorola Mobility Llc Method and apparatus for estimating high-band energy in a bandwidth extension system
US20090201983A1 (en) 2008-02-07 2009-08-13 Motorola, Inc. Method and apparatus for estimating high-band energy in a bandwidth extension system
US20090203395A1 (en) * 2008-02-08 2009-08-13 Sony Ericsson Mobile Communications Ab Amplitude modulation radio transmission with extended bandwidth
RU2487429C2 (ru) 2008-03-10 2013-07-10 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и метод для обработки аудиосигнала, содержащего переходный сигнал
JP5326311B2 (ja) * 2008-03-19 2013-10-30 沖電気工業株式会社 音声帯域拡張装置、方法及びプログラム、並びに、音声通信装置
EP2104096B1 (de) * 2008-03-20 2020-05-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und verfahren zum umwandeln eines audiosignals in eine parametrisierende darstellung, vorrichtung und verfahren zum modifizieren einer parametrisierenden darstellung, vorrichtung und verfahren zur synchronisation eines audiosignals
JP2009300707A (ja) * 2008-06-13 2009-12-24 Sony Corp 情報処理装置および方法、並びにプログラム
US8909361B2 (en) * 2008-06-19 2014-12-09 Broadcom Corporation Method and system for processing high quality audio in a hardware audio codec for audio transmission
US9378751B2 (en) * 2008-06-19 2016-06-28 Broadcom Corporation Method and system for digital gain processing in a hardware audio CODEC for audio transmission
EP2306453B1 (de) * 2008-06-26 2015-10-07 Japan Science and Technology Agency Audiosignal-komprimierungseinrichtung, audiosignal-komprimierungsverfahren, audiosignal-dekodierungseinrichtung und audiosignal-dekodierungsverfahren
US8010313B2 (en) 2008-06-27 2011-08-30 Movea Sa Hand held pointing device with roll compensation
US20140184509A1 (en) 2013-01-02 2014-07-03 Movea Sa Hand held pointing device with roll compensation
US8880410B2 (en) 2008-07-11 2014-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating a bandwidth extended signal
PL2346030T3 (pl) 2008-07-11 2015-03-31 Fraunhofer Ges Forschung Koder audio, sposób kodowania sygnału audio oraz program komputerowy
EP2301026B1 (de) 2008-07-11 2020-03-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Tonsignalgenerator und tonsignalkodierer
PL2291842T3 (pl) * 2008-07-11 2014-08-29 Fraunhofer Ges Forschung Urządzenie i sposób do generowania sygnału o rozszerzonej szerokości pasma
USRE47180E1 (en) 2008-07-11 2018-12-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating a bandwidth extended signal
BRPI0910517B1 (pt) * 2008-07-11 2022-08-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V Um aparelho e um método para calcular um número de envelopes espectrais a serem obtidos por um codificador de replicação de banda espectral (sbr)
KR101756834B1 (ko) * 2008-07-14 2017-07-12 삼성전자주식회사 오디오/스피치 신호의 부호화 및 복호화 방법 및 장치
US8463412B2 (en) 2008-08-21 2013-06-11 Motorola Mobility Llc Method and apparatus to facilitate determining signal bounding frequencies
US8326640B2 (en) * 2008-08-26 2012-12-04 Broadcom Corporation Method and system for multi-band amplitude estimation and gain control in an audio CODEC
JP2010079275A (ja) * 2008-08-29 2010-04-08 Sony Corp 周波数帯域拡大装置及び方法、符号化装置及び方法、復号化装置及び方法、並びにプログラム
US8352279B2 (en) * 2008-09-06 2013-01-08 Huawei Technologies Co., Ltd. Efficient temporal envelope coding approach by prediction between low band signal and high band signal
WO2010028292A1 (en) * 2008-09-06 2010-03-11 Huawei Technologies Co., Ltd. Adaptive frequency prediction
WO2010028299A1 (en) * 2008-09-06 2010-03-11 Huawei Technologies Co., Ltd. Noise-feedback for spectral envelope quantization
US8515747B2 (en) * 2008-09-06 2013-08-20 Huawei Technologies Co., Ltd. Spectrum harmonic/noise sharpness control
US8532998B2 (en) 2008-09-06 2013-09-10 Huawei Technologies Co., Ltd. Selective bandwidth extension for encoding/decoding audio/speech signal
US8577673B2 (en) * 2008-09-15 2013-11-05 Huawei Technologies Co., Ltd. CELP post-processing for music signals
WO2010031003A1 (en) 2008-09-15 2010-03-18 Huawei Technologies Co., Ltd. Adding second enhancement layer to celp based core layer
WO2010036061A2 (en) 2008-09-25 2010-04-01 Lg Electronics Inc. An apparatus for processing an audio signal and method thereof
EP2184929B1 (de) 2008-11-10 2013-04-03 Oticon A/S N-Band FM-Demodulation als Hilfe zur Hörverbesserung von Cochlea-Hörgeschädigten
US8548816B1 (en) * 2008-12-01 2013-10-01 Marvell International Ltd. Efficient scalefactor estimation in advanced audio coding and MP3 encoder
US9947340B2 (en) 2008-12-10 2018-04-17 Skype Regeneration of wideband speech
GB2466201B (en) 2008-12-10 2012-07-11 Skype Ltd Regeneration of wideband speech
GB0822537D0 (en) 2008-12-10 2009-01-14 Skype Ltd Regeneration of wideband speech
CN101751925B (zh) * 2008-12-10 2011-12-21 华为技术有限公司 一种语音解码方法及装置
EP3364414B1 (de) 2008-12-15 2022-04-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audiobandbreitenerweiterungsdecodierer, korrespondierendes verfahren und computerprogramm
AU2013203159B2 (en) * 2008-12-15 2015-09-17 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder and bandwidth extension decoder
WO2010070770A1 (ja) * 2008-12-19 2010-06-24 富士通株式会社 音声帯域拡張装置及び音声帯域拡張方法
TR201910073T4 (tr) 2009-01-16 2019-07-22 Dolby Int Ab Vektörel çarpımı geliştirilmiş harmonik aktarım.
EP2211339B1 (de) * 2009-01-23 2017-05-31 Oticon A/s Hörsystem
US20100191534A1 (en) * 2009-01-23 2010-07-29 Qualcomm Incorporated Method and apparatus for compression or decompression of digital signals
ES2906255T3 (es) 2009-01-28 2022-04-13 Dolby Int Ab Transposición armónica mejorada
CA2749239C (en) * 2009-01-28 2017-06-06 Dolby International Ab Improved harmonic transposition
AU2015221516B2 (en) * 2009-01-28 2017-08-10 Dolby International Ab Improved Harmonic Transposition
AU2013211560B2 (en) * 2009-01-28 2016-04-28 Dolby International Ab Improved harmonic transposition
EP2214165A3 (de) 2009-01-30 2010-09-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung, Verfahren und Computerprogramm zur Änderung eines Audiosignals mit einem Transientenereignis
US8463599B2 (en) * 2009-02-04 2013-06-11 Motorola Mobility Llc Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder
WO2010088960A1 (en) 2009-02-06 2010-08-12 Oticon A/S Spectral band substitution to avoid howls and sub-oscillation
TWI662788B (zh) 2009-02-18 2019-06-11 瑞典商杜比國際公司 用於高頻重建或參數立體聲之複指數調變濾波器組
TWI716833B (zh) * 2009-02-18 2021-01-21 瑞典商杜比國際公司 用於高頻重建或參數立體聲之複指數調變濾波器組
US9082395B2 (en) 2009-03-17 2015-07-14 Dolby International Ab Advanced stereo coding based on a combination of adaptively selectable left/right or mid/side stereo coding and of parametric stereo coding
JP5267257B2 (ja) * 2009-03-23 2013-08-21 沖電気工業株式会社 音声ミキシング装置、方法及びプログラム、並びに、音声会議システム
EP2239732A1 (de) 2009-04-09 2010-10-13 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Vorrichtung und Verfahren zur Erzeugung eines synthetischen Audiosignals und zur Kodierung eines Audiosignals
RU2452044C1 (ru) * 2009-04-02 2012-05-27 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Устройство, способ и носитель с программным кодом для генерирования представления сигнала с расширенным диапазоном частот на основе представления входного сигнала с использованием сочетания гармонического расширения диапазона частот и негармонического расширения диапазона частот
JP4921611B2 (ja) * 2009-04-03 2012-04-25 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
JP4932917B2 (ja) 2009-04-03 2012-05-16 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
CN101521014B (zh) * 2009-04-08 2011-09-14 武汉大学 音频带宽扩展编解码装置
CO6440537A2 (es) 2009-04-09 2012-05-15 Fraunhofer Ges Forschung Aparato y metodo para generar una señal de audio de sintesis y para codificar una señal de audio
AU2013207549B2 (en) * 2009-04-09 2015-06-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating a synthesis audio signal and for encoding an audio signal
AU2013263712B2 (en) * 2009-05-27 2015-11-12 Dolby International Ab Efficient Combined Harmonic Transposition
US8971551B2 (en) 2009-09-18 2015-03-03 Dolby International Ab Virtual bass synthesis using harmonic transposition
AU2015264887B2 (en) * 2009-05-27 2017-12-07 Dolby International Ab Efficient Combined Harmonic Transposition
WO2011047887A1 (en) 2009-10-21 2011-04-28 Dolby International Ab Oversampling in a combined transposer filter bank
US11657788B2 (en) 2009-05-27 2023-05-23 Dolby International Ab Efficient combined harmonic transposition
TWI484481B (zh) * 2009-05-27 2015-05-11 杜比國際公司 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體
AU2014201331B2 (en) * 2009-06-29 2015-10-01 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Bandwidth extension encoder, bandwidth extension decoder and phase vocoder
PL2273493T3 (pl) * 2009-06-29 2013-07-31 Fraunhofer Ges Forschung Kodowanie i dekodowanie z rozszerzaniem szerokości pasma
JP5365380B2 (ja) * 2009-07-07 2013-12-11 ソニー株式会社 音響信号処理装置、その処理方法およびプログラム
EP2306456A1 (de) * 2009-09-04 2011-04-06 Thomson Licensing Verfahren zur Decodierung eines Audiosignals mit einer Basisschicht und einer Erweiterungsschicht
JP5031006B2 (ja) * 2009-09-04 2012-09-19 パナソニック株式会社 スケーラブル復号化装置及びスケーラブル復号化方法
CN102318004B (zh) * 2009-09-18 2013-10-23 杜比国际公司 改进的谐波转置
JP5754899B2 (ja) * 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
WO2011048010A1 (en) 2009-10-19 2011-04-28 Dolby International Ab Metadata time marking information for indicating a section of an audio object
JP5422664B2 (ja) * 2009-10-21 2014-02-19 パナソニック株式会社 音響信号処理装置、音響符号化装置および音響復号装置
RU2547220C2 (ru) * 2009-10-21 2015-04-10 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Устройство и способ для генерирования высокочастотного аудиосигнала с применением адаптивной избыточной дискретизации
US20110257978A1 (en) * 2009-10-23 2011-10-20 Brainlike, Inc. Time Series Filtering, Data Reduction and Voice Recognition in Communication Device
TWI484473B (zh) 2009-10-30 2015-05-11 Dolby Int Ab 用於從編碼位元串流擷取音訊訊號之節奏資訊、及估算音訊訊號之知覺顯著節奏的方法及系統
EP2502230B1 (de) * 2009-11-19 2014-05-21 Telefonaktiebolaget L M Ericsson (PUBL) Anregungssignale zur verbesserten bandbreitenausdehnung
US8929568B2 (en) 2009-11-19 2015-01-06 Telefonaktiebolaget L M Ericsson (Publ) Bandwidth extension of a low band audio signal
CN102725791B (zh) * 2009-11-19 2014-09-17 瑞典爱立信有限公司 用于音频编解码中的响度和锐度补偿的方法和设备
AU2010332925B2 (en) * 2009-12-16 2013-07-11 Dolby International Ab SBR bitstream parameter downmix
AU2014200151B2 (en) * 2010-01-19 2015-04-16 Dolby International Ab Improved subband block based harmonic transposition
AU2015203065B2 (en) * 2010-01-19 2017-05-11 Dolby International Ab Improved subband block based harmonic transposition
CA3200142C (en) 2010-01-19 2024-02-20 Dolby International Ab Improved subband block based harmonic transposition
KR101712101B1 (ko) * 2010-01-28 2017-03-03 삼성전자 주식회사 신호 처리 방법 및 장치
EP2362376A3 (de) * 2010-02-26 2011-11-02 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Gerät und verfahren zur¨änderung eines audiosignals durch hüllkurvenenformung
SG183967A1 (en) 2010-03-09 2012-10-30 Fraunhofer Ges Forschung Apparatus and method for processing an input audio signal using cascaded filterbanks
BR112012022745B1 (pt) * 2010-03-09 2020-11-10 Fraunhofer - Gesellschaft Zur Föerderung Der Angewandten Forschung E.V. dispositivo e método para resposta de magnitude aperfeiçoada e alinhamento temporal em um vocoder de fase com base no método de extenção da largura de banda para sinais de áudio
RU2591012C2 (ru) 2010-03-09 2016-07-10 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Устройство и способ обработки переходных процессов для аудио сигналов с изменением скорости воспроизведения или высоты тона
DK2375782T3 (en) * 2010-04-09 2019-03-18 Oticon As Improvements in sound perception by using frequency transposing by moving the envelope
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
CA2800613C (en) * 2010-04-16 2016-05-03 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus, method and computer program for generating a wideband signal using guided bandwidth extension and blind bandwidth extension
US8452826B2 (en) 2010-05-04 2013-05-28 Raytheon Applied Signal Technology, Inc. Digital frequency channelizer
US8751225B2 (en) 2010-05-12 2014-06-10 Electronics And Telecommunications Research Institute Apparatus and method for coding signal in a communication system
US8600737B2 (en) * 2010-06-01 2013-12-03 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for wideband speech coding
CA2770287C (en) 2010-06-09 2017-12-12 Panasonic Corporation Bandwidth extension method, bandwidth extension apparatus, program, integrated circuit, and audio decoding apparatus
KR20240023667A (ko) 2010-07-19 2024-02-22 돌비 인터네셔널 에이비 고주파 복원 동안 오디오 신호들의 프로세싱
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
US8762158B2 (en) * 2010-08-06 2014-06-24 Samsung Electronics Co., Ltd. Decoding method and decoding apparatus therefor
MY156027A (en) 2010-08-12 2015-12-31 Fraunhofer Ges Forschung Resampling output signals of qmf based audio codecs
KR102014696B1 (ko) 2010-09-16 2019-08-27 돌비 인터네셔널 에이비 교차 곱 강화된 서브밴드 블록 기반 고조파 전위
JP5552988B2 (ja) * 2010-09-27 2014-07-16 富士通株式会社 音声帯域拡張装置および音声帯域拡張方法
US8924200B2 (en) * 2010-10-15 2014-12-30 Motorola Mobility Llc Audio signal bandwidth extension in CELP-based speech coder
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
US8868432B2 (en) * 2010-10-15 2014-10-21 Motorola Mobility Llc Audio signal bandwidth extension in CELP-based speech coder
KR20120046627A (ko) * 2010-11-02 2012-05-10 삼성전자주식회사 화자 적응 방법 및 장치
TWI412022B (zh) * 2010-12-30 2013-10-11 Univ Nat Cheng Kung 遞迴式離散餘弦正、逆轉換之系統
JP5743137B2 (ja) 2011-01-14 2015-07-01 ソニー株式会社 信号処理装置および方法、並びにプログラム
JP5666021B2 (ja) 2011-02-14 2015-02-04 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 復号後オーディオ信号をスペクトル領域で処理する装置及び方法
TWI476760B (zh) 2011-02-14 2015-03-11 Fraunhofer Ges Forschung 用以使用暫態檢測及品質結果將音訊信號的部分編碼之裝置與方法
AU2012217184B2 (en) 2011-02-14 2015-07-30 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E. V. Encoding and decoding of pulse positions of tracks of an audio signal
JP5625126B2 (ja) 2011-02-14 2014-11-12 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン スペクトル領域ノイズ整形を使用する線形予測ベースコーディングスキーム
MY166394A (en) * 2011-02-14 2018-06-25 Fraunhofer Ges Forschung Information signal representation using lapped transform
ES2916257T3 (es) * 2011-02-18 2022-06-29 Ntt Docomo Inc Decodificador de voz, codificador de voz, método de decodificación de voz, método de codificación de voz, programa de decodificación de voz y programa de codificación de voz
PT2908313T (pt) * 2011-04-15 2019-06-19 Ericsson Telefon Ab L M Partilha adaptativa de taxas de ganho/forma
US9536534B2 (en) 2011-04-20 2017-01-03 Panasonic Intellectual Property Corporation Of America Speech/audio encoding apparatus, speech/audio decoding apparatus, and methods thereof
JP5986565B2 (ja) * 2011-06-09 2016-09-06 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 音声符号化装置、音声復号装置、音声符号化方法及び音声復号方法
US9070361B2 (en) * 2011-06-10 2015-06-30 Google Technology Holdings LLC Method and apparatus for encoding a wideband speech signal utilizing downmixing of a highband component
DE102011106034A1 (de) * 2011-06-30 2013-01-03 Zte Corporation Verfahren und Vorrichtung zur Spektralbandreplikation und Verfahren und System zur Audiodecodierung
US20130006644A1 (en) * 2011-06-30 2013-01-03 Zte Corporation Method and device for spectral band replication, and method and system for audio decoding
EP2562751B1 (de) 2011-08-22 2014-06-11 Svox AG Temporäre Interpolation von nebeneinander liegenden Spektren
JP6037156B2 (ja) 2011-08-24 2016-11-30 ソニー株式会社 符号化装置および方法、並びにプログラム
JP5975243B2 (ja) 2011-08-24 2016-08-23 ソニー株式会社 符号化装置および方法、並びにプログラム
JP5807453B2 (ja) * 2011-08-30 2015-11-10 富士通株式会社 符号化方法、符号化装置および符号化プログラム
US8781023B2 (en) * 2011-11-01 2014-07-15 At&T Intellectual Property I, L.P. Method and apparatus for improving transmission of data on a bandwidth expanded channel
US8774308B2 (en) * 2011-11-01 2014-07-08 At&T Intellectual Property I, L.P. Method and apparatus for improving transmission of data on a bandwidth mismatched channel
USRE48258E1 (en) 2011-11-11 2020-10-13 Dolby International Ab Upsampling using oversampled SBR
JP5817499B2 (ja) 2011-12-15 2015-11-18 富士通株式会社 復号装置、符号化装置、符号化復号システム、復号方法、符号化方法、復号プログラム、及び符号化プログラム
US9173025B2 (en) 2012-02-08 2015-10-27 Dolby Laboratories Licensing Corporation Combined suppression of noise, echo, and out-of-location signals
US8712076B2 (en) 2012-02-08 2014-04-29 Dolby Laboratories Licensing Corporation Post-processing including median filtering of noise suppression gains
WO2013142650A1 (en) 2012-03-23 2013-09-26 Dolby International Ab Enabling sampling rate diversity in a voice communication system
US8965290B2 (en) * 2012-03-29 2015-02-24 General Electric Company Amplitude enhanced frequency modulation
JP5997592B2 (ja) 2012-04-27 2016-09-28 株式会社Nttドコモ 音声復号装置
EP2682941A1 (de) * 2012-07-02 2014-01-08 Technische Universität Ilmenau Vorrichtung, Verfahren und Computerprogramm für frei wählbare Frequenzverschiebungen in der Subband-Domäne
JP6065452B2 (ja) * 2012-08-14 2017-01-25 富士通株式会社 データ埋め込み装置及び方法、データ抽出装置及び方法、並びにプログラム
EP2704142B1 (de) 2012-08-27 2015-09-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Wiedergabe eines Audiosignals, Vorrichtung und Verfahren zur Erzeugung eines codierten Audiosignals, Computerprogramm und codiertes Audiosignal
EP2709106A1 (de) 2012-09-17 2014-03-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Erzeugung eines bandbreitenerweiterten Signals aus einer Bandbreite mit eingeschränktem Audiosignal
US9129600B2 (en) * 2012-09-26 2015-09-08 Google Technology Holdings LLC Method and apparatus for encoding an audio signal
KR101771828B1 (ko) 2013-01-29 2017-08-25 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 오디오 인코더, 오디오 디코더, 인코딩된 오디오 정보를 제공하기 위한 방법, 디코딩된 오디오 정보를 제공하기 위한 방법, 컴퓨터 프로그램 및 신호 적응적 대역폭 확장을 이용한 인코딩된 표현
JP6146069B2 (ja) 2013-03-18 2017-06-14 富士通株式会社 データ埋め込み装置及び方法、データ抽出装置及び方法、並びにプログラム
RU2665228C1 (ru) 2013-04-05 2018-08-28 Долби Интернэшнл Аб Аудиокодер и декодер для кодирования по форме волны с перемежением
CN110010140B (zh) * 2013-04-05 2023-04-18 杜比国际公司 立体声音频编码器和解码器
US8804971B1 (en) 2013-04-30 2014-08-12 Dolby International Ab Hybrid encoding of higher frequency and downmixed low frequency content of multichannel audio
PL3008726T3 (pl) 2013-06-10 2018-01-31 Fraunhofer Ges Forschung Urządzenie i sposób kodowania obwiedni sygnału audio, przetwarzania i dekodowania przez modelowanie reprezentacji sumy skumulowanej z zastosowaniem kwantyzacji i kodowania rozkładu
CA2914418C (en) 2013-06-10 2017-05-09 Tom Baeckstroem Apparatus and method for audio signal envelope encoding, processing and decoding by splitting the audio signal envelope employing distribution quantization and coding
DK2822263T3 (da) 2013-07-05 2019-06-17 Sennheiser Communications As Kommunikationsanordning med ekkoundertrykkelse
EP2830055A1 (de) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Kontextbasierte Entropiecodierung von Probenwerten einer spektralen Hüllkurve
EP2830063A1 (de) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung, Verfahren und Computerprogramm zum Dekodieren eines kodierten Audiosignals
CN105531762B (zh) 2013-09-19 2019-10-01 索尼公司 编码装置和方法、解码装置和方法以及程序
EP2871641A1 (de) * 2013-11-12 2015-05-13 Dialog Semiconductor B.V. Verbesserung von Schmalband-Audiosignalen unter Verwendung einer Einseitenband-AM-Modulation
CN105765655A (zh) * 2013-11-22 2016-07-13 高通股份有限公司 高频带译码中的选择性相位补偿
KR102356012B1 (ko) 2013-12-27 2022-01-27 소니그룹주식회사 복호화 장치 및 방법, 및 프로그램
CN103795420B (zh) * 2014-02-10 2017-04-05 南京邮电大学 一种基于分段的sbr多属性数据压缩方法
EP4325488A2 (de) 2014-02-28 2024-02-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decodierungsvorrichtung, codierungsvorrichtung, decodierungsverfahren, codierungsverfahren, endgerätevorrichtung und basisstationsvorrichtung
JP6439296B2 (ja) * 2014-03-24 2018-12-19 ソニー株式会社 復号装置および方法、並びにプログラム
JPWO2015151451A1 (ja) 2014-03-31 2017-04-13 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 符号化装置、復号装置、符号化方法、復号方法、およびプログラム
EP2963645A1 (de) * 2014-07-01 2016-01-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Rechner und Verfahren zur Bestimmung der Phasenkorrekturdaten für ein Audiosignal
CN107517593B (zh) * 2015-02-26 2021-03-12 弗劳恩霍夫应用研究促进协会 用于使用目标时域包络来处理音频信号以获得经处理的音频信号的装置和方法
TW202242853A (zh) 2015-03-13 2022-11-01 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
TWI693595B (zh) * 2015-03-13 2020-05-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
WO2016180704A1 (en) 2015-05-08 2016-11-17 Dolby International Ab Dialog enhancement complemented with frequency transposition
US10847170B2 (en) * 2015-06-18 2020-11-24 Qualcomm Incorporated Device and method for generating a high-band signal from non-linearly processed sub-ranges
US9837089B2 (en) * 2015-06-18 2017-12-05 Qualcomm Incorporated High-band signal generation
WO2017080835A1 (en) * 2015-11-10 2017-05-18 Dolby International Ab Signal-dependent companding system and method to reduce quantization noise
EP3182411A1 (de) 2015-12-14 2017-06-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und verfahren zur verarbeitung eines codierten audiosignals
WO2017132366A1 (en) 2016-01-26 2017-08-03 Dolby Laboratories Licensing Corporation Adaptive quantization
JP6763194B2 (ja) * 2016-05-10 2020-09-30 株式会社Jvcケンウッド 符号化装置、復号装置、通信システム
EP3246923A1 (de) * 2016-05-20 2017-11-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und verfahren zur verarbeitung eines multikanal-audiosignals
JP6621709B2 (ja) * 2016-05-26 2019-12-18 アルパイン株式会社 音声処理装置、音声処理方法及びコンピュータプログラム
CN107845385B (zh) * 2016-09-19 2021-07-13 南宁富桂精密工业有限公司 信息隐藏的编解码方法及系统
GB201620317D0 (en) * 2016-11-30 2017-01-11 Microsoft Technology Licensing Llc Audio signal processing
NO343581B1 (no) * 2017-03-01 2019-04-08 Dolby Int Ab Fremgangsmåte, anordning og program til spektralinnhyllingsjustering
CN109215675B (zh) * 2017-07-05 2021-08-03 苏州谦问万答吧教育科技有限公司 一种啸叫抑制的方法、装置及设备
US10714098B2 (en) * 2017-12-21 2020-07-14 Dolby Laboratories Licensing Corporation Selective forward error correction for spatial audio codecs
IL278223B2 (en) * 2018-04-25 2023-12-01 Dolby Int Ab Combining high-frequency audio reconstruction techniques
KR102560473B1 (ko) 2018-04-25 2023-07-27 돌비 인터네셔널 에이비 후처리 지연을 저감시킨 고주파 재구성 기술의 통합
EP3671741A1 (de) * 2018-12-21 2020-06-24 FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. Audioprozessor und verfahren zum erzeugen eines frequenzverbesserten audiosignals mittels impulsverarbeitung
CN113113032A (zh) * 2020-01-10 2021-07-13 华为技术有限公司 一种音频编解码方法和音频编解码设备
JPWO2022097242A1 (de) * 2020-11-05 2022-05-12
WO2022097240A1 (ja) * 2020-11-05 2022-05-12 日本電信電話株式会社 音信号高域補償方法、音信号後処理方法、音信号復号方法、これらの装置、プログラム、および記録媒体

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4150253A (en) * 1976-03-15 1979-04-17 Inter-Technology Exchange Ltd. Signal distortion circuit and method of use
US4667340A (en) * 1983-04-13 1987-05-19 Texas Instruments Incorporated Voice messaging system with pitch-congruent baseband coding
US4790016A (en) * 1985-11-14 1988-12-06 Gte Laboratories Incorporated Adaptive method and apparatus for coding speech
CA1220282A (en) 1985-04-03 1987-04-07 Northern Telecom Limited Transmission of wideband speech signals
SE444750B (sv) * 1985-06-04 1986-04-28 Lars Gustaf Liljeryd Metod for att pa elektronisk veg astadkomma fortydligande av ljud- eller bildinformation jemte anordning for utforande av metoden
US4776014A (en) * 1986-09-02 1988-10-04 General Electric Company Method for pitch-aligned high-frequency regeneration in RELP vocoders
US4771465A (en) 1986-09-11 1988-09-13 American Telephone And Telegraph Company, At&T Bell Laboratories Digital speech sinusoidal vocoder with transmission of only subset of harmonics
US5127054A (en) * 1988-04-29 1992-06-30 Motorola, Inc. Speech quality improvement for voice coders and synthesizers
US5040217A (en) 1989-10-18 1991-08-13 At&T Bell Laboratories Perceptual coding of audio signals
US5388181A (en) * 1990-05-29 1995-02-07 Anderson; David J. Digital audio compression system
US5436940A (en) * 1992-06-11 1995-07-25 Massachusetts Institute Of Technology Quadrature mirror filter banks and method
CA2106440C (en) * 1992-11-30 1997-11-18 Jelena Kovacevic Method and apparatus for reducing correlated errors in subband coding systems with quantizers
US5684920A (en) 1994-03-17 1997-11-04 Nippon Telegraph And Telephone Acoustic signal transform coding method and decoding method having a high efficiency envelope flattening method therein
US5717823A (en) * 1994-04-14 1998-02-10 Lucent Technologies Inc. Speech-rate modification for linear-prediction based analysis-by-synthesis speech coders
US5687340A (en) * 1995-05-16 1997-11-11 Hewlett-Packard Company Reduced area floating point processor control logic utilizing a decoder between a control unit and the FPU
US5692050A (en) * 1995-06-15 1997-11-25 Binaura Corporation Method and apparatus for spatially enhancing stereo and monophonic signals
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US5687191A (en) 1995-12-06 1997-11-11 Solana Technology Development Corporation Post-compression hidden data transport
US5822370A (en) * 1996-04-16 1998-10-13 Aura Systems, Inc. Compression/decompression for preservation of high fidelity speech quality at low bandwidth
US6049766A (en) * 1996-11-07 2000-04-11 Creative Technology Ltd. Time-domain time/pitch scaling of speech or audio signals with transient handling
JP3017715B2 (ja) * 1997-10-31 2000-03-13 松下電器産業株式会社 音声再生装置
EP0957579A1 (de) * 1998-05-15 1999-11-17 Deutsche Thomson-Brandt Gmbh Verfahren und Vorrichtung zur Abtastrateumsetzung von Audiosignalen
JP3546755B2 (ja) * 1999-05-06 2004-07-28 ヤマハ株式会社 リズム音源信号の時間軸圧伸方法及び装置
US6988066B2 (en) * 2001-10-04 2006-01-17 At&T Corp. Method of bandwidth extension for narrow-band speech

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102008015702A1 (de) * 2008-01-31 2009-08-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals
DE102008015702B4 (de) * 2008-01-31 2010-03-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals
US8996362B2 (en) 2008-01-31 2015-03-31 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Device and method for a bandwidth extension of an audio signal

Also Published As

Publication number Publication date
DK1367566T3 (da) 2005-10-10
EP0940015A1 (de) 1999-09-08
EP1367566A3 (de) 2004-09-08
JP2001521648A (ja) 2001-11-06
HK1030843A1 (en) 2001-05-18
SE9800268D0 (sv) 1998-01-30
JP2005173607A (ja) 2005-06-30
US6680972B1 (en) 2004-01-20
PT940015E (pt) 2004-06-30
PT1367566E (pt) 2005-11-30
AU7446598A (en) 1998-12-30
EP1367566B1 (de) 2005-08-31
ES2247466T3 (es) 2006-03-01
JP4220461B2 (ja) 2009-02-04
ATE257987T1 (de) 2004-01-15
CN1272259A (zh) 2000-11-01
JP3871347B2 (ja) 2007-01-24
EP1367566A2 (de) 2003-12-03
CN1308916C (zh) 2007-04-04
WO1998057436A2 (en) 1998-12-17
BR9805989A (pt) 1999-08-31
CN1629937A (zh) 2005-06-22
US20040078194A1 (en) 2004-04-22
SE512719C2 (sv) 2000-05-02
DE69821089D1 (de) 2004-02-19
DK0940015T3 (da) 2004-04-26
ES2213901T3 (es) 2004-09-01
DE69831435D1 (de) 2005-10-06
US7283955B2 (en) 2007-10-16
US7328162B2 (en) 2008-02-05
CN1206816C (zh) 2005-06-15
EP0940015B1 (de) 2004-01-14
US6925116B2 (en) 2005-08-02
US20040078205A1 (en) 2004-04-22
HK1057815A1 (en) 2004-04-16
ATE303679T1 (de) 2005-09-15
WO1998057436A3 (en) 2000-02-10
US20040125878A1 (en) 2004-07-01
SE9800268L (sv) 1998-12-11
DE69831435T2 (de) 2006-06-14
BR9805989B1 (pt) 2009-12-01

Similar Documents

Publication Publication Date Title
DE69821089T2 (de) Verbesserung von quellenkodierung unter verwendung von spektralbandreplikation
US10699724B2 (en) Spectral translation/folding in the subband domain
DE60013785T2 (de) VERBESSERTE SUBJEKTIVE QUALITäT VON SBR (SPECTRAL BAND REPLICATION)UND HFR (HIGH FREQUENCY RECONSTRUCTION) KODIERVERFAHREN DURCH ADDIEREN VON GRUNDRAUSCHEN UND BEGRENZUNG DER RAUSCHSUBSTITUTION
DE60317722T2 (de) Verfahren zur Reduzierung von Aliasing-Störungen, die durch die Anpassung der spektralen Hüllkurve in Realwertfilterbanken verursacht werden
DE102008015702B4 (de) Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals
EP1979901B1 (de) Verfahren und anordnungen zur audiosignalkodierung
DE69631728T2 (de) Verfahren und Vorrichtung zur Sprachkodierung
EP2867894B1 (de) Vorrichtung, verfahren und computerprogramm für frei wählbare frequenzverschiebungen in der subband-domäne
DE60128121T2 (de) Wahrnehmungsbezogen verbesserte aufbesserung kodierter akustischer signale
RU2256293C2 (ru) Усовершенствование исходного кодирования с использованием дублирования спектральной полосы
EP1239455A2 (de) Verfahren und Anordnung zur Durchführung einer an die Übertragungsfunktion menschilcher Sinnesorgane angepassten Fourier Transformation sowie darauf basierende Vorrichtungen zur Geräuschreduktion und Spracherkennung

Legal Events

Date Code Title Description
8327 Change in the person/name/address of the patent owner

Owner name: CODING TECHNOLOGIES AB, STOCKHOLM, SE

8364 No opposition during term of opposition
8327 Change in the person/name/address of the patent owner

Owner name: DOLBY INTERNATIONAL AB, AMSTERDAM, NL