Strahl, Stefan (2009) Efficient coding of natural sounds. PhD, Universität Oldenburg.
|
Volltext (4Mb) |
Abstract
Es werden Methoden für eine effiziente Kodierung natürlicher Töne vorgeschlagen, die auf dem Konzept der "spärlichen Kodierung" basieren, ein Hauptmechanismus in der neurosensorischen Informationsverarbeitung. Eine verbesserte Audioqualität, insbesondere bei niedrigen Bitraten, wurde in dem Audiokodierungsverfahren MPEG-2/4 AAC erreicht durch den Austausch der modifizierten diskrete Kosinustransformation (MDCT) durch ein verschiebungsinvariantes spärliches Signalmodel (Matching Pursuit). Es konnte gezeigt werden, dass die Anzahl M>100 Gammatonfiltern (2.4 Filter pro ERB) eine fast perfekte Rekonstruktion des Signalraumes der natürlichen Töne ermöglicht. Weiterhin wird gezeigt, wie mittels Signifikanzbäumen eine effektive Kodierung spärlicher Koeffizienten erreicht werden kann. Unter Verwendung einer datenabhängigen Menge von Signifikanzbäumen kann dieses Kodierungskonzept den hochmodernen Audiokodierer MPEG-2/4 für Bitraten unterhalb von 32 kbps übertreffen, während es zusätzlich eine feinabgestimmte Bitratenskalierbarkeit ermöglicht.
["eprint_fieldname_abstract_plus" not defined]
In this dissertation, methods for an efficient coding of natural sounds are proposed that are based on the concept of "sparse coding" which has been identified as one major mechanism involved in the neurosensory information processing. An improved perceived audio quality, especially at low bitrates, was achieved by replacing in the MPEG-2/4 AAC audio coding scheme the modified discrete cosine transform (MDCT) with a shift-invariant sparse signal model (matching pursuit). It is further shown that the number M>100 of gammatone filters (2.4 filters per ERB) leads to a near-perfect reconstruction of the signal space of natural sounds. Finally it is demonstrated how a set of significance trees can be used to achieve an effective encoding of sparse coefficients. Using a data-dependent set of significance trees, the proposed coding scheme outperforms the state-of-the-art audio coding scheme MPEG-2/4 AAC for bitrates less than 32 kbps while additionally offering the property of fine-grain bitrate scalability.
Item Type: | Thesis (PhD) |
---|---|
Uncontrolled Keywords: | audio coding , sparse coding , neurosensory coding , data compression , significance tree coding , matching pursuit , gammatone filterbank |
Controlled Keywords: | Spärliche Codierung , Ton <Akustik> , Akustisches Signal |
Subjects: | Science and mathematics > Physics |
Date Deposited: | 17 Jan 2013 14:24 |
Last Modified: | 08 Jul 2013 13:04 |
URI: | https://oops.uni-oldenburg.de/id/eprint/956 |
URN: | urn:nbn:de:gbv:715-oops-10282 |
DOI: | |
Nutzungslizenz: |
Actions (login required)
View Item |