Schubotz, Wiebke (2015) Performance of current models of speech recognition and resulting challenges. PhD, Universität Oldenburg.

[img]
Preview


Volltext (2689Kb)

Abstract

Speech is usually perceived in background noise (masker) that can severely hamper its recognition. Nevertheless, there are mechanisms that enable speech recognition even in difficult listening conditions. Some of them, such as e.g., the combination of across-frequency information or binaural cues, are studied in this dissertation. Moreover, masking aspects such as energetic, amplitude modulation or informational masking are considered. Speech recognition in complex maskers is investigated that systematically vary in their spectro-temporal properties and address all aspects listed above. Outcomes of current models of speech recognition are compared to the data observed in the listening experiments. This allows to assess how well the different models account for the observed speech reception thresholds, as each model incorporates different signal analysis strategies. The studies designate the limits of the current model approaches, and thus constitute a benchmark for speech recognition models which might be useful for improving our current state of the art in modelling speech recognition.

["eprint_fieldname_title_plus" not defined]

Aktuelle Sprachverständlichkeitsmodelle: Untersuchung ihrer Leistungsfähigkeit und daraus resultierende Herausforderungen

["eprint_fieldname_abstract_plus" not defined]

Sprache wird oft durch Störgeräusche (Maskierer) verdeckt, die das Verstehen eines Zielsprechers erheblich behindern können. Aber es gibt Mechanismen, die Sprachverstehen in schwierigen Hörsituationen ermöglichen. Einige davon, z.B. die frequenzübergreifende Kombination von Information oder binaurale Merkmale, werden in dieser Dissertation untersucht. Außerdem werden Maskiereigenschaften wie energetische Maskierung, Amplitudenmodulationsmaskierung und „informational masking“ diskutiert. Sprachverständlichkeit wird in komplexen Maskierern untersucht, die systematisch ihre spektro-temporalen Merkmale ändern und dabei die verschiedenen Aspekte ansprechen. Gemessene Sprachverständlichkeitsschwellen werden mit den Vorhersagen verschiedener Sprachverständlichkeitsmodelle verglichen. Da jedes Modell eine andere Analysestrategie der dargebotenen Signale hat, kann beurteilt werden, wie gut die einzelnen Modelle die gemessene Sprachverständlichkeit vorhersagen. Diese Dissertation benennt die Grenzen aktueller Modelle und bietet so eine „benchmark“ für die Weiterentwicklung von Sprachverständlichkeitsmodellen.

Item Type: Thesis (PhD)
Uncontrolled Keywords: Sprachwahrnehmung, Störgeräusch, Modellierung
Subjects: Science and mathematics > Physics
Divisions: Faculty of Mathematics and Science > Institute of Physics (IfP)
Date Deposited: 02 Feb 2016 13:55
Last Modified: 02 Feb 2016 13:55
URI: https://oops.uni-oldenburg.de/id/eprint/2649
URN: urn:nbn:de:gbv:715-oops-27302
DOI:
Nutzungslizenz:

Actions (login required)

View Item View Item

Document Downloads

More statistics for this item...