Print
Univis
Search
 
FAU-Logo
Techn. Fakultät Willkommen am Institut für Informatik FAU-Logo

Dr. rer. biol. hum. Tobias Bocklet

Alumnus of the Pattern Recognition Lab of the Friedrich-Alexander-Universität Erlangen-Nürnberg

Speaker recognition and recognition of speaker characteristics

 

 

 

 

 

 Automatische Sprachanalyse von Kindern und Jugendlichen mit Lippen-Kiefer-Gaumenspalten

Lautbildungsstörungen und morphologische Veränderungen der oberen Atmungs- und Sprechorgane gehören zu den häufigen Einschränkungen bei Kindern und Erwachsenen, die eine Lippen-Kiefer-Gaumenspalte haben oder hatten. Die Diagnostik der Lautbildungsstörungen erfolgt derzeit lediglich subjektiv oder erfasst nur einzelne Laute. Eine neue, für den Patienten nicht belastende Möglichkeit der objektiven und umfassenden Diagnostik der verschiedenen Lautbildungsstörungen, stellt der Einsatz der automatischen Sprachanalyse dar, welche sich bereits bei der Diagnostik anderer Störungen der lautsprachlichen Kommunikation bewährt hat. Hierbei werden verschiedene Lautbildungsstörungen erkannt, unterschieden und quantifiziert werden. Das angewendete Verfahren ist nicht beschränkt auf bestimmte Lautbildungsstörungen und wurde bisher zur Sigmatismusdetektion - und quantifizierung eingesetzt.

 

 

Automatische, objektive Analyse von Sprechstörungen bei Patienten mit Plattenepithelkarzinom der Mundhöhle

Plattenepithelkarzinome der Mundhöhle gehören zu den 10 häufigsten Malignomen des Menschen. Deren Vorhandensein bzw. deren Therapie kann zu einer Funktionseinschränkung mit reduzierter Sprachverständlichkeit führen. Es existiert bisher keine vom Untersucher unabhängige Methode, um Art und Ausmaß einer Sprechstörung bei Patienten mit Plattenepithelkarzinomen zu quantifizieren. In Vorarbeiten wurde ein automatisches Spracherkennungssystem entwickelt, das eine objektive Analyse der Sprechqualität bei Patienten mit Plattenepithelkarzinomen der Mundhöhle zulässt. Gemessen wurde dabei die Verständlichkeit als Prozentsatz richtig erkannter Wörter einer Wortreihe, die sogenannte Worterkennungsrate.

Ziel dieses Projektes ist es, das Spracherkennungssystem zu verfeinern und im klinischen Kontext anzuwenden. Neben der Worterkennungsrate sollen einzelne Lautbildungsstörung automatisch identifiziert werden. Dies ermöglicht erstmals eine objektive Klassifizierung von Sprechstörungen bei Patienten mit Plattenepithelkarzinomen der Mundhöhle. In einem zweiten Schritt wird eine prospektive Sprachdatenerhebung eine Zuordnung der Sprechstörungen zu Tumorstadien und -lokalisationen einerseits, zu unterschiedlichen Therapieschemata andererseits, erbringen. Auf dieser Basis kann das Sprechen, ein elementarer Teil der Ergebnisqualität nach der Therapie eines malignen Tumors, objektiv als Entscheidungskriterium in die Therapiewahl einbezogen werden.

 

 

 

Sprechererkennung und Klassifikation von Sprechercharakteristika

Die Erkennung von bestimmten Sprechercharakteristika, wie z.B. Alter, Muttersprache und Emotion, kann als Klassifikationsproblem beschrieben werden. Dabei wird entschieden, ob ein Sprecher zu einer bestimmten Gruppe von Sprechern gehört, die bestimmte Charakteristika gemeinsam haben. Die Sprechererkennung kann auch als Gruppenklassifikationsproblem beschrieben werden, wobei die Gruppe dann genau einen Sprecher enthält, nämlich genau den Sprecher selbst. Diese Projekt beschäftigt sich mit der Adaption von Sprechererkennungverfahren an das Problem der Sprechergruppenerkennung. Ziel ist die Erstellung eines generischen Systems, welches für verschiedene Sprechercharakteristika verwendet werden kann. Dieses System wird an zwei Problemen evaluiert: Alterserkennung und Muttersprachenerkennung. Abschließend wird untersucht, ob es möglich ist, die Sprechererkennung mit der Erkennung von Sprechercharakteristika zu verbessern.