TRR 318 - Projekt C06: Technisch ermöglichtes Erklären von Sprecher-Eigenschaften
Überblick
Im Projekt C6 wird ein spezieller Fall von soziotechnischer Assistenz betrachtet, bei dem Expert:innen durch maschinelle Lernausgabe unterstützt werden, die es ihnen ermöglicht, ein Sprachsignal besser zu verstehen und damit interpretierbar zu machen. Weiterhin wird untersucht, wie dieser Output von Phonetik-Expert:innen genutzt werden kann, um ihr Wissen über ein Phänomen mittels einer Erklärung an Novizen weiterzugeben. Es trägt zum Verständnis der Dynamik von Explanandum und Explanans bei, indem es das Explanans als eine Zeitreihe modelliert, die sich als Reaktion dem Feedback von sowohl Phonetiker:innen als auch von Novizen anpasst.
Key Facts
- Grant Number:
- 438445824
- Art des Projektes:
- Forschung
- Laufzeit:
- 07/2021 - 12/2025
- Gefördert durch:
- Deutsche Forschungsgemeinschaft (DFG)
News
Detailinformationen
Publikationen
Speech Synthesis along Perceptual Voice Quality Dimensions
F. Rautenberg, M. Kuhlmann, F. Seebauer, J. Wiechmann, P. Wagner, R. Haeb-Umbach, in: ICASSP 2025 - 2025 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), IEEE, 2025.
Synthesizing Speech with Selected Perceptual Voice Qualities – A Case Study with Creaky Voice
F. Rautenberg, F. Seebauer, J. Wiechmann, M. Kuhlmann, P. Wagner, R. Haeb-Umbach, in: Interspeech 2025, ISCA, 2025.
Challenges and Limits in Explaining and Acoustic Modeling of Voice Characteristics
J. Wiechmann, P. Wagner, Journal of Voice (2025).
On Feature Importance and Interpretability of Speaker Representations
F. Rautenberg, M. Kuhlmann, J. Wiechmann, F. Seebauer, P. Wagner, R. Haeb-Umbach, in: ITG Conference on Speech Communication, 2023.
Explaining voice characteristics to novice voice practitioners-How successful is it?
Alle Publikationen anzeigen
J. Wiechmann, F. Rautenberg, P. Wagner, R. Haeb-Umbach, in: 20th International Congress of the Phonetic Sciences (ICPhS) , 2023.