1 / 21

Emotionen in Sprache

Hauptseminar: Phonetic and technological aspects of speaker characteristics Wintersemester 2007/08 Dozent: Prof. Dr. Harrington Referentin: Sarah Stolze. Emotionen in Sprache. Inhalt:. 1) Grundfrequenz als Parameter f ü r Sprechererkennung

thuong
Download Presentation

Emotionen in Sprache

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Hauptseminar: Phonetic and technological aspects of speaker characteristicsWintersemester 2007/08Dozent: Prof. Dr. HarringtonReferentin: Sarah Stolze Emotionen in Sprache

  2. Inhalt: 1) Grundfrequenz als Parameter für Sprechererkennung 1.1) Beeinflussung der Grundfrequenz durch technische Faktoren 1.2) Beeinflussung der Grundfrequenz durch physiologische Faktoren 1.3) Beeinflussung der Grundfrequenz durch psychologische Faktoren 2) Stress 2.1) Realer vs. Simulierter Stress„Hindenburg Disaster“ 2.2) F0 real vs. Reproduziert 2.3) Level des empfundenen Stresses 3) Zusammenfassung

  3. 1) Grundfrequenz als Parameter für Sprechererkennung - Abhängig von der Anatomie des Kehlkopfes • Geringe Veränderung innerhalb eines Sprechers - robust bei Telefonübertragung

  4. 1.1 Beeinflussung der Grundfrequenz durch technische Faktoren • Schnelligkeit beim Abspielen von Sprachmaterial • Sampling Rate • Verhältnis modal zu falsetto (m) 2:1  Sprecher ausschließen, jedoch sehr ungenau

  5. 1.2 Beeinflussung der Grundfrequenz durch physiologische Faktoren • Alter Veränderungen geschehen langsam, älteres Material kann verwendet werden • Rauchen Kann die Einschätzung des Alters erschweren • Alkohol  F0 steigt

  6. 1.3 Beeinflussung der Grundfrequenz durch psychologische Faktoren Emotionen Neutral • Langsame Veränderung von F0 • Kontinuierliche Verlaufsform • Gut definierte Struktur der Vokale • Konsonanten unpräzise artikuliert • Kurze Pausen

  7. F0 Verlauf verschiedener Emotionen Figur (1): Fundamental frequency (F0) contours of selected control clustersas spoken by voice B in different situations in the scenario. Numbers refer to the control clusters.

  8. 1.3 Beeinflussung der Grundfrequenz durch psychologische Faktoren Ärger • höhere F0 als bei neutraler Äußerung • 1 bis 2 Silben zeigen eine Spitze, sonst kontinuierlicher, glatter Verlauf • Höhere F0 Reichweite als bei neutral • Hoher F1, da Mund weit geöffnet • Klarer Verschluss bei Konsonanten

  9. 1.3 Beeinflussung der Grundfrequenz durch psychologische Faktoren Sorge • Flacher Verlauf der Kontur • F0 tiefer als bei neutral • Weniger Betonung als bei neutral • Unregelmäßigkeiten in der Stimmgebung (flüstern) • Lange Dauer der Äußerung lange Vokale, Konsonantenverschlüsse und Pausen

  10. 1.3 Beeinflussung der Grundfrequenz durch psychologische Faktoren Angst • Schnelle Veränderung der Kontur • F0 niedriger als bei Ärger • Kann dem neutralen Muster ähneln, jedoch mit hohen Spitzen • unregelmäßige Stimme • Längere Dauer als bei Ärger und neutral • Präzise Artikuliert

  11. 2) Stress • Was bedeutet Stress  Emotionen (Angst, Ärger, Sorge) 2.1) Realer vs. Simulierter Stress 2.2) Level des empfundenen Stresses

  12. Real Vorher: Glatter F0-Verlauf Kontinuierlicher Ab- und Aufwärtsverlauf von F0 Nachher: Konturverlauf verändert sich abrupt Durchschnittlicher F0-Wert ist höher größere F0 Spanne „zittern“ bei 0,6s und 0,8s  Kontrollverlust der Muskulatur+ unregelmäßiges Atmen 2.1) Realer vs. Simulierter Stress„Hindenburg Disaster“

  13. Originalaufnahme des Radiosprechers Aus: Williams, Stevens (1972)Fig.2: Radio announcer speaking before (top) and after (middle and bottom) the crash of the HINDENBURG. Narrow-band.

  14. Simuliert vorher Weniger „Bewegung“ als in der Originalaufnahme Der Verlauf ist ähnlich glatt nachher F0 steigt Ab- und Aufwärtsbewegungen sind stärker ausgeprägt „zittern“ und die ungleichmäßige Kontur ist ähnlich dem Original 2.1) Realer vs. Simulierter Stress„Hindenburg Disaster“

  15. Simulierte Aufnahme Aus: Williams, Stevens (1972) Fig. 3: Voice C simulating announcement of Hindenburg crash before (top) and after (middle and bottom) the disaster. Narrow-band. F0 (Hz) F0 Range (Hz) Original Vorher 166 124-196 Nachher 196 152-260 Simuliert Vorher 138 117-168 Nachher 222 117-280

  16. 2.2) F0 real vs. reproduziert Tabelle 1: Durchschnittliche Grundfrequenz aus: Gfroerer, Wagner (1995)

  17. 2.3) Level des empfundenen Stresses • F0 steigt • Die Sprache wird weniger fließend • Vokalintensität steigt • Der Sprachfluss nimmt zu • Die Zahl der Bursts nimmt ab

  18. Stimmveränderung in Abhängigkeit von Stress Aus: Hollien (1990)Fig. 4: Model of the most common shifts in the voice and speech of a person who is responding to psychological stress. SFF is speaking fundamental frequency, NF is nonfluencies, VI is vocal intensity, and SB refers to the number of speech bursts per unit of time.

  19. 3) „Zusammenfassung“ • Keine Möglichkeit den genauen emotionalen Zustand einer Person zu ermitteln, eher Richtwerte, Tendenzen. • Referenzmaterial sollte dem zu untersuchenden Material so ähnlich wie möglich sein.

  20. Literatur • Williams, Carl E., Stevens, Kenneth N.(1972 `Emotions and Speech: Some Acoustical Correlates`, Biometric Technology Today, 52 (4), 1238-1250) • Jessen, M. (1997) `Phonetic manifestations of cognitive and physical stress in trained and untrained police officers`, Forensic Linguistics, The International Journal of Speech Language and the Law, 4 (1), 125-147 • Hollien, H. F. (1990) `The Acoustics of Crime: the new science of forensic phonetics`, Plenum Press, New York, chapter 12 and 13, p. 255-289 • Braun, A. (1995) `Fundamental Frequency – How Speaker-Specific is it?`, Studies in Forensic Phonetics, 64,9-23 • Gfroerer, S., Wagner, I. (1995) `Fundamental Frequency in Forensic Speech Samples`, Studies in Forensic Phonetics, 64, 41-48 • Homayounpour, M. M., Goldman, J. Ph. (1995) `Machine vs. Human Speaker Verification` Studies in Forensic Phonetics, 64, 109-120

  21. Danke für die Aufmerksamkeit

More Related