1 / 11

Wird die Sprechererkennung durch Sprecherbekanntschaft beeinflusst?

Wird die Sprechererkennung durch Sprecherbekanntschaft beeinflusst?. LMU München Hauptseminar : Forensische Phonetik Dozent : Prof. Dr. Jonathan Harrington Referentin : Carolin Funk Datum : 6.12.2007 WiSe 07/08.

macon
Download Presentation

Wird die Sprechererkennung durch Sprecherbekanntschaft beeinflusst?

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Wird die Sprechererkennung durch Sprecherbekanntschaft beeinflusst? LMU München Hauptseminar: Forensische Phonetik Dozent: Prof. Dr. Jonathan Harrington Referentin: Carolin Funk Datum: 6.12.2007 WiSe 07/08

  2. 1.Versuch zur Stimmidentifikation (P. u. J. Ladefoged,1980): 1.1 Materialien und VPn • 11 vollkommen unbekannte Sprecher sowie 13 bekannte -> P.L. hatte Stimmen „ein oder zweimal gehört“ • Drei verschiedene Aufnahmetypen wurden gemacht: 1) Wort „hello“ isoliert sprechen 2) Bild in einem Satz beschreiben 3) Bild 30s lang beschreiben • Zwei zusätzliche Versuchsbedingungen wurden geschaffen: 1) Überprüfung des Einflusses prosodischer Merkmale: Extraktion der Grundfrequenz 2) Überprüfung des Einflusses von Vokabular oder Syntax: Aufnahmen von J. Ladefoged

  3. 1.Versuch zur Stimmidentifikation (P. u .J.Ladefoged,1980): 1.2 Methode und Ablauf • P.L. hörte sich alle Aufnahmen unter Verwendung von qualitativ hochwertiger Ausstattung in einem schalldichten Raum an • Der Hörtest lief wie folgt ab: 1) Grundfrequenzverläufe, 2) Sprachaufnahmen von J.L., 3) 52 x „hello“, 4) 52 Einzelsätze, 5) Sprachaufnahmen zu je 30s • Der Hörtest zog sich über mehrere Tage hin und fand zu verschiedenen Gelegenheiten statt • P.L. versuchte, jeder Stimme einen Namen zuzuordnen; beurteilte die „Sicherheit“ seiner Entscheidungen (3 Beurteilungsgrade:„certain“, „fairly certain“, „possibly“)

  4. 1.Versuch zur Stimmidentifikation (P. u. J. Ladefoged,1980): 1.3 Ergebnisse und Diskussion • Grundfrequenzverläufe: keiner konnte identifiziert werden • Sprachaufnahmen von J.L.: Identifikation nicht sicher • 52 x „hello“: 31% korrekt • 52 Einzelsätze: 66% korrekt • Sprachaufnahmen zu je 30 s: 83% korrekt • Stimmverwechslung: in VB 5) drei VPn falsch erkannt -> 2x unbekannte für bekannte gehalten, 1x nicht richtig erkannt • Stimmerkennung: eigene Mutter erst in VB 5) identifiziert -> Einfluss der 14 bekannten Sprecherinnen mit demselben Akzent (British English, RP)? -> Inwiefern sind diese Ergebnisse relevant für die Forensik?

  5. 2.Stimmidentifikation und „Telefonsprache“ (Schm.-N., Stern,1984) 2.1 Materialien und VPn • 40 Mitarbeiter aus derselben Beschäftigungssparte („organizational branch“) -> davon 24 Hörer (5 nur Hörer; 19 auch Sprecher) und 24 Sprecher (15 Männer, 9 Frauen) • zusätzlich wurden Aufnahmen von 4 Sprechern gemacht, die bereits an einem Experiment teilgenommen hatten, und den Mitarbeitern nicht bekannt waren -> Überprüfung auf Verwendung von Ratestrategien • Sprachmaterial: Pausen und „individuelle Informationen“ entfernt; mind 12 Äußerungen je VB; VB 1): ca. 29,8 s lang, VB 2): ca. 54,1 s lang

  6. 2.Stimmidentifikation und „Telefonsprache“ (Schm.-N., Stern,1984)2.2 Methode und Ablauf • VPn sollten über ein Kommunikationssystem „Schiffe versenken“ („battleship game from the NRL Communicability Test“ aus Schm.-N. u. Everett, 1982) spielen -> zwei VBn: 1) Normaler Kanal, 2) LPC Sprachverarbeitungssystem • vor dem eigentl. Identifikationstest: Beurteilung des „Bekanntheitsgrades“ und der „Unterscheidbarkeit“ • Hörer: wurden unabhängig von den Sprechern getestet; sollten die „Sicherheit“ ihrer Beurteilungen bewerten („guessing“, “fairly sure“, „very sure“)

  7. 2.Stimmidentifikation und „Telefonsprache“ (Schm.-N., Stern,1984)2.3 Ergebnisse und Diskussion • Unterschied zwischen VB 1) (90 %) und VB 2) (70 %) signifikant; Erkennungsrate für VB 2) trotzdem noch sehr hoch • Bei beiden Äußerungsarten nahmen die Anzahl der richtigen Antworten sowie der Punktewert für die geschätzte „Sicherheit“ mit dem Bekanntheitsgrad zu und das Verhältnis blieb konstant • zwei verschiedene Fehlertypen: -> konsistente Fehler: ein Sprecher wurde nahezu immer mit demselben anderen Sprecher verwechselt (bei sehr gut bekannten Namen; höherer Wert für die „Sicherheit“; häufiger bei bekannten Personen) -> inkonsistente Fehler: ein Sprecher wird von mehreren Hörern nicht erkannt (durch Fehler beim Erraten der Namen; bei weniger bekannten Namen; bei Sprechern und Nichtsprechern)

  8. 2.Stimmidentifikation und „Telefonsprache“(Schm.-N., Stern,1984)2.3 Ergebnisse und Diskussion • 4 unbekannte Sprecher: -> die 2 Frauen wurden regelmäßig mit sehr gut bekannten Sprechern verwechselt; die 2 Männer dagegen mit verschiedenen anderen Personen -> 2 Frauen erhielten seltener die Bewertung „do not know“ beim Bekanntheitsgrad • die VPn beurteilten ihre eigene Stimmen sehr unterschiedlich -> in 19 Fällen befand sich die Stimme eines Hörers unter den dargebotenen: bei unveränd. Stimme in 16 (84,2%) Fällen richtig, bei LPC in 13 (68,4%) ABER: insgesamt nur genauso gut wie die Stimmen der Mitarbeiter -> von den insgesamt 576 einzelnen Bewertungen wurde in 27 Fällen ein Spr. als „totally unfamiliar“ eingeschätzt; der Spr. wurde jedoch von den Hörern 44% bei den ungefilterten und zu 30% bei den LPC-Äußerungen korrekt identifiziert

  9. 2.Stimmidentifikation und „Telefonsprache“(Schm.-N.,Stern, 1984)2.3 Ergebnisse und Diskussion • Identifikation und Unterscheidbarkeit: bei einzelnen Spr. und bei den Hörern konnten große Unterschiede bei der Sprecheridentifikation festgestellt werden ungefilterte Äußerungen: zu 47,8% - 100% richtig erkannt LPC-Äußerungen: zu 27,7% - 100% richtig erkannt • alle Spr., die über LPC gut identif. werden konnten, wurden auch bei ungefilterten Äußerungen gut identifiziert; aber einige mit hohen Bewertungen bei den ungef. Äuß. wurden über LPC schlecht erkannt • bei den Sprechern wurde eine höhere Variabilität festgestellt als bei den Hörern • Bekanntheitsgrad und Unterscheidbarkeit korrelierten signifikant (je bekannter eine Stimme, desto unterscheidbarer)-> zusätzlicher Identifikationstest mit unbekannten Hörern

  10. 2.Stimmidentifikation und „Telefonsprache“ (Schm.-N.,Stern,1984)2.4 „Zusammenfassung“ und Ausblick • Ergebnis des zusätzlichen Identifikationstests: die Sprecheridentifikation durch Hörer, denen die Sprecher nicht bekannt waren, sind mit den Identifikationsleistungen bei bekannten Sprechern signifikant korreliert -> einige Stimmen scheinen leichter erkennbar zu sein als andere -> nach psychophysischen Kriterien aufgestellte Stimmeigenschaften haben keinen Einfluss auf die Sprechererkennung • auch linguistische Einflüsse werden berücksichtigt • auch bei bekannten Sprechern können Fehler bei dem Versuch auftreten, sie anhand ihrer Stimme zu identifizieren • Hörer verwenden unterschiedliche Strategien bei der Sprecheridentifikation

  11. 2. Stimmidentifikation und „Telefonsprache“ (Schm.-N.,Stern,1984)2.4 „Zusammenfassung“ und Ausblick Versuche können zeigen, DASS die Sprechererkennung durchSprecherbekanntschaft beeinflusst wird; aber das WIE bleibt dabei ungeklärt -> Sind die Kriterien für die Sprechererkennung nur dem Unterbewusstsein zugänglich? Quellen: Ladefoged, P. und J. Ladefoged (1980). The ability of listeners to identify voices. UCLA Working Papers in Phonetics,49, 43-51 Schmidt-Nielsen, A. und Stern,K. (1985). Identification of known voices as a function of familiarity and narrow-band coding. Journal of the Acoustical Society of America, 77, 658-663.

More Related