Sprache und Stimme schaffen Identität. Mit Wörtern verständigen wir uns. Allerdings geht es bei diesem Thema um viel mehr als nur um die einzelnen Wörter oder Sätze. Mit der Art, wie wir sprechen, wie unsere Stimme klingt und wie wohl wir uns dabei fühlen, vermitteln wir paralinguistisch – also abseits des Gesagten – noch zahlreiche weitere Dinge: unser Selbstbewusstsein, unsere Gefühle, unser Charisma etwa. Wir können mit unserer Stimme Räume füllen, oder sie auch verlieren, weil wir viel zu angestrengt sprechen mussten, um überhaupt gehört zu werden. Frauen und Männer haben dabei aus biologischen Gründen ganz unterschiedliche Voraussetzungen und Herausforderungen. Barbara Schuppler und Martin Hagmüller vom Institut für Signalverarbeitung und Sprachkommunikation der TU Graz beschäftigen sich mit Stimme, Sprache und Verständigung – auf unterschiedlichen Ebenen. Während Barbara Schuppler vor allem daran forscht, was Sprechen und Dialoge ausmacht, versucht Martin Hagmüller Menschen die eine Kehlkopf-Beeinträchtigung haben, eine möglichst persönliche Stimme zurück zu geben.
Künstlich natürliche Dialoge
Barbara Schuppler untersucht unter anderem Dialoge zwischen Menschen, um aus dem daraus gelernten dann Gespräche mit sozialen Robotern natürlicher machen zu können. Dabei ist es wichtig, dass das System einerseits die menschliche Sprache versteht und dass es andererseits auf natürliche Weise antworten kann. „Diese Modelle sind in erster Linie mit Standardsprache trainiert. Und dort vor allem mit englischen Beispielen“, sagt Schuppler. „Für das Verständnis ist nicht das Geschlecht und damit die Stimmhöhe der sprechenden Person ausschlaggebend, sondern Faktoren wie Sprechgeschwindigkeit, Versprecher und Dialekte.“ Sie hat mit ihrem Team in den vergangenen Jahren eine der größten Datenbanken für Spontansprache aufgebaut und dort Menschen in unterschiedlichen Geschlechtskombinationen in spontanen Gesprächen ohne Drehbuch aufgenommen. Basierend auf diese Daten konnte sie die Fehlerrate von Spracherkennungssystemen bei gesprochenen Dialekten maßgeblich verringern. Barbara Schuppler untersucht außerdem, wie sich Frauen und Männer in Gesprächen unterschiedlich verhalten: „Menschen verhalten sich in Gesprächen je nach ihrem Gegenüber anders, und wir passen uns unseren Gesprächspartner*innen manchmal stärker an und manchmal schwächer.“, erzählt sie. „Wir haben dabei unterschiedliche Dinge herausgefunden: Zum Beispiel wurde in den aufgenommenen Daten in den Gesprächen zwischen zwei Frauen signifikant weniger gleichzeitig gesprochen als in denen zwischen zwei Männern und denen zwischen Männern und Frauen. In den Gesprächen zwischen Frauen und Männern wurde signifikant mehr gelacht als in gleichgeschlechtlichen Gesprächen.“
Wenn ein Chatbot zum Üben von Bewerbungsgesprächen zum Einsatz kommt zum Beispiel, wäre es für die Systeme der Zukunft wichtig, dass möglichst reale Dialoge entstehen. Dann müssen diese Systeme Dialoge dementsprechend strukturieren können und müssen erkennen, welchem Thema wie viel Zeit eingeräumt werden sollte bzw. wie Wortwechsel ablaufen sollten. „Wir brauchen da auf jeden Fall noch mehr Forschung, um solche Systeme besser an das soziale Geschlecht der Person, mit der sie sprechen, anpassen zu können und die Dialoge für alle angenehm zu machen.“
Eine persönliche Stimme, die zur eigenen Identität passt
„Kehlkopferkrankungen betreffen wesentlich weniger Frauen als Männer – aber die Auswirkungen für Frauen sind meistens schlimmer“, erklärt Martin Hagmüller. Personen, die nach einer Erkrankung keinen Kehlkopf mehr haben, haben nur eingeschränkte Möglichkeiten, um noch sprechen zu können. All diese Möglichkeiten haben gemein, dass die erzeugte Stimme selten natürlich klingt. Und auf jeden Fall nicht weiblich. „Es gibt zum Beispiel einen Elektrolarynx, der sehr gut funktioniert. Aber er ist, weil diese Problematik eben vor allem Männer betrifft, für tiefe Frequenzen ausgelegt und klingt darüber hinaus sehr robotisch. Für Frauen ist das, so haben wir das in unseren Projekten beobachtet, besonders schlimm, weil diese neue Stimme gar nicht zu ihrer körperlichen Identität passt.“ Das Problem: Weil wenige Frauen betroffen sind, gibt es auch wenig Forschung und Entwicklung zu Systemen für weibliche Stimmen. Das möchten Hagmüller und sein Team nun ändern - mit einem neuen System, das weibliche und männliche Stimmen natürlicher machen könnte. „Wir möchten Aufnahmen der eigenen Stimme nutzen, um sie realitätsgetreu zu reproduzieren.“ In Zeiten von Social Media und Audionachrichten am Telefon gibt es sehr oft Aufnahmen, die die Forschenden dafür heranziehen möchten. „Wir wollen eine direkte Stimmumwandlung ohne große Latenz erreichen. Und genau das ist die große Herausforderung. Das Projekt startet gerade und wir sind gespannt, was wir erreichen werden können.“
Neben der direkten Stimmumwandlung gibt es aber noch ein weiteres Ziel: Im Projekt soll es möglich werden, die Stimmfarbe vorherzusagen, die nach einer bevorstehenden Operation oder anderen Behandlung erreicht werden kann. Das könnte die Entscheidung für oder gegen eine bestimmte Vorgehensweise erleichtern.
Weibliche und männliche Stimmen im Raum
Dass Stimme uns Identität und Ausstrahlung verleiht, zeigt sich insbesondere dann, wenn die akustischen Voraussetzungen mangelhaft sind, erklären die Forschenden. „Jeder Klang besteht aus einer Grundfrequenz und einem Vielfachen dieser Frequenz. Wenn meine Grundfrequenz tief bei 100 Hertz liegt, dann habe ich auch bei 200, 300 und 400 Hertz Komponenten meiner Stimme. Liegt meine Grundfrequenz aber höher - bei 200 oder 300 Hertz, dann habe ich erst wieder bei 300, 600 und 900 Hertz Komponenten“, erklärt es Martin Hagmüller technisch. Was das bedeutet: Höhere Stimmen - typischerweise weibliche Stimmen - transportieren weniger Energie im Raum und es braucht wesentlich mehr Kraft und Anstrengung, einen ganzen Raum akustisch zu füllen. Die Folge: Die Sprecherin klingt angestrengt und wird leichter heiser. Das wiederrum beeinflusst die Wirkung, das Charisma und die Selbstsicherheit, die die sprechende Person verbreitet. Das bedeutet auch, dass akustisch schlecht geplante Räume oder fehlende Mikrofone – was die Stimmlippengesundheit angeht—mehr die Frauen schadet. Ein Problem, das einfach gelöst werden kann. Martin Hagmüller: „Eine bessere Akustik oder Mikrofone auch in kleinen Räumen helfen ganz grundsätzlich beiden Geschlechtern beim Sprechen – es wird in jedem Fall wesentlich weniger anstrengend und ein besseres Hörerlebnis für das Publikum.“