Wir sind, wie wir sprechen - wissenschaft.de | Bild der Wissenschaft
BDW PlusGesellschaft & Psychologie
Wir sind, wie wir sprechen
Auf den ersten Blick war es ein ganz normales Speed-Dating-Event. Als die 30 Frauen und Männer das Café betraten, bekamen sie ein Namensschild, ein kleines Heft und einen Platz an einem Tisch zugewiesen. Nach sechs Minuten Kennenlernzeit sollten sie in das Heftchen eintragen: ja (gerne wieder treffen) oder nein…
Sie haben noch 2 von 3 kostenlosen Artikeln übrig1/3
von JAN SCHWENKENBECHER
Auf den ersten Blick war es ein ganz normales Speed-Dating-Event. Als die 30 Frauen und Männer das Café betraten, bekamen sie ein Namensschild, ein kleines Heft und einen Platz an einem Tisch zugewiesen. Nach sechs Minuten Kennenlernzeit sollten sie in das Heftchen eintragen: ja (gerne wieder treffen) oder nein (nicht nochmal treffen). Dann zogen die Herren einen Tisch weiter. Speed-Dating eben. Bei einem Ja von beiden stellten die Event-Organisatoren binnen 24 Stunden den Kontakt her, bei einem oder zwei Neins nicht.
In Wirklichkeit ging es aber um etwas ganz anderes: Alle Teilnehmenden trugen ein Headset, das an ein Audio-Aufnahmegerät angeschlossen war. Die Geräte zeichneten alles auf, was die Speed-Dater sprachen. Ein Team aus Forschenden von Universitäten in Polen, Großbritannien und Deutschland wollte mit den Audio-Aufzeichnungen folgende Frage klären: Nutzen Menschen die Fähigkeit, ihre Stimmhöhe zu verändern, um einem Wunsch-Partner zu gefallen?
Denkbar wäre es, denn die Stimme hat eine Wirkung. Wer zum Beispiel das Radio anschaltet und die Moderatorin sprechen hört, der hat ein Bild der Sprecherin im Kopf, obwohl er sie nicht sieht. Auch wer im Bus jemanden hinter sich reden hört, hat einen bildlichen Eindruck vom Sprecher. Und wenn wir eine Durchsage im Bahnhof, eine Werbung im Supermarkt oder die Bandansage einer Hotline hören, haben wir ebenfalls eine grobe Vorstellung von der sprechenden Person.
Doch wie genau ist diese Vorstellung? Und: Stimmt es denn, was wir zu hören glauben und entsprechend interpretieren? Dabei geht es zunächst einmal um die grundlegende Frage: Wie entsteht die Stimme eigentlich?
Der Klangkörper des Sprechers
Damit beim Sprechen und Plaudern, beim Singen und Lachen, beim Schreien und Flüstern Töne unseren Mund verlassen, sind drei Körperregionen wesentlich: die Lunge, der Kehlkopf sowie der Nasen-, Rachen- und Mundraum. Jeder Ton beginnt damit, dass die Lunge Luft in die Luftröhre drückt, die dann von unten in den Kehlkopf gelangt. In der Mitte des Kehlkopfes bildet die ihn auskleidende Schleimhaut Falten. Die Öffnungen zwischen diesen sogenannten Stimmlippen heißen Stimmritzen. Über die an den Stimmlippen anliegenden Stimmbänder und die Kehlkopfmuskulatur wird gesteuert, wie eng die Stimmlippen geschlossen sind, was wiederum beeinflusst, wie viel Ausatemluft die Lunge durch sie hindurchpresst.
Strömt Luft an den Stimmlippen vorbei, beginnen sie zu schwingen – ein Ton entsteht. Das ist ganz ähnlich, wie wenn man bei einem aufgeblasenen Luftballon die Luft nach und nach durch den auseinandergezogenen Hals quietschend entweichen lässt. Je nachdem, wie stark man den Luftballon-Hals auseinanderzieht, unterscheidet sich die Höhe des Tons. Und je nachdem, in welcher Stellung die Stimmlippen sich gerade befinden, unterscheidet sich der im Hals entstehende Ton. Nasen-, Rachen- und Mundraum fungieren als Resonanzraum und verstärken diesen Grundton. Durch die Bewegungen von Zunge, Mund und Gaumensegel wird er moduliert. So entstehen Laute, mit denen wir Silben, Wörter und Sätze bauen können.
Mehr aus Gesellschaft & Psychologie
Weitere aktuelle Artikel aus der Rubrik Gesellschaft & Psychologie.
All das zeigt, wie sehr die Stimme von den Körpereigenschaften des Sprechers beeinflusst wird. Wie hoch sie ist, hängt etwa von der Länge der Stimmlippen ab: je kürzer die Stimmlippen, desto höher die Stimme. Männer haben einen größeren Kehlkopf und damit auch längere Stimmlippen, die langsamer schwingen und so einen tieferen Grundton produzieren. Im Schnitt liegt dieser bei etwa 120 bis 130 Hertz. Bei Frauen liegt die Frequenz des Grundtons im Bereich von 200 bis 220 Hertz. Auch die Klangfarbe hängt von der Kopf- und Halsform ab – nämlich von der Größe und Form des Rachenraums, der Mund- und Nasenhöhle, von den Zähnen, der Zunge und den Lippen. Aus der Einzigartigkeit des Aussehens eines Menschen folgt also unmittelbar die Einzigartigkeit seiner Stimme.
Körperliche Merkmale erkennen
Dieser Zusammenhang ist die Ursache dafür, dass sich anhand der Stimme ziemlich genaue Rückschlüsse auf den Sprecher ziehen lassen. Welche das sind, weiß Katarzyna Pisanski, Psychologin und Stimmforscherin am Labor für Sprachdynamik des Centre national de la recherche scientifique im französischen Lyon. Denn sie untersucht Ursprünge, Entwicklung, Mechanismen und Funktionen der akustischen Kommunikation.
„Das Merkmal, das wir am besten an der Stimme erkennen können, ist das Geschlecht. Wir schaffen das mit 99-prozentiger Sicherheit“, sagt Pisanski. „Bei der Einschätzung verlassen wir uns auf die Höhe der Stimme, denn nach der Pubertät sind Männerstimmen im Schnitt um 75 Prozent tiefer als Frauenstimmen. Außerdem sind wir sehr gut im Einschätzen des Alters. Man erkennt sehr leicht, ob ein Kind, ein Teenager oder ein Erwachsener spricht“, so Pisanski. „Besonders gut gelingt die Unterscheidung kurz vor und nach der Pubertät. Aber auch sonst kann man anhand der Stimme das Alter auf etwa fünf Jahre genau schätzen.“
Das liegt daran, dass das Alter eines Menschen die Beschaffenheit seines Sprechapparats beeinflusst. Die größte Veränderung geschieht während der Pubertät. Der Kehlkopf und die Stimmbänder wachsen, die Stimme wird tiefer. Bei Jungs geschieht das zwar deutlich stärker, doch auch Mädchen bekommen eine leicht tiefere Stimme. Mit dem Alter verknorpelt die Stimmritze zunehmend, Rücken-, Atem- und Sprechmuskulatur verlieren an Elastizität. Das führt dazu, dass ältere Menschen ihre Stimme weniger genau kontrollieren können, die Stimme wird oft zittrig oder beginnt leicht zu knarzen.
Ein weiteres Merkmal, das sich recht gut anhand der Stimme erkennen lässt, ist die Körpergröße. Fragt man nach, woran jemand die Einschätzung der Körpergröße des Sprechers festgemacht hat, wird das oft auf die Höhe der Stimme zurückgeführt. Nur: zwischen Stimmhöhe und Körpergröße gibt es gar keinen Zusammenhang. Wohl aber hängt die Größe mit einem anderen Merkmal zusammen: den Formanten. Das sind Frequenzbereiche, in denen die Stimme durch die Resonanzräume in Rachen, Nase und Mund besonders gut verstärkt wird. Sie führen zur einzigartigen Klangfarbe einer Stimme, auch Timbre genannt. „Größere Menschen haben längere Vokaltrakte, sie haben deswegen tiefere Formanten, ein tieferes Timbre“, erklärt Pisanski. „Und das erkennen wir, auch wenn wir es nicht genau benennen können.“
Ein weiteres physisches Merkmal ist die Kraft. „Menschen können an der Stimme erkennen, ob jemand stark oder schwach ist“, sagt der Stimmforscher Greg Bryant. Der Kognitionspsychologe ist Professor in der Abteilung Kommunikation an der University of California. Bei der Körperkraft gilt ähnliches wie bei der Körpergröße: Viele Menschen führen ihre Einschätzung irrtümlich auf die Stimmhöhe zurück. Doch die korreliert gar nicht mit der Körperkraft. Allerdings wissen die Forscher hier nicht, worauf das Urteil beruht. „Es ist nicht die Höhe der Stimme, aber irgendeinen Zusammenhang muss es geben“, sagt Bryant. „Wir denken, es ist die Lautstärke. In unseren Studien waren diejenigen, die am lautesten rufen können, auch die stärksten.“ Um das mit Sicherheit sagen zu können, sind aber noch weitere Studien nötig. So untersucht Bryant gerade, ob Menschen an der Stimme erkennen können, wie laut jemand brüllen kann, ohne dass er gerade brüllt.
Greg Bryant sieht auf jeden Fall einen Zusammenhang zwischen Körperform und Stimme: „Die Stimme ist zum großen Teil eine Konsequenz des Aussehens, sie hängt mit der Kopf- und Gesichtsform zusammen. Menschen klingen, wie sie aussehen.“
Emotionen in der Stimme
Sie klingen aber auch, wie sie sich gerade fühlen. „Die Basisemotionen können wir in den Stimmen Fremder sehr gut erkennen“, sagt Bryant. „Da gibt es grundlegende Merkmale, die den Emotionen Freude, Angst, Trauer, Überraschung, Wut und Ekel Ausdruck verleihen. Und diese Merkmale sind überall auf der Welt gleich“, so Bryant.
Manche Forscher gehen noch einige Schritte weiter, Alan Cowen zum Beispiel. Er forschte zunächst an der University of California in Berkeley und bei Google zu Emotionen und leitet heute seine eigene Forschungsfirma „Hume AI“. Wie schon der Firmenname nahelegt, setzt Cowen auf Künstliche Intelligenz. Mit ihrer Hilfe kreiert er „Landkarten“ der Emotionen. Eine davon zeigt die in Lauten widergespiegelten Emotionen. Oben links findet sich dort der Begriff „Vergnügen“, daneben stehen einige kleine Buchstaben, die eine bestimmte Lautäußerung kodieren – und die hört man, wenn man mit der Computermaus darüber fährt. Je weiter man sich vom „Vergnügen“ entfernt, desto näher kommt man der „Verlegenheit“, etwas weiter warten die passenden Töne zu „Triumph“ und „Euphorie“. An anderen Stellen stehen weitere gemischte Emotionen – also solche, die sich aus verschiedenen Basisemotionen zusammensetzen – zum Beispiel „Verlangen“, „Verzweiflung“ oder „Schmerz“. Und auch Basisemotionen wie „Angst“, „Trauer“ oder „Ekel“ finden sich auf der Karte.
Cowens Ansatz geht davon aus, dass es über die Basisemotionen hinaus unzählige weitere Emotionen gibt, die sich über verschiedene Kanäle äußern, etwa die Stimme. Und dass man sie erkennen kann, wenn man sie vorher nur genug differenziert beschrieben hat und weiß, auf welche Unterschiede man achten muss. Algorithmen sollen dabei helfen, diese Unterschiede zu erkennen. Denn sie sind oft zu fein, um sie mit Ohr oder Auge zu bemerken.
Doch hier widerspricht Greg Bryant: „Ich bin ein wenig skeptisch gegenüber diesem Ansatz. Ich glaube, es kann nicht funktionieren, all die verschiedenen emotionalen Mischzustände, die ein Mensch erleben kann, mit Sprache auszudrücken. Dafür reichen unsere Worte einfach nicht aus.“ Bryant bezweifelt also, dass die Lautgeber der Landkarte ihre Emotionen so differenziert beschreiben können, wie sie sie selbst erleben. Somit könne die Karte auch nicht abbilden, wie komplex das menschliche Erleben tatsächlich ist. Auf Maschinen zu setzen, deren Algorithmen die Laute klassifizieren, in ein Verhältnis setzen und entsprechend auf einer Karte anordnen, bringe ein weiteres Problem mit sich: Sie erkennen womöglich feinste Differenzen in der Stimme, die ein Mensch selbst gar nicht wahrnehmen kann – und die damit für die zwischenmenschliche Kommunikation keine Rolle spielen. Und dann müsse man sich fragen, welchen Sinn das ganze Unterfangen habe. Bryant sagt: „Es muss immer darum gehen, was Menschen wahrnehmen können – und nicht nur darum, was Algorithmen oder Spektrografen messen können.“
Ausdruck der Persönlichkeit
Psychologen bezeichnen Emotionen auch als „States“, übersetzbar etwa als Zustände. Neben den kurzfristigen States gibt es die langfristigen Traits. Das sind Eigenschaften, die uns kennzeichnen, etwa unsere Persönlichkeit. Und es stellt sich die Frage: Stecken auch die Traits in unserer Stimme?
Das hat die Psychologin Julia Stern von der Universität Bremen untersucht. Im Sommer 2021 veröffentlichte sie mit Kollegen Studienergebnisse, die auf Daten von über 2000 Versuchsteilnehmern basieren. Sie belegen: je tiefer die Stimme, desto extravertierter der Sprecher. Schon ältere Studien hatten gezeigt, dass Menschen die Extraversion eines anderen anhand der Stimme einschätzen können. Auch, wie emotional stabil jemand ist, lässt sich erhören. Für die anderen drei Dimensionen des Persönlichkeitskonzepts der sogenannten Big Five – Offenheit, Gewissenhaftigkeit und Verträglichkeit – gelingt das nicht. Aber es gibt noch ein paar andere Eigenschaften, die mit der Stimmhöhe zusammenhängen. Eine davon ist die Dominanz: Hier gilt wie bei der Extraversion, dass der Sprecher dominanter ist, je tiefer seine Stimme klingt.
Etwas komplizierter wird es bei der Glaubwürdigkeit, denn hier erbrachten die Studien gemischte Ergebnisse. Frühere Arbeiten zeigten, dass Zuhörer eine höhere Stimme als glaubwürdiger wahrnehmen. Jüngere Studien hingegen weisen eher auf das Gegenteil hin. Wie sich das unter einen Hut bringen lässt? „Ich glaube, es hängt vom jeweiligen Kontext ab, denn da waren die Studien nicht wirklich vergleichbar“, sagt Katarzyna Pisanski. „Je nachdem, was Menschen über diejenigen, die sie hören, zu wissen glauben, passen sie ihr Urteil an.“ Der Maßstab für Glaubwürdigkeit, den wir zum Beispiel bei einem Politiker anlegen, sei ein anderer als der bei Freunden und der Familie. „Politiker lenken ein Land, Freunde und Familie helfen und unterstützen uns im Alltag – das sind zwei verschiedene Dinge“, so Pisanski. „Es macht Sinn, dass bei einem Politiker eine tiefe Stimme mit Glaubwürdigkeit in Zusammenhang gebracht wird, denn eine tiefe Stimme assoziieren wir mit Kompetenz, Intelligenz und Führungskraft. Wir vertrauen diesem Menschen also als Führungspersönlichkeit – aber nicht unbedingt in dem Sinne, in dem wir einem Freund Vertrauen schenken.“
Höhe bestimmt Attraktivität
Und es gibt noch eine weitere Eigenschaft, deren Zusammenhang mit der Stimme gut untersucht ist: die Attraktivität. „Frauen finden tiefe Männerstimmen attraktiver“, sagt Pisanski, die an der eingangs erwähnten Speed-Dating-Studie beteiligt war. „Und lange Zeit beobachteten Stimmforscher, dass Männer höhere Frauenstimmen attraktiver finden.“ Sie interpretierten, dass die hohe Stimme für Jugend und Fruchtbarkeit steht. Tatsächlich wird die weibliche Stimme mit der Menopause tiefer. Die Forscher schlossen: Je höher die Stimme, desto größer die Wahrscheinlichkeit, dass die Frau noch Kinder gebären kann – was gemäß einem evolutionären Erklärungsansatz das Hauptziel des Mannes ist.
„In der Speed-Dating-Studie haben wir allerdings beobachtet, dass Männer tiefere Frauenstimmen attraktiver finden“, sagt Pisanski. Sie ist nicht die einzige Stimmforscherin, die in ihren Studien festgestellt hat, dass sich der Zusammenhang zwischen der Attraktivität einer Frauenstimme und ihrer Höhe umzukehren scheint. Immer mehr Untersuchungen erbrachten ähnliche Ergebnisse. „Das könnte daran liegen, dass sich die Einschätzung der Männer geändert hat“, sagt Pisanski. „Mehr und mehr Männer finden reifere, selbstsichere, kompetente und unabhängige Frauen attraktiver, was sie wiederum mit einer tieferen Stimme assoziieren.“
Ob das wirklich stimmt, müssen die Stimmforscher noch weiter untersuchen. Die Speed-Dating-Studie lieferte darauf einen Hinweis: Saßen die Teilnehmer – Männer wie Frauen – jemandem gegenüber, den sie attraktiv fanden und dem sie gefallen wollten, sprachen sie tiefer.
BDW PlusGesellschaft & Psychologie
Dopamin – ein Porträt
8. Juni 2026
Rund um den Botenstoff Dopamin gibt es einige Mythen und Missverständnisse. Er ist viel mehr als ein „Glückshormon“. Er ist der Lehrmeister…
Gesellschaft & Psychologie
Auch unser Gehirn arbeitet mit Wort-Vorhersagen
8. Juni 2026
Biologische Vorhersagemaschine: Unser Gehirn arbeitet beim Verstehen von Sprache ähnlich wie die künstliche Intelligenz – es nutzt…