Die Facebook-Sprachstudie sagt Alter, Geschlecht und Persönlichkeitsmerkmale voraus

Posted on
Autor: Randy Alexander
Erstelldatum: 23 April 2021
Aktualisierungsdatum: 1 Juli 2024
Anonim
Die Facebook-Sprachstudie sagt Alter, Geschlecht und Persönlichkeitsmerkmale voraus - Platz
Die Facebook-Sprachstudie sagt Alter, Geschlecht und Persönlichkeitsmerkmale voraus - Platz

Die Forscher analysierten die Sprachmuster der Benutzer, um das Alter, das Geschlecht und die Antworten der Personen auf Persönlichkeitsfragebögen vorherzusagen.


Im Zeitalter der sozialen Medien wird das Innenleben der Menschen zunehmend durch die Sprache erfasst, die sie online verwenden. Vor diesem Hintergrund ist eine interdisziplinäre Gruppe von Forschern der University of Pennsylvania daran interessiert, ob eine rechnergestützte Analyse dieser Sprache so viel oder mehr Einblick in ihre Persönlichkeit liefern kann als traditionelle Methoden, die von Psychologen verwendet werden, wie selbst berichtete Umfragen und Fragebögen .

In einer kürzlich in der Fachzeitschrift PLOS ONE veröffentlichten Studie haben 75.000 Personen freiwillig einen Fragebogen zur gemeinsamen Persönlichkeit durch einen Antrag ausgefüllt und ihre Statusaktualisierungen für Forschungszwecke zur Verfügung gestellt. Anschließend suchten die Forscher nach allgemeinen Sprachmustern in der Sprache der Freiwilligen.


Wortwolken, die die Sprache vergleichen, die Extravertierte (oben) und Introvertierte (unten) in ihren Status s verwendet haben.

Ihre Analyse ermöglichte es ihnen, Computermodelle zu generieren, die das Alter, das Geschlecht und die Antworten der Personen auf die von ihnen gestellten Persönlichkeitsfragebögen vorhersagen konnten. Diese Vorhersagemodelle waren überraschend genau. Zum Beispiel stimmten die Forscher zu 92 Prozent, wenn sie das Geschlecht der Benutzer nur anhand der Sprache ihrer Statusaktualisierungen vorhersagten.

Der Erfolg dieses „offenen“ Ansatzes legt neue Wege nahe, um Zusammenhänge zwischen Persönlichkeitsmerkmalen und Verhaltensweisen zu untersuchen und die Wirksamkeit psychologischer Interventionen zu messen.

Die Studie ist Teil des World Well-being Project, eines interdisziplinären Projekts mit Mitgliedern der Abteilung für Computer- und Informationswissenschaft an der Penn's School of Engineering und Applied Science sowie der Abteilung für Psychologie und des Zentrums für Positive Psychologie an der School of Arts and Sciences.


Es wurde von H. Andrew Schwartz, einem Postdoktoranden in Computer- und Informationswissenschaften und im Zentrum für Positive Psychologie, geleitet und umfasste den Doktoranden Johannes Eichstaedt, die Postdoktorandin Margaret Kern und den Direktor Martin Seligman, alle vom Zentrum für Positive Psychologie, sowie einen Professor Lyle Ungar von der Computer- und Informationswissenschaft.

Wortwolken, die die Sprache vergleichen, die jüngere (oben) und ältere (unten) Personen in ihren Status s verwendeten.

Das Penn-Team arbeitete mit Michal Kosinski und David Stillwell vom Psychometrics Center der University of Cambridge zusammen, die die Daten ursprünglich von Benutzern gesammelt hatten.

Die Studie der Forscher stützt sich auf eine lange Geschichte des Studierens der Wörter, mit denen die Menschen ihre Gefühle und mentalen Zustände verstehen. Bei der Analyse der Daten im Kern ging es jedoch eher um „offene“ als um „geschlossene“ Ansätze.

"In einem geschlossenen Vokabular", sagte Kern, "könnten Psychologen eine Liste von Wörtern auswählen, die ihrer Meinung nach positive Emotionen signalisieren, wie" zufrieden "," enthusiastisch "oder" wunderbar ", und dann die Häufigkeit des Gebrauchs einer Person untersuchen." Mit diesen Worten lässt sich messen, wie glücklich diese Person ist. Ansätze mit geschlossenem Wortschatz haben jedoch mehrere Einschränkungen, einschließlich der Tatsache, dass sie nicht immer das messen, was sie zu messen beabsichtigen. “

"Zum Beispiel", sagte Ungar, "könnte man feststellen, dass der Energiesektor mehr negative Emotionswörter verwendet, einfach weil sie das Wort" roh "mehr verwenden." Dies weist jedoch auf die Notwendigkeit hin, Ausdrücke mit mehreren Wörtern zu verwenden, um die beabsichtigte Bedeutung zu verstehen. "Rohöl" ist anders als "Rohöl" und ebenso ist es anders, "krank" zu sein, als nur "krank" zu sein. "

Eine weitere inhärente Einschränkung des Konzepts des geschlossenen Vokabulars besteht darin, dass es sich auf eine vorgefasste, feste Menge von Wörtern stützt. Eine solche Studie könnte bestätigen, dass depressive Menschen zwar häufiger erwartete Wörter (wie „traurig“) verwenden, aber keine neuen Erkenntnisse generieren können (dass sie weniger über sportliche oder soziale Aktivitäten sprechen als beispielsweise glückliche Menschen).

Frühere psychologische Sprachstudien haben sich notwendigerweise auf geschlossene Vokabularansätze gestützt, da ihre kleinen Stichprobengrößen offene Ansätze unpraktisch machten. Das Auftauchen massiver Sprachdatensätze, die durch soziale Medien bereitgestellt werden, ermöglicht nun qualitativ unterschiedliche Analysen.

"Die meisten Wörter kommen selten vor - jede Schriftprobe, einschließlich Statusaktualisierungen, enthält nur einen kleinen Teil des durchschnittlichen Wortschatzes", sagte Schwartz. „Das bedeutet, dass Sie, abgesehen von den gebräuchlichsten Wörtern, Proben von vielen Menschen schreiben müssen, um Verbindungen zu psychologischen Merkmalen herzustellen. Traditionelle Studien haben interessante Zusammenhänge mit vorgewählten Wortkategorien wie „positive Emotionen“ oder „Funktionswörter“ festgestellt. Die Milliarden von Wortinstanzen, die in den sozialen Medien verfügbar sind, ermöglichen es uns jedoch, Muster auf einer viel umfassenderen Ebene zu finden. “

Im Gegensatz dazu leitet der Open-Vocabulary-Ansatz wichtige Wörter und Ausdrücke aus der Stichprobe selbst ab. Mit mehr als 700 Millionen Wörtern, Phrasen und Themen, die aus der Stichprobe der Statusinformationen dieser Studie herausgearbeitet wurden, gab es genug Daten, um die Hunderte von gebräuchlichen Wörtern und Phrasen zu überwinden und eine offene Sprache zu finden, die aussagekräftiger mit bestimmten Merkmalen korreliert.

Diese große Datenmenge war entscheidend für die vom Team verwendete spezifische Technik, die so genannte Differential Language Analysis (DLA). Die Forscher verwendeten DLA, um die Wörter und Ausdrücke zu isolieren, die sich um die verschiedenen Merkmale gruppierten, die in den Fragebögen der Freiwilligen selbst angegeben wurden: Alter, Geschlecht und Punktzahl für die „Big Five“ -Persönlichkeitsmerkmale, die Extraversion, Akzeptanz, Gewissenhaftigkeit, Neurotismus und Offenheit sind . Das Big Five-Modell wurde ausgewählt, da es eine gängige und gut untersuchte Methode zur Quantifizierung von Persönlichkeitsmerkmalen ist. Die Methode der Forscher könnte jedoch auch auf Modelle angewendet werden, die andere Merkmale messen, einschließlich Depression oder Glück.

Um ihre Ergebnisse zu visualisieren, erstellten die Forscher Wortwolken, die die Sprache zusammenfassten, die ein bestimmtes Merkmal statistisch vorhersagte, wobei die Korrelationsstärke eines Wortes in einem bestimmten Cluster durch seine Größe dargestellt wurde. Beispielsweise enthält eine Wortwolke, die die von Extravertierten verwendete Sprache anzeigt, Wörter und Ausdrücke wie "Party", "Gute Nacht" und "Schlag mich an", während eine Wortwolke für Introvertierte viele Verweise auf japanische Medien und Emoticons enthält.

„Es mag naheliegend erscheinen, dass ein extrem extravertierter Mensch viel über Partys spricht“, sagte Eichstaedt. „Insgesamt bieten diese Wortwolken jedoch ein beispielloses Fenster in die psychologische Welt von Menschen mit einem bestimmten Merkmal. Viele Dinge scheinen nachträglich offensichtlich und jeder Punkt macht Sinn, aber hättest du an alle gedacht, oder sogar an die meisten? “

 »Wenn ich mich frage«, sagte Seligman,  »wie ist es, extrovertiert zu sein? «  »wie ist es, ein junges Mädchen zu sein? «  »wie ist es, schizophren oder neurotisch zu sein? « oder  »wie ist es, zu sein 70 Jahre alt? 'Diese Wortwolken kommen dem Kern der Sache viel näher als alle Fragebögen, die es gibt.'

Um zu testen, wie genau sie die Merkmale der Menschen durch ihren offenen Vokabularansatz erfassen, teilten die Forscher die Freiwilligen in zwei Gruppen auf und untersuchten, ob ein statistisches Modell, das von einer Gruppe abgeleitet wurde, verwendet werden könnte, um die Merkmale der anderen abzuleiten. Für drei Viertel der Freiwilligen verwendeten die Forscher maschinelle Lerntechniken, um ein Modell der Wörter und Ausdrücke zu erstellen, die die Antworten auf den Fragebogen vorhersagen. Sie verwendeten dieses Modell dann, um das Alter, das Geschlecht und die Persönlichkeiten für das verbleibende Quartal basierend auf ihren Beiträgen vorherzusagen.

"Das Modell war zu 92 Prozent genau darin, das Geschlecht eines Freiwilligen anhand seines Sprachgebrauchs vorherzusagen", sagte Schwartz, "und wir konnten das Alter einer Person innerhalb von drei Jahren mehr als die Hälfte der Zeit vorhersagen. "Unsere Persönlichkeitsprognosen sind von Natur aus ungenauer, aber fast so gut wie die Verwendung der Fragebogenergebnisse einer Person von einem Tag, um ihre Antworten auf den gleichen Fragebogen an einem anderen Tag vorherzusagen."

Mit dem Ansatz des offenen Wortschatzes, der sich als gleichwertiger oder prädiktiver als geschlossene Ansätze erwiesen hat, verwendeten die Forscher die Wortwolken, um neue Erkenntnisse über die Beziehungen zwischen Wörtern und Merkmalen zu gewinnen. Beispielsweise verwendeten Teilnehmer, die auf der neurotischen Skala schlecht abschnitten (d. H. Diejenigen mit der größten emotionalen Stabilität), eine größere Anzahl von Wörtern, die sich auf aktive soziale Aktivitäten bezogen, wie z. B. „Snowboarden“, „Treffen“ oder „Basketball“.

"Dies garantiert nicht, dass Sie beim Sport weniger neurotisch werden. Es könnte sein, dass Neurotizismus die Menschen dazu veranlasst, Sport zu meiden “, sagte Ungar. "Aber es legt nahe, dass wir die Möglichkeit untersuchen sollten, dass neurotische Individuen emotional stabiler werden, wenn sie mehr Sport treiben."

Durch den Aufbau eines Vorhersagemodells der Persönlichkeit auf der Grundlage der Sprache der sozialen Medien können Forscher solche Fragen jetzt einfacher angehen. Anstatt Millionen von Menschen zum Ausfüllen von Umfragen aufzufordern, können zukünftige Studien durchgeführt werden, indem Freiwillige ihre oder Feeds für anonymisierte Studien einreichen.

"Forscher haben diese Persönlichkeitsmerkmale seit vielen Jahrzehnten theoretisch untersucht", sagte Eichstaedt, "aber jetzt haben sie ein einfaches Fenster, wie sie das moderne Leben im Zeitalter gestalten."

Unterstützung für diese Forschung leistete das Pioneer Portfolio der Robert Wood Johnson Foundation.

Die Forschungsprogrammierer Lukasz Dziurzynski und die wissenschaftliche Mitarbeiterin Stephanie M. Ramones, beide Psychologen, sowie die Doktoranden Megha Agrawal und Achal Shah, beide Computer- und Informationswissenschaftler, haben ebenfalls zu dieser Studie beigetragen.

Über die University of Pennsylvania