Nejoblíbenější slova používaná na sociálních médiích

Přemýšleli jste někdy o jazyce používaném v sociálních médiích? Nebo woexrds, které používáme, jsou založeny na našich osobnostních rysech? Pokud je vaše odpověď ano, máte štěstí.



Pozadí

The Centrum pozitivní psychologie se sídlem na University of Pennsylvania vytvořil to, co je známé jako Světový blahobyt (WWBP). Tento úžasný projekt kuje vědecké techniky měřením psychické pohody a fyzického zdraví na základě analýzy jazyka v sociálních médiích. Nejjasnější počítačoví vědci, psychologové a statistici dávají dohromady psychosociální procesy, které ovlivňují zdraví a štěstí, a zkoumají možnosti nahrazení drahých metod průzkumu. V roce 2013 publikovala WWBP a studie s názvem Osobnost, pohlaví a věk v jazyce sociálních médií: přístup otevřeného slovníku. V jedné z dosud největších studií analyzovala WWBP přes 700 milionů slov, frází a tématických instancí shromážděných ze zpráv 75 000 dobrovolníků z Facebooku. K analýze zpráv použili dvě různé metody k nalezení demografických a psychologických atributů:

  • Diferenciální jazyková analýza (DLA): metoda navržená WWBP k identifikaci nejvýznamnějších jazykových funkcí od daného atributu.
  • Jazykový dotaz a počet slov (LIWC): populární nástroj používaný v psychologii k hledání způsobů, jakými lidé používají slova ve svém každodenním životě. To může poskytnout bohaté informace o jejich přesvědčeních, obavách, vzorcích myšlení, sociálních vztazích a osobnostech.

V této konkrétní studii WWBP také nechala dobrovolníky absolvovat standardní testy osobnosti (Big 5 Factor Model) k určení slov použitých v určitých osobnostních rysech. Zkombinujte je a dokázali propojit jazyk sociálních médií osobnosti, pohlaví a věku s přesností 91,9%. Pojďme si zašpinit ruce a podívejme se, jak shromáždili aktualizace stavu Facebooku a formulovali své vizualizační tabulky.



Data

Kompletní datová sada se skládala z přibližně 19 milionů aktualizací stavu Facebooku napsaných všemi účastníky. Tým WWBP omezil svou analýzu na ty uživatele Facebooku, kteří splňují 4 určitá kritéria:

  • Musí označovat angličtinu jako primární jazyk
  • Ve svých aktualizacích stavu napsali alespoň 1 000 slov
  • Být mladší 65 let
  • Uveďte pohlaví (muž a žena) a věk

Jazyk pohlaví:

jazyk sociálních médií

Funkce ženského jazyka jsou zobrazeny nahoře a funkce jazyka mužského jazyka níže. S ize slova označuje sílu korelace; the Barva udává relativní četnost použití. Podtržítka (_) spojuje slova víceslovných frází.



  • Samice z této studie (Nahoru), použilo více emočních slov (např. vzrušených) a singulárů první osoby a zmiňuje více psychologických a sociálních procesů (např. „miluji tě“ a „miluji tě“<3’ –a heart).
  • Ills používal více nadávek a odkazů na objekty (např. „xbox“, „černé operace“, „přeje si“).

Jazyk věku:

jazyk sociálních médií

Jak vidíte na obrázku 3 výše, dochází k jemným změnám témat postupujících od jedné věkové skupiny k další. Existují také jasné rozdíly ve slovech, jako je použití slangu, emotikony a internet Věková skupina 13 až 18 let . V Věková skupina 23 až 29 let , můžete vidět pár Internet mluví nebo pracovní témata (např. „v práci“, „nové zaměstnání“). Vidíme škola související téma pro 13 až 18 let (např. „škola“, „domácí úkol“, „uf“), zatímco vidíme a vysoká škola související téma pro 19 až 22 let (např. „semestr“, „vysoká škola“, „registrace“). Jak postupujete k Věková skupina 30 až 65 let „používaná slova se více zaměřují na emoční stabilitu s rodinou a přáteli (např.„ dcera “,„ můj syn “,„ moje děti “a„ moji přátelé fb “). Při pohledu na hlavní témata napříč všemi věkovými skupinami obecně uvidíte postup školy, vysoké školy, práce a rodiny.





Standardní frekvence témat a slov podle věku: jazyk sociálních médií

v Obr. 4A , graf ukazuje relativní frekvenci nejselektivnějších témat pro každou věkovou skupinu jako funkci věku. Obr. 4B posiluje tuto hypotézu předložením podobného vzorce založeného na jiných sociálních tématech. Obr. 4C ukazuje, že používání „my“ se zvyšuje po 22 letech, zatímco „I“ klesá. To rozhodně naznačuje rostoucí význam přátelství a vztahů s věkem lidí.



Jazyk osobnosti:

Vědci se zabývali tím, jak se náš jazyk a osobnost shodují. Analyzovali slova použitá účastníky a uspořádali je na základě osobnosti každého účastníka. Zde je rychlé obnovení 5 faktorů osobnosti:

  • Extroverze: popisuje, jak komunikujete s lidmi.
  • Neurotismus: je to, jak se vypořádáváte s emocemi
  • Souhlas: je to, jak se cítíte k ostatním
  • Svědomitost: popisuje, jak jste organizovaní a spolehliví
  • Otevřenost: je, když je někdo zvědavý a otevřený novým zkušenostem a znalostem
jazyk sociálních médií jazyk sociálních médií

Vlevo nahoře vidíme, že se to sociálně příbuzným kategoriím líbí večírek témata se objevují jako klíčový rozlišovací znak pro Extroverti . Výsledky to navíc naznačují Introverti zajímají se o japonská média (např. anime, manga, internet a emotikony v japonském stylu: ˆ_ˆ). Vlevo dole na obrázku 5 výše je vidět, že lidé Vysoký v neurotismu běžně zmiňované fráze jako „nevolnost“, „deprese“ a „nenávidím“. Vpravo dole je zobrazen jazyk související s emoční stabilitou ( Nízký neurotismus ). Nízko neurotický jednotlivci psali o příjemných sociálních aktivitách, které posilují harmonii nebo vytvářejí větší emoční rovnováhu, jako například „sport“, „dovolená“, „pláž“, „kostel“, „tým“ a rodinný čas téma. Na obrázku 6 níže (vpravo dole) lidé, kteří zobrazují Nízká otevřenost při aktualizaci stavu používejte zkrácená slova (např. „2 dny“, „ur“, „každé 1“). Lidé, kteří jsou High Open (vlevo dole) použijte kreativní slova (např. „umění“, „vesmír“, „hudba“, „psaní“ a „duše“). Možná s tím nebudete rezonovat, ale Nízká svědomitost lidé (uprostřed vlevo) přitom ve svých aktualizacích používají velmi explicitní slova Vysoká svědomitost lidé (vlevo nahoře) používají fráze (např. „do práce“, „připraveno na“ a „skvělý den“). Jak vidíte, platformy sociálních médií, jako je Facebook a Twitter, jsou velmi příznivými zdroji pro studium lidí; aktualizace stavu a tweety jsou expresivní, osobní a mají emotivní obsah. Pamatujte na několik věcí:





  • Tento jazyk je obecně nezaujatý a jde o měřitelná data o chování
  • Jazyk Facebooku konkrétně umožňuje vědcům sledovat jednotlivce, jak prezentují své skutečné já online světu.

FOR Metoda

Obrázek 1



Jak můžete vidět na obrázku 1 výše, DLA funguje takto: 1.) Extrakce funkcí: Extrahování jazyka podle: a) slova a fráze : posloupnost 1 až 3 slov nalezených v řetězci textu, emotikonech a dvou nebo více slovech, která odpovídají nějakému konvenčnímu způsobu vyslovování věcí. b) témata : automatická analýza velkých sbírek neoznačeného textu. 2.) Korelační analýza: proces korelace slov s pohlavím, věkem a osobností. Vzhledem k tomu, že našli tisíce významně korelovaných slov, byly vizualizační tabulky klíčem k pochopení jejich výzkumu (viz obr. 2 níže).

Fascinující, že?