Les paraules més populars utilitzades a les xarxes socials

Us heu preguntat mai sobre el llenguatge utilitzat a les xarxes socials? O els woexrds que fem servir es basen en els nostres trets de personalitat? Si la resposta és afirmativa, està de sort.



Antecedents

El Centre de Psicologia Positiva amb seu a la Universitat de Pennsilvània va crear el que es coneix com El Projecte Benestar Mundial (WWBP). Aquest increïble projecte està forjant tècniques científiques mesurant el benestar psicològic i la salut física a partir de l’anàlisi del llenguatge a les xarxes socials. Els informàtics, psicòlegs i estadístics més brillants estan posant el cap en els processos psicosocials que afecten la salut i la felicitat i estan explorant el potencial de substituir els costosos mètodes d’enquesta. El 2013, WWBP va publicar un estudiar titulat Personalitat, gènere i edat en el llenguatge de les xarxes socials: l’enfocament de vocabulari obert. En un dels estudis més grans fins a la data, WWBP va analitzar més de 700 milions de paraules, frases i casos temàtics recollits dels missatges de Facebook de 75.000 voluntaris. Per analitzar els missatges, van utilitzar dos mètodes diferents per trobar atributs demogràfics i psicològics:

  • Anàlisi del llenguatge diferencial (DLA): un mètode dissenyat per WWBP per identificar les característiques lingüístiques més distintives de qualsevol atribut donat.
  • Consulta lingüística i recompte de paraules (LIWC): una eina popular utilitzada en psicologia per trobar maneres en què les persones utilitzen les paraules en la seva vida quotidiana. Això pot proporcionar una rica informació sobre les seves creences, pors, patrons de pensament, relacions socials i personalitats.

En aquest estudi en particular, WWBP també va fer que els voluntaris fessin proves de personalitat estàndard (el Big 5 Factor Model) per determinar les paraules utilitzades en determinats trets de personalitat. Combineu-ho tot i van poder vincular el llenguatge de personalitat, gènere i edat de les xarxes socials amb un 91,9% de precisió. Ara ens embrutem les mans i fem una ullada a com van recollir les actualitzacions d’estat de Facebook i van formular els seus gràfics de visualització.



Les dades

El conjunt de dades complet consistia en aproximadament 19 milions d’actualitzacions d’estat de Facebook escrites per tots els participants. L'equip de WWBP va restringir les seves anàlisis als usuaris de Facebook que compleixin quatre criteris:

  • Han d’indicar l’anglès com a llengua principal
  • Heu escrit almenys 1.000 paraules a les actualitzacions d'estat
  • Tenir menys de 65 anys
  • Indiqueu gènere (home i dona) i edat

Idioma de gènere:

llenguatge de xarxes socials

A la part superior es mostren les funcions de llengua femenina, a continuació les de llengua masculina. El s ize de la paraula indica la força de la correlació; el color indica la freqüència relativa d’ús. Puntuacions baixes (_) connectar paraules de frases amb diverses paraules.



  • Femelles d’aquest estudi (superior), va utilitzar més paraules d’emoció (per exemple, emocionat) i singulars en primera persona i esmenten més processos psicològics i socials (per exemple, ‘t’estimo’ i ‘<3’ –a heart).
  • mals feia servir més paraules de jurament i referències d’objectes (per exemple, 'xbox', 'opcions negres', 'desitjos').

Idioma d'edat:

llenguatge de xarxes socials

Com podeu veure a la figura 3 anterior, hi ha canvis subtils de temes que avancen d'un grup d'edat a un altre. A més, hi ha distincions clares en paraules com ara l'ús de l'argot, les emoticones i Internet Grup d’edat de 13 a 18 anys . A la De 23 a 29 anys , en pots veure una parella Internet parla o temes de treball (per exemple, 'a la feina', 'nova feina'). Veiem un escola tema relacionat per a Joves de 13 a 18 anys (per exemple, «escola», «deures», «uf»), mentre veiem a universitat tema relacionat per a Joves de 19 a 22 anys (per exemple, 'semestre', 'universitat', 'registre'). A mesura que avanceu cap al Grup d’edat de 30 a 65 anys , les paraules que s’utilitzen se centren més en l’estabilitat emocional amb la família i els amics (per exemple, «filla», «el meu fill», «els meus fills» i «els meus amics de fb»). En general, veureu una progressió de l’escola, la universitat, la feina i la família quan analitzeu els temes principals de tots els grups d’edat.





Freqüència estàndard de temes i paraules segons l'edat: llenguatge de xarxes socials

En Fig. 4A , el gràfic mostra la freqüència relativa dels temes més selectius per a cada grup d’edat en funció de l’edat. Fig. 4B reforça aquesta hipòtesi presentant un patró similar basat en altres temes socials. Fig. 4C mostra que l’ús de 'nosaltres' augmenta després dels 22 anys, mentre que 'jo' disminueix. Sens dubte, això suggereix la importància creixent de les amistats i les relacions a mesura que les persones envelleixen.



Idioma de personalitat:

Els investigadors van aprofundir en com coincideixen la nostra llengua i personalitat. Van analitzar les paraules utilitzades pels participants i les van organitzar en funció de la personalitat de cada participant. Aquí teniu un repàs ràpid dels 5 factors de personalitat:

  • Extroversió: descriu com interactueu amb les persones.
  • Neuroticisme: és com tractes les emocions
  • Agradabilitat: és com et sents cap als altres
  • Consciència: descriu l’organització i la confiança que sou
  • Obertura: és quan algú té curiositat i es mostra obert a noves experiències i coneixements
llenguatge de xarxes socials llenguatge de xarxes socials

A la part superior esquerra podem veure categories relacionades amb la societat, com ara festa els temes apareixen com una característica distintiva clau per a Extrovertits . A més, els resultats suggereixen que Introverts estan interessats en els mitjans japonesos (per exemple, ‘anime’, ‘manga’, ‘internet’ i emoticones d’estil japonès: ˆ_ˆ). La part inferior esquerra de la figura 5 mostra que les persones Alt en neurotisme frases mencionades habitualment com 'fart de', 'deprimit' i 'odio'. A la part inferior dreta es mostra un llenguatge relacionat amb l’estabilitat emocional ( Neuroticisme baix ). Neuròtica baixa les persones van escriure sobre activitats socials agradables que afavoreixen l’harmonia o creen un equilibri emocional més gran, com ara “esports”, “vacances”, “platja”, “església”, “equip” i temps en familia tema. A la figura 6 següent (a la part inferior dreta), persones que mostren Baixa obertura utilitzeu paraules escurçades a la seva actualització d'estat (per exemple, '2 dies', 'ur', 'cada 1'). Gent que ho és Alt obert (a la part inferior esquerra) utilitzeu paraules creatives (per exemple, 'art', 'univers', 'música', 'escriptura' i 'ànima'). És possible que no tingueu ressò amb això, però Baixa consciència mentre que la gent (esquerra mitjana) utilitza paraules molt explícites a les seves actualitzacions Alta consciència la gent (esquerra mitjana) utilitza frases (per exemple, 'treballar', 'a punt per' i 'gran dia'). Com podeu veure, les plataformes de xarxes socials com Facebook i Twitter són recursos molt favorables per a l’estudi de les persones; les actualitzacions d'estat i els tuits són expressius, personals i tenen contingut emocional. Recordeu algunes coses:





  • Aquest llenguatge, en general, és imparcial i són dades de comportament mesurables
  • El llenguatge de Facebook permet específicament als investigadors observar les persones mentre presenten el seu veritable jo al món en línia.

Mètode FOR

figura 1



Com podeu veure a la figura 1 anterior, el DLA funciona mitjançant: 1.) Extracció de funcions: Extracció de l'idioma mitjançant: (a) paraules i frases : una seqüència d'1 a 3 paraules que es troba en una cadena de text, emoticones i dues o més paraules que corresponen a alguna manera convencional de dir les coses. (b) temes : analitza automàticament grans col·leccions de text sense etiquetar. 2.) Anàlisi correlacional: el procés de correlació de paraules amb gènere, edat i personalitat. Com que van trobar milers de paraules correlacionades significativament, els gràfics de visualització van ser la clau per entendre la seva investigació (vegeu la figura 2 a continuació).

Fascinant oi?