Sprids känslor på Facebook? Nja, inte riktigt.

Facebook - känslor

I massmedierna har en nyligen publicerad studie framställts som att känslor sprids på Facebook. Om en vän slutar skriva en massa positiva ord så skriver du fler negativa ord. Men är det verkligen så?

Studien tittade på hur känslor kan spridas från en människa till en annan när de pratar eller interagerar med varandra på något sätt (emotional contagion). Forskarna manipulerade nyhetsflödet hos 689 003 Facebookanvändare och visade mindre positiva och negativa inlägg för användarna för att se om de påverkades under veckan. Rent konkret så var det en algoritm som sökte igenom Facebookinlägg och dolde inlägg om de hade positiva (eller negativa) ord.

När positiva inlägg försvann så ökade antalet negativa inlägg med 0,04 procent. Och när negativa inlägg försvann så ökade antalet positiva inlägg med 0,07 procent.

Men som vanligt när massmedierna refererar till forskning (och i synnerhet effekter) så görs alla nyanser om till ett svartvitt beslut: ”Sprids känslor vidare på Facebook eller inte?” Det är dock svårt att göra om en skala till en fråga som bara har två svarsalternativ. Det korta svaret är att det finns en effekt. Men den är inte speciellt stor, och den är heller inte speciellt relevant.

1. Väldigt, väldigt liten effekt

Så här säger Facebookstudien med all sin detaljrikedom:

When positive posts were reduced in the News Feed, the percentage of positive words in people’s status updates decreased by B = −0.1% compared with control [t(310,044) = −5.63, P < 0.001, Cohen’s d = 0.02], whereas the percentage of words that were negative increased by B = 0.04% (t = 2.71, P = 0.007, d = 0.001). Conversely, when negative posts were reduced, the percent of words that were negative decreased by B = −0.07% [t(310,541) = −5.51, P < 0.001, d = 0.02] and the percentage of words that were positive, conversely, increased by B = 0.06% (t = 2.19, P < 0.003, d = 0.008). The results show emotional contagion. [mina fetmarkeringar]

Skippa de krångliga siffrorna och titta på det mest uppenbara – procentstorleken. Skriver du mindre positiva ord på Facebook så minskar antalet positiva ord som dina vänner skriver med upp till 0,1 procent. Är det mycket? Nej, inte speciellt. Det är jävligt lite i sammanhanget om vi antar att du har 150 vänner (vilket är ungefär vad en genomsnittlig användare har).

Dessutom går det att notera att effektstorleken är väldigt, väldigt liten. Cohens d är som högst 0,02 i studien. Det är motsvarigheten till att hälla en burk rödfärg i Vättern och säga att man har färgat vattnet rött. Det är visserligen sant, men hur mycket av hela sjön har egentligen färgats rött? Det är knappt synbart och förmodligen inte något man behöver ringa Länsstyrelsen för att berätta.

Såvida du inte har 100 000 vänner lär du förmodligen inte påverka dina vänner speciellt mycket med dina statusuppdateringar. Men om du nu råkar vara Robyn eller någon annan kändis så kan du förmodligen påverka dina vänner så att några av dem uttrycker sig mer positivt eller negativt.

2. Ord är inte känslor

Ett annat problem är kopplingen mellan ord och känslor. För det första har de inte mätt känslor, utan känslouttryck, och det är något helt annat. Jag kan exempelvis uttrycka mig ledsamt samtidigt som jag är väldigt glad och vice versa.

Men detta är inte ett speciellt allvarligt problem eftersom vi ändå inte kan veta vad personen på andra sidan skärmen faktiskt tycker eller känner.

Citat kan innehålla negativa ord samtidigt som Facebookinlägget i övrigt är positivt, men det spelar inte heller så stor roll. Frågan är om orden smittar eller ej.

Dessutom sprids mycket tårdrypande historier liksom solskenshistorier via videoklipp och foton, som har högre potential att uttrycka känslostämningar, så vi kan anta att effekten är betydligt större när det kommer till multimedia. Det är dock oerhört svårt att undersöka foton och videon på en så stor vetenskaplig skala eftersom det sällan går att mäta på något vettigt sätt (vilket är en allvarlig brist i största allmänhet).

Läs också Word of Psychology som skrivit en bra kritik av metoderna. Där påpekas bland annat att textanalysen är kass eftersom den inte passar för korta texter.

3. Nej, konsekvenserna är små

Forskarna säger att detta experiment visserligen har små effekter men ändå har potentialen att påverka hundratusentals människor eftersom Facebook har över en miljard användare:

More importantly, given the massive scale of social networks such as Facebook, even small effects can have large aggregated consequences (14, 15): For example, the well-documented connection between emotions and physical well-being suggests the importance of these findings for public health. Online messages influence our experience of emotions, which may affect a variety of offline behaviors. And after all, an effect size of d = 0.001 at Facebook’s scale is not negligible: In early 2013, this would have corresponded to hundreds of thousands of emotion expressions in status updates per day.

Men detta är inte helt sant.

Människor är grupperade i kluster och information sprids inom kluster snarare än mellan dem. Det innebär att information på Facebook skickas mellan vänner och sällan når längre än så, och det beror i huvudsak på att det är vänner och kollegor som pratar med varandra på Facebook. Det finns förstås undantag där information sprids väldigt långt, upp till 82 steg från källan har uppmätts, men de är lätträknade i jämförelse. På andra sociala medier, såsom Twitter, är det däremot mer främlingar som talar med varandra, men däremot visar forskning att även på Twitter tenderar människor att prata med likasinnade.

Jag tror snarare att de långsiktiga effekterna av att använda sociala medier är betydligt ”starkare”, vilket också är något jag ska undersöka i min egen doktorsavhandling.

Och sedan den etiska biten att manipulera Facebookflöden utan att användarna är medvetna om det. Ja, den frågan ignorerar jag helt i detta inlägg och överlåter jag till moralfilosofer i stället. Det verkar dock som att de bröt mot många etiska regler inom vetenskapen, bland annat om samtycke och att man ska informera deltagarna om vad som har hänt.

Slutsats

Kan du påverka dina vänners känslor på Facebook? Nej. Effekten i den här studien är så liten så att jag vill påstå att den är försumbar och helt enkelt kan ignoreras.

Eftersom forskarna heller inte tar hänsyn till mediets egenskaper (hur människor använder Facebook och hur information sprids på Facebook) gör det att de av misstag sätter ett likhetstecken mellan känslornas spridningsmöjlighet med antal användare. Men de flesta Facebookanvändare har inte 100 000 vänner.

Det vill säga, information sprids mest mellan vänner och det innebär att informationen inte kommer speciellt långt. Därmed blir den känslomässiga spridningen (emotional contagion) inte heller speciellt påtaglig då de psykologiska teorierna inte kan överföras direkt till ett medium utan att man också tar hänsyn till hur folk använder medierna. Det är därför man måste ha kunskap om både psykologi och medier för att kunna göra psykologiska fältexperiment med medier.

Sammanfattningsvis, även om effekten hade varit större så hade den fortfarande inte varit speciellt relevant.

Betyder detta att Facebookanvändare är immuna mot känslomässig påverkan? Inte alls. Testa själv genom att skriva en statsuppdatering om att dina föräldrar har dött. Du kommer garanterat att påverka dina vänners känsloyttringar på Facebook väldigt mycket. Men räkna inte med att det kommer att spridas speciellt långt. Och räkna inte heller med att någon kommer att ta dig på allvar i fortsättningen.

Några som skrivit om studien

Här är ett axplock av massmedier och bloggar som skrivit om Facebookstudien:

Foto: Evan Raskob

Dela:facebooktwittergoogle_plus
Följ:twitterrss

Hur en konversation på Twitter går till


;)

Och om du händelsevis undrar vad jag egentligen menar: Diskussioner på Twitter handlar, enligt min ringa erfarenhet, av att komma till en åsikt så fort som möjligt och låta andra få reda på den (snarare än att man diskuterar vad folk tycker, varför de tycker som de gör och hur de kommer fram till de åsikterna).

Med andra ord ett slags omedelbart fördömande eller prisande. Ju fortare, desto bättre.

Dela:facebooktwittergoogle_plus
Följ:twitterrss

Varför skriver folk sina åsikter innan de läst vad det handlar om?

Detta är genialiskt och något jag önskar att jag hade kommit på (och att jag hade någonstans att göra det). Jag pratar om aprilskämtet från amerikanska public service-radion NPR (National Public Radio).

De lyckas visa på en ganska basal mänsklig egenskap, nämligen vår benägenhet att uttrycka våra åsikter utan att ta hänsyn till fakta. I sociala medier blir det här förstås extra tydligt och man kan dessutom exploatera det.

Knepet är enkelt:

  1. Dela en nyhet på Facebook med en länk till ett aprilskämt.
  2. Ändra texten som visas på Facebook så att nyheten ser ut att beklaga sig över någon allmän företeelse i samhället.
  3. Invänta medan kommentarsfältet fylls på med folk som inte har klickat på länken och läst vad som faktiskt står där, men mer än gärna delger sina åsikter i frågan.

Det som hade gjort det här aprilskämtet ännu bättre vore om det handlade om källkritik.

Här är inlägget de delade, men du kan också se inlägget live på Facebook. Just nu är det fyllt med ironiska kommentarer så det kan vara roligare att titta på bilderna nedan.

NPR aprilskämt

NPR aprilskämt

NPR aprilskämt

 

(Via Uproxx via Lamebook)

 

Dela:facebooktwittergoogle_plus
Följ:twitterrss

Detta är det äckligaste jag sett (speciellt bild 2) – Hyllat.se tar betesjournalistiken till Sverige

Betesjournalistik, eller länkbete, har länge varit ett kännetecken av kvällstidningar: Rubriker som lovar mer än vad de håller. På internet har det funnits länge, men däremot inte så många i Sverige. Därför är det kul att det numera finns en svensk blogg som jagar klick.

Ett par av mina vänner på Facebook och de jag följer på Twitter har oberoende av varandra länkat till hyllat.se. Domänen skapades redan 4 mars 2014 så den har inte varit aktiv mer än en knapp månad.

De har redan fler än 10 000 fans på Facebook så det har gått relativt snabbt för dem att skapa sig en följarskara. På Twitter är det dock bara 45 följare, men det är förmodligen inte så konstigt med tanke på att så få använder Twitter i förhållande till Facebook. Google+ är inte ens värt att nämna.

Vad är hemligheten?

Tittar man på deras Instagramkonto så blir det ganska tydligt att rubriker fyller en väldigt viktig funktion. Den ska inte bara skrivas, den ska finslipas in i minsta detalj.

Hyllat.se lägger ned mycket tid på sina rubriker

Det är förstås rubriker som lovar guld och gröna skogar, men som sällan når ända dit. Lite som att sälja sand i Sahara. Det brukar ofta kallas länkbete på internet, men det är egentligen inget nytt. Jag har sett detta på förstasidan av dagstidningar från början av 1900-talet där rubriken är väldigt subjektivt värderad och hårt vinklad, förvisso amerikanska tidningar.

Efter journalistikens professionalisering fasades den typen av rubriker ut mer och mer, men lever såklart vidare i kvällstidningarna. Att använda superlativ (bästa, sämsta, äckligaste, viktigaste etc) är något man bör undvika i journalistiska texter, men på nätet är det annorlunda.

Däremot är det få rubriker i kvällstidningar som är uttalat subjektiva, som exempelvis ”Detta är det värsta jag sett”. Professionaliseringen har gjort att journalisten står i bakgrunden och framför allt rapporterar fakta, inte sina egna värderingar. (Vilket såklart är en sanning med modifikation därför att urvalet av fakta speglar journalistikens värderingar, men det kan vi skippa här.)

På internet är den här typen av rubriker väldigt effektiva eftersom man kan mäta resultatet i realtid. En liten justering av rubriken och en ny placering är ibland allt som behöver göras för att artikeln ska återuppväckas från de döda. Lägg även till spridningen i sociala medier, som är personlig och värderande redan från början, och vi har en väldigt effektiv metod för spridning. Gödselspridning, skulle man kunna kalla det om man ville vara elak och nedvärdera metoden.

Vilka rubriker från Hyllat.se presterar bäst?

Jag lovade ju dessutom i min egen rubrik att visa det äckligaste jag har sett. Speciellt bild nummer två som kommer nu. Om du läst så här långt så förstår du förmodligen att superlativet bara var hittepå för att få dig att klicka vidare.

Klicka på diagrammet nedan så ser du vilka artiklar och rubriker som har presterat bäst. Det är en ganska imponerande bedrift att på mindre än en månad få en väldig snabb och och ”hög” spridning av artiklarna. Då väljer jag att medvetet inte tala om kvaliteten.

Den artikel som spridits mest har ungefär 128 000 gillningar, delningar och kommentarer på Facebook. Rubriken är ”De fem saker människor ångrar mest på dödsbädden”.

Delningar m.m. på Facebook för Hyllat.se

(Du kan också ladda ned datan i Excel-format om du själv vill undersöka det närmare.)

Som så mycket annat på nätet (och i resten av hela världen) så är det som sprids väldigt få. I detta fallet är det bara fem artiklar som sprids i 90-percentilen och två artiklar som sprids i 95-percentilen. Tittar man på forskningen inom journalistik och informationsspridning (vilket jag forskar om just nu) så är det ungefär så det ser ut. Det är bara ett fåtal av artiklarna som sprids vidare i någon nämnvärd omfattning, och ofta är det i ett begränsat antal ämnesområden.

Läs mer

Även Hans Kullin skriver om den här formen av journalistik, men då hur kvällstidningar och i synnerhet Expressen använder ”stjärnan” för att dölja vem artikeln handlar om. Allt för att vi ska bli nyfikna på vem det handlar om, och klicka vidare för att läsa.

Som en motreaktion har även speciella Twitterkonton dykt upp, som avslöjar vad artiklarna egentligen handlar om. För Huffington Post finns @HuffPoSpoilers och för flera svenska tidningar finns @Nyhetsspoilers. Följ dem gärna, för det är roligt att se hur rubriken är skriven och vad som egentligen döljer sig bakom den, utan att behöva läsa hela artikeln.

Dela:facebooktwittergoogle_plus
Följ:twitterrss

Se föreläsningen om påverkan och manipulation här

För drygt en vecka sedan föreläste jag och min medförfattare Håkan Järvå om påverkan och manipulation på ABF i Stockholm.

Innehållet bygger mycket på vår nya bok, Påverkan och manipulation, som kom ut på Studentlitteratur i december 2013.

Klippet är 1 tim 23 min. Första delen med mig handlar om språk- och mediepåverkan medan andra delen med Håkan handlar om psykologisk påverkan. Andra delen börjar 30 min in i klippet. Ungefärliga hålltider i klippet kan du hitta nedan.

  • 2:00 Hur språket påverkar känslor och verklighetsbild
  • 5:00 Metaforer för att styra människors uppfattning
  • 8:30 Hur du får högre lön
  • 12:30 Vanlig myt om journalisters partiskhet
  • 14:00 En gris och en apa har sex
  • 16:00 Medierna påverkar vad vi tänker på
  • 19:30 Medierna påverkar hur vi tänker
  • 32:00 Hur vi tillskriver mening
  • 36:30 Hur vi anpassar oss till gruppen
  • 43:00 Klassiskt logikexperiment med baseball
  • 47:00 Vår blindhet inför beslut vi precis har fattat
  • 51:00 Två sätt att fatta beslut: Snabbt och långsamt
  • 57:00 Vem är snyggast?
  • 1:09:00  Tecken på manipulation och hur du försvarar dig
  • 1:14:00 Frågestund

Du kan läsa mer om boken på marionett.net.

Dela:facebooktwittergoogle_plus
Följ:twitterrss

Min bok om påverkan och manipulation äntligen här

Påverkan och manipulation - Studentlitteratur

Woho! Nu har Håkan Järvås och min bok Påverkan och manipulation släppts!

Boken går att köpa på Adlibris, Bokus och alla andra större nätbokhandlar.

Boken tar ett väldigt brett perspektiv på påverkan genom att beskriva saker som hur människor beter sig i sociala situationer, hur synintrycken kan vilseleda, effekten av social påverkan, hur ord och argument kan förvrängas liksom vilka effekter massmedier har på människor. Boken är helt enkelt ett måste för alla som är seriöst intresserade av att påverka andra.

Du kan läsa mer om boken på Studentlitteraturs sida eller bokens sida marionett.net där vi samlar filmklipp och länkar.

Dela:facebooktwittergoogle_plus
Följ:twitterrss

Här är e-brevet som avslöjar de fula SEO-knepen

Hur gör oseriösa sökmotoroptimerare när de ska sälja in sina kunder? De skickar mängder med e-post till olika hemsidor och ber dem länka till sina kunder för pengar. I strid mot gällande riktlinjer.

SuperSerp

Google har under flera år sagt att köp av länkar inte är tillåtet enligt deras riktlinjer (såvida de inte använder attributet rel="nofollow" på länkarna, som inte ska påverka PageRank).

Så det är alltid kul när man får e-post som uppmuntrar till brott mot dessa regler, se bilden till höger eller texten nedan.

Hej!
Jag undrar om du tar in sponsrat innehåll till din sida? Jag letar efter relevanta sidor att använda åt min klient i samband med en speciell kampanj för tillfället, samt vill bygga relationer
med olika webmaster för framtida projekt.
Min klient är ett respekterat online spelföretag och länken inom artikeln kommer att vara till en av deras kasino/bingospel sajter.
Allt innehåll är skräddarsytt för att passa in på webmasterns sida.Vänligen se nedan exempel på några av våra sponsrade inlägg:

http://www.moviezine.se/artikel/13838
http://whatsupsthlm.se/restaurang/hur-du-tillbringar-en-weekend-i-stockholm/9932/
http://teaterstockholm.se/2013/08/16/fem-anledningar-varfor-teaterscenen-ar-battre-an-film/
Vår budget för den här kampagnen är: 800 SEK per artikel. Om du kunde jobba med oss den här gången skulle jag vara glad att skicka över så mycket relevant verksamhet som
möjligt till dig på en regelbunden basis.
Jag ser fram emot att höra från dig.

XXXX XXXXXX XXX@superserp.com
superserp marketing specialist

This message is confidential. It may also be privileged or otherwise protected by work product immunity, confidentiality or other legal rules. If you are not the intended recipient you are notified that disclosing, copying, distributing or taking any action in reliance on the contents of this information is strictly prohibited. Please note that any views or opinions presented in this email are solely those of the author and do not necessarily represent those of SuperSerp.

If you no longer wish to receive emails from us, please click here

Jag har (uppenbarligen) tagit bort namnet på den person som skickat mejlet eftersom det inte är relevant. Tydligen så ligger min e-postadress på någon e-postlista. Genom länken längst ned i mejlet vill de tydligen att jag ska avsluta prenumerationen.

Upp till två tredjedelar av innehållet i vanliga dagstidningar kan komma från en påverkanspart (Järvå & Dahlgren, 2013). Men hur många av nyheterna på internet som egentligen kommer från påverkansparter är inte lika väl undersökt. Däremot finns det ju många fall som tagits upp i medierna när det gäller bloggare som får prylar hemskickade och skriver positiva omdömen om prylarna.

Däremot är det god praxis att skriva varifrån nyheten kommer, även om man såklart kan missa det ibland. Däremot är det en stor skillnad på att glömma skriva varifrån man får nyheten jämfört med att bli betald för att skriva en nyhet där man nämner vissa företag och länkar till dem. Sponsrade nyheter kan vara helt i sin ordning så länge som det framgår att de är sponsrade. Av de tre länkarna i e-brevet är det bara Teater Stockholm som skriver ut att nyheten är sponsrad (”Sponsrat inlägg” längst ned till höger), medan MovieZine skriver ”Av Annons” i artikelns byline. Ingen av de tre sidorna följer dock Googles riktlinjer.

Etik är viktiga frågor. Det framgår förmodligen för alla som läst vad jag skrivit om moralisk universalism och hur PR-konsulter hjälper tvivelaktiga kunder.

Vad tycker du? Är det rätt eller fel att köpa länkar?

Dela:facebooktwittergoogle_plus
Följ:twitterrss

Vad bäverbajs kan lära dig om källkritik

Att källkritiken är dålig på nätet är väl inget kontroversiellt påstående, men desto mer fascinerande är att personer som skriver om vikten av källkritik inte verkar tillämpa den själva.

Källkritik

I ett blogginlägg skriver Stiftelsen för Internetinfrastruktur (IIS) om vikten av källkritik när Facebooksidan Matfusket skriver om hur analsekret och urin från bävrar används som aromämne i mat.

Varför stiftelsen skriver om mat och djur kan man förstås fråga sig, men förmodligen för att ge något konkret exempel på källkritik.

Ungefär så här gick det till:

  1. Matfusket delar denna bild om bäverbajs i mat. Eller ”bävergäll” om vi ska vara mer korrekta.
  2. IIS skriver blogginlägget Vad sa du att jag delar? om vikten av källkritik. Där intervjuas en bäverexpert om hur ett ord som på engelska (castor oil) betyder ricinolja förmodligen har misstolkats som bävergäll (castoreum).
  3. Matfuskets Facebooksida svarar med källhänvisningar och i kommentarsfältet dyker länkar till vetenskapliga studier upp som visar att bävergäll förekommer i mat (och att det är ofarligt – för den som undrar).

Jag är ingen expert på mat eller bävrar, men det finns många källhänvisningar som stödjer Matfuskets påstående om att bävergäll används i mat (bland annat Burdock, 2007). Huruvida de andra påståenden Matfusket gör på Facebooksidan är sanna eller ej är förstås en helt annan fråga.

Att använda källkritik som utgångspunkt för kritik blir extra pinsamt om man gör sin egen källkritik dåligt. I stället för konkreta faktafel verkar kritiken snarare handla om att vinkeln är för hårt tillskruvad på Matfuskets Facebooksida. Men den intressanta frågan i sammanhanget är, i mitt tycke, egentligen experten i IIS blogginlägg.

En bäverexpert är förstås expert på bävrar. Så långt är allt enkelt. Men är bäverexperten även expert på mat som görs av eller från bävrar? Det är en svårare fråga. Djur och mat är två olika ämnesområden, men de överlappar förstås väldigt ofta. Kanske är en livsmedelsexpert en bättre person att intervjua. Det blir i grund och botten en fråga om hur långt man menar att expertens kunskaper egentligen sträcker sig.

6 kritiska frågor om experter

I slutet av boken Påverkan och manipulation ger jag några råd om hur man bedömer uttalanden från experter. Det kan man göra genom att ställa sex stycken kritiska frågor:

  • Expertis: Hur tillförlitlig är personen som expert?
  • Ämne: Är personen en expert i det område sakfrågan berör?
  • Omdöme: Vad var det som personen hävdade som leder fram till påståendet?
  • Trovärdighet: Är personen trovärdig som expert?
  • Konsistens: Stämmer påståendet överens med andra experters påståenden?
  • Bevis: Är påståendet baserat på några bevis eller belägg?

Dessa frågor ger inga entydiga svar på vad som är ett korrekt uttalande av en expert eller ej. Med de bör åtminstone ge en fingervisning om åt vilket håll uttalandet lutar, och det är viktigt för källkritiken.

Om man är osäker på en experts uttalande är det nästan alltid enklast att fråga en annan expert i samma eller närbesläktat område som sakfrågan berör. Poängen är att om de säger samma sak så bör det nog också förhålla sig på det viset. Att själv försöka söka i vetenskapliga databaser är förstås den ”bästa” formen av källkritik, men kräver också den ”bästa” utbildningen för att ha kompetens nog att göra det.

E-nummer

För övrigt skriver jag också ingående om E-nummer i boken. Det är ett effektivt sätt att manipulera människor att tänka negativt om mat om man säger att det innehåller många E-nummer eller tillsatser än om man säger att det innehåller många naturliga ingredienser. Men många naturliga ingredienser har ett E-nummer. Så man är egentligen mer rädd för orden än för innehållet.

Uppdaterat: DN, Expressen, Aftonbladet skriver också om det.

Dela:facebooktwittergoogle_plus
Följ:twitterrss

Varför ”Big Data” bara är lurendrejeri

Big data - statistik

Först ett skämt: Finns det telefoner i lera, eller är det lurendrejeri? Okej, nu till allvaret.

Det finns något undangömt antagande om att mer information innebär att vi kan fatta bättre beslut. Det vill säga, om vi kan få åtkomst till mer och mer data så blir slutsatsen vi kan dra från datan betydligt mer säker. Exempelvis, om vi kan analysera 2 miljarder inlägg från Twitter så skulle vi med väldigt hög säkerhet kunna säga vad människor tänker och tycker om olika saker.

Allt detta är dock lurendrejeri.

Vi behöver rätt information – inte mer

Mer information innebär inte nödvändigtvis bättre information. Det fundamentala är att man måste ha rätt sorts information för att kunna dra slutsatser. Inte mer information. Då spelar saker som ”big data” heller ingen roll, eftersom det inte löser de fundamentala problemet med att ha rätt information från första början.

Det kallas information bias och är en sorts ”skevhet” i människors sätt att tänka. Det är tron att ju mer information man har (för att fatta ett beslut), desto bättre är det. Men den tron är alltså ogrundad.

Nya, sexiga ”data science”

Ett roligt ord är ”data science”. Ungefär som om det vore ett helt nytt och revolutionerande sätt att bedriva forskning.

Forskare som håller på med stora mängder data borde ju rimligtvis innebära att de därmed kan dra stora slutsatser och stora generaliseringar. Det låter kanske som ett rimligt argument, men det är det knappast. Det är inte bara mängden data som avgör, utan också hur man har fått tag i den som är det väsentliga.

Ingenjören Pete Warden skriver på sin blogg om varför man aldrig ska lita på en data scientist. Genom att göra färgglada bilder med linjer och streck från 200 miljoner Facebookprofiler skulle man kanske kunna tro att han gjort en ”objektiv” beskrivning av Facebookanvändarna:

The clustering was produced by me squinting at all the lines, coloring in some areas that seemed more connected in a paint program, and picking silly names for the areas. I thought I was publishing an entertaining view of some data I’d extracted, but it was treated like a scientific study. A New York Times columnist used it as evidence that the US was perilously divided. White supremacists dug into the tool to show that Juan was more popular than John in Texan border towns, and so the country was on the verge of being swamped by Hispanics.

[...]

I’ve never ceased to be disturbed at how the inclusion of numbers and the mention of large data sets numbs criticism.

Det är gammal hederlig statistik…

Kan man säga att ”7 av 10 av unga har provat droger” så låter det trovärdigt och som ett allvarligt hälsoproblem. Det är ”fakta” som serveras rakt upp och ned. Att det i själva verket bara är femtio personer på Sergels torg som har fyllt i ett formulär och fått uppskatta droganvändningen bland sina vänner tycks vi vara mindre angelägna om att ta reda på. Formuleringen ”7 av 10″ tycks vara nog för att vi ska sluta ställa frågor och låta vårt intellekt kapitulera.

Men man måste fortfarande göra lämpliga stickprov ur populationen, välja rätt skala och variabler liksom att analysera med rätt koefficienter och så vidare. Kort sagt: Man måste fortfarande hålla på med statistik. Och det kräver i regel lång utbildning och är ingenting som mer data eller snyggare infographics kan råda bot på.

…men statistik är inte sexigt

Det låter ju mer övertygande att säga att man har analyserat 200 miljoner Facebookprofiler än någon sociolog som gjort ett obundet slumpmässigt urval bland några tusental personer. Stora siffror är häftiga. Krångliga metodavsnitt i avhandlingar är ångestframkallande.

Vad som ger rätt slutsats är nämligen inte samma sak som det som ger en intressant slutsats. Forskare letar efter rätt slutsats till precist formulerade frågor, medan medierna letar efter en intressant slutsats baserad på vaga och förutfattade spekulationer till frågor (det som passar medielogiken).

Med hjälp av ”data science” och ”big data” får man däremot siffror att låta sexigt, utan att behöva befatta sig med jobbig statistik. Men som satirikern H.L. Mencken uttryckte det: ”För varje komplext problem finns det ett enkelt svar, och det är fel.”

Och när vi ändå är inne på att såga myter så kan jag säga att den ”magiska” gränsen för statistisk signifikans med ett p-värde = 0,05 är fullständigt godtycklig. Men det låter ju mer vederhäftigt om det är 0,05 eller under.

Slutsats

Big data är, trots sitt sexiga namn, inget annat än vanlig statistisk analys. Däremot finns det helt andra användningsområden för så kallad ”big data” som är mer lämpliga, men man kommer däremot inte ifrån att man håller på med statistik i någon form, eller att metoderna (insamling och analys) kommer att påverka resultatet.

Siffror öppnar inte en magisk dörr av värdeneutral objektivitet. Man måste fortfarande veta var siffrorna kommer ifrån och vad de betyder och, framför allt, vilka slutsatser man faktiskt kan dra från dem. Och det är gammal kunskap som ny teknik inte har förändrat.

Vad vi sällan behöver är mer och mer data. Vad vi snarare behöver är mer välformulerade problem.

Läs mer

Dela:facebooktwittergoogle_plus
Följ:twitterrss