Hvad kan forskere finde blandt de 32 millioner URL'er, som Facebook netop har frigivet til Social Science One?

Fakta-Tjek

Af Sergey Nivens/Shutterstock

Samfundsvidenskab en , den non-profit-kommission, der blev lanceret i 2018 for at etablere konkrete partnerskaber mellem akademikere og datarige institutioner som Facebook, har nu 32 millioner individuelle links udtrukket fra Mark Zuckerbergs sociale medie-netværk, hvorpå man kan udføre forskning.

Efter en uventet forsinkelse på næsten et år, var der noget, der skabte en ked af det sammen med projektets grundlæggere modtog forskerkoalitionen endelig fra Facebook, hvad der anses for at være 'en af de største sæt af links nogensinde skabt til akademisk forskning.'

Det er i hvert fald, hvad Solomon Messing, tidligere direktør ved Pew Researcher Centers Data Lab og nu leder af datavidenskab for Social Science One, fortalte IFCN.

Nu vil teams af forskere udvalgt fra hele kloden være i stand til at bruge datasættet til at identificere trends, mønstre og populære emner inden for indholdsverdenen på Facebook.

Ifølge platformen inkluderer datasættet antallet af gange, URL'erne blev delt offentligt, den dato, de første gang blev delt, den dato, de første gang blev faktatjekket, det land, hvor de blev mest delt, og en oversigt over det faktiske indhold. indeholdt i URL'en.

Det inkluderer også data om brugerinteraktion, herunder antallet af gange, en URL blev markeret af en bruger som indeholdende falske nyheder, og antallet af gange, en URL blev delt uden faktisk at blive klikket på.

Facebook sagde, at det valgte disse datapunkter, fordi de i vid udstrækning menes at være indikatorer for misinformation. Fra nu af kan forskere bruge dem til at forstå den slags emner, der dominerer på platformen eller til at skabe maskinlæringsmodeller baseret på disse mønstre.

For at få adgang til sættet med omkring 32 millioner URL'er skal akademikere have deres projekter godkendt af Social Science One-kommissionen. Forslag, der accepteres, kan blive tildelt midler, data og andre fordele. Og alle resulterende artikler kan publiceres efter forskerens ønsker, uden yderligere begrænsninger fra Facebook eller kommissionen.

'Vi fortsætter med at gøre yderligere data tilgængelige på en måde, der beskytter folks privatliv,' sagde Messing. 'Dette datasæt vil give forskere mulighed for at besvare vigtige spørgsmål om misinformation og sociale mediers rolle i samfundet.'

Forventningerne er høje.

En forsinkelse i datalevering

I april 2018, hvor Facebook annonceret det samarbejdede med akademikere for at give dem værdifulde data til misinformationsforskning, det var forventet, at disse datasæt ville tage lidt tid at forberede. Men ikke så længe.

I august, Buzzfeed News rapporteret at Social Science Ones finansierere, herunder Democracy Fund, William and Flora Hewlett Foundation, John S. og James L. Knight Foundation, Charles Koch Foundation og Omidyar Network truede med at trække sig ud af projektet på grund af forsinkelsen.

Ifølge rapporten gav de Facebook en frist til den 30. september til at dele de datasæt, det havde lovet, ellers ville projektet ende.

I januar havde Social Science One dog meddelt i et blogindlæg, at Facebook ville have brug for mere tid til at frigive et URL-datasæt med henvisning til bekymringer om privatlivets fred.

'Facebook skal ikke kun overholde EU's nye generelle databeskyttelsesforordning såvel som lignende love om beskyttelse af personlige oplysninger i jurisdiktioner rundt om i verden, men det skal også overholde Facebooks samtykkedekret med US Federal Trade Commission,' blogindlæg Læs. 'På grund af vores projekts hidtil usete karakter, bevæger Facebook sig langsomt og forsigtigt for at sikre, at vores projekt overholder alle relevante juridiske retningslinjer.'

Datasættet blev frigivet i midten af september, lige før den deadline, som Buzzfeed rapporterede.

Hvordan blev privatlivsproblemer håndteret?

Ifølge Facebook blev der tilføjet differentieret privatliv til de URL'er, der kom ind i datasættet. Det betyder, at enhver persons bidrag til dataene er blevet maskeret.

Facebook sagde, at det karakteriserede differentieret privatliv som yderligere 'statistisk støj', der giver folk et ekstra lag af beskyttelse og holder dem sikre mod cyberangreb.

Hvilken forskning er gjort mulig af dette datasæt?

En tidligere version af URL-datasættet, som blev gjort tilgængeligt for godkendte forskere via den sociale overvågningsplatform CrowdTangle, blev allerede brugt i en undersøgelse om koordineret uægte linkdelingsadfærd op til valget til Europa-Parlamentet i 2019 i Italien.

Nu vil forskere være i stand til at bruge det fulde datasæt til bedre at forstå, hvilken slags indhold og emner der er udbredt på Facebook. De vil være i stand til at identificere mønstre i det, der deles over tid, og kan potentielt bygge maskinlæringsmodeller, der opdager misinformation.

Facebook sagde, at forskere længe har været opmærksomme på behovet for et stort og forskelligartet datasæt til at træne sådan en maskinlæringsmodel. Dette URL-datasæt er blandt de største, der findes, på 7 gigabyte indeholdende cirka 32 millioner URL'er og omkring 544 millioner celleværdier.

Akademikere kan muligvis identificere, hvordan trendindhold er relateret til politiske begivenheder og produktudrulning på Facebook. Andre potentielle emner for undersøgelse inkluderer, hvordan polarisering, politikere og nyhedscyklusser spiller en rolle i spredningen af misinformation på platformen.

Find Ud Af Kompatibilitet Ved Hjælp Af Stjernetegn

Hvad kan forskere finde blandt de 32 millioner URL'er, som Facebook netop har frigivet til Social Science One?

Fakta-Tjek