Zistite Kompatibilitu Znamením Zverokruhu
Čo môžu výskumníci nájsť medzi 32 miliónmi adries URL, ktoré Facebook práve zverejnil pre Social Science One?
Overovanie Faktov

Autor: Sergey Nivens/Shutterstock
Spoločenská veda jedna , nezisková komisia spustená v roku 2018 s cieľom nadviazať konkrétne partnerstvá medzi akademikmi a inštitúciami bohatými na údaje, ako je Facebook, má teraz 32 miliónov individuálnych odkazov extrahovaných zo siete sociálnych médií Marka Zuckerberga, na ktorých možno vykonávať výskum.
Po nečakanom takmer ročnom oneskorení niečo, čo vytvorilo an rozčúlený so zakladateľmi projektu koalícia výskumníkov konečne dostala od Facebooku to, čo sa považuje za „jedného z najväčšie súbory odkazov kedy boli vytvorené pre akademický výskum.“
Aspoň to je to, čo Solomon Messing, bývalý riaditeľ dátového laboratória Pew Researcher Center a teraz manažér dátovej vedy pre Social Science One, povedal pre IFCN.
Tímy výskumníkov vybraných z celého sveta budú teraz môcť použiť súbor údajov na identifikáciu trendov, vzorov a populárnych tém vo svete obsahu na Facebooku.
Podľa platformy súbor údajov obsahuje počet verejne zdieľaných adries URL, dátum ich prvého zdieľania, dátum prvého overenia faktov, krajinu, v ktorej boli najčastejšie zdieľané, a súhrn skutočného obsahu. obsiahnuté v URL.
Zahŕňa aj údaje o interakcii používateľa vrátane toho, koľkokrát bola webová adresa označená používateľom ako obsahujúcu falošné správy a koľkokrát bola webová adresa zdieľaná bez toho, aby na ňu skutočne klikol.
Facebook uviedol, že vybral tieto dátové body, pretože sú všeobecne považované za indikátory dezinformácií. Odteraz ich môžu výskumníci používať na pochopenie druhu tém, ktoré na platforme dominujú, alebo na vytváranie modelov strojového učenia na základe týchto vzorov.
Ak chcú akademici získať prístup k súboru približne 32 miliónov adries URL, musia mať svoje projekty schválené komisiou Social Science One. Návrhy, ktoré budú prijaté, môžu získať finančné prostriedky, údaje a iné výhody. A všetky výsledné práce môžu byť publikované podľa želania výskumníka, bez akýchkoľvek ďalších obmedzení zo strany Facebooku alebo komisie.
„Pokračujeme v sprístupňovaní ďalších údajov spôsobom, ktorý chráni súkromie ľudí,“ povedal Messing. 'Tento súbor údajov umožní výskumníkom odpovedať na dôležité otázky o dezinformáciách a úlohe sociálnych médií v spoločnosti.'
Očakávania sú vysoké.
Oneskorené doručenie údajov
V apríli 2018, keď Facebook oznámil bolo to partnerstvo s akademikmi, aby im poskytlo cenné údaje na výskum dezinformácií, očakávalo sa, že tieto súbory údajov trvať nejaký čas pripraviť. Ale nie tak dlho.
V auguste Buzzfeed News nahlásené že sponzori Social Science One, vrátane Democracy Fund, William and Flora Hewlett Foundation, John S. and James L. Knight Foundation, Charles Koch Foundation a Omidyar Network, hrozili, že odstúpia od projektu kvôli oneskoreniu.
Podľa správy dali Facebooku lehotu 30. septembra na zdieľanie súborov údajov, ktoré sľúbil, inak sa projekt skončí.
V januári však Social Science One v blogovom príspevku oznámil, že Facebook bude potrebovať viac času na zverejnenie súboru údajov URL s odvolaním sa na obavy o súkromie.
„Facebook musí spĺňať nielen nové všeobecné nariadenie o ochrane údajov Európskej únie, ako aj podobné zákony na ochranu súkromia v jurisdikciách po celom svete, ale musí spĺňať aj dekrét Facebooku o súhlase s Federálnou obchodnou komisiou USA,“ príspevok v blogu čítať. 'Vzhľadom na bezprecedentnú povahu nášho projektu sa Facebook pohybuje pomaly a opatrne, aby zabezpečil, že náš projekt bude v súlade so všetkými relevantnými právnymi predpismi.'
Súbor údajov bol zverejnený v polovici septembra, tesne pred termínom, ktorý Buzzfeed oznámil.
Ako sa riešili otázky ochrany súkromia?
Podľa Facebooku bolo do adries URL, ktoré vstúpili do súboru údajov, pridané rozdielne súkromie. To znamená, že príspevok každého jednotlivca k údajom bol maskovaný.
Facebook uviedol, že rozdielne súkromie charakterizoval ako dodatočný „štatistický šum“, ktorý ľuďom poskytuje ďalšiu vrstvu ochrany a chráni ich pred kybernetickými útokmi.
Aký výskum umožňuje tento súbor údajov?
Skoršia verzia súboru údajov URL, ktorá bola sprístupnená schváleným výskumníkom prostredníctvom sociálnej monitorovacej platformy CrowdTangle, sa už používala v štúdium o koordinovanom neautentickom správaní pri zdieľaní odkazov v období pred európskymi voľbami v roku 2019 v Taliansku.
Teraz budú môcť výskumníci použiť celý súbor údajov, aby lepšie pochopili, aké druhy obsahu a tém prevládajú na Facebooku. Budú schopní identifikovať vzory v tom, čo sa v priebehu času zdieľa, a mohli by potenciálne vytvárať modely strojového učenia, ktoré rozpoznávajú dezinformácie.
Facebook uviedol, že výskumníci si už dlho uvedomujú potrebu veľkého a rôznorodého súboru údajov na trénovanie takéhoto modelu strojového učenia. Táto množina údajov URL patrí medzi najväčšie existujúce, so 7 gigabajtmi obsahuje približne 32 miliónov adries URL a približne 544 miliónov hodnôt buniek.
Akademici môžu byť schopní identifikovať, ako trendový obsah súvisí s politickými udalosťami a zavádzaním produktov na Facebooku. Medzi ďalšie potenciálne témy štúdia patrí, ako polarizácia, politici a spravodajské cykly zohrávajú úlohu pri šírení dezinformácií na platforme.