Notícia

Com els periodistes poden trobar, extreure i utilitzar dades obertes

Juan Manuel Casanueva Promotor de l'Escola de Dades

Des que la informació es va fer àmpliament disponible al web, els defensors de la transparència han estat pressionant perquè les dades públiques adoptin un format obert. Grups com ILDA a Llatinoamèrica i l'OGP Open Data working group a nivell mundial s'esforcen no sol en investigar i analitzar l'obertura de les dades públiques, sinó també en avaluar de quina manera els mitjans estan utilitzant les dades obertes. Periodistes, hackers civils, acadèmics i organitzacions de la societat civil són alguns dels usuaris de dades obertes més actius que es dediquen a transformar aquestes dades en informació consumible per al públic.

Els periodistes llatinoamericans han estat especialment creatius a l'hora d'assolir diferents fonts de dades per a les seves investigacions i històries, però a causa que el moviment de dades obertes és relativament jove a la regió, la recerca de dades netes, utilitzables i disponibles encara pot ser un desafiament. Com a becari d’ICFJ Knight i copromotor de l'Escola de Dades i de comunitats de dades obertes a Llatinoamèrica, Juan Manuel Casanueva va estar en contacte directe amb les necessitats i els trucs amb què els periodistes tendeixen a enfrontar-se mentre busquen o utilitzen dades. Va conduir un taller sobre aquest tema a la Media Party Miami, un esdeveniment de dos dies en Florida que va reunir periodistes, hackers, acadèmics i estudiants dedicats a la innovació mediàtica als Estats Units i Llatinoamèrica. Vet aquí un resum d'aquest esdeveniment:

On són les dades? El moviment per les dades obertes ha demostrat que les dades són a tot arreu i que els esforços en equip poden contribuir a alliberar dades claus de ciutats o països. Així que si les dades estan disponibles però no han estat oberts, els periodistes poden utilitzar el projecte col·laboratiu Voz Data de La Nación com a guia. Però recorda que estem vivint a l'era de la informació i que la recol·lecció de la mateixa es torna cada dia més fàcil amb l'ús d'aplicacions mòbils, tecnologies i programes de recol·lecció de dades que utilitzen una gran varietat de fonts, des dels signes vitals d'una persona fins als fluxos d'informació de les xarxes socials.

Com puc extreure i netejar les dades? Si les dades estan disponibles, el més probable és que estiguin en formats tancats o semitancats tals com a PDFs. En aquests casos, és molt important que els periodistes desenvolupin capacitats d’scraping i es converteixin en experts en l'ús de diferents eines per importar dadesde pàgines web, PDF i documents escanejats.

Una llista de tutorials i eines està disponible a schoolofdata.org. Netejar i estandarditzar dades és una altra habilitat bàsica que els periodistes necessiten desenvolupar. Eines com OpenRefine o fins i tot l'ús intel·ligent dels fulls de càlcul pot permetre't desfer-te de les dades duplicades i combinar variables i conjunts de dades. Com puc utilitzar les dades obertes? Les dades s'utilitzen principalment per fer anàlisi, però l'enfocament d'aquests pot variar.

Per exemple, els usuaris més narratius tendeixen a demostrar una sèrie d'hipòtesi (una notícia o història principal) mitjançant l'anàlisi de les dades. Aquest enfocament pot ser molt eficaç si la visió general del periodista sobre les dades és precisa i si existeix una alta probabilitat que trobi les respostes que necessita en el conjunt de dades.

D'altra banda, els usuaris més analítics (codificadors o científics) solen tenir un enfocament més “agnòstic”. Analitzen totes les variables i determinen i proven les hipòtesis que les dades mateixes els mostren. L'anàlisi de dades pot ser un repte, però els desafiaments que apareixen en el seu processament i en el transcurs de la investigació poden ser abordats molt millor si es compta amb un equip que inclogui tant a narradors com a tècnics.

Cercar publicació



Destacats


giny

giny

giny

© Associació Catalana de Premsa Comarcal (ACPC), 1980-2024

Avís legal

Contacte