Nyttiga länkar från NICAR 2019

NICAR 2019 – Våra lärdomar och tips!

Över 50 dragningar, hands on-workshops och specialkurser! Digitala insatsstyrkan har gjort sitt bästa för att täcka in så mycket som möjligt av den tvärfunktionella konferensen Nicar 2019. Här följer massor av länkar till nya verktyg, inspirerande publiceringstips, och våra spaningar kring läget för den digitala journalistiken.

Innehållet i denna artikel:

Följ våra spaningar i följande ordning:

Niklas Emilsson, utvecklare
Paloma Lucero, grafiker
Marcus Eriksson, producent
Camilla Tranberg, utvecklare
Maksim Goobar, designer
Elin Wärmegård, journalistpraktikant
Eric Weber, datajournalist
Yasmine El Rafie, produktägare

Niklas Emilsson, utvecklare:

 

Publicera ditt arbete, din data och dina resultat och var transparent med din publik

Flertalet sessioner tar både upp och demonstrerar hur man kan publicera och redovisa sitt arbete och sin data för sin publik och där med vara transparent med vad man har kommit fram till och hur.

Ett bra sätt som används inom kodspråket R är det som kallas "R Markdown" där programmeringskommandon blandas med beskrivningar och kommentarer så publiken kan följa med steg for steg och även reproducera resultaten själva.

Flertalet sätt att exportera sin "R Markdown" till mer publikvänliga format tas upp där webbaserade plattformar som Jupyter Notebook och RPubs som har många olika format nämns.

Läs mer om programpunkten "Share your work: Publishing your data analysis with R" och på GitHub.

Lärande maskiner är mer gissande maskiner

Det är tveksamt om det som idag kallas "machine learning" verkligen är självlärande maskiner då det "bara" är mer eller mindre kvalificerade gissningar om framtida saker baserade på historisk data.

Dagens "machine learning" är mer "machine guessing". Kanske kommer det i framtiden faktiskt finnas riktig "machine learning" där maskiner lär sig och justerar sina gissningar vart eftersom de också lär sig kolla hur väl deras gissningar slog in.

Samarbete mellan data/expert-team och redaktioner

I samarbeten där man inte känner varandra och/eller inte arbetat ihop tillsammans tidigare är det bra att klargöra vem som driver vad så rollerna inte är allt för otydliga.

Detta underlättar för personer att ta initiativ inom sitt/sina områden och inte behöva vara orolig för att trampa in på någon annans område och eventuellt ömma tår.

Man ska inte heller vara för rädd att ödsla tid genom att bara umgås över en kopp kaffe, lunch eller etc. då detta ger möjlighet att lära känna varandra bättre.

Paloma Lucero, grafiker:

 

Visualiseringar som sticker ut

Rachel Binx, Data Visualization Engineer for Content Science på Netflix visade oss exempel på information som gör sig bäst som visualiseringar.
Som den här illustrerade boken som förklarar matematik.

När tekniken berör

Nonny de la Peña, grundare och CEO på Emblematic Group, är bland de första att visualisera immersivt med hjälp av VR och AR. Hon menar att med hjälp av immersive teknik kan människan ta till sig information på ett naturligare sätt eftersom hjärnan uppfattar det som en utforskande upplevelse. Exempelvis statistik i 3D via AR och en dokumentär om den smältande isen i form av en VR-upplevelse.

Hur hittar vi de okända berättelserna om minoritetsgrupper?

En panel bestående av @nausheenhusain, @zhoyoyo och @newsterrier delade med sig av sina erfarenheter av att ge minoritetsgrupperna en röst. De lyfte vikten av att bygga upp relationerna med dina källor med tillit genom ärlighet och empati innan du behöver dem till din uppsamling av data. Och även att alltid återkoppla till dina källor i efterhand.
https://tinyurl.com/unfamiliar-communities

Läs mer: Presentatörernas powerpoint och tips.

Marcus Eriksson, producent:

 

Cool data-analys! Kan jag få receptet?

Om publiken, medarbetare, ansvariga utgivare och du själv några månader senare ska ha full koll på metoden du använt i din komplexa data-analys behöver du föra noggrann dokumentation av val och algoritmer du kodat längs vägen. Mycket att vinna i längden. Inte minst transparens/trovärdighet och så blir analysen reproducerbar för din redaktion och andra.

Vanligt att exempelvis använda GitHub och R för att skapa dessa begripliga "recept".

Här finns fler samlade länkar.

Och här kan du få hjälp och hjälpa andra med kod för olika analyser av data världen över.

Våga tagga ner på siffrorna i en data-story för radio

Dataresearch tar tid. Du begär ut data. Tiden går. Tvättar datan. Tiden går. Testar datan. Tiden går. Du har massor av bra data och ofantligt mycket arbete bakom den slutliga nyheten. Och de övriga på nyhetsredaktionen har i regel ingen aning. Men trots allt detta, när nyheten väl berättas i radio och presenteras online är det berättelsen och människorna berörda i den som behöver lyftas fram.

Tips från Lisa Pickoff-White, flerfaldigt prisbelönad datajournalist på KQED, San Francisco:

  • Låt programledaren, presentatören berätta det mesta rörande siffrorna i påannonseringen. Det är en rejäl genomgång av data - "därför ska du nu lyssna"
  • Låt personer/karaktärer illustrera datan
  • Repetera de viktiga slutsatserna i datan genom radioberättelsen, så lyssnaren inte fastnar och tänker, vad var det nu igen?
  • Använd audiolisering. Som att exempelvis låta ett spelat instrument illustrera olika styrkor av jordbävningar. Som podcasten "The Big One".

Hej nyhetsredaktionen! Hur hanterar vi "deep fakes?"

Tekniken att manipulera och framställa video och ljud med människor som är helt uppdiktade utvecklas allt snabbare. En persons röst kan återskapas via text och kända personer kan simuleras i videoklipp som kan framstå som verkliga. Så hur kan nyhetsredaktioner hänga med och vara redo att hantera bedömningar av sådant material?

En möjlig lösning för redaktioner kan vara att sätta samman en grupp specialister som genom verktyg och uppdaterade metoder snabbt kan vara behjälpliga att bedöma misstänkt material.

Läs mer: Exempel på verktyg att använda

Camilla Tranberg, utvecklare:

 

R och Python

Det verkar som att R och Python är mer populärt än SQL. Det var flertalet R och Python-relaterade hands-on workshops än vad det var SQL. En anledning till det skulle kunna vara ett ökat behov av att dokumentera och dela sina utredningar.

Machine learning

Maskininlärning (ML) är en underkategori till artificiell intelligens och det var många föreläsningar som handlade om ML. Ett projekt som har använt en ML algoritm är "The Implant Files" som är en utredning av dödsfall relaterade till implantat.

Att få in research i det dagliga arbetet

Jag var på en session där personer berättade om sina projekt. Dave Sheingold från NorthJersey.com berättade om han gjorde en kort story en gång i veckan relaterat till aktuella ämnen. Han menade att det är ett bra sätt att få in mer research och att använda data regelbundet även om det inte finns reportrar tillgängliga för att göra mer djupgående analyser.

Här finns Daves projekt, och här finns de andra projekt som det berättades om.

Maksim Goobar, designer:

 

AI är inte allt vi tror det är, framför allt inte smart

Leder AI automatiskt till superintelligenta mördarmaskiner? Nej, snarare till korkade och rasistiska mördarmaskiner. Åtminstone om vi ska tro Meredith Broussard som i sin ganska pessimistiska dragning How it works: Artificial Intelligence inte berättade jättemycket om hur det funkar utan mest om konsekvenserna av de bias som byggs in i tekniken. Enligt Broussard så är Machine learning (som är den del av AI som är aktuell idag) i bästa fall något som kan agera inspiration till journalistik, men tro inte att den kan göra jobbet på egen hand eller räkna med digra konsekvenser!

Broussards bok Artificial Unintelligence 

Bonuslänk: Artikel hos Veckans Affärer samma dag som dragningen

Låt publiken gissa - forskningsbaserat verktyg för interaktiva grafer

New York Times har gjort ett antal artiklar på temat You draw it, där läsaren får gissa på hur en graf ser ut genom att rita ut den och sen se den faktiska grafen. Genom ett antal studier har denna typ av interaktiva grafer testats och utvecklats för att ge största effekt på användare. Utifrån resultatet har det byggts ett verktyg som låter vem som helst skapa liknande grafer till sin publiceringar. They draw it! som verktyget döpts till finns ute i en första version. Det arbetas på att få resultatet (som i dagsläget blir en iframe) mobilanpassat och open source.

Exempel på You Draw It från New York Times

Här finns verktyget They Draw It!

Publicera vektorgrafik via ditt CMS

Ett annat intressant grafik-verktyg som visades på konferensen var Vizier. Det låter dig skapa grafik i Adobe Illustrator, de flesta grafikers standardprogram, och sedan spara ut den i ett format som de flesta CMS klarar av. Det går att ge grafiken brytpunkter så att den funkar både i mobil och på desktop och dessutom ska texten bli skalbar och funka med skärmläsare. Låter dom en dröm! Återstår att testa i Isidor.

Länk till verktyget Vizier

Elin Wärmegård, journalistpraktikant:

 

Ren och fin data

När man skriver nyheter baserat på data är det viktigt att säkerställa att datan är korrekt. På master classen "Self-editing & bulletproofing the data" gick vi igenom hela processen hur man gör en datanyhet. En tidskrävande del av arbetet kan ofta vara att tvätta din data, ett verktyg man kan använda för att tvätta datan snabbare är OpenRefine

Skala ner datan

Att berätta en databaserad nyhet på olika plattformar kan vara en utmaning. Ditt arbete underlättas om du har en bra och genomtänkt pitch, det ger dig en tydlig vision och du kan lättare sälja in din nyhet. En bra pitch innehåller så lite siffror som möjligt. Att skala bort exempel från sin data återkommer också i presentationen av nyheten, oavsett om det är i FM eller på sociala medier.

I powerpointen finns flera bra exempel på hur man kan prata om data i FM och på sociala medier. 

Hitta personer på kreativa sätt

Publiken vill inte ha nyheter fulla av data och siffror, de vill ha nyheter om människor. Därför måste vi, med hjälp av datan, hitta personer att berätta om för att förmedla vår nyhet. I detta fall hittades intervjupersonerna genom att kolla om den som anklagats för våldtäkt hade förbud att besöka och kontakta någon. Om de hade det, var det i många fall målsäganden i våldtäktsfallet som ansökt om besöksförbudet. De dokumenten är allmänna handlingar vilket gjorde att reportern kunde få ut dem och hitta målsäganden.

Eric Weber, datajournalist:

 

Så berättar du ditt datagräv

Under programpunkten"Seeing the story: How to write the data-driven investigation" gav panelen ett antal handfasta tips för vanliga problem man möter under arbetet med ett datadrivet gräv, bland annat:

  • Misströsta inte om du bara hittar ett fåtal case i din granskning: "It's not the number of incidents, it's the scale of injustice."
  • Försök begränsa mängden siffror. Behövs de passar de ofta bra att lägga i en punktlista.
  • Var försiktig med att använda ord som "många", "ofta" och "rutinmässigt", och var tydlig med din redaktör om vad du menar med dem.
  • Har du svårt att hitta någon som är drabbad av missförhållandet du granskar? Försök att hitta en "bad guy" i stället.
  • När du ska välja ett case, tar du det mest extrema fallet, eller ett som representerar normen i din data? Panelens råd: Välj det case som på bästa sätt bär storyn, det du vill berätta, framåt.

Hur granskar man algoritmer?

"Algorithmic accountability" är ett växande fält inom datajournalistiken. I Digitala insatsstyrkan har vi tidigare utforskat ämnet i en granskning av svenska hyressajter.

Under programpunkten "Holding algorithms accountable" gav Nicholas Diakopoulos från Northwestern University ett par tips för hur man kan gå tillväga när man har hittat en algoritm man vill granska:

  • "Auditing" – jämföra ingångs- och utgångsvärden för att ta reda på vad som sker inne i algoritmen
  • "Poking and prodding" - att t ex redigera sin användarprofil på Facebook för att se hur nyhetsflödet förändras.
  • "Crowdsourcing" – be publiken ladda ner eller begära ut sina egna data och dela med sig av dem. Ett exempel är tyska Der Spiegels granskning av kreditupplysningsföretaget Schufas algoritmer.
  • "Code audits" – om du kan få tillgång till källkoden, läs och granska den för att förstå hur algoritmen fungerar.

Engagerande visualiseringar

Det finns många oskrivna regler kring hur man visualiserar data, och i vilka lägen det passar bäst att använda sig av t ex ett stapeldiagram eller en kloropletkarta. Men ibland kan det vara värt att frångå konventioner för att skapa mer engagerande visualiseringar. Under paneldiskussionen "Avant garde data viz" visades många exempel på detta, bland annat denna enkla och slående illustration av mässlingsutbrott över tid.

Yasmine El Rafie, produktägare:

 

Tålamod, ensamhet och samhörighet

"The lonely coder in the newsroom" är en så vanlig känsla att det blivit ett eget community på nätet, för de journalister som inte kan bolla sin kod och data-analyser med redaktören eller producenten - eftersom dessa inte förstår med vad/hur datareportrarna och utvecklarna jobbar.
Det var slående hur skönt många tyckte att det var att få tillhöra ett team - andra personer med angränsande kompetens inom programmering, design, grafik, data-analys, tvärfunktionella projekt eller annat.
Och hur avgörande det är för den journalistiska kvalitén att ha tillgång till personer som kan titta på ens kod/analys och faktiskt kunna granska den.
För den som saknar kollegor och vill få stöd och ett sammanhang, finns slack-kanalen för lonely coders in the newsroom: https://lcc-slack.herokuapp.com/

(Time) managing up and across

För mig personligen var det roligast att Nicar i år satsade rejält på kurser och paneler om management, det vill säga arbetsledning. Och lika roligt var det att dela erfarenheten av hur det är lite andra områden som kräver energi när man leder specialister, jämfört med generalister - ett evigt pedagogiskt arbete med att förklara vad man måste prioritera bort varje gång man säger ja till något. Träning i att säga "yes and..." istället för "yes but...". Att se och avgränsa tiden för specialister som annars kan bränna ut sig i perfektionism. Att sälja, förklara, sälja, förklara för en organisation som har mycket lite kunskap om vilket svårt område som teamet jobbar med. Roligt också att höra föreläsare från Reuters och NPR förorda att lyfta in tekniker från produktutveckling (dvs sånt som är ryggraden för Insatsstyrkan - tidsestimat, tid för kompetensutveckling, parprogrammering, med mera. Nicar gör att jag känner mig mindre ensam. Och bekräftar att jag är bra på det jag gör.

AI, AR och deep fakes

Det är tydligt att intresset för AI och machine learning är stort - vissa föreläsningar var fullsatta trots att de hölls i den största salen. Överlag kan man väl konstatera att det finns en sund skepsis mot alla panikvarningar som brukar komma med ny teknik. Om AI kan kan skapa fejkfilmer där det ser ut som att det är Trump som pratar, så kan AI också tränas på att upptäcka fejkfilmer. För att inte tala om hur alla verkar ha glömt att det sedan arabiska våren finns etablerade verktyg för källgranskning med klassiska journalistiska metoder (såsom http://verificationhandbook.com/), vilket Sam Gregory från WITNESS påminde om.
En av de mest tankeväckande panelisterna under Nicar19 var Latoya Peterson från Data & Society. https://datasociety.net/people/peterson-latoya.
Bland mycket tänkvärt väckte hon frågan om vilken framtid vi får när bias byggs in i tekniker som voice och face recognition, som skapas utifrån exempelvis en vit manlig norm, och gör det svårare för minoriteter att göra sig förstådda när de pratar med röststyrda enheter.

 

NICAR 2019: Hela listan på allt vi gick på

• Info om alla punkter hittar du här
• Tips och dragningar hittar du här

  • 25th CAR: What a ride it's been!
  • Advanced SQL: Working with dates, sub-queries and more
  • After a disaster: Long-term reporting on floods, fires and other emergencies
  • An introduction to data visualization with Tableau (Hosted by Tableau)
  • Avant garde data viz
  • Bring your investigative reporting to life using animation and comics
  • Building and telling a bulletproof data story
  • CAR throwback
  • Creative ways to teach difficult concepts
  • Data blitz
  • Design thinking for journalists (en bit)
  • Doxxing for good: Tracing your online footprint before hackers can
  • Easy machine learning for data journalists
  • Finding untold stories in unfamiliar communities
  • Finding your data story: Visual analytics best practices using Tableau (Hosted by Tableau)
  • From messy data to insightful story: Cleaning data using Tableau (repeat, hosted by Tableau)
  • (Generally) painless collaboration with the greater newsroom
  • Holding algorithms accountable
  • How and why to make your data analysis reproducible
  • How it works: Artificial intelligence
  • How it works: Blockchain
  • How it works: The internet (for journalists who want to scrape it)
  • How to help your TV newsroom achieve a data journalism mindset.
  • How to make your data stories shine for different audiences
  • How to turn data into human stories
  • Interactive viz for news readers’ beliefs
  • International meet & greet
  • Intro to R
  • Introducing Slidetrack: Visual annotation for your podcast
  • Introduction to digital security
  • JavaScript 1: Fundamentals and syntax
  • Javascript 3: Building a map in D3
  • Lightning Talks
  • Machine learning and investigative reporting
  • Management: leading the data reporting team
  • Master class: Design thinking for journalists
  • Master class: leading the data team
  • Master class: self-editing & bulletproofing the data
  • Master class: Telling the datastory across platforms
  • MySQL
  • Observable notebooks: Your interactive data journal
  • PDF 3: Batch pdf processing
  • PostgreSQL
  • Preparing for the future of disinformation and deep fakes
  • Python: Basic mapping and GIS
  • Python 2: Intro to data analysis using pandas (repeat)
  • Research on the beach: Deep diving
  • Seeing the story: How to write the data-driven investigation
  • Share your work: Publishing your data analysis with R
  • Spatial queries in PostGIS
  • Sports data visualization in R
  • The latest digital tools
  • The next 25 years of CAR
  • Three open-source workflow tools that your newsroom could use today
  • Under pressure: real life in real time with breaking news
  • Welcome first-timers
  • Writing the data-driven narrative
  • Year in CAR
  • Year in international CAR
  • Grunden i vår journalistik är trovärdighet och opartiskhet. Sveriges Radio är oberoende i förhållande till politiska, religiösa, ekonomiska, offentliga och privata särintressen.
    Du hittar dina sparade ljud i menyn under Min lista