Nyttiga länkar från NICAR 2018

NICAR 2018 – Våra lärdomar och tips!

69 avbetade dragningar, hands on-workshops och specialkurser! Digitala insatsstyrkan har gjort sitt bästa för att täcka in så mycket som möjligt av den tvärfunktionella konferensen Nicar 2018. Här följer massor av länkar till nya verktyg, inspirerande publiceringstips, och våra spaningar kring läget för den digitala journalistiken.

Generella spaningar hittas här

Listan på de 69 punkter vi betade av finns här

Innehållet i denna artikel:

1. Andrew Dry, webbutvecklare
Siffror i radio, R-ett populärt verktyg för att preparera och undersöka data, Google News Labs verktyg för dataimportering, bearbetning och publicering, Att identifiera personer eller platser med alternativa stavningar
2. Yasmine El Rafie, produktägare
Tvärfunktionell språkförbistring, "More bibles, fewer priests:
Tools for running self-managing teams", Gör din infografik såhär, Kreativ verbal analys - boom!, Design för dummies, Hybrid-team rockar!
3. Niklas Emilsson, systemutvecklare
Machine learning inom journalistik, Datakit-kommandoradsmall för dataprojekt, Ordning och reda – Bulletproofing Data, Så presenterar du torr data på ett roligare sätt, Tips för att arkivera datajournalistik
4. Eric Weber, datajournalist
Verktyg för att granska internationella bolag, Tips för tvärfunktionella team, Tips för att komma igång med "machine learning", Chattbottar: Håll det enkelt!, Kan man använda blockchain för att motverka falska nyheter?, Hur granskar man algoritmer?, Tips för internationell data, Audiolisering! 
5. Maksim Goobar, digital designer
"Ensam på redaktionen", Hur ska vi använda grafer?, Comics <3, Teknik + storytelling, Audioliseringsverktyg på G?, "First graphics-app", Vad händer med våra blobbar?
6. Lilly Kronlund, datajournalist
Återanvänd ditt arbete, Förenkla!, Datajournalistik för att berätta om minoriteten, Lagra data i molnet eller krypterat, Hämta dina satelitbilder från Google, Vad är en nerd box, Undvik nybörjarmissarna!

Siffror i radio
Under sessionen "Deep dives for radio and podcasts" nämndes några konkreta tips:

  • Undvik siffror i ljuden även om det finns data bakom.
  • Lägg siffror i påan och hantera reaktionen på siffran i ljudet
  • Få intervjupersoner att säga siffran om avslöjande. Låt flera personer testa, och plocka den som har bäst naturlig reaktion på siffran.
  • Om ljudet måste innehålla siffror – berätta sammanhanget först.
  • Banda allt. Skapa ordning och reda på klippen (märk upp) så att du lätt hittar när du ska klippa.

 Läs mer: Deep dives for radio and podcasts

R ett populärt verktyg för att preparera och undersöka data
På de populära "hands-on"-sessionerna lärdes grunderna i R ut. Fördelen mot program som Excel är att det går att spara alla instruktioner i skript som går att köras om – utan att alla steg i analysen behöver göras om manuellt.

Läs mer: En introduktion till R

Google News Labs verktyg för dataimportering, bearbetning och publicering
Datajournalisters arbetsflöde följer i grova drag ordningen: definiera, hitta, hämta, verifiera, preparera, analysera och presentera. Både praktiska övningar och presentationer av olika onlineprodukter gjorde denna super-session (2 timmar) intressant genom att visa hur journalister på ett enkelt sätt kan samla in (Google spreadsheets), analysera (OpenRefine, Google Cloud Dataprep) och presentera data (Google data studio).

Läs mer:
Google News Lab
Google Data Studio

Att identifiera personer eller platser med alternativa stavningar
Namn i olika dataset kan bli lättare att matcha genom att använda csvmatch. Testa att matcha med stöd av "fuzzy" sökning baserad på Levenshtein (matematisk), Metaphone (phonetisk) och Bilenko (AI, maskininlärning).

Läs mer: "Finding needles in haystacks with fuzzy matching"

Tvärfunktionell språkförbistring
Något som var återkommande redan dag ett, var hur tvärfunktionella team ska jobba harmoniskt med varandra och med den ganska annorlunda arbetskulturen som råder på redaktioner.

En av utmaningarna, som vi också känner igen i insatsstyrkan och jobbat med att lösa med allt från visuell istället för verbal kommunikation, till levande charader med teknikuttryck – är skillnader i vokabulär. En utvecklare och en reporter kan exempelvis mena helt olika saker med "fort".

Därför var punkten "What the hell is D3? And other questions you're afraid to ask" både underhållande och värdefull. Det kvarhängande rådet är att utveckla ett eget esperanto, ett mellanspråk som kombinerar lingo från redaktioner och produktutveckling.

Tipslänken är ett minilexikon att sätta i händerna på låneredaktörer och andra nykomlingar som dimper ner för att jobba med oss. Avslutas dessutom med ett litet test!

Gör testet här

"More bibles, fewer priests:
Tools for running self-managing teams"
Brian Boyer har tidigare varit nån sorts sorts motsvarighet till mig, på NPR Visuals. Hela dragningen var inspirerande, men i synnerhet verktygen/metoderna han listade, som också de var bekanta:

  1. Daglig Scrum
  2. Arbetsbeskrivningar eller responsibility matrix för att etablera ansvar 
  3. Deployment checklist (vi har definition of done)
  4. Kadens! Skapar trygghet och förutsägbarhet

Tipset här blir helt enkelt Brians egen blogg – en sån där ovanlig sak där någon annan grubblat över hur tusan man leder tvärfunktionella journalistikteam.

Till bloggen om tvärfunktionell journalistik

Gör din infografik såhär
Panelen "Bring your investigative reporting to life using animation and comics" intressant var intressant att lyssna på! Ska du göra en animation, rekommenderar Vox följande:

  1. Research - sätt dig in i materialet och lista vinklar och format som stöds bättre med bild.
  2. Write - skriv ett bildmanus i kolumner där du parar text med visuellt material du behöver ta fram.
  3. Produce - rita/leta upp det bildinnehåll du saknar.
  4. Animate - animera ditt bildinnehåll.
  5. First draft - skapa en så enkel första version du kan, för att se att du fått med allt och tänkt rätt.
  6. Second draft - den snygga versionen du vill ha.
  7. Tweaks and tests.

Till Vox's "Bring your investigative reporting to life using animation and comics" (slide 24 ff)

Kreativ verbal analys - boom!
De flesta vet vad ordmoln är, men det finns mycket mer kreativa sätt att hitta nyheter i stora textmassor. (Och textmassor kan man skapa genom scraping såväl som och av massor med dokument.) Tricket är att vara kreativ kring vad ord kan säga om något, liksom att ta klustringsalgoritmer till hjälp.

Hitta många fiffiga exempel här

Design för dummies
Som sagt. Jämfört med tidigare Nicars har denna verkligen lyft sig ännu mer i bredd. En intressant punkt om design handlade om vad icke-designers borde ha i bakhuvudet. Ska man förenkla det så kokar det ner till: Contrast, Alignment, Repetition, Hierarchy. Vänster- eller högerställ framför mitten, gruppera och organisera efter viktighetsgrad, och ta i när det gäller skillnader. Tydligt.

Coolors.co genererar en smakfull färgpalett för den som ska designa något men saknar designskills.

Hybrid-team rockar!
Viktigast om du ska sätta ihop ett tvärfunktionellt team (i prioordning):

  1. Klura ut vilka förväntningar din chef har på vad det ska bli och vad teamet ska göra.
  2. Kartlägg vilka andra team du kommer att behöva jobba med, och hur stor del av din framgång som kommer bero på din relation till de teamen
  3. Först som trea:
    Avgör, utifrån ovanstående, vilka skills medlemmarna behöver ha. (Utöver hantverket väger samarbetsvilja tungt, till exempel).

Det är konstigt hur mycket det kan hjälpa att känna att man inte är ensam därute.

För det är ju inte (enbart) jag som säger detta alltså, utan Jon McClure på:

Politicos motsvarighet till Digitala insatsstyrkan.

Machine learning inom journalistik
Anthony Debarros höll en väldigt bra introkurs till PostgreSQL. Där får du lära dig installera programvara och flera användbara SQL-frågor och funktioner för både spatial data och full-text-sökningar.

Till dokumentationen på IRE:s webbplats och på GitHub.

Datakit-kommandoradsmall för dataprojekt
Jag och Andrew gick båda på sessionen om "DataKit" som tagits fram av Associated Press. Det är ett CommandLine-verktyg (inget GUI) som via kommandon skapar ett mallbaserat projekt, och har som syfte att automatisera de tråkiga uppsättningsdelarna av ett "dataprojekt".

Läs mer: Datakit på GitHub

Ordning och reda – Bulletproofing Data
Bulletproofing betyder att säkra upp sin data, sin story och ha ordning på saker och ting.

Övergripande tips är att ha en version av grunddata/masterdata/rådata orörd på ett ställe och göra kopior versionshanterade så en tydlig logg förs över arbetet så det går att backa fram och tillbaka i sitt jobb och återställa och reproducera sitt resultat.

Data och filer som används från internet ska laddas ner i en lokal kopia och versionshanteras så det loggas när vilken data hämtades från vart.

Läs mer om presentationen: Bulletproofing Data.
Tips och användbara länkar här.

Så presenterar du torr data på ett roligare sätt
Om det du ska berätta bygger på ett material som känns torftigt eller trist och inte väcker något "wow"-intresse för publiken kan det vara en idé att göra en kul ingång till ämnet som är mer lättillgängligt.

Ett exempel som gavs på en session handlade om ett träslag som är utrotningshotat och förbjudet att exportera, men som används vid byggandet av instrument. Här börjar presentationen – ett radioinslag – med musik med instrument som är gjorda av detta träslag, för att sedan gå över till den andra delen i storyn.

Länk till sessionen finns här

Tips för att arkivera datajournalistik
Journalistik som paketeras i olika interaktiva lösningar, som sökbara databaser, kartor med mera riskerar alla att en dag sluta fungera på det sätt de en gång gjorde. Detta sker successivt i och med utvecklingen av nya hårdvaror, mjukvaror och olika plattformar.

Ett grundläggande tips för att överkomma detta är att tänka på att göra "enkla" de-facto-standard-lösningar som har mindre risk att sluta fungera.

Exponera åtminstone de data som arbetet bygger på på något sätt, exempelvis i en fil, till exempel en statisk html-sida på ett ställe där det är säkert att den funkar och inte är beroende av externa resurser som du inte har kontroll över.

Ett ytterligare alternativ är att dokumentera produkten i form av en video – filma vad som är gjort, hur det funkar och hur det ser ut. Då finns det alltid en chans för publiken att efteråt få en uppfattning och känsla för vad som gjorts.

Läs mer: Sessionen "Archiving data journalism"

Verktyg för att granska internationella bolag
Jag var på en demo av OpenCorporates – en internationell databas som innehåller uppgifter om uppemot 135 miljoner bolag världen över. Kände inte till den sedan tidigare, och fick verkligen lust att utforska den.

Några stora usp:ar är att den endast innehåller data från myndighetskällor, att det även finns historiska bolagsdata, samt att de är noggranna med att dokumentera varifrån (och från när) varje datapunkt är hämtad. 

Läs mer: OpenCorporates

Tips för tvärfunktionella team
Var på ett för Digitala insatsstyrkan väldigt relevant panelsamtal om hur man bygger välfungerande tvärfunktionella team. Många av de svårigheter - inte minst kring språkförbistringar och konflikter mellan olika arbetssätt - som lyftes upp var bekanta.

Några konkreta tips som gavs var att hålla hårt på retrospectives, och att mentorsprogram eller "ridealongs" kan göra det lättare att förstå vad personer med andra kompetenser gör.

Läs mer: "Building happy cross-functional teams"

Tips för att komma igång med "machine learning"
Besökte ett panelsamtal om "machine learning" inom journalistik. Ett av de främsta användningsområdena är när man har ett stort (och eventuellt rörigt) dataset där allt inte är ordentligt klassificerat. I sådana fall kan man ofta automatisera en del av arbetet för att effektivisera.

Ett annat konkret tips var att inte endast använda den rådata man har, utan försöka bryta ut nya variabler ur den, för att ge algoritmen fler möjligheter att hitta det som är intressant och sticker ut.

Ett inspirerande exempel som visades var Buzzfeed News kartläggning av amerikanska övervakningsflygplan med hjälp av algoritmen Random Forests och databasen Flightradar24.

Se den här: BuzzFeed News Trained A Computer To Search For Hidden Spy Planes. This Is What We Found.

Chattbottar: Håll det enkelt!
Under programpunkten ”How emerging technologies can aid your storytelling” gav Emily Withrow från Quartz (som precis lanserat en Facebook Messenger-bot) några tips på saker att tänka på när man utvecklar en chattbot.

”Too much choice is overwhelming”.

  • Undvik att ha med för många menyer och valmöjligheter.
  • Att tvinga användare att välja väg inom en chattkonversation (och därmed välja bort en annan möjlig väg) gör vissa nervösa.
  • En egenartad personlighet kan vara bättre än en torr och saklig ton.

Läs mer: om Quartz nya chattbot

Spaning: Kan man använda blockchain för att motverka falska nyheter?
I takt med att så kallade "deepfakes" - superrealistiska videoklipp skapade med hjälp av AI - blir vanligare (exempel), hur ska publiken kunna veta vad som är äkta och inte? Ett förslag som har lyfts upp under flera programpunkter är att medier kan börja använda blockchain-teknik för att märka sitt egna, faktagranskade innehåll.

Hur granskar man algoritmer?
I takt med att algoritmer har inverkan på allt fler delar av samhället – till exempel amerikanskt rättsväsende – blir det viktigt för journalister att försöka granska dem. Men det är ofta lättare sagt än gjort. Under programpunkten "Algorithmic accountability" listades några av de problem som journalister ofta stöter på, bland annat:

  • Även när algoritmer används av aktörer inom offentlig sektor är de nästan alltid utvecklade av privata underleverantörer, vilket gör det svårt att begära ut källkod.
  • Det saknas i många fall ordentlig dokumentation.
  • Många algoritmer ändras regelbundet.
  • Många sajter förbjuder uttryckligen försök till "reverse engineering" i sina användarvillkor.

Ett konkret tips som gavs var dock att – i de fall en algoritm används inom offentlig sektor – försöka begära ut annat än själva koden, till exempel uppdragsbeställningar till underleverantörer, beslut, mejlkorrespondens eller annat som kan ge ledtrådar till hur algoritmen har tagits fram.

Exempel: Algoritmer som används inom amerikansk offentlig sektor

Tips för internationell data
Under sessionen "No passport needed: How to find relevant international data" gav Giannina Segnini från Columbia University en rad tips på dataset för internationella granskningar, bland annat:

Läs mer: "No passport needed: How to find relevant international data"

Audiolisering!
För oss är det alltid inspirerande med exempel på datajournalistiska projekt som har ljudet i fokus. Ett sådant, som togs upp under programpunkten "Finding and using climate change data", var radiostationen WNYC:s audiolisering av inomhus- och utomhustemperaturer under en värmebölja i New York.

Lyssna här: Hear the Heat: Our Song Demonstrates What it Felt Like Inside Harlem Homes This Summer

"Ensam på redaktionen"
Under sessionen "The only one in the newsroom" tipsade tre personer om hur de gör när de är ensamma med sin kompetens på sin redaktion. Det stämde väldigt väl överens med hur vi jobbar. Några tips som gavs var: Se till att få mandat, prioritera, skapa backlog, tacka nej, ta in journalister, parprogrammera, dokumentera, återanvänd, och inse vad som är framgångar.

Läs mer: The only one in the newsroom

Hur ska vi använda grafer?
Två föreläsningar på Nicar – "Use which graphs when" och "All charts lie" – handlade om hur grafer ska se ut och användas (eller inte användas). 
Den första, som hölls av designers, tryckte mycket på att förenkla (men var mycket ur ett visuellt perspektiv, att inte överlasta användaren). Här lades kommentaren ”om du behöver förklara så är det inte bra”.

Den andra, som hölls av en journalist som gått mer åt det akademiska, tryckte istället på att inte förenkla saker. Istället ska man presentera en helt korrekt graf, tillsammans med en utförlig förklaring över felmarginaler och liknande.

En gemensamt slutsats från båda föreläsningarna skulle kunna vara "Uppfinn inte tvetydiga grafer/visualiseringar". Men frågan återstår: Förklara eller inte förklara?

En rolig visualisering som visades, från National Geographic: Sizing up Sharks, the Lords of the Sea

Comics <3
Under programpunkten "Bring your investigative reporting to life using animation and comics" gavs exempel och tips på hur man kan använda animationer och comics i explainers och reportage. 

Bland annat kan man använda dem för att förklara system, relationer och händelseförlopp, göra anonymiseringar mer livfulla, berätta äldre material och historier på nya sätt, samt att förklara data och vetenskap.

Exempel: The fallen of WW2

Teknik + storytelling
Vox Media pratade under sessionen "How emerging technology can aid your storytelling" om hur de försöker innovera sitt CMS, bland annat genom ett nytt format för artikelsamlingar.

Läs mer: Hur Vox designade och skapade sina artikelsamlingar

Audioliseringsverktyg på G?
Google News Lab berättade under samma session om ett antal verktyg och utforskningar de arbetar med. Ett exempel är deras Data Gif Maker, som skapar en gif utifrån datapunkter. De nämnde också att de utvecklar ett "sonification"-verktyg som är tänkt att lanseras som en template i tjänsten Flourish (som även utan den har mycket potential).

"First-graphics-app"
Jag gick en heldagskurs där vi fick bygga en s.k. "graphic stack" (en webbartikel med ett antal visualiseringar efter varandra) i form av en kopia på denna

Detta gjordes med hjälp av Javascript, HTML och CSS inom ett Node.js-framework. Processen förenklas genom att använda verktygen Yeoman och Yeogurt som agerar generator av en projekt-template. Flera mediahus har tagit fram egna templates som de använder sig av för att snabbt kunna få upp sidor av detta slag.

Utförliga instruktioner för hela kursen finns här

Vad händer med våra html-blobbar?
Vi var på ett panelsamtal med en datajournalist, nyhetsarkivarie och bibliotekarie om hur vi kan arbeta för att inte förlora digital journalistik (speciellt sådan som innehåller tekniska komponenter som kanske inte varar, som våra projekt).

Det lyftes att varje organisation borde ha åtminstone en digital arkivarie. Även tjänster som Internet Archive och savemy.news nämndes som bra att integrera i sitt arbetssätt. Ben Welsh (favorit sedan gårdagen) föreslog fem budord: You shall not make a mess, You shall publish static files, You shall not depend on random links, You shall version manage CSS and base templates, You shall treat archives like platforms.

Återanvänd ditt arbete
Sessionen "How and why to make your data analysis reproducible" handlade till stor del om fördelarna med att automatisera delar av det journalistiska arbetet, att göra så att "metoden" blir återanvändningsbar. De var även generösa nog att dela med sig av de verktyg som de själva utvecklat.

Läs om verktygen här

Förenkla!
Många av föreläsningarna jag har gått på handlar om att förenkla. Förenkla ditt arbete. Förenkla för din publik. Förenkla dina tabeller. Förenkla för teamet. Fråga dig alltid om du kan förenkla det du gör.
Föreläsningen "Beyond the numbers: Turn data into characters in your story" handlade bland annat om att förenkla siffror genom att hitta en person som kan representera flera.

Läs mer: Beyond the numbers: Turn data into characters in your story

Datajournalistik för att berätta om minoriteten
Stora mängder data måste inte betyda att man berättar en historia om den stora massan. Mycket handlar om att hitta det som inte passar in – det som avviker från genomsnittet och vilken historia det kan berätta.

Läs mer: Data journalism that breaks the filter bubble (kolla även in talarnas tidigare arbeten)

Spaning: Lagra data i molnet eller krypterat
Det känns som det finns två läger inom datajournalistik: de som delar med sig av sitt material och de som vill hålla all sin information krypterad. Men bara för att man väljer det ena behöver det inte utesluta det andra – all data behöver inte hanteras på samma sätt.

Läs mer:
Risky research: Investigation on the deep web)
Super session: Free Google tools for data analysis and visualization

Hämta dina satellitbilder från Google
Google har en tjänst som heter Earth Engine som tillåter dig hämta hem satelit bilder, med några rader kod. Du behöver registrera dig med ett Google-konto innan du startar.

För att komma igång, följ stegen här

Vad är en "Nerd box"?
En så kallad "Nerd box" (nördlåda, om du så vill) är ett ställe där man förklarar metoden bakom sin granskning för publiken. Det kan till exempel vara ett blogginlägg, något kreativt i videoformat eller med en massa färgglada grafer, eller en white paper. Eller varför inte en steg för steg guide till hur arbetsprocessen ser ut.

För att få en större förståelse till varför Digitala Insatsstyrkan bloggar om sina projekt:

Undvik nybörjarmissarna!
I "How to avoid rookie data mistakes" uppmanar Alex Richards oss att inte göra nybörjarmisstagen. Hans grundläggande tips är:

  • Känn din data – Vad är det för något? Är det något som ser konstigt ut?
  • Gör kopior – Skriv inte i orginalfilen utan gör kopior.
  • Skriv inte över gamla filer – du vet aldrig när du behöver gå tillbaka för att kontrollera något.
  • Döp dina filer ordentligt – Det underlättar bland annat när du ska lista ut vilken version som din kollega (eller chef) har fått.
  • Dokumentera vad du gör – För din egen och teamets skull.
  • Förutsätt inte att den data du får ut stämmer.

Framför allt så ska du se till att du hittar en uppsättning verktyg som du gillar och bli bekväm med det. Du behöver inte kunna allt själv.

Läs mer: Så undviker du nybörjarmisstagen