Dit is het?tweede, en laatste deel van onze boekbespreking??Digital Humanitarians ? How Big Data is changing the face of humanitarian response? geschreven door?Patrick Meier. Het boek is werkelijk een?aanrader voor elke crisisbeheersingsprofessional of humanitaire hulpverlener, maar ook elke amateur (of Pro-Am) die op een positieve manier wil bijdragen aan?incidenten en crises?waar ook ter wereld. Veel van de principes die wij ook al tijden aanhangen worden besproken, zij het in een iets andere?context van humanitaire hulp en crisisbeheersing. Maar zeer veel is toepasbaar voor opsporing en misdaadbestrijding. Daarom een uitgebreid blog met geleerde lessen.
We bespreken kort een tiental?interessante cases waarin duidelijk wordt wat de kracht van open informatie, tools en kennis van velen kan brengen om misstanden aan de kaak te stellen en crises in kaart te brengen. Hoe het kan werken als marktplaats waarin vraag en aanbod slim wordt gekoppeld, maar ook hoe lastig het kan zijn om grote hoeveelheden data goed?te vinden, valideren en verwerken.
Tenslotte ronden we af met de boodschap die Patrick wil meegeven om er in de toekomst beter mee om te gaan: een slimme combinatie van computers en mensen (crowd-computing), tezamen met vooruitstrevend beleid en leiderschap van organisaties tot effectieve en effici?nte hulpverlening kan helpen. Naar onze bescheiden mening geldt dit voor Big Crisis Data, maar ook voor Big Crime Data.
Case 1: Wapeneigenaren in kaart gebracht
Op 23 december 2012 plaatste de New Yorkse krant The Journal News een kaart online met daarop alle wapeneigenaren uit het grootstedelijke New York (zo?n 33 duizend mensen) met naam, adres en woonplaats. Het idee voor de Gun Owner Next Door ontstond na de schietpartij op de basisschool Sandy Hook in Newtown, Connecticut van een paar weken eerder. De informatie op de kaart was publieke informatie en werd in een paar weken miljoenen keren bekeken. Maar de kritiek die volgde werd enorm.
E?n van de problemen was dat je op de kaart ook de adressen kon vinden van politieagenten of gevangenisbewaarders. Criminelen gebruikten deze kaart dan ook om hen te bedreigen. Ook het plannen van overvallen of inbraken werd hiermee een stuk eenvoudiger: je kon eenvoudig adressen uitzoeken waar je niet het risico liep om neergeschoten te worden of je was juist op zoek naar een wapen (met een straatwaarde van enkele honderden euro?s). Maar er waren meer redenen. Ook burgers die geen wapen hadden voelden zich extra kwetsbaar door het delen van de kaart. Iemand zei het treffend: ? Ik heb nooit een wapen gehad, maar nu heb ik geen keus meer?. Ik ben onderkend als iemand die geen wapen in huis heeft, en ik zal alles, echt alles, doen om mijn familie te beschermen?.
Ook de journalisten die de kaart hadden gedeeld werden met de dood bedreigd en kregen (bewapende) bewaking. Zo werd er ook een kaart gemaakt met de NAW gegevens van deze journalisten en wat achtergronden van ze, zoals waar hun kinderen op school zaten. Er kwamen veel verdachte pakketjes met poeder binnen op de nieuwsredactie (gelukkig allemaal onschuldig).
Na een paar weken haalde de krant de kaart van het internet die, naar later bleek, ontzettend veel fouten bevatte omdat?de gegevens van de wapenregistratie deels onjuist waren.?Deze journalisten deden niets illegaals, omdat ze gebruik maakten van publiek beschikbare data. Toch laat de casus laat zien dat er ook een ethische norm is, er misbruik gemaakt kan worden van data, en het (soms onverwachte) vervelende gevolgen kan hebben.
Case 2: Grote branden en verkiezingen in Rusland
Slechts 4% van de Russen zegt de staatsmedia te vertrouwen. Nieuwsgaring is daardoor lastig en vaak niet te vertrouwen. Tijdens de grote branden in Rusland wilde Gregory Asmolov een soort Match.com kaart maken waarin vraag en aanbod aan elkaar gekoppeld werd. Meer dan 100.000 unieke gebruikers hielpen met de kaart die een kwart miljoen kijkers trok. Op een Russisch blog stond: ” Zonder opdracht, zonder echte stimulans en niet voor de roem, gingen mensen de taken van de staat overnemen…. Er?werd duidelijk?dat de combinatie van actieve mensen, de nieuwste technologie?n van gedistribueerd werken, het gebrek aan formele restricties en onuitputbare hoeveelheid kennis op het internet met een relatief kleine groep tot geweldige impact kan leiden voor een enorm groot gebied.” Het initiatief?kreeg er de Russische Internet Oscar voor en ze mochten bij president Putin op bezoek.
Tijdens de verkiezingen van 2011 in Rusland is ook een crowdmap online gezet om de fraude in kaart te brengen. Nu weet iedereen wel dat er fraude gepleegd wordt tijdens dergelijke verkiezingen, maar een poging om het structureel in kaart te brengen was nog niet gedaan, iets wat samen met verkiezingswaakhond?GOLOS werd gerealiseerd.
Pro-Kremlin activisten vonden de kaart een doorn in het oog “de rode puntjes op de kaart zijn als een ziekte op het gezicht van moeder Rusland”.?Het GOLOS initiatief kreeg zelfs een boete van $1000 van het Russische gerechtshof (met een zojuist aangenomen wet) en er waren verwoede pogingen om de kaart illegaal te verklaren.
Case 3:?Opstanden in?Libi??
Er valt veel meer over deze indrukwekkende casus te vertellen, vooral omdat het een hele lange periode besloeg. Bijzonder was ook dat deze keer een crisiskaart in samenwerking met de VN werd gelanceerd. Het betrof een publieke?crisiskaart waarin mensen mee konden helpen om de situatie van Libi? en omringende gebieden op een betrouwbare manier ?in kaart te brengen.?Binnen 72 uur hadden zich 18.000 mensen gemeld en waren er 50.000 kijkers uit 65 landen. Een kernteam van zo’n 300 mensen van de Standby Task Force (SBTF) toonden hun kunsten als ‘mapsters’ en ‘crowdsourcerers’ en rapporteerden meer dan 1400 belangrijke wetenswaardigheden afkomstig uit meer dan 100 social media bronnen in slechts een paar weken. De?Standby Task Force groeide uit tot meer dan 1000 vrijwilligers uit zo’n 80 landen.
Werving van betrouwbare mensen
Het werven van crisismappers en microtaskers komt nauw, zeker bij crises waarin de belangen van het volk niet worden gediend. De situatie in Libi? was er zo een. Hoe kom je dan aan betrouwbare mensen? Om dit enigszins te kunnen bepalen had het SBTF de ” Ik ben Gaddafi niet” test gemaakt. Hieronder de uitleg in het Engels:
“As you know, the situation in Libya is intense, and there are security challenges in creating a crisis map of a hostile environment. So please don’t take it personally that we ask about your background, we just need to make sure you’re not Gaddafi! So the more official information you can share about yourself, the faster we’ll be able to give you access to the crisis map. We promise that none of your information you share with us will ever be made public. We are not Facebook! 🙂 We promise we won’t ask any more questions after you’ve passed the ‘I’m not Gaddafi’ test!”
In een kort formulier vroegen ze nieuwe?vrijwilligers om hun professionele of academische mailadressen (geen Gmail of Yahoo adres dus) en ook social media referenties, zoals je Twitter, Facebook of LinkedIn account. Maar ook als je een blog hebt of andere aanwijzingen kunt geven dat je een betrouwbare kracht bent. het is natuurlijk geen waterdicht systeem, maar ook start-ups zoals AirBnB gebruiken dergelijke mechanismen waarmee huiseigenaren de vreemden kunnen bekijken die ze in hun huis toelaten.
Betrouwbare systemen waren ook wel nodig. Zo werd?bijvoorbeeld IntaFeen.com gebruikt als een soort Foursquare om te laten weten waar je was. Veel transportroutes naar en vanaf Tripoli werden op deze manier handig gemanaged met gratis digitale platformen.
Trouwe vrijwilligers
Iedereen was zeer actief. Bijvoorbeeld?Justine Mackinnon, die werkte als incident- en crisismanager op de luchthaven Heathrow van Londen. Nadat haar werk erop zat en het laatste vliegtuig midden in de nacht succesvol de lucht in was, dook ze op Skype om te helpen. Of Melissa Elliott, die haar kinderen elke dag?van school moest halen?aan de andere kant van de stad, en haar auto vaak aan de kant zette?om wat Tweets een goede plek op de kaart van Libi? te geven. Een?vrijwilliger uit Egypte excuseerde zichzelf dat ze haar gebruikelijke bijdrage die dag niet kon doen, waarna bleek dat zij die dag op het Tahir plein gearresteerd en een paar uur vast had gezeten na een protestmars.
Omdat de vrijwilligers van de?Standby Task Force in vrijwel elke tijdszone van de wereld zaten, werd het klokje rond gewerkt en kon de crisiskaart van Libi? 24/7 bijgehouden worden.
De crisiskaart van Libi?:
Case 4: De tyfonen in de Filippijnen
Tijdens tyfoon Pablo en ook anderen die volgden werden weer nieuwe tools ingezet, zoals die van?CrowdCrafting.?Hierin werden weer burgers centraal gezet in de hulpverlening online en gevraagd berichtgeving nader te duiden.
Andrej Verity (werkzaam bij OCHA) maakte met hulp van vele anderen daar onderstaande kaart van:
MicroMappers
Enkele maanden voor de allergrootste orkaan?op aarde, Yolanda (Haiyan) die op 8 november 2013 aan land kwam, werd MicroMappers gestart. Door Yolanda waren zo’n 2 miljoen mensen dakloos geworden en meer dan 6 miljoen mensen op de vlucht. Er vielen zo’n 6000 doden en na een jaar waren er nog steeds 20.000 vermist. In de stad Tacloban was 90% van alle gebouwen zwaar beschadigd of compleet verwoest.
Slechts een jaar daarvoor was tijdens orkaan Pablo het?Digital Humanitarian Network (DHN) ingezet om de schade en behoefte aan hulp in kaart te brengen. Toen lukte het de vrijwilligers om binnen 72 uur een kwart miljoen tweets, zo goed mogelijk gevalideerd, op de kaart te zetten.
Het initiatief MicroMappers (dat nog maar voor 30% voorbereid?was) maakte redelijk onvoorbereid gebruik van nieuwe tools als de ImageClicker en de TweetClicker (zie plaatjes hieronder) om de berichten onder grote groepen te valideren om vervolgens via de GeoClicker?tool gecheckt en wel op de kaart te verschijnen.?Per bericht was 1 reactie niet genoeg. pas als een grotere groep aangaf wat er op een foto stond werd dit overgenomen. Zo’n 5000 foto’s stonden klaar (door technische problemen waren slechts 1200 foto’s verwerkt) en 250.000 tweets, waarvan 55.000 unieke tweets. Binnen 72 uur werden er 30.000 tweets verwerkt waarvan 3.800 als relevant werden bestempeld en er 600 met redelijke zekerheid voorzien werden van een locatie zodat ze op de kaart geplot konden worden. Van alle binnengehaalde tweets was dus maar 0.3% relevant, wat maar weer aangeeft dat je op zoek bent naar een speld?in de hooiberg. Hoewel?Patrick Meier het liever niet over een hooiberg heeft, want een hooiberg is nog een bij elkaar geharkte berg naalden, wat op enige vorm van organisatie zou duiden. Hij heeft het liever over een willekeurig (wild) veld vol met spelden.
Je kunt jezelf ook aanmelden voor MicroMappers via hun website. Er is geen ervaring vereist en ook geen donaties. Alleen in de vorm van wat tijd. Maar ook het?Humanitarian Open StreetMap Team (HOT) was actief met?online?werkzaamheden?tijdens deze orkaan en zoekt nog extra vrijwilligers. Of bekijk?het resultaat van de MicroMappers na?orkaan Ruby in onderstaande infographic:
User Generated Content (UGC) Hub van de BBC
De User Generated Content Hub?bestond al een jaar voor de lancering van Twitter, en werkte als onderdeel van de BBC vanuit Londen. Hun voornaamste taak: het verifi?ren van berichten ten behoeve van?nieuwsgaring. In 2014 bestond het team uit?zo’n 20 digitale Sherlocks en ze gebruiken veel open source tools zoals Google Earth om bijvoorbeeld te checken of foto’s van bepaalde locaties echt kunnen zijn. ?Maar ze gebruiken ook andere gratis tools als Advanced Search van Twitter, TweetDeck, Geofeedia, NewsWhip, Facebook Search, Topsy, Reddit, Bing Social Network, Google Advanced Search, Banjo, Bambuser en Addictomatic.
Trushar Barot van de?UGC Hub zegt erover: “Mensen zijn zeer verbaasd als ze ontdekken dat we geen high-tech team, CSI?team zijn”.?Zijn chef Chris Hamilton springt bij “Het verifi?ren en ontkrachten van informatie uit het publiek leunt veel meer op journalistieke ingevingen dan op geavanceerde technologie”.
Maar ook dit team valt soms bijna voor de valse berichtgeving. Zo vonden ze in 2013?bijvoorbeeld een heftig filmpje van een Syrische soldaat die ogenschijnlijk levend begraven werd. De video was uniek en de soldaten spraken inderdaad de juiste taal, Alawiet een etnische groepering uit de juiste regio. Toch voelde er iets niet goed aan de video. De gymschoenen die ze droegen waren een dood spoor want deze schoenen werden inderdaad veel gedragen in deze regio. Maar hoe kon het dat de stem van de man die begraven werd zo duidelijk te verstaan was? Zou hij misschien een microfoontje gedragen hebben? En waarom eindigde de video precies toen zijn hoofd begraven werd? Was dit een acteur? Ze besloten de video toch af te keuren, omdat er teveel zaken niet klopten.
De UGC Hub gebruikt nu als criteria dat als ze de persoon die de berichtgeving de wereld in geholpen heeft niet kunnen spreken, ze in de meeste gevallen twijfelen aan het bericht.
Zo blijkt maar weer dat je geen Hollywood studio (zoals de film Wag the Dog) nodig hebt om zelfs de beste journalisten als collectief op het verkeerde been te zetten. En je hebt in dit geval niet veel?aan een IT expert op het gebied van?information forensics, maar moet vooral goede journalistieke vragen stellen.
Het is ongelooflijk waartoe we als mensen met moderne middelen van het internet toe in staat zijn, ook al maken deze middelen het (ook) mogelijk zand in het systeem te gooien. De bekende journalist Craig Silverman zei erover: “Never before in the history of journalism – or society – have more people and organisations been engaged in fact checking and verification. Never has it been so easy to expose an error, check a fact, crowdsource and bring technology to bear in service of verification”
Claire Wardt, social media verificatie expert van het Tow Center van Digitale Journalistiek van de Columbia universiteit valt deze groep bij. Ook zij weet dat 100 uur YouTube materiaal dat elke minuut online komt,?en 2 miljoen berichten op Facebook per minuut, niet door mensen te verwerken zijn. Aan de andere kant zegt ze ook “No technology can automatically verify a piece of UGC with 100 percent certainty. However the human eye or traditional investigations aren’t enough either. It’s the combination of the two” .
Een andere mooie quote (bron) die de complexiteit van dit soort informatieprocessen weergeeft is:
“It’s an illusion to believe that anyone has perfectly accurate information in mass emergency and disaster situations to account for the whole event. Of someone di, then the situation would not be a disaster or crisis” .
En de tijdsfactor is ook nog eens van belang (waarbij het adagium ‘roughly right or precisely wrong’?de afweging weergeeft):
“If you have ‘accurate’ info that is hours old, you don’t have accurate info in the social media world” – @TheFireTracker2 #TechAtState
? Patrick Meier (@PatrickMeier) February 3, 2012
Als de BBC ??n of twee nieuwsberichten mist is er geen man over boord, want voor een?gerenommeerd nieuwsmedium als BBC geldt de gouden regel?”being right is more important than being first“. Maar voor crisisbeheersing is geen informatie misschien nog wel kwalijker als onbetrouwbare informatie. Deze afweging moet dus gemaakt worden, ook bij het inzetten van informatievalidatie middels crowdsourcing.
Verily
De dienst Veri.ly is een zeer relevante ontwikkeling in dit kader. Deze dienst richt zich op tijd-kritische crowdsourcing voor het verzamelen en valideren van bewijsmateriaal, maar vereist ook wat van het kritisch denkvermogen en probeert dit in het crowdsourcing proces mee te nemen, gebaseerd op wetenschappelijke inzichten. Hieronder een voorbeeldje van hoe het werkt:
Veri.ly gaat verder dan?bijvoorbeeld Reddit, die laten zien dat het platform niet geschikt was om het kritische denkvermogen van de massa effici?nt in te zetten bij de aanslag tijdens Boston Marathon, omdat het group think?(algehele tunnelvisie) juist in de hand werkte. Reddit werkt overigens wel aan verbeteringen na dat incident, maar het platform heeft niet als voornaamste focus om informatie te valideren.
Case 5: Kyrgyzstan, juni 2010
Het geweld in de regio’s Osh en Jalal-Abad zorgden voor een algehele noodsituatie in dat gebied. Berichten over het aantal doden varieerden van 200 tot 2000 en schatting over het aantal vluchtelingen liepen uiteen van 100.000 tot 400.000.
Tattu Mambetalieva, een vrouw die een eigen NGO opgericht had onder de naam Civil Initiative for Internet Policy, startte een Skype groep en had binnen 2 uur zo’n 2000 mensen door het hele land aan de lijn in een groepchat. Meer kan een Skype groepchat ook niet aan overigens, waardoor ze later moesten overstappen naar een ander online platform om hun speurwerk te doen. Ook zij had een zgn.’trusted referral‘ systeem. m.a.w. je moest instaan voor de persoon die je aandroeg, omdat dit een gesloten systeem was, zgn. ‘bounded crowdsourcing’, of ‘ prosourcing’.
De groep was sterk in het valideren van berichten. Zelfs SMS berichten konden gevalideerd worden met hulp van locale telecom operators. De telecombedrijven konden daarna op hun beurt de geruchten dan weer via SMS broadcast heel gericht ontkrachten.
Case 6: Crowdsearching van Vlucht MH370, 8 maart 2014
Het Tomnod microtasking platform focust zich inmiddels al een aantal jaren volledig op satellietbeelden. Na het verdwijnen van vlucht 370 op 8 maart 2014 riep Tomnod op tot online actie om te helpen in het zoeken naar het vermiste vliegtuig op de verzamelde satellietbeelden die gezamenlijk meer dan 1 miljoen vierkante kilometer (!) besloegen. In slechts een paar dagen kregen ze de hulp van 8 miljoen vrijwilligers (meer dan de totale populatie van een land als Oostenrijk) die gezamenlijk in de eerste vier dagen 15 miljoen points of interest?aanwezen op de kaart waar hulpdiensten verder naar konden kijken. Op een gegeven moment waren op het platform (dat robuust bleef) zo’n half miljoen mensen tegelijkertijd aan het speuren op de kaart. Het kostte Tomnod wel een slordige $80.000 om te investeren in servers. Toch is dat een schijntje vergeleken met alleen al de dagelijkse kosten voor de inzet van het Australische marineschip van $550.000. De Amerikaanse en Japanse overheid besteedden ook nog eens 15 miljoen aan de zoekactie.
DigitalGlobe (dat Tomnod overkocht) had al wat ervaring opgebouwd met online crowdsourcing van satellietbeelden toen in 2007 rond Nevada een kleiner vliegtuig vermist werd met daarin Amerikaanse zakenman Steve Fosset. Zoekacties uit de ?lucht in de gigantische woestijn?leverden niets op. DigitalGlobe zette de beelden op Mechanical Turk van Amazon en 50.000 vrijwilligers speurden in zo’n 300.000 satellietbeeldjes. Helaas werd hij pas een jaar later gevonden toen een wandelaar een portemonnee vond. Toch heeft helaas nog niemand gepoogd te onderzoeken of die locatie nu?over het hoofd gezien is tijdens deze massale poging.
Middels hun CrowdRank algoritme bepaalde Tomnod welke van de 15 miljoen aanwijzingen als eerste met beeldexperts van DigitalGlobe gedeeld moesten worden voor nadere analyse. CrowdRank bepaald wie de meest betrouwbare taggers zijn voor de verzamelde beelden op basis van hoe anderen de beelden waarderen. De top 1% van de beste speurders kan Tomnod dan weer vragen voor moeilijkere taken. Luke Barrington van Tomnod?noemt het wel het crowdsourcen van crowdsourcing.
Het werd de grootste zoekactie ooit, waarin deze digitale manier van werken?onmiskenbaar gewaardeerd werd. Deze speld in het veld (niet een hooiberg) was nog lastiger te vinden, omdat het veld continu bewoog: de oceanische stromingen zorgen dat het vliegtuig kan afdrijven en natuurlijk ook zinken. Het werd een nauwkeurig proces van uitsluitsel (vergelijkbaar met de klassieke Sherlock Holmes) waarin de nieuwe werkwijze van microtasking misschien niet perfect was, maar wel redelijk snel grote hoeveelheden beelden aankon. Perfect waren de professionele hulpdiensten immers ook niet. Zo dacht een Chinese analist dat hij het vliegtuig had gevonden op een van hun eigen satellietbeelden.
Case 7: Genghis Khan?Somali?
Vanuit je luie stoel archeoloog spelen. Dat was het idee van het?Valley of the Khans Project?gesteund door National Geographic en geleid door Dr. Albert Yu-Min Lin die als moderne Indiana Jones op zoek was naar de gouden graal: de tombe van?Genghis Khan in Somali?. De uitdaging? Meer dan?2 miljoen vierkante kilometer afstruinen middels satellietbeelden met een resolutie van 50 centimeter. Pierre Izard van DigitalGlobe noemt het “een Big Data probleem dat nu nog massale menselijke hulp nodig heeft totdat software hier echt iets serieus in kan betekenen. De wervingstekst deed het echter goed:
Hello fellow explorers!
The entire Valley of the Khans team is very excited to begin the expedition to Mongolia but, for me, the adventure begins today. By enlisting the help of thousands of “virtual explorers” like you, we can start to uncover the mysteries of the Valley of the Khans right now!
The area that we will be exploring has been untouched for more than 800 years. There are no maps, no roadsigns and no one to ask for directions. But we’ve scanned the landscape with super high-resolution satellite imagery. By participating in the online exploration on this site, YOU can join our team by examining these satellite images and searching for clues that will guide our quest to discover the lost tomb of Genghis Khan. Maybe you’ll map out roads and rivers that our expedition can follow to make our way through this inhospitable territory. Perhaps you can identify traces of a nomad’s ger that might be a good place for us to camp. Or maybe you’ll see the buried outline of an ancient tomb that could be the clue we’re searching for…
Het idee was dus om je computer niet op zichzelf naar buitenaardse wezens te laten zoeken, zoals in het jarenlange [email protected] crowdcomputing onderzoek, maar om nu zelf als mens via je computer op avontuur te gaan, met het comfort en veiligheid van je luie stoel. Meer dan 10.000 vrijwilligers gingen door honderdduizenden beelden.
In Somali? werd overigens ook gezocht naar een kwart miljoen vluchtelingen nadat geweld in dat land uitbrak. Helaas door slechts 160 digitale vrijwilligers. Een groot contrast als je bedenkt dat in?de zoektocht naar Malaysian Airlines vlucht 370 een land zo groot als Oostenrijk (met 8 miljoen inwoners) samen zochten naar 120 passagiers.
Case 8: 10 rode weerballonnen
In 2009 loofde DARPA (Defense Advanced Research Project Agency) een beloning uit van $40.000 dollar voor diegene die het snelst 10 losgelaten weerballonnen kon vinden, die verspreid waren over de hele VS. Riley Crane van MIT kreeg wel een idee: dit lukt je niet alleen. ?Na een nachtje doorwerken had hij een online crowdsearching?platform gebouwd waarin hij een soort omgekeerde crowdfunding toepaste om het prijzengeld te verdelen onder de vele deelnemers die hij hoopte te vinden. Voor hun moeite kreeg de vinder van elke ballon $2000 dollar, maar degene die deze persoon had aangedragen (middels een referral) kreeg $1000 dollar, degene die hem had aangedragen $500 dollar enzovoorts. Het platform was dus ingericht om met grote groepen mensen te gaan zoeken, deze mensen te rekruteren en ze ook nog eens te belonen.
Het team won met glans. Het duurde geen weken, ook geen dagen maar om precies te zijn 8 uur en 4 minuten om alle ballonnen in een gebied van 5 miljoen vierkante kilometer uit te kammen, zonder dat het team uit hun stoel hoefde te komen. En het kon nog veel sneller, aldus de reactie van Riley: “De reden dat het zo lang duurde is dat we allerlei valse berichten van concurrerende teams slim moesten uitfilteren, en het verifi?ren van deze valse aanwijzingen heeft ons meer tijd gekost dan we dachten”. ?Toch werden alle ballonnen feilloos gevonden, ondanks dat notoir onbetrouwbare bronnen als Twitter werden toegepast.
Case 9: Syri??en de langstlopende crisiskaart tot nu toe
Op de online crisiskaart van Syri??zijn zo’n 4.000 ooggetuigenverslagen geplot op de kaarten zo’n 160.000 nieuwsberichten gecheckt en in kaart gebracht. Het is een indrukwekkend geschiedenisboek geworden, met enorme hoeveelheid detail dat middels een tijdsfilter stap voor stap teruggekeken kan worden. New Scientist noemde het “de meest nauwkeurige schatting van het aantal doden tijdens de opstand in Syri?… en het zou weleens de meest krachtige manier kunnen zijn om de menselijke schade van oorlog en rampen in kaart te kunnen brengen.”
10: Overige cases
Overstromingen in Queensland
De overstromingen in Queensland, Australi? uit 2010 en 2011 zorgden voor veel schade in een gebied dat bijna twee keer zo groot was als Engeland. Om Social Media berichtgeving te kanaliseren gebruikte de Queensland Police Service Media Unit diverse hashtags. Zo gebruikten ze #mythbuster om geruchten en valse informatie de wereld uit te helpen. Hieronder enkele voorbeelden van deze berichten die zeer effectief bleken:
#mythbuster: Wivenhoe Dam is NOT about to collapse! #thebigwet #qldfloods
#mythbuster: There is currently NO fuel shortage in Brisbane. #qldfloods #thebigwet
Vanwege het succes gebruikt de politie van Queensland gebruikt deze hashtag vandaag de dag nog steeds om geruchten te ontkrachten.
Ebola in kaart
Maar bijvoorbeeld ook Ebola wordt op dergelijke manieren in kaart gebracht middels het?Health Map Crisis platform:
Het platform bracht bijvoorbeeld 90% van het geweld in kaart met alleen maar vrijwilligers. En New Scientist voegt nog toe?dat “de data ook de regering en andere leiders ook verantwoordelijk kan houden voor hun daden’, kortom het DNA van deze inbreuk op de mensenrechten is digitaal vastgelegd en misschien iets dat het Haagse internationale gerechtshof in de toekomst zal kunnen gebruiken.
“We use Facebook to schedule our protests, Twitter to coordinate and YouTube to tell the world.” zei een digitale activist tijdens de opstanden van 2011 in Egypte.
De kracht en de last van beelden
Instagram is een mooi voorbeeld van hoeveel beelden er geproduceerd worden tijdens rampen. Tijdens orkaan Sandy bijvoorbeeld werden 1.3 miljoen plaatjes gedeeld, met pieken van 10 plaatjes per seconde die vrijwilligers moeten verwerken. Ook 1 uit de 4 tweets hadden links naar foto’s of video’s gerelateerd aan de orkaan (bron). En UAV’s schieten tegenwoordig ook veel beelden. Slechts 1% van alle gefabriceerde drones en UAV’s?worden voor militaire doeleinden ingezet. Democratisch gebruik ervan (zoals de Ebee) lijkt?dus niet meer te stoppen. ?Bekijk hoe men er al mee begon bij de ramp in Ha?ti:
Planet Four
Het Zooniverse team lanceerde bijvoorbeeld het project?PlanetFour (een verwijzing naar de rode planeet Mars) kreeg 15.000 bezoekers binnen 60 seconden na de aankondiging via de Britse BBC. Meer dan 2 miljoen beelden van de planeet Mars werden in maar liefst 48 uur getagged, om de planeet te verkennen op diverse bijzonderheden (bron). Dat terwijl de site niet crashte!
Snap Shot Serengeti
In een ander project zochten vrijwilligers in de Serengeti naar wilde dieren die met 225 automatische bewegingscamera’s waren vastgelegd. De vrijwilligers vonden het zo leuk om te doen dat ze klaagden toen de beelden op waren.
Planetary Response Network
NASA en vele anderen partijen kijken tegenwoordig naar de mogelijkheden om de massa in te zetten bij het zoeken naar details in beelden. Er zelfs een heus Planetary Response Network dat klaarstaat om bij te springen.
Militaire inlichtingen crowdsourcen
Er is zelfs een poging gedaan om militaire inlichtingen te crowdsourcen, in de Exploration Challenge waarin men militaire voertuigen moest spotten op satellietbeelden. Later bleek het gewoon een testje van Tomnod, en maar goed ook, want er werden diverse?kritische kanttekeningen geplaatst?over de ethische kant hiervan. Want als je als crowdsearcher niet weet wat je precies doet met welk doel, is dit dan wel verantwoord? Toch is vanuit Bellingcat inmiddels een soortgelijk project gestart om de verplaatsingen van militaire voertuigen in Oekra?ne in kaart te brengen.
Rode kruis
Wendy Harman en haar team van vrijwilligers zit ook altijd klaar in het Digital Operations Centre van Washington D.C. Tijdens de tornado?die over Oklahoma stad heen ging op 20 mei 2013 was ook zij met haar team in de weer om social media berichtgeving te vangen, duiden en in kaart te brengen. Normaal heeft het team een vaste bezetting van 3 mensen, die op een normale dag alleen al 4.000 berichten via Twitter naar hun hoofd geslingerd krijgen. Dus wat de digitale storm is tijdens een incident als de Oklahoma tornado kun je je voorstellen.?Ze zoeken onder andere ook naar tekenen van angst en emotionele stress tijdens de nafase van een ramp en bieden nazorg aan.
AIDR: Artificial Intelligence for Disaster Response platform
Crowdsourcen van honderden classifiers die benut kunnen worden om tweets beter te filteren en eventueel in eerste slag kunnen duiden. Tijdens de tyfoon Yolanda bracht deze techniek meer dan 250.000 terug tot 55.000 relevante tweets die handmatig bekeken moesten worden. Bij de aardbeving van Chili op 27 februari 2010 (met de grootste beving ooit gemeten op aarde van 8.8 op de schaal van Richter) werd uit meer dan een half miljoen tweets een selectie van 20.000 aangeboden waarvan maar 1000 handmatig getagged hoefden te worden (bron).
Onderzoek naar 5 miljoen tweets die tijdens deze ramp werden gepost, toont aan dat 95% van de tweets valide informatie weergaf. Slechts 0.03% van de tweets trokken deze bulk van twets in twijfel. Andersom gaf het onderzoek ook aan dat het aantal tweets dat andere tweets in twijfel trekt veel groter is bij een gerucht (soms werd zelfs de helft van de valse geruchten meteen in twijfel getrokken). De wijsheid van de massa en het zelfcorrigerend vermogen is sterk. En het wordt nog beter, want onderzoek?toonde ook aan dat twitteraars wiens tweets in twijfel worden getrokken voortaan beter opletten met het produceren en delen van informatie (een reductie van 150% in onbetrouwbare tweets). Toch kan je zomaar als crisisproferssional of burger in?de verkeerde hoek kijken. Technologische ondersteuning kan hierin gelukkig steeds beter helpen.
Met de hulp van Andy Carvin (eerst werkzaam bij de National Public Radio) lukte het steeds beter om semi-automatisch tweets op relevantie te filteren. Computers kunnen namelijk leren waar mensen ook op letten, en Andy leerde de computer zijn journalistieke skills om betrouwbare berichten te onderscheiden van onzin. Zo bleek dat?tweets met BREAKING NEWS en veel uitroeptekens die niet van journalisten afkomstig waren meestal niet erg betrouwbaar waren.
Andy weet als geen ander dat de meeste mensen met hun informatie je niet proberen te misleiden. Er zitten vaak maar een paar rotte appels tussen.
“The vast majority of folks that are posting information, their hearts are in the right place but sometimes the fog of war affects them just as it would any other journalist” (bron).
Betrouwbaarheid automatisch herkennen
Onder andere?Carlos Castillo?(nu collega van Patrick Meier bij QCRI) maakte op technisch?vlak mooie stappen middels zijn paper Predicting Information Credibility in Time-Sensitive Social Media. Hij maakte een classifier waarmee computers de waarheid van een tweet beter konden inschatten, op basis van geleerde eigenschappen uit diverse datasets. Iemand is betrouwbaarder als hij meer volgers heeft, URL’s in de tweets gebruikt en langere berichten plaatst. Hij stelde als eerste 16 eigenschappen vast die betrouwbare tweets onderscheiden van onbetrouwbare tweets:
??Average number of tweets posted by authors of the tweets on the topic in past.
??Average number of followees of authors posting these tweets.
? ?Fraction of tweets having a positive sentiment.
? ?Fraction of tweets having a negative sentiment.
? ?Fraction of tweets containing a URL that contain most frequent URL.
? ?Fraction of tweets containing a URL.
? ?Fraction of URLs pointing to a domain among top 10,000 most visited ones.
? ?Fraction of tweets containing a user mention.
? ?Average length of the tweets.
? ?Fraction of tweets containing a question mark.
? ?Fraction of tweets containing an exclamation mark.
? ?Fraction of tweets containing a question or an exclamation mark.
? ?Fraction of tweets containing a ?smiling? emoticons.
? ?Fraction of tweets containing a ?rst-person pronoun.
? ?Fraction of tweets containing a third-person pronoun.
? ?Maximum depth of the propagation trees.
Hij kwam met deze methode al tot een 86% betrouwbare voorspelling. Annotaties van datasets, gedaan door betrouwbare vrijwilligers zouden in de loop van de tijd deze eigenschappen nog verder verfijnen. Inmiddels kan TweetCred?(een plugin voor Google Chrome) zo’n 45 eigenschappen onderkennen en wordt al toegepast om zgn rumor bombs te herkennen. Een mooi voorbeeld van hoe artificial intelligence door crowdsourcing gevoed wordt (computers die iteratief leren van mensen). En ook het Twitter leugen detector project Pheme, of het EU project Social Sensor met hun alethiometer (Alethia is Grieks voor waarheid) is wat dit betreft interessant om te volgen. Naast de verzamelde lessen in het Content Validation handboek natuurlijk waarover we al eerder blogden.
Deze technologie kan van pas komen, zeker als geruchten machines prominent zijn.
Tijdens de Boston Marathon bleek uit onderzoek van 8 miljoen (unieke) tweets van 3.7 miljoen accounts, dat 29% van de berichten die viral gingen een gerucht betrof. En 51% van de berichten waren algemene meningen en commentaar, niet per se relevant voor hulpinstanties. De overgebleven 20% was echt relevant te noemen. Deze geruchten waren deels afkomstig van 32.000 Twitter accounts die nog tijdens de ramp aangemaakt werden. Zo’n 20% daarvan werd enige tijd later door Twitter opgedoekt, en naar later bleek dat 99% van deze accounts het woord “Boston” in het account staan. Toch zijn veel van deze accounts zeer invloedrijk geweest in hun berichtgeving. Toch worden er lessen getrokken die in algoritmes te vangen zijn. Zo bleek onder andere dat deze accounts specifiek gedrag vertoonden en vaak ook met elkaar communiceerden. Maar of dergelijk gedrag te generaliseren is naar andere incidenten blijft de vraag.
Een vervolgstudie naar maar liefst veertien grote gebeurtenissen (oa de Londense rellen, aardbeving Virginia, de opstanden in Libi? en orkaan Irene) Credibility Ranking of Tweets during High Impact Events uit 2011 onderzocht 35 miljoen tweets. Daaruit bleek dat zo’n 30% van de tweets waardevolle informatie ten behoeve van omgevingsanalyse bracht en 14% echt spam was. Zo’n 17% van de totale informatie was niet allen relevant, maar ook aantoonbaar betrouwbaar. Deze technologie werd deels ook toegepast om de vele beelden die bij orkaan Sandy langskwamen te beoordelen en het bleek dat het algoritme tot 90% betrouwbaarheid kon komen. Sterker nog, de computer leek beter in het bepalen van de betrouwbaarheid op basis van de eigenschappen van de tweet dan de eigenschappen van het twitteraccount. Ook bij Sandy bleek weer dat er een kleine kerngroep verantwoordelijk was voor het produceren of retweeten van alle valse geruchten (zo’n 30 Twitter accounts was verantwoordelijk voor 90% van de retweets van deze berichten).
In andere situaties heeft de digitale respons echter niet alleen te maken van Big Crisis Data en Big False Data, maar ook met Big Brother. Normale rampen schieten niet terug, maar in sommige landen is informatievalidatie een gevaarlijk proces. Denk aan het werk in Rusland, Libi? of Syri? waar het verzet op die manier ook handig in kaart wordt gebracht, of denk aan wat?Bellingcat?in het MH17 onderzoek?deed waarin Rusland actief haar propagandamachine verdedigd.
Momenteel zoekt ook een onderzoeksgroep in Japan uit of tweets tijdens een ramp kunnen laten zien aan welke producten een tekort is in het gebied. En in Jakarta proberen onderzoekers via tweets te monitoren?wat er gebeurt tijdens een overstroming.
Nieuw geschiedenisboek
Terugkijkend bieden deze crisismapping voorbeelden allen een interessant kijkje op deze incidenten. De kaart geeft je bovendien de mogelijkheid om in je eigen helikopter te stappen en eenvoudig in-en uit te zoomen en chronologisch door de gebeurtenis te wandelen.?Deze tekstberichten zijn vereeuwigd. Stel dat we de stemmen uit het verleden op deze manier hadden kunnen horen, bijvoorbeeld ten tijde van de tweede wereldoorlog of andere belangrijke historische gebeurtenissen.
De open werkwijze van deze grote groepen maakt dat ondemocratische leiders het steeds moeilijker krijgen, terwijl de massa haar kennis (door collectieve waarheidsvinding) en mogelijkheden of rechten alleen maar verder uitbreidt. ?De massa media be?nvloedt niet het standpunt van mensen. Politieke verandering is een twee traps raket, waarin?pas in tweede instantie politieke opinies worden gevormd juist door interactie via social media (aldus ook Clay Shirky). Pas als men gezamenlijk een kaart maakt van de situatie met honderden, duizenden aanwijzingen ziet men gezamenlijk het grotere plaatje en voelt men zich gesteund om een verandering in te gaan.?James Scott noemt dit het delen van het hidden transcript, iets dat onderhuids in de maatschappij al zacht borrelde.
Twee weken na de aardbeving in Ha?ti gaf Hillary Clinton een gedenkwaardige speech over de revolutie die tijdens die ramp duidelijk werd en zei: “The technology community has set up interactive maps to help identify needs and target resources. And on Monday, a 7-year-old girl and two women were pulled from the rubble of a collapsed supermarket by an American search and rescue team after they sent a text message calling for help.”
en ze vervolgde haar betoog met een verwijzing naar andere landen en vrije internettoegang:
“By relying on mobile phones, mapping applications, and other new tools, we can empower citizens. So let me close by asking you to remember this little girl who was pulled from the rubble on Monday in Port-au-Prince. She’s alive, she was reunited with her family, she will have the chance to grow up because these networks took a voice that was buried and spread it to the world. No nation, no group, no individual should stay buried in the rubble of oppression. We cannot stand by while people are seperated from the human family by walls of censorship. And we cannot be silent about these issues simply because we cannot hear the cries.”
Terwijl Patrick Meier een lans breekt voor de?democratische overheden die ook ‘data filantropie‘ meer zouden moeten stimuleren. Data donoren, data DJ’s, er zijn allerlei rollen denkbaar vanuit het publiek. Als je toch al geld overmaakt om voedsel of water te sturen, waarom dan niet helpen met data?
Met grote dank aan Patrick Meier voor de bundeling van deze?waardevolle kennis. En als het smaakt naar meer: volg zijn blog iRevolution?want daar is?het meeste van bovenstaande (en meer) nog uitgebreider na te lezen.