Tagarchief: hunchlab

Wat er mis is met predictive policing

Is predictive policing ? politiewerk op basis van onderbouwde voorspellingen ? het nieuwe wondermiddel? Dankzij geavanceerde algoritmen die big data aankunnen, kan de politie misdaad voorspellen en preventieve maatregelen nemen om de kans op misdaad te verkleinen, bijvoorbeeld door daar te zijn waar die kans het grootst is. Predictive policing is overgewaaid uit Amerika. Veel politieorganisaties zijn ermee in de weer, maar onderzoek heeft nog geen uitsluitsel kunnen geven over de vraag of het echt effectiever is dan mensenwerk.

Auteurs: Rick van der Kleij is senior researcher human factors; Selmar Smit is senior researcher artificial intelligence; Hans van Vliet is senior business consultant; Freek van Wermeskerken is
researcher artificial intelligence. Allen bij TNO.

Predictive policing is relatief nieuw. Critici benadrukken vaak de mogelijkheid van systematische vooringenomenheid van de voorspelling (en dus etnische profilering) en zien een gebrek aan transparantie en verantwoording. Daarnaast brengen precieze voorspellingen de misdaadcijfers niet per definitie omlaag, bijvoorbeeld als het tijdstip en de locatie onvoldoende specifiek zijn of de politie de voorspellingen verkeerd interpreteert. Aan de andere kant hoeven bij een goed ontworpen systeem en goede inbedding in het proces dergelijke effecten helemaal niet op te treden en kan predictive policing bijdragen aan effectiever politieoptreden.

Dit artikel belicht de data en de algoritmen in de predictive policing-terugkoppelingslus. Hoe staat het met de algoritmen die de tijd en locatie van een toekomstige misdaad voorspellen (zoals inbraak)? De huidige benaderingen en algoritmen kunnen beter. Onze nieuwe benadering van predictive policing laat zien wat er precies moet veranderen om de effecten van voorspellingen op basis van algoritmen te verbeteren, en daarmee ook het proces van de toewijzing van de schaarse middelen (agenten, voertuigen, enzovoort).
We kijken eerst naar de huidige voorspellingsalgoritmen. Vervolgens zoomen we in op de problemen met deze algoritmen en de manier waarop die problemen toenemen wanneer de voorspellingen daadwerkelijk worden gebruikt voor operaties. Daarna beschrijven we onze nieuwe benadering en kijken we hoe het verder moet.

>> “Onze nieuwe benadering laat zien wat er precies moet veranderen”

Huidige predictive-policingalgoritmen
Predictive-policingalgoritmen zijn doorgaans gebaseerd op gecombineerde informatie, bijvoorbeeld omgevingsgerelateerd/demografisch, datum-/tijdgerelateerd en vooral ook misdaad in het verleden. Een voorbeeld: het meest simpele voorspellingsmodel stelt dat het voorspelde aantal incidenten op een locatie (?box?) gelijk is aan het gemiddelde aantal vorige week gemelde incidenten op deze locatie. Dit model kan werken, maar er zijn complexere modellen denkbaar:

Het aantal inbraken op een specifieke locatie staat gelijk aan 2 x het aantal inbraken vorige week min 1 x het aantal inbraken van precies twee weken geleden.

Dit model kan een simpele trend weergeven. Als er vorige week tien inbraken waren en de week ervoor acht, dan zal de voorspelling twaalf zijn. Toevoeging van meer data levert al snel complexe formules op. De uitdaging hierbij is: wat is de wegingsfactor (het relatieve belang) van iedere variabele? In het vorige voorbeeld was dat eenvoudig, namelijk 2 en 1. Maar hoe zit dat met deze formule?

Komende maandag is het aantal inbraken in deze ?box? 0,257 x de luchtvochtigheid, plus 1,56 x het aantal inbraken vorige week, min 0,46 x het aantal inbraken dat gewoonlijk op een maandag plaatsvindt, plus 0,12 x het aantal inbraken vorige week in een aangrenzende ?box?.

Wegingsfactoren kunnen worden geschat op basis van?historische data. Als je weet wat vorig jaar de exacte luchtvochtigheid was op een specifiek moment en als je het aantal gemelde inbraken vorige week, het gebruikelijke aantal inbraken op een maandag en het aantal inbraken op aangrenzende locaties kent, dan is het mogelijk het gewicht van iedere variabele vast te stellen, en is de gemiddelde kwadratische fout het kleinst. Met een complexe formule kun je een boek vullen. De termen die gerelateerd zijn aan misdaden in het verleden zijn over het algemeen het belangrijkst,
omdat deze in essentie trend analyzers zijn. De formules schatten de waarschijnlijkheid van een incident op een specifieke locatie en een specifiek tijdstip op basis van de trend in gemelde misdaden uit het verleden. De meeste predictive-policingsystemen werken op basis van deze, of vergelijkbare, uitgangspunten.

Vertekend beeld
Om misdaad te kunnen voorkomen, moeten we weten wat het misdaadpotentieel is: het aantal misdaden dat zou plaatsvinden als we niets doen. Er zijn heel veel factoren van invloed op het misdaadpotentieel, en die kunnen verschillen per type misdaad. Voorbeelden zijn het opleidingsniveau van de dader of diens aanwezigheid in een situatie die geschikt is om een misdaad te plegen ? de gelegenheid maakt de dief.

Het probleem zit in de data die de politie gebruikt voor het voorspellen van misdaad. Dit zijn namelijk data over gemelde misdaad en niet over het daadwerkelijke misdaadpotentieel. Bij inbraak komt het gemelde misdaadcijfer redelijk overeen met de gepleegde misdaad. Maar voor? fietsendiefstal gaat dat niet op. Mensen doen hierbij niet snel aangifte, want de kans dat je je fiets terugziet is klein en het aangifteproces is moeizaam. Daar komt nog een complicerende factor bij. Het percentage aangiften verschilt per locatie (?box?), terwijl de meeste software aanneemt dat die variabele constant is. Verder kan de aangiftebereidheid op een locatie stijgen als er agenten aanwezig zijn.
En wat als die data een bijproduct zijn van politieoperaties, bijvoorbeeld in het geval van drugdealers? Data in dit verband worden meestal gegenereerd door de politie zelf. Op plekken waar geen agent is geweest, kan de politie dus geen overtredingen waarnemen, wat niet betekent dat er geen misdaad heeft plaatsgevonden. Kortom: de data die voor de huidige predictive-policingsoftware worden gebruikt, geven de werkelijkheid niet goed weer. Bovendien verschilt de mate waarin dit beeld wordt vertekend vermoedelijk per type misdaad en locatie.

Dat is nog niet alles. De data van de politie houdt ook geen rekening met de voorkomen misdaad. Het misdaadpotentieel voor een specifieke locatie kan hoog zijn, terwijl het grootste gedeelte van die misdaad wordt voorkomen door intensieve surveillance. Een dergelijke ?box? kent dus weinig gepleegde (en dus gemelde) misdaad en wordt daardoor ook in het voorspellingsmodel ondervertegenwoordigd.

Voorspellingen die enkel op basis van gemelde misdaad werken, zullen dus (in een bepaalde mate) vertekend zijn. Niet-gemelde of voorkomen misdaad wordt beide niet meegenomen, en daardoor is de gemelde misdaad meestal kleiner dan het aantal gepleegde misdaden en te allen tijde kleiner dan de daadwerkelijke potenti?le misdaad. In feite worden met de huidige algoritmes enkel aangiftes voorspeld, en niet de criminaliteit. Dit effect wordt nog verder versterkt door wat wij de ?back-to-the-future-paradox? noemen (naar de gelijknamige films).

Back-to-the-future-paradox
Een belangrijke stimulans voor criminele activiteit is de afwezigheid van mensen die misdaad kunnen voorkomen, bijvoorbeeld agenten op straat. Politieoptreden heeft dus een effect op de data die worden verzameld. Wanneer we voorspellingen gebruiken om operaties aan te sturen, cre?ren we dan ook een terugkoppelingslus:

Gemelde misdaad wordt gebruikt om misdaad te voorspellen, de voorspelde misdaad wordt gebruikt om operaties aan te sturen en de operaties zelf be?nvloeden de gemelde misdaad. Op die manier kunnen voorspellingen zichzelf dus bevestigen en leiden tot een zichzelf steeds versterkende terugkoppelingslus.
In het beste geval leidt dit tot onnauwkeurige voorspellingen, in het ergste kan het zelfs discriminatoir beleid tot gevolg hebben. Het probleem van het voorspellen van drugsdealers is ondertussen redelijk bekend (hoewel nog niet opgelost), maar een terugkoppelingslus die vaak over het hoofd wordt gezien, is dat politieoperaties ook misdaad voorkomen, met als gevolg dat die voorspellingen de daadwerkelijke ernst van de situatie onderschatten. Als een agent op basis van een voorspelling ergens gaat staan en er gebeurt niets, kun je onmogelijk weten of de agent de
misdaad heeft voorkomen of dat hij zijn tijd heeft verknoeid op een veilige locatie. Dat effect treedt niet alleen op in de ?box? waarop de operaties gericht zijn. Door de afschrikking en de verspreidingseffecten (positieve en negatieve waterbedeffecten) kan het misdaadpotentieel op aangrenzende locaties toenemen of afnemen, afhankelijk van de afstand en de motivatie van de daders en aanwezige politie.

Een gebied met zeer veel aangiftes zorgt voor een hoge voorspelde misdaad. Als gevolg gaat de politie zich volledig op dat gebied concentreren, en verplaatsen criminelen hun activiteiten naar aangrenzende locaties. In het eerste gebied daalt dus het aantal aangiftes, en op de aangrenzende locaties stijgt het aantal aangiftes. Op basis van deze gegevens zal het algoritme de agenten naar de aanliggende gebieden sturen, waarna de criminelen zich dus gewoonweg weer terug verplaatsen. In dit (extreme) voorbeeld is het enige wat de politie doet steeds een stap te laat zijn.

De precieze vertekening in de resultaten, de afschrikking en de waterbedeffecten zijn lastig vast te stellen. Misdaad die zich verplaatst, zal vaak buiten de gebieden en typen misdaden vallen waarop de politie focust of schuilgaan achter globale trends. Om dit effect te kunnen isoleren, is eigenlijk een speciaal experiment nodig, namelijk langdurige vergelijking van misdaadlocaties waar de politie heel actief was met locaties waar dit helemaal niet het geval was. We kunnen alleen moeilijk voor een wetenschappelijk onderzoek bepaalde locaties geheel aan hun lot overlaten.

>> Er wordt een onderscheid gemaakt tussen?potenti?le, gepleegde en gemelde misdaad

Evaluaties
Hoe komt het dan dat predictive policing zo populair is geworden? Deels is dat een gevolg van een bijna religieus geloof in data bij sommige bedrijven, organisaties, media en delen van de samenleving. Ook is een grondige evaluatie van predictive policing gecompliceerd. En misschien komt het sommige mensen ook beter uit om te stellen dat de evaluaties van predictive policing niet deugen dan dat het algoritme niet goed, of juist heel succesvol is.

In sommige experimenten leidden predictive policingmethoden tot veel betere voorspellingen dan die van de reguliere analisten. Maar klopt dit wel? Het lijkt erop dat de analisten moesten voorspellen waar veel misdaad was (het potentieel), terwijl de nauwkeurigheid van hun voorspelling werd ge?valueerd op basis van gemelde misdaad. Het algoritme daarentegen voorspelde de gemelde misdaad en won dus. Daarbij hadden de analisten ook nog last van de backto-the-future-paradox, namelijk: er gingen wel agenten naar de door hen aangewezen locaties (om daar misdaad te voorkomen), maar niet naar de door de algoritme aangewezen locaties. Met andere woorden, een nauwkeurige voorspelling is geen goede indicatie voor de kwaliteit van de voorspelling.

Figuur 1. Routine Activity met betrekking tot misdaadpotentieel (P), gepleegde misdaad (C) en gemelde misdaad (R).

Het omgekeerde is zelfs waar: als er ook interventies gedaan worden op basis van voorspellingen is de daling van de nauwkeurigheid juist een teken dat ze goed werken. In de ?paper van Brantingham? (Mohler et al. 2015) vermindert die nauwkeurigheid enkel bij hun algoritme, en niet bij de voorspellingen van de analisten. De enig mogelijke verklaring is dat de politieactiviteit in de betreffende gebieden in de ?beschikbare tijd? geen effect had, omdat hier al voldoende reguliere politieactiviteit was. Wederom: de analisten voorspelden het misdaadpotentieel en niet het aantal
gepleegde misdaden.

Een nieuwe benadering
Om de voorspellingen van het algoritme (meldingen) beter te laten aansluiten op het denkkader van de analist (criminaliteit), is een nieuwe benadering nodig. De huidige methoden voor dataverzameling richten zich op de verkeerde criminele respons: enkel de gemelde misdaden worden meegenomen in de algoritmen. Alleen, predictive policing gaat niet om het voorspellen van het aantal dossiers, maar om het voorkomen van misdaad. Het betreft dus niet-waargenomen ? want voorkomen ? misdaden, of anders gezegd: het afschrikwekkende effect van politieactiviteit.
Ons voorstel is om voor de voorspellingen gebruik te maken van het veel stabielere misdaadpotentieel in plaats van de gemelde misdaden. Het misdaadpotentieel op zichzelf kunnen we niet meten. Wel kunnen we proberen het af te leiden uit wat er niet kon worden voorkomen, namelijk de aangiftes, de daadwerkelijke politie-inzet en de effectiviteit van die inzet. Het misdaadpotentieel is gelijk aan de aangiftes + de voorkomen misdaad (inzet maal effectiviteit). Helaas kun je de effectiviteit weer alleen berekenen als je het potentieel kent. Deze vicieuze cirkel is
te doorbreken met een complex wiskundig model (http://policing.ai).

Daar waar de huidige predictive-policingalgoritmen potenti?le misdaad modelleren als een functie van gemelde misdaad, maakt onze benadering een onderscheid tussen potenti?le misdaad (P), gepleegde misdaad (C) en gemelde misdaad (R), zie figuur 1. Bijvoorbeeld: het misdaadpotentieel van morgen (een maandag) heeft een relatie met de potenti?le misdaad op andere maandagen.
Op vergelijkbare wijze heeft het misdaadpotentieel op deze specifieke locatie een relatie met aangrenzende locaties. In tegenstelling tot de gemeten misdaad is het basisidee dat potenti?le misdaad alleen wordt be?nvloed door tijd en locatie, en slechts geleidelijk verandert, omdat potenti?le misdaad in feite de overlap is van ?potenti?le dader? en ?geschikt doelwit? in de gelegenheidstheorie,
beter bekend als de Routine Activity Theory. Zowel daders als slachtoffers opereren in een bepaald gebied. Tenzij ze zich verplaatsen of achter slot en grendel verdwijnen, is het aantal ?potenti?le daders? relatief stabiel. Datzelfde geldt voor ?geschikte doelwitten?. Mensen gaan niet in korte tijd en masse verhuizen of iets veranderen aan de geschiktheid als doelwit (bijvoorbeeld door nieuwe sloten tegen inbrekers aan te schaffen).
Het enige wat het algoritme hoeft te doen, is voor elk van deze relaties een getal vinden dat de sterkte goed uitdrukt. Tegelijkertijd moet het model getallen vinden voor de plaatselijke effectiviteit van de interventies en voor de waterbedeffecten. En natuurlijk moeten deze getallen zo goed mogelijk passen bij alle dagen, alle locaties en alle mogelijke vormen van politie-inzet in het
verleden en in de toekomst. En hoewel dat complex is, kunnen deze getallen geschat worden met behulp van een combinatie van het aantal historische aangiftes en de bijbehorende gepleegde politie-inzet (bijvoorbeeld door GPS tracking van voertuigen en communicatiemiddelen). En daarmee kan het model compenseren voor de back-to-the-future-paradox.

Figuur 2. Effect van surveillanceduur

Effect en effectiviteit
Naast verbeterde voorspellingen van criminele activiteiten heeft de nieuwe benadering nog een belangrijk voor?deel: ze bepaalt ook direct het effect van politie-inzet, evenals de effectiviteit per interventie. Daarmee kunnen in principe dus operaties geoptimaliseerd worden, bijvoorbeeld als we weten wat de effectiviteit (procentueel) is van een surveillance te voet in een bepaald gebied
(figuur 2).
We kunnen de surveillanceduur te voet in een ?box? optimaliseren door de effectiviteit te vermenigvuldigen?met de (voorspelde) potenti?le misdaad. Bijvoorbeeld: 10 minuten surveillance te voet kan mogelijk 0,044 (effectiviteit) x 2,0 misdaden (wat er zonder politie zou zijn opgetreden) voorkomen. Wanneer de potenti?le misdaden voor iedere ?box? zijn vastgesteld, is het eenvoudig om de
beschikbare hulpmiddelen en de naar verwachting voorkomen misdaden te optimaliseren.

Hoe nu verder?
Het pure voorspellingsinstrument ?predictive policing? kan dus nog flink worden verbeterd. Een belangrijke eerste stap richting de verbreking van de foutieve terugkoppelingslus in predictive policing is het meenemen van de daadwerkelijke actie die is ondernomen, zodat voor de effecten ervan te compenseren is. Voor de implementatie van de nieuwe benadering moet men 1) de huidige voorspelalgoritmes aanpassen?en 2) de interventies die zijn toegepast meten. Aan dat laatste zijn wel aspecten als privacy en transparantie verbonden.

[slideshare id=76826011&doc=prescriptivepolicingtnoen-170610155107&type=d]

>> Het voorgestelde model moet vooral inspireren en zeker niet dirigeren

Prescriptive policing
Een bijkomend voordeel van denieuwe benadering is dat ze de stap richting impactgedreven of zelfs prescriptive policing mogelijk maakt: het voorspellen van de effectiviteit van een bepaalde inzet, gegeven een bepaalde situatie en gebaseerd op kennis van de effecten van specifieke interventies. Als predictive policing kan voorspellen waar en wanneer je ergens moet zijn, dan kan prescriptive policing voorspellen wat vermoedelijk de beste handelwijze is voor die specifieke ?box? en tijd. Als we kunnen vaststellen dat iets werkt op locaties met specifieke kenmerken, maar niet in andere, dan kunnen we die kennis ook gebruiken voor andere locaties. Zonder de effectiviteit van elke interventie in die bepaalde ?box? te moeten vaststellen, kunnen we dus al beoordelen wat waarschijnlijk wel of niet gaat werken.

Ten slotte
Ten slotte nog dit. Handhaving is een van de moeilijkste taken van de politie en we moeten bedenken dat ook het meest geavanceerde model geen boeven vangt. Het is er enkel en alleen om de analisten te ondersteunen. Een model kan honderd keer roepen dat een bepaalde interventie klopt, uiteindelijk gaat het toch enkel om een kansberekening. Iemand die een specifiek gebied of mogelijke daders goed in beeld heeft, komt vermoedelijk tot een betere oplossing.
Het hier voorgestelde model, en in principe elk voorspelmodel, moet dus vooral inspireren, en zeker niet dirigeren. De werkelijke waarde van dit soort modellen zit in het gebruik ervan en de inbedding in het politieproces. Voorspellingen hebben op zich geen waarde. Het zijn de acties van politiemensen die ze waardevol kunnen maken. Daarom is het van belang om onderzoek te doen, te experimenteren en te investeren in de samenwerking tussen mens en systeem, communicatie, uitleg en transparantie, op zo?n manier dat politiemensen dergelijke systemen op waarde kunnen
schatten.?

Bronnen: Website voor de politie waar ook een geannoteerde versie staat met daarin de wiskundige onderbouwing.

Predictive policing: een overzicht

3 reacties

Door: Arnout de Vries en Selmar Smit (beiden werkzaam bij TNO)

Al enige tijd zijn er veel mooie verhalen in diverse media over Predictive Policing. Maar wat is het eigenlijk en werkt het nu echt?

Tijd om de mythes te doorbreken en de diverse oplossingen die er zijn eens op een rijtje te zetten. Ook geven we iets meer theoretische achtergrond voor de liefhebbers, want voor een deel is het oude wijn in nieuwe zakken.

Het Paretoprincipe (?80/20-regel?) en onveiligheid (hot problems).

Delicten (hot crimes): een beperkt aantal soorten delicten vormt het grootste deel van de criminaliteit.
Overlast (hot disorders): een beperkt aantal soorten overlast vormt het grootste deel van alle overlast.
Locaties (hot spots): een groot deel van de criminaliteit en overlast vindt plaats op een beperkt aantal locaties.
Binnensteden, wijken en buurten (hot areas): een groot deel van de criminaliteit en overlast vindt plaats in de binnensteden en in een beperkt aantal wijken en buurten.
Daders (hot shots): een groot deel van de criminaliteit wordt gepleegd door een klein aantal criminelen.
Dadergroepen (hot groups): een groot deel van de criminaliteit wordt gepleegd door een klein aantal criminele samenwerkingsverbanden.
Slachtoffers (hot victims): een klein deel van de slachtoffers is slachtoffer van een groot deel van de delicten.
Tijdstippen (hot times): een groot deel van de criminaliteit en overlast vindt plaats op een beperkt aantal tijdstippen of tijdsperioden.
Buit (hot products): het grootste deel van de diefstallen is gericht op een beperkt aantal buitsoorten.
Voorzieningen (hot facilities): het grootste deel van de criminaliteit wordt gepleegd in een klein deel van de winkels, kantoren, bedrijven, bedrijventerreinen, scholen, sportcomplexen, openbaar vervoer enzovoort.

[Bron: P. Versteegh, e.a. [2010]. ?The best of three worlds. Effectiever politiewerk door een probleemgerichte aanpak van hot crimes, hot spots, hot shots en hot groups.? Politieacademie, Apeldoorn.]

Hot of Hype?

Door de huidige ontwikkelingen neemt predictive policing?een enorme vlucht, ook bij de Nederlandse politie die sinds de vorming van de Nationale Politie in 2013 nu landelijk betere?beschikbaarheid heeft over alle databronnen. Maar ook de complexere ‘Big Data’ ontwikkelingen waarin nieuwe databronnen gebruikt kunnen worden, gecombineerd met verbeterde analysecapaciteiten, visualisatietools en krachtigere smartphones op?straat maken dat predictive policing echt?hot?is. Steeds meer toepassingen zijn denkbaar: van preventie tot handhaving en opsporing waarin door het huidige economische klimaat slimmer gewerkt moet worden (?meer met minder?). Bovendien is de politie dan proactief in plaats van achter de feiten aan te lopen en het gevoel van veiligheid kan stijgen als mensen zien dat de politie boeven altijd net een stapje voor is. Rechercheren verandert in prechercheren. En last but not least wordt de acceptatie van deze technologische aanpak beter, want de politie is al enige tijd toch?vooral een informatie organisatie geworden.

Glazen wazige bol?

Predictive policing als term wordt vooral gebruikt in de VS. Maar wat is het?precies? Heel in het kort: politiewerk doen aan de hand van voorspellingen. Net zoals het voorspellen van beurskoersen een complexe aangelegenheid is, is dat ook met criminaliteit het geval. Maar de politie heeft inmiddels een goudmijn aan gegevens (big data) over misdaden uit het verleden tot haar beschikking. En Big data is een grondstof die nooit opraakt, juist exponentieel groeit. Door hier een diepe analyse op los te laten kan de politie straks in combinatie met verfijnde algoritmen toekomstige misdaden voorspellen. Computer modellen dus die o.a. gebruik maken van misdaadgegevens. Met andere woorden: op grond van predictive policing kunnen mensen straks worden opgepakt nog voor ze een misdaad hebben begaan. Dat is ook eng, want kan dat allemaal zo maar? In veel media wordt om die reden het angstige vergelijk gemaakt met de film?Minority Report.

Bill Bratton, toenmalig korpschef van de LAPD en voorloper op het gebied van predictive policing en real-time crime monitoring, nam zorgen over de wiskundige abacabra weg door te stellen: ?Crime is just a physical process and if you can explain how offenders move and how they mix with their victims, you can understand an incredible amount.? En hij kreeg bijval van antropoloog en grondlegger van Predpol Jeff?Brantingham: ? “The naysayers want you to believe that humans are?too?complex and too random ? that this sort of math?can’t?be done, but humans are not nearly as random as we?think.??

[Bron:?Joel Rubin, ?Stopping Crime Before It Starts? Los Angeles Times, 21 augustus, 2010. ]

Onlangs was Bill Bratton nog te gast in “Cities for Tomorrow 2015 – Data Mining in the Modern City”, waarin hij kritiek pareerde op het gebruik van deze technologie?n:

Eerst de theorie

Als we weten hoe criminelen denken en doen, dan kunnen we misschien ook voorspellen waar ze gaan toeslaan. En in een vakgebied wat al jaren bestaat, zoals dat van criminologie, ?is er aan dergelijke theorie?n geen gebrek. De ratio, die ook bij criminelen aanwezig is, in combinatie met gelegenheid maakt dat er al snel patronen ontstaan.

Zo zegt de immens populaire routine activity theory?dat criminelen zullen toeslaan op die locatie waar de virtuele cirkels rond criminelen en geschikte slachtoffers elkaar overlappen. Kortom, zo lang er geen grote volksverhuizingen zijn, zullen steeds dezelfde gebieden worden getroffen.

[Bron: Ronald V. Clarke and Marcus Felson M., 1993, ??Introduction?: Criminology, Routine Activity, and Rational Choice??,?Advances in Criminological Theory: Routine Activity and Rational Choice, vol. 5, pp.?1?14]

De rational choice theory zegt daarentegen juist dat criminelen op zoek zullen gaan naar die locatie waar de afweging tussen risico(pakkans) en buit zo gunstig mogelijk is.

De crime pattern theory tenslotte is een derde populaire theorie over crimineel gedrag,die zegt dat 1) criminelen altijd zullen toeslaan in een buurt die ze kennen; vlak bij huis/werk/sportschool, of op de weg daar naar toe en 2) criminelen nooit zullen toeslaan te dicht bij hun eigen huis.

Naast deze drie basistheorie?n, bestaat er nog een vierde belangrijke, de zogenaamde ?blended theory? die, zoals de naam al zegt, hun combinatie is: een crimineel zal toeslaan op een locatie (routine activity theory) langs zijn activiteiten-routes, maar niet te dicht bij huis (crime pattern theory) daar waar de afweging tussen buit en pakkans positief is (rational crime theory).

Voor predictive policing worden deze theorie?n vaak overboord gegooid, en wordt voornamelijk gekeken naar ?near repeats?. Een methode die er vanuit gaat dat er in de buurt van een incident vaak nog een tweede, derde, etc. incident zal volgen. Hoewel dat niet lijkt op de drie eerdere theorie?n zal, zolang de pakkans, buit en activiteiten van criminelen niet veranderen, het effect hetzelfde zijn. Want daar waar al een keer een incident is geweest was blijkbaar de afweging tussen buit en pakkans positief, en was er blijkbaar ook een crimineel aanwezig. Zolang er niets verandert, zal er dus (volgens de drie theorie?n) zich nog een tweede, derde etc. incident zich in de buurt gaan voordoen.

In bijna alle commerci?le pakketten die nu te koop zijn wordt voor deze versimpelde weg gekozen. Vaak wordt er naast dit trekken van cirkels rond incidenten ook nog gekeken naar tijdsaspecten (spatiotemporele analyse), zowel naar trends zoals verplaatsingen, als naar seizoen, weekdag, of zelfs het specifieke tijdstip. Zo is er al jaren een duidelijke piek van inbraken rond kerst, is een werkdag populairder voor het dievengilde dan een weekend, en is het aantal inbraken rond 08:00 ?s ochtends minimaal. Door dit soort aspecten mee te nemen, kun je dus ook inbouwen dat de pakkans, buit of activiteiten van criminelen (uit de basistheorie?n) veranderen gedurende het jaar/maand/dag/uur.

Voeg bij die tijdaspecten ook nog andere kenmerken zoals omgevingsfactoren (demografie etc.) en weersvoorspellingen (een regressie-analyse/data-mining), en afstanden tot vluchtwegen (aantrekkende werking) en politiebureaus (afstotende werking) en je krijgt een complexe formule met tientallen parameters die zo goed mogelijk moeten worden bepaald uit de historische data.

Hoewel het bepalen van de juiste waarde voor al die parameters nog een hele klus is, is een dergelijk voorspelmodel is dus niet echt rocket-science. Toch levert het al behoorlijk goede voorspellingen op en dat is dan ook de rede dat vrijwel alle softwarepakketten op de markt ook (in meer of minder mate) kiezen voor deze aanpak.?En voorspellen is nog maar een klein deel van het hele verhaal, want het handelen op basis van goede voorspellingen is waar de crux zit.?Laten we eens kijken naar hoe een aantal van deze oplossingen het doen.

In de praktijk

Hoe staat het eigenlijk met de huidige ‘state of the art’, zoals die al geadopteerd is door politie organisaties? TNO bekeek in een korte verkenning enkele oplossingen op het gebied van predictive policing. Daar waar een studie van RAND eerder al keek naar de inpassing van predictive policing in het politiewerk, bespreken wij hieronder een aantal oplossingen die vandaag de dag al gebruikt worden. Een echte gedegen vergelijking vraagt om meer degelijk onderzoek, want de getallen die leveranciers afgeven zijn vaak ontdaan van alle context en niet objectief vastgesteld. Predpol schijnt er zelfs een nogal? dubieuze strategie van gemaakt te hebben om hun klanten vooral zoveel mogelijk positieve verhalen naar buiten te laten brengen. SF Weekly deed uit de doeken hoe de contracten eisen dat politie de technologie promoot, los van de behaalde resultaten.

Maar al zouden de cijfers wel kloppen, de beoogde effecten kan de software niet voorspellen: resultaten uit het verleden bieden geen enkele garantie voor de toekomst. En er zijn nog steeds operationele diensten nodig om boeven te vangen, dat doen de algoritmes niet.

Maar hoe vergelijken de oplossingen dan onder de motorkap? Volledige transparantie staan niet alle leveranciers zomaar toe, omdat hun concurrentiepositie dan gevaar loopt. Toch zal de maatschappij (en de wet) wellicht gaan eisen dat algoritmes volledig transparant zijn, want waarom ben je aangehouden of kwam de politie eigenlijk op jouw spoor?

Onderstaand overzicht helpt veiligheidsorganisaties om een keuze te maken in bestaande oplossingen. Het is verre van volledig, want de markt trekt stevig aan tot een mogelijk oerwoud aan oplossingen. Daarnaast ontbreekt een veelheid aan selectiecriteria, die bovendien per organisatie verschillend zullen zijn. De context en het doel van het gebruik, de bevoegdheden, de beschikbare data, organisatorische en financi?le (on)mogelijkheden alswel het toekomstperspectief bepalen welk middel het beste zal passen.

Predpol

De ontwikkeling van PredPol?begon al in 2008 bij de politie van Los Angeles doordat topchef Bill Bratton het aandurfde om wiskundige technieken toe laten in de politiepraktijk. Samen met?Jeff Brantingham?van de universiteit UCLA hadden ze het idee om de algoritmes die aardbevingen konden voorspellen op basis van het verleden toe te passen op oude misdaadstatistieken. Het bleek een gouden greep. Waar voorheen intelligence gestuurde politie (ook wel Intelligence Led Policing) nog bleef steken bij het maken van hotspotkaartjes, kon men nu ineens veel meer dan alleen een lijntje in een grafiek doortrekken. Een veelvoud aan invloedsfactoren (zoals variaties in criminaliteitstypen, plaatsen en tijden) kon ineens worden meegewogen en de voorspellingen leken beter te zijn. Het kon al snel anderhalf tot twee keer beter risicogebieden inschatten dan politieanalisten deden.

In November 2011, benoemde?TIME?Magazine?predictive policing om deze reden ??n van de 50 beste inventies van 2011. Deze?oplossing is?PredPol?gaan heten en inmiddels is?de software?voor een aardig?bedrag te koop (zo?n 100 kEuro per jaar). De software analyseert oude misdaadstatistieken ? voor accuratesse zijn er wel zo?n paar duizend nodig ? en plot die op een kaart, waarin het surveillancegebied is opgedeeld in echt kleine vakjes (van 45 vierkante meter). Zo kan de politie dus per vakje zien wat er daar allemaal is gebeurd en wat er vermoedelijk gaat gebeuren, waarbij zelfs de weersvoorspellingen worden meegewogen. Dat is wel iets anders dan de misdaadanalist met gekleurde spelden en een stadsplattegrond. In een blinde proef ? de ene dag gingen agenten op pad met een traditionele hotspotkaart en de dag erop met een van PredPol ? bleek al snel dat Predpol tot betere resultaten leidde. Niet alleen meer arrestaties, maar vooral dalende misdaadcijfers.

In feite is dit niet veel anders dan wat een bedrijf als Amazon doet: goed kijken naar de klant en precies uitvinden hoe die koopt, wat die koopt en waarom die koopt. Dit maakt het voor Amazon mogelijk toekomstig gedrag te voorspellen (en het koopgedrag te bevorderen). Welke algoritmen Amazon hiervoor gebruikt is trouwens onduidelijk (dat is bedrijfsgeheim).

PredPol maakt het eenvoudiger om effici?nt en effectief te surveilleren. Het gaat daarbij zeker ook om het voorkomen van een misdrijf. Juist omdat de politie gericht surveilleert op de plekken waar het telt zullen op die plekken minder misdaden worden gepleegd. Niet meer blauw op straat maar gerichter blauw op straat. Dat is althans de theorie. De cijfers laten zien dat die theorie klopt: in het gebied dat door PredPol in Los Angeles wordt bestreken daalde de misdaad met 13%. In Santa Cruz, waar ze het ook gebruiken om hotspots te identificeren, ging het aantal inbraken met 27% omlaag. Hier zijn voor 60.000 inwoners ? en 150.000 in het hoogseizoen ? slechts 94 politiemensen beschikbaar, en geld voor meer personeel is er niet. Predictive policing zal daarom groot worden. Het scheelt mankracht.

De politie uit Kent heeft ook een eigen studie uitgevoerd waarin PredPol 6 maanden lang werd gebruikt. Ze concludeerden dat PredPol een hitscore haalde van 8.47, wat betekent dat er over die periode in 8.47% van de geselecteerde vakjes ook daadwerkelijk een inbraak heeft plaatsgevonden. Dat klinkt als niet zo veel, maar was bijna 60% hoger dan wanneer eenzelfde aantal vakjes handmatig werd gekozen door analisten.

Kent is Predictive policing software breder gaan inzetten na deze kleine test in 2013, waarin het ondervond dat misdaad op straat met 6% afnam. Toch nam misdaad in het eerste jaar daarna toe, iets dat de politie van Kent wijdt aan een slechte implementatie in een periode waarin ook niet alle misdaadgegevens volledig voorhanden waren. Inmiddels lijken de resultaten beter met een afname van 140.000 naar 100.000 misdaden.

In het Amerikaanse Richmond is men inmiddels zelfs gestopt met Predpol, ondanks dat het driejarige contract met Predpol nog niet was uitgediend. Reden: gebrek aan bewijs dat het zou werken. Predpol claimde nog dat misdaad omlaag ging door hun software, maar politiechef Chris Magnus spreekt dat tegen en geeft aan dat na een periode van initi?le afname misdaad de laatste tijd weer met dubbele cijfers omhoog gaat.

En succes hangt ook af van het type interventies en sociale acceptatie. Zo ging de politie van Chicago op basis van Predpol preventief huisbezoeken plegen bij veelplegers. Het idee was dat misdaad voorkomen kon worden als deze doelgroep meer informatie over de inmiddels hogere straffen kregen of begeleidingsprogramma?s kreeg om ze aan het werk te krijgen. Deze interventievorm die in de pers al snel het label ?profiling? kreeg leverde veel kritiek van de lokale bevolking op.

Toch wordt het gebruik van PredPol ?steeds populairder, en is het onder andere in gebruik bij de politiekorpsen in de VS zoals Los Angeles, Seattle, Modesto, Alhambra, Santa Cruz, Atlanta en Little Rock, en krijgt het ook in Europa voeten aan de grond zoals in Kent, Verenigd Koninkrijk.

Daily Crime Forecast

Daily Crime Forecast (DCF) is een volledig via het web benaderbare tool die qua functionaliteit niet onder doet voor PredPol. Ook hier vinden we de bekende vlakjes waarbij voor elk uur wordt bepaald wat daar de dreiging is. En net zoals PredPol is er voor het maken van voorspellingen maar heel weinig data nodig. Uit enkel de datum, tijd en positie van eerdere geregistreerde delicten wordt een voorspelmodel gemaakt voor de komende tijd. Is er recent een inbraak geweest in een vakje of ??n van zijn buurvakjes? Dan stijgt daarmee het risico op nog een inbraak. Wordt er in dit vakje vooral ingebroken op maandag? Dan wordt ook dat meegenomen voor de voorspellingen voor alle komende maandagen.

Het pakket is ontwikkeld in samenspraak met het Edmonton Transit System (ETS), maar via hun website kan iedereen een demonstratie bekijken van de functionaliteiten.

Waar PredPol nog een hitscore vermelde die 60% hoger was dan die van een analist, rapporteert DCF een nog veel hoger getal, namelijk 100% beter. Dat zegt op zich nog niets aangezien het voorspellen van misdaad in een stad toch iets heel anders is dan dat van overlast rond een vervoerssysteem. Maar DCF lijkt zeker te werken, niet omdat ze dergelijke hitscores behalen (wat met wat gegoochel met getallen altijd lukt), maar omdat ze ook daadwerkelijk vermelden dat het aantal keren dat een agent handelend kon optreden in de eerste twee jaar steeg met bijna 60%, terwijl het aantal meldingen van slachtoffers juist daalde met 52%. Dat betekent dat een dergelijk systeem niet enkel kan voorspellen wat er gebeurt, maar ook problemen kan voorkomen.

Criminaliteits Anticipatie Systeem (CAS)

Ligt Predictive policing ver van ons bed? Nee, want hier in Nederland gebeurt het ook al. In het programma Politie en Wetenschap werkte de politie van Amsterdam aan een soortgelijk systeem van geavanceerde plannings- en voorspellingsmethoden om te voorspellen welke incidenten waar plaats gaan vinden. En hoe laat. En sinds enige tijd is het Criminaliteits Anticipatie Systeem (CAS) in gebruik genomen op districtsniveau en door zogenaamde ?flexteams in Amsterdam, waar jaarlijks alleen al zo?n 7000 woninginbraken plaatsvinden.

Een voorwaarde is wel dat de data goed beschikbaar gemaakt wordt. Het BVH systeem van de politie (Basis Voorziening Handhaving) bevat veel van die benodigde data. Om voorspellingen te verbeteren kan meer data handig zijn, zoals ?gegevens over vluchtroutes bij overvallen, en in andere gevallen de bevolkingssamenstelling of het type bedrijven dat in die buurt zit. Allemaal relevante indicatoren voor criminaliteitspatronen. Als het aantal bronnen toeneemt wordt het ook ingewikkelder. Patronen in de grotere hoeveelheden meervoudige data zijn complex, waarbij het ook de vraag is of de mens die ermee moet werken het systeem nog snapt. Het maakt een directere (sturing op de) inzet van de politiecapaciteit mogelijk, waardoor effici?ntie en in het bijzonder effectiviteit van de inzet wordt vergroot. Het is niet alleen een instrument voor de politie zelf, maar ook voor het bevoegde gezag en veiligheidspartners.

CAS wordt momenteel gebruikt om High Impact Crimes mee te voorspellen (woninginbraak, straatroof en overvallen). Het systeem deelt de eenheid Amsterdam op in vakjes van 125 bij 125 meter. Gebiedjes waarvan de kans op een incident vooraf al laag kan worden ingeschat, zoals weilanden en open water, worden verwijderd. Van de overblijvende vakjes wordt een grote hoeveelheid gegevens verzameld: criminaliteitshistorie, afstand tot bekende verdachten, afstand tot de dichtstbijzijnde snelwegoprit, soort en aantal bedrijven zoals bekend bij de politie, en demografische en socio-economische gegevens van het CBS.

Van ieder vakje wordt op verschillende peilmomenten geregistreerd welke gegevens er op dat moment bekend zijn. Vervolgens wordt bepaald wat er in de twee weken na de peiling aan incidenten kan plaatsvinden. Er wordt kunstmatige neurale netwerktechnologie toegepast om te bepalen welke combinatie van kenmerken indicatief is voor criminaliteit in de nabije toekomst en het resultaat is dat de vakjes op de kaart indicatief worden ingekleurd; een zgn. heat map waarin hoge scores een warmere kleur krijgen.

In onderstaande uitzending van Factchecker legt Dick Willems van de politie Amsterdam uit hoe het globaal werkt (na ongeveer 9 minuten in de uitzending). Zie ook?hier.

Net zoals bij PredPol is ook van CAS een studie gedaan van de hitscore en daar werd een score van 15% gerapporteerd. Merk op dat beide studies niet onderling zijn te vergelijken omdat, naast dat de gebieden (Amsterdam en Kent) logischerwijs volkomen verschillend zijn ook niet hetzelfde aantal vakjes is geselecteerd. Naast deze 15% direct-hits zijn er ook near-hits, namelijk een inbraak of straatroof die niet in het vakje valt, maar er net buiten. In het geval van woninginbraak is dat percentage 40%, voor straatroof zelfs 60%.

HunchLab

HunchLab?is op veel manieren vergelijkbaar met alle eerdere pakketten. Onder andere Philadelphia PD gebruikt het. Ook HunchLab heeft een webinterface (en zelfs ook speciaal voor tablets), heeft ook de bekende vlakjes, en richt zich ook op near-repeat crimes door middel van het analyseren van misdaadpieken. Maar dit pakket heeft nog een aantal andere interessante features. Hij kan bijvoorbeeld zelf detecteren als er een serie van ?buitengewone? incidenten is. Waarbij buitengewoon betekent dat ze buiten het voorspelde gebied lagen. Met de feature ?Hunch Focus? kan een analist daarna met deze, van de norm afwijkende, incidenten aan de gang. Waren het gewoon incidenten? Of is er meer aan de hand, en bestaat er een trend?

Daarnaast biedt HunchLab de mogelijkheid om, de naam zegt het al, ?hunches? te testen. De gebruiker kan via de interface een bepaald vermoeden beschrijven, waarna de tool gaat kijken in hoeverre dit vermoeden waar is. Wat er daarna met die uitkomsten wordt gedaan, niets? en dat is jammer want wat nou als het systeem daar van zou kunnen leren? De mens-machine interactie zou op deze manier een hele sterke combinatie kunnen opleveren.

Precobs

In Z?rich test men sinds oktober 2014 het Precobs systeem?(Pre Crime Observation System). De ouderwetse prikborden op de muur in het bureau van de kriminalpolizei met een kaart vol punaises zijn al sinds langere tijd opgedoekt. Eenvoudige hotspot software werd al enige tijd gebruikt. Precobs gaat verder en gebruikt slimme algoritmes die als een Zwitsers zakmes diverse doorsnijdingen van Big Data maken, om zo patronen naar boven te halen die agenten op straat kunnen inzien op hun smartphone. Na Zwitserland is ook Duitsland deze software nu aan het testen: in N?rnberg (Beieren) en Berlijn is men al begonnen. Noordrijn-Westfalen heeft interesse, maar is terecht nog zeer kritisch over de echte effecten. Want de getallen en gemeten effecten uit dit artikel komen vooral van de softwareleveranciers en de causaliteit tussen de inzet van de software en de criminaliteitscijfers is nog nauwelijks bepaald. En oorzaak-gevolg is in de aanpak van criminaliteit sowieso al niet eenvoudig, ondanks het sturen op cijfers.

Accenture dat in Londen een pilot doet, heeft voor predictive policing een andere invalshoek gekozen. Anders dan de andere producten richt Accenture zich niet op de locatie, maar op de dader. Op basis van een groot aantal daderkenmerken en activiteit op social media kan hun methode een inschatting maken van de mate van risico die een individu vormt.? In deze specifieke pilot kwamen ze op die manier tot een heat-list van 300 namen. De Londense politie bemerkte dat daar zes nieuwe namen bijstonden, waarvan er vijf in de weken daarna een misdaad pleegden.

IBM zou IBM niet zijn als ze niet met ook op deze markt waren gesprongen. Met hun Jeopardy spelende Watson computers en een beroemd pakket als SPSS is het logisch dat zij er vroeg bij waren. Al in 2005 experimenteerden?ze samen met de universiteit van Memphis met Blue CRUSH (Criminal Reduction Utilizing Statistical History) waar de algehele criminaliteit na een aantal jaar met 30% terugliep, en geweldsmisdrijven met 15%. Memphis behoorde in 2009 nog tot de top 3 van Amerikaanse gevaarlijkste steden. De politie van Memphis beschrijft de successen deels aan deze gerichte aanpak: ?de juiste politie inzet op de juiste plek en plaats?. Blue CRUSH gebruikt misdaadgegevens en surveillancedata om de politie gericht en op tijd naar locaties te sturen om daar (soms in burger) te surveilleren, auto?s staande te houden of undercover operaties te plannen. In oktober 2010 waren er 75% minder autodiefstallen en inbraken in bedrijven daalden met 67%. In 2007 leidde Blue CRUSH met ?Operation HeartBreak Hotel? tot het aanpakken en sluiten van vier motels waar structureel drugshandel, prostitutie, overvallen en moorden plaatsvonden. In 2008 werd door de Memphis politie een Real Time Crime Center van 3 miljoen neergezet. Onderzoek van Nucleus Research wees uit dat de opbrengst (oa het aantal agenten dat nodig is voor het verminderen van criminaliteit) van een dergelijk centrum meer dan 7 miljoen per jaar was.

IBM kiest nu, net als bijvoorbeeld Accenture en BAIR analytics, voor een andere aanpak dan PredPol. Niet een gelikte, black-box oplossing maar een volledig analysepakket waarin de analist zoveel mogelijk informatie tot zijn beschikking heeft. Andere software-giganten zoals Oracle die het veiligheidsdomein bedienen maken een soortgelijke beweging. Gezien de populariteit van Predpol lijkt de keuze van ?het grote publiek? echter al gemaakt, en is er meer behoefte aan een simpele, maar duidelijke user-interface dan aan nog meer informatie en analysemogelijkheden. Ook burgers willen simpelweg weten hoe het zit in hun buurt en krijgen vandaag de dag al misdaadkaarten op maat voorgeschoteld (zgn. Crime Maps) op het web of in een app zodat ook zij kunnen meedenken en doen.

Hoewel het overzicht niet compleet is, zitten er wel wat verschillen in de beschikbare producten. Ook hangen er verschillende prijskaartjes aan. Sommige producten zijn niet meer dan software, anderen bieden aanvullende maatwerkdiensten of zelfs analisten van vlees en bloed als je dat deel wilt uitbesteden. Grote partijen als IBM en Microsoft pakken flink uit en daar betaal je ook voor, terwijl Predpol, BAIR en Accenture de middenklasse bedienen. Aan oplossingen als het door de Nationale politie zelf ontwikkelde CAS hangt geen expliciet prijskaartje maar laat wel zien dat technologische oplossingen in deze fase van ontwikkeling nog ook prima zelf gebouwd kunnen worden.

Onderstaande tabel toont de gebruikte methoden (uit de classificatie van RAND) van de genoemde oplossingen. Besef wel dat dit een momentopname is, want de markt groeit momenteel stevig met nieuwe oplossingsrichtingen en nieuwe spelers.

?	Near repeat	Spatio-temporal	RTM	Data Mining
Predpol	X	X		X
Daily Crime Forecast	X	X
Criminaliteits Anticipatie Systeem (CAS)	X	X	X	X
HunchLab	X	X	X	X
Precobs	X	X
Accenture				X
IBM SPSS Crime Prediction	X	X	X	X
BAIR analytics	X	X		X

De toekomst

Slimme, effectieve en proactieve aanpak tegen misdaad is duidelijk beter dan achter criminelen aanhollen. Predictive policing, tesamen met de ontwikkelingen op het gebied van Big Data (het nieuwe goud voor de politie), is daarom een enorme vlucht aan het nemen. Maar ondanks deze ontwikkelingen, moet het verschil uiteindelijk op straat gemaakt worden: door agenten die met deze uiterst relevante informatie op de juiste tijd en plaats slim kunnen ingrijpen.

De meeste van de genoemde methoden hangen nog in wetenschappelijke hoek, maar de politie in Nederland omarmt het al wel. Onlangs schreef intelligenceprofessional Rutger Rienks er namens de politieacademie een toegankelijk boek over en iets eerder al was predictive policing officieel toegevoegd als innovatiedomein aan de business intelligence roadmap van de Nationale Politie

Hoe hard het gaat toont Silicon Valley, waar al een R2D2 robot agent rondrijdt met de naam Knightscope. Het is een volledig autonome robot op Segway wieltjes die kan horen, zien en luisteren (zelfs in de nacht en op social media) en zelf bepaalt waar hij heen moet op basis van predictive policing software. Het algoritme zal hem op het pad van zakkenrollers zetten in het drukke winkelcentrum en even later naar de parkeerplaats sturen op zoek naar autodieven. Het apparaat registreert nu alleen nog en produceert 90 terabytes aan data per jaar. Praten of ingrijpen doet het (nog) niet. Nu kost het ding nog een paar duizend euro, maar over een paar jaar kun je deze digitale agent voor een paar honderd euro in je robot grasmaaier in je voortuin laten rondrijden. Het gebruik van predictive policing zal in de toekomst democratiseren.

Predictive profiling en meer…

Die trend van voorspelling is al lang aan de gang en groeit vooral flink in commerci?le toepassingen. De meeste mensen weten het niet, maar bedrijven als Facebook werken al met big data en algoritmen om hun klanten te screenen. Ook dat gaat ver. Schrijf je bijvoorbeeld altijd berichtjes aan meisjes van dertien, en gebruik je ook het trefwoord seks een beetje te vaak, dan kan Facebook jou als verdachte aanmerken en de politie inseinen. Dit voorbeeld is trouwens echt gebeurd. Met de politie in de rol van het meisje (op haar computer). Goed, dat een viespeuk wordt opgepakt zullen we allemaal niet zo erg vinden. Maar wat als Facebook straks voorspellingen gaat doen over mogelijk druggebruik, of wie er straks allemaal naar alle waarschijnlijkheid mee zullen doen met nieuwe rellen in Londen. En Facebook kan dit nu al, juist omdat men alles kan volgen. Zonder gerechtelijk bevel om die priv?gegevens in te zien (dat heeft de politie wel altijd nodig). Dat gaat heel ver.

De universiteit van Virginia lukte het om met hun algoritmes 19 van de 25 onderzochte misdaadvormen?in Chicago te voorspellen. Met Twitter als databron.?Vooral bij misdrijven als stalking, diefstallen en mishandeling blijkt Twitter interessante aanknopingspunten op te leveren. Niet met berichten als: ?Ik ga vanavond mijn ex weer eens stalken.? maar met berichtgeving over ?dronken worden? in een bepaalde geografische omgeving blijkt het een voorspellende gave te hebben.

In New York werkt de politie samen met Microsoft aan een zeer geavanceerde analysetool, het Domain Awareness System (DAS). Die kan de beelden van de meer dan 3000 politiecamera?s in de stad analyseren, inclusief alle databases die de politie tot haar beschikking heeft. Het wordt dan mogelijk precies na te gaan waar een verdachte auto in de weken voor een misdrijf is gesignaleerd. New York heeft daartoe ook een?Real Time Crime Center?opgezet dat deze forecasting-technieken gebruikt. In New York wordt onder andere RTMDx gebruikt voor voorspellingen:

In 2013 werd DAS nog aangehaald?bij het vinden van de terroristen na de aanslag tijdens de Boston Marathon. Maar van het systeem konden wij helaas enkel anekdotisch bewijs vinden. Zo zouden de camera systemen die met DAS gekoppeld zijn helpen voor kleine diefstallen waar lokale huiseigenaren erg blij mee waren. Er is echter geen structureel en hard bewijs geleverd dat het DAS systeem structureel voor minder misdaad zorgen.

Peter de Kock promoveerde recent aan de universiteit van Tilburg op het gebruik van scenario?s om terroristische aanslagen te voorspellen. Met een achtergrond aan de filmacademie en voormalige carri?re als cameraman, producent en regisseur onderzocht hij de parallel tussen een filmscenario en een aanslag. Beiden hebben een communicatiedoel, een boodschap die een bepaalde beleving teweeg moet brengen bij het publiek om hopelijk een hoger doel te bereiken. Hij kwam tot een lijst van 12 elementen waar zo?n scenario uit kan bestaan: een hoofdrolspeler, een slechterik, een plaats, een tijdstip, een motivatie, een doel, een middel, een modus-operandi, de tegenstand, symboliek en een dwaalspoor. De in het model verzamelde scenario?s (criminele gebeurtenissen) maken trends en relaties zichtbaar die kunnen worden gebruikt om de aannemelijkheid van toekomstige criminele incidenten te berekenen. Sterker nog, in potentie zouden zelfs alle verzonnen scenario?s uit boeken of films een voorspellende waarde kunnen bevatten. Immers: als een terrorist iets bedenkt, is er een kans dat iemand anders op de wereld het idee weleens uitgewerkt heeft in een stripboek, een misdaadroman of krimi op TV.

Zie hieronder het interview dat hij gaf op de dag van zijn promotie in De Wereld Draait Door, met de kern van zijn onderzoek: ??wij zijn [?] nu voor de eerste keer in staat om heel veel data te genereren, heel veel data te wassen [?] Tot voor kort was het belangrijk wie dat opsporingsonderzoek leidde en of die de juiste kennis had. Nu kun je die kennis apart in een database zetten en iedereen heeft daar toegang toe die je daar toegang toe verleent. En dat gaat diegene helpen die de interpretatie moet maken.?

Kritiek

Het gevaar is wel dat de politie of andere partijen straks allerlei mensen gaat oppakken om vervolgens te zeggen: ja, dat moest van mijn algoritmen.

Evgeny Morozo maakt zich ernstige zorgen over predictive policing en wijdt in zijn laatste boek ?To Save Everything, Click Here? een heel hoofdstuk aan deze ontwikkeling, die bovendien de grootste databron van de wereld (het internet) niet links zal laten liggen in zijn analyses waardoor het allemaal heel eng kan worden.

Straks worden we door Facebook bij de politie aangegeven voordat we ook maar iets hebben gedaan. Of een priv? detective koopt je data. Of op grond van de Nederlandse versie van PredPol staande gehouden terwijl we geheel onschuldig met een gereedschapskist door een buurt lopen waar statistisch op dat moment veel wordt ingebroken. Dan heb je als burger ineens veel uit te leggen. Die algoritmen weten ook niet alles natuurlijk.

Rutger Rienks van de Nationale Politie beschreef een toegankelijke inleiding op predictive policing met een praktijkvoorbeeld van Nederlandse bodem dat deze risico?s mooi weergeeft:

?In 2011 is in Driebergen een systeem ontwikkeld dat op vergelijkbare wijze drugsrunners kon detecteren die hero?ne over de weg vervoerden (Schakel et al., 2012). Het systeem kon op basis van een tweetal waarnemingen een drugsrunner onderkennen. Enerzijds aan het bewegingspatroon van een voertuig dat op en neer reed tussen twee steden binnen een bepaald (kort) tijdsbestek. Anderzijds aan het feit dat het waargenomen voertuig eerder in verband was gebracht met drugsgerelateerde feiten. Meerdere camera?s konden langs een route voertuigen herkennen met behulp van een referentiebestand met voertuigen die met drugs in aanraking waren geweest. Dit ging op eenzelfde wijze als de herkenning van een gestolen voertuig. Zo reikte het systeem ons op een presenteerblaadje aan welke voertuigen ?controlewaardig? waren. Door de controleploeg te richten op de door het systeem aangewezen voertuigen ging het aantal gevonden grammen hero?ne per gecontroleerd voertuig omhoog van 5 naar 1027 gram. Bovendien was de afhandelcapaciteit vele malen kleiner. Metingen hadden van tevoren aangegeven hoeveel voertuigen de politie gemiddeld op een avond kon verwachten. Hierop werd de capaciteit op ingericht.

Ook hier ging niet alles goed. Een dame, die in haar nieuwe tweedehands auto met een klein poedelhondje een spuitje haalde bij een dokter, werd door het systeem aangewezen als drugsrunner. Aangezien de politie de voertuigen niet heel vriendelijk tot stoppen maande, was in dit geval een bosje bloemen achteraf gerechtvaardigd.?

Een?rechter zal hier waarschijnlijk geen genoegen mee nemen. Ook al weten we dat de meeste misdaad voorkomt in arme, multiculturele wijken, de politie kan niet zo maar ineens alle mensen gaan oppakken op grond van een impuls. Er zal toch minstens een aanwijzing moeten zijn dat voortkomt uit het algoritme: het moet immers controleerbaar zijn.

En wat moeten we met zaken die helemaal niet bij de politie worden aangegeven, zoals veel verkrachtingen en geweld? Voorspellend politiewerk is gebaseerd op misdaadstatistieken. Als die er niet zijn zal de software dus alleen voorspellingen kunnen doen over misdaden die ooit zijn aangegeven. En blijft de rest ? zoals veel andere misdrijven ? ongezien (de zgn. dark number). Predictive Policing richt zich om die reden vooral op veelvoorkomende delicten waar een klein aantal mensen een rol in speelt (zoals veelplegers uit de buurt of rondtrekkende dadergroepen); vermogensdelicten zoals woninginbraken en straatroof waar vaak aangifte van wordt gedaan. Maar op termijn, met meer en betere beschikking van vroegtijdigere signalen, valt te verwachten dat ook bijvoorbeeld liquidaties in de onderwereld, een radicaliseringsproces of zelfs een crime-passionele voorspeld kunnen gaan worden.

Technologisch gezien zou Predictive policing exponentieel verder kunnen groeien. Maar vanuit maatschappelijk en organisatorisch oogpunt zit er nog een rem op. Wil de politie wel zoveel gaan vertrouwen op technologie? Is de organisatie er wel klaar voor? Nemen algoritmes en robots het werk van agenten op diverse vlakken zometeen over? En wat zijn eigenlijk de juridische en ethische haken en ogen? Want we weten allemaal dat een 100% betrouwbare voorspelling een illusie zal blijven.

Tot slot: een handreiking

Predictive policing gaat over het slim toepassen van analytische technieken?om misdadigers of misdaden uit het verleden of voor de toekomst te kunnen vinden middels diverse statistische methoden. Kern van deze methodieken is dat op basis van slimme analyses van beschikbare gegevens de politie in die gebieden versterkt aanwezig is waar de kans op een volgend incident het grootst is. Van deze aanwezigheid gaat een aantoonbare preventieve werking uit.

Er is inmiddels voldoende sterk bewijs dat misdaad voorspelbaar is (in statistische zin), omdat criminelen misdrijven plegen in hun ?comfort zone?, maw in gebieden en op manieren die ze kennen en waar ze in het verleden succes mee geboekt hebben.

Evidence based policing

Het rapport van RAND, maar ook dit artikel geeft weer dat er weinig onderzoek is gedaan naar de effectiviteit van predictive policing en ook niet naar de effecten van gerichte inzet van politiecapaciteit op basis hiervan. En dat terwijl de politie, maar ook de overheid in het algemeen, het liefst evidence based werkt. Dat geldt voor de beleidsmatige kant, maar zeker ook voor de operationele inzet die nog steeds op cijfers wordt gestuurd. Want als een nieuwe aanpak niet bewezen werkt, waarom zou je er dan op investeren?

Bewijs voor succesvolle politie interventies is om te beginnen al een hele moeilijke discussie. Het centrum voor evidence-based criminaliteitsbeleid van de George Mason universiteit deed onder leiding van David Weisburd en Cynthia Lum onderzoek?naar 89 evaluaties van politie interventies en maakte een driedimensionale matrix die ook interactief op hun website te gebruiken is. Deze of andere soortgelijke evaluaties zijn echter tot nu toe niet gebruikt in de toepassing van predictive policing.

Het voordeel van predictive policing is dat het vaak in ieder geval eerst theoretisch gevalideerd kan worden: even droogoefenen op getallen en kijken of voorspellingen uit het verleden kloppen met zaken die je zelf ook constateerde zonder die voorspelling. En dat is wel zo veilig. Maar de vertaling van een goede voorspellingsmethodiek van theorie naar praktijk kan heel weerbarstig zijn, laat staan dat behaalde successen zijn toe te schrijven aan de verbeterde predictive policing intelligence.? Want wat als de voorspelling niet uit komt? Kwam dat door een verkeerde voorspelling? Of doordat je uitstekend hebt gehandeld op basis van de kennis uit deze voorspelling, en de crimineel door je aanwezigheid werd afgeschrikt?

Intelligence gestuurd werken

Er is veel veranderd in het omgaan met gegevens. Nog geen 3 jaar geleden werkte men met allerlei gegevens en rapportages nog veel op papier. De tijd is snel gegaan en andere manieren van werken hebben hun intrede gedaan. Zo is er bij de politie al sinds jaren een omslag gemaakt naar informatie gestuurd optreden, net zoals het bedrijfsleven dat al jaren zwaar inzet op business intelligence en zo processen optimaliseert. Maar ook gemeenten blijven niet achter. Grote gemeenten hadden al langer eigen onderzoeksafdelingen die op diverse manieren (middels enqu?teresultaten, meldingen en statistische analyses) input gaven voor beleid en operationele processen.

De gemeente Eindhoven bevindt zich in een transitie naar een informatiegestuurde veiligheidsorganisatie en kent nu een heus intelligence cluster. Dat betekent dat er ten aanzien van de beleidsmatige en operationele aanpak gericht wordt gestuurd op de besluitvorming middels (veiligheids)informatieproducten (intelligence). Op allerlei plekken in het proces worden informatieknooppunten ingericht waar data, methodieken en vooral ook slimme mensen uit diverse instanties zich buigen over veiligheids-en leefbaarheidsproblemen in de buurt, wijk, stad of regio. Middels eenvoudige visualisaties van inzichten worden uitvoerende diensten intrinsiek gemotiveerd zelf ook te werken met deze rijke informatie en er zelf aan bij te dragen. Maar ook andere aandachtsgebiedshouders buiten het domein van veiligheid worden geprikkeld door de voornoemde producten.

Iedereen is op zoek naar verbetering en krijgt met meer data en inzichten een steeds beter begrip en gevoel bij de problematiek in de wijk en kan daarmee gezamenlijk de burger beter van dienst zijn. Samen sta je sterker, met Big Data als steun in de rug.

De politie heeft natuurlijk diverse criminaliteitsgegevens en haar eigen informatie en analyseknooppunten, maar de gemeente wil ook andere zaken berekenen om inzicht te krijgen. Bijvoorbeeld de kans dat iemand slachtoffer wordt, zoals het besmettingsrisico bij woninginbraken, om zo meer aan preventie te kunnen doen. Voorkomen is nog altijd beter dan genezen, en dan zijn niet alleen misdaadcijfers van belang, maar ook meer inzage in mogelijke verklaringen hiervoor. Oorzaken voor woninginbraken kunnen bijvoorbeeld liggen in straatverlichting of veel voorkomen bij bepaalde typen woningen wat weer input geeft voor andere ruimtelijke ordening.

Er is veel discussie over bredere uitwisseling van gegevens en samenwerking. Er zijn namelijk veel gegevens waarvan bekend is dat die er toe doen, maar die niet gebruikt mogen worden om redenen van privacy. Voorspellingen van onveiligheid worden beter als locaties (woonadressen) van veelplegers worden meegenomen. Maar ook risico-profielen van gezinsleden van bekende ‘jeugdcriminelen’ maken een vroegtijdige (en gerichte) preventieve aanpak mogelijk. Ook op een hoger abstractieniveau kunnen geanonimiseerde gegevens over bijvoorbeeld werk en inkomen (uit het Suwinet) helpen om het DNA van de buurt beter te begrijpen en erop in te spelen. Gegevens van de belastingdienst of van woningcorporaties dragen ook bij aan dat inzicht. Doelbinding houdt deze mogelijkheden nu tegen, ook al zou het gaan om geabstraheerde of geanonimiseerde gegevens.

Dataficatie = data fixatie?

Er is exponentieel meer data beschikbaar over de dingen om ons heen en steeds meer dingen uit onze omgeving produceren deze data (Internet of Things). Big Data uit een enorme diversiteit aan bronnen verteld ons steeds meer over menselijk gedrag en kan dit voorspellen. Toch is onze digitale glazen bol met data nog wat wazig. Er wordt hard gewerkt door grote partijen om dit te verbeteren en die ontwikkelingen gaan snel.

De ontwikkelingen zijn exponentieel op velerlei gebied: exponentieel meer data uit exponentieel meer bronnen (alleen al social media kent honderdduizenden verschillende soorten bronnen en dataformaten), steeds meer contexten van toepassing in een complexer wordende maatschappij met steeds meer techniek waar het gedrag van criminelen zich bovendien ook nog op aanpast. Hoe krijg je goede voorspellingen die inspelen op de steeds dynamischere wereld? Vroegsignalering en steeds meer real-time gegevens verwerken is daarin van belang, maar het blijven altijd voorspellingen die getraind zijn op basis van het verleden. Een nieuwe context laat zich moeilijk voorspellen.

Toch is het een gevaarlijke valkuil om vooral aan de technologische ontwikkeling te denken en alleen te blijven werken aan betere computervoorspellingen. Eerder al gaven we aan dat het pareto principe (de 80/20 regel) opgaat in de voorspellingen. Verbeteringen in de techniek zitten dus al snel in de marge. Het is veel belangrijker na te denken over de vraag hoe je met een enigzins betrouwbare voorspelling effectief aan de slag kunt gaan. Het slim inregelen van operationele inzet van mensen en slimme interventies is waar de crux zit. Zonder de juiste acties geen resultaat, hoe goed een voorspelling ook is.

Er zijn daarom al experimenten gaande waarin gekeken wordt hoe ook de juiste inzet door een computer aangestuurd kan worden. Dat gaat verder dan een vrijblijvende voorspelling, maar kent uiteraard ook risico?s. Flitshandel op de beurs laat zien hoe zoiets mis kan gaan, beurskoersen kelderen en worden gemanipuleerd enkel omdat de systemen volledig autonoom functioneren en geen verder besef hebben van context en daarom gewoon uitvoeren hoe ze zijn geprogrammeerd.

Humans in the loop

Toch zou predictive policing meer moeten zijn dan computers die een spelletje cluedo spelen met Big Data en boeven vangen met logisch redeneren. Want boeven aanhouden doen machines nog niet, daarvoor is een goede vertaling naar de operationele inzet van agenten op straat nodig. Heterdaadkracht leunt nog vooral op mensenwerk en daar zit nu juist de crux.

Een belangrijke vraag bij predictive policing is dan ook: Hoe kun je de feedback loop sluiten met informatie van de straat, van professionals en burgers? Ook een goede relatie tussen analisten achter het bureau en agenten op straat die samen zorgen voor het totale intelligence netwerk is essentieel. Zonder mensen sta je nergens met intelligence, en al helemaal in de huidige fase van predictive policing waarin alles nog in de kinderschoenen staat. Human in the loop by design is de essentie van het principe dat wij voorstellen, omdat we de mens als belangrijkste schakel in elke toepassing van predictive policing zien. Alle menselijke schakeltjes moeten ingebakken zitten in het ontwerp van predictive policing: denk aan de analisten, de leiding, beleidsmakers en de agenten op straat. Hoewel de menselijke schakel onder druk staat in de huidige informatiemaatschappij, is veel data die de politie nu gebruikt nog steeds door mensen verzameld, verwerkt en in context geplaatst. Analisten doen vervolgens diverse interpretatieslagen en mensen nemen besluiten op basis van deze adviezen waarna maatregelen door mensen worden genomen, die vervolgens weer door mensen worden beoordeeld op hun effectiviteit. Academici doen al honderden jaren onderzoek naar waarom mensen crimineel worden, en hoe ze zich dan gedragen. Waarom wordt al die informatie, bij al die verschillende mensen, overboord gegooid en platgeslagen tot cirkeltjes rond een positie uit een database?

Het gewoonweg toevoegen van meer data lost dit tekort aan kennis niet op. Correlaties en causale verbanden zijn altijd lastig te bevatten. In gebieden waar veel politie is, is statistisch gezien ook veel misdaad. Dat wil niet zeggen dat misdaad veroorzaakt wordt door de aanwezigheid van politie. Als je maar genoeg data toevoegt is er altijd wel een correlatie te vinden. Zo kun je het aantal moorden met behulp van stoom of hete vloeistoffen al jarenlang perfect voorspellen door middel van de leeftijd van de Miss America van dat jaar. Maar is dat een nog onbegrepen oorzakelijk verband, of gewoon toeval?

Als je de eigen (jarenlang opgebouwde) kennis van academici, analisten en mensen op de straat wil toevoegen betekent dit dat je daar expliciet van te voren al rekening mee moet houden. Dat betekent dat deze rol in de gebruikte methode(n) moeten inbakken anders komt de mens steeds meer langs de zijlijn te staan. Niemand snapt het systeem dan meer en je gaat ingrijpen ?omdat het systeem dat zegt?. Maar is dat wel voldoende voor een ?probable cause? (NL variant hiervan; een redelijk vermoeden hebben) om iemand staande te houden of zelfs aan te houden?

De mens is slimmer tot de het moment van singularity; het moment waarop computers niet alleen sneller of accurater kunnen rekenen, maar ook creatiever, slimmer en bewuster zijn dan mensen. Dat duurt nog minstens een decennium en zelfs dan is het de vraag of je iets dergelijks in handen van een machine wil leggen, want dan komt Minority Report wel heel dichtbij.

Verbreding van de toepassingen

Doordat steeds meer databronnen eenvoudig voor handen komen nemen de toepassingen ook toe. Zo kan alleen al de politie predictive policing methoden uitbreiden van veelvoorkomende criminaliteit en high impact crime naar ondermijning. En naast een thematische aanpak kan het ook in de opsporing individuele zaken helpen. Of een doorbraak leveren in hele reeks van zaken. Van zakkenrollers tot terrorisme, en van preventie en handhaving tot opsporing: mogelijkheden genoeg. En niet alleen de politie profiteert van predictive policing. De genoemde methoden zijn ook toepasbaar voor diverse andere veiligheidspartijen zoals gemeentes, veiligheidsregio?s, belastingdienst, maar ook het bedrijfsleven. Of bijvoorbeeld de Defensiehoek waar men ontdekte dat het gedrag van opstandelingen enigszins leek op dat van georganiseerde criminelen.

Een toepassingsvoorbeeld uit een andere hoek dan de politie is bijvoorbeeld een nieuw computermodel van TNO dat gebruikt werd om overlastsituaties in wijken te voorspellen en interventies te laten berekenen die het beste zouden moeten werken in die specifieke situatie.

De theorie is gebaseerd op Patricia L. en Paul J. Brantingham die zogenoemde crime attractors introduceerden. Dit zijn plaatsen die potenti?le overlastveroorzakers aantrekken, maar niet noodzakelijk zelf overlast veroorzaken. Een voorbeeld hiervan is een bankje in een park. Gekoppeld met de theorie van Richard Wortley die juist een verklaring voor de hoeveelheid criminaliteit in een gebied geeft werd een model gevormd. Deze laatste theorie is gebaseerd op crime precipitators. Dan gaat het om omgevingsfactoren die aanmoedigend werken op personen om overlast te veroorzaken. Een caf? en discotheek zijn daar logische voorbeelden van.

Ieder object, gebouw of gebied in een omgeving kan fungeren als precipitator, attractor, of allebei. Want precipitators cre?ren een bepaald niveau van overlast, terwijl attractors bepalen waar de overlast plaatsvindt. In een analyse voor regio Haaglanden, met data van onder andere hoeveiligismijnwijk.nl en Open Street Map? als databron voor omgevingskarakteristieken, bleken de 4 grootste bronnen van overlast bars, caf?s, fastfoodrestaurants en supermarkten te zijn, en hotels of buurthuizen een effectief middel om overlast te verminderen.

Democratisering

De gemeente Eindhoven gebruikt inzetkaarten die voor diverse doelgroepen gebruikt kunnen worden. Zo weten bijvoorbeeld de BOA?s (Buitengewoon Opsporings Ambtenaar) van stadstoezicht welke thema?s waar en wanneer kunnen spelen, zodat hun operationele inzet effectiever ingezet wordt. En burgers ervaren dit ook zo, men ziet merkbaar meer politie en hulp of toezicht daar waar nodig. Men is vaker en sneller op de juiste plek en tijd dan voorheen. Ook door meer en betere samenwerking en prioriteitstelling tussen instanties.

Maar waarom zijn predictive policing methoden niet ook toepasbaar voor bedrijven of burgers die in een Buurt Interventie Team (BIT) of met hun hond (project WAAKS) een rondje in de wijk doen en gericht kijken op de juiste plek en juiste tijd waardoor preventie veel effectiever zou kunnen worden? Welke informatie kun je hun geven? De vraag is natuurlijk of dat altijd wel gewenst is. Als je op huis-niveau kunt bepalen wat de dreiging is van een inbraak, wil je dan echt naar de bewoners communiceren dat er een grote dreiging is? Zelfs als die dreiging enkel een kans van 1 op 100 is?

Handelingsperspectief

Je staat in het rode vakje, en dan? Moet je nog langer wachten? En hoe veel langer dan? Waar moet je op letten? Waar moet je naar kijken? En wat moet je eigenlijk doen? Predictive policing ontbeert nu nog handelingsperspectief.

Voorspellingen maken is namelijk maar het halve werk. Algoritmes vangen geen boeven, dus het gaat er om wat je daadwerkelijk kunt met de voorspelling. En dat is juist hoe je de waarde van een voorspelling zou moeten bepalen. Het correct voorspellen is namelijk niet het primaire doel, effectief ingrijpen is dat wel. Logischerwijs is de waarde van een voorspelling dus heel iets anders dan de correctheid. Daarom zou ook het doel niet moeten zijn om modellen te ontwikkelen die zo goed mogelijk kunnen voorspellen, maar om modellen te maken die leiden tot een zo groot mogelijk effect als er naar gehandeld wordt.

Je kunt zelfs interventies laten doorrekenen en meenemen in de voorspellingen. Bestaan er aantoonbare verbanden tussen patrouille-routes en inbraken? En kun je die informatie gebruiken om je interventies in te richten? Nog beter is zelfs om niet enkel de patrouille mee te nemen in de voorspelling, maar om juist de effectiviteit van de interventie zelf te voorspellen. Welke actie heeft nu een zo groot mogelijk effect? En logischerwijs hoe, en wat communiceer ik dan naar diegene die de interventie dan gaat uitvoeren?

Privacy, transparantie en rechtmatigheid

Er zijn ook nog een aantal aandachtspunten op het gebied van privacy, transparantie en rechtmatigheid. Allereerst is het van belang om te bekijken wat de toepassing van de analytische software betekent voor de privacy van individuele burgers. Dat is met name het geval wanneer gebruik wordt gemaakt van real-time data. Dit impliceert namelijk dat in meer of mindere mate bewegingen van individuen of groepen gevolgd of inkaart gebracht kunnen worden. Indien gegevens herleidbaar zijn tot individuele personen is er sprake van persoonsgegevens en is de dataprotectiewetgeving van toepassing. Vanuit een breder perspectief zou een analyse op grond van artikel 8 EVRM aangaande het recht op eerbiediging van de persoonlijke levenssfeer van belang zijn. Ook al gaat het om de publieke ruimte, dan nog is de bewegingsvrijheid van het individu een recht dat door dit artikel beschermd wordt, omdat er ook de vrijheid is om jezelf vrij te bewegen. Een inbreuk op het recht op privacy is wel toegestaan, maar in die gevallen moet er een wettelijke basis voor bestaan en dient tevens aan proportionaliteit en subsidiariteit te zijn voldaan. Die toets is niet altijd eenvoudig. In het bijzonder wanneer, zoals in dit overzicht aangegeven, het causale verband tussen predictive policing en een daling van criminaliteit niet altijd eenduidig vast te stellen is.

Wat betreft transparantie is vereist dat beslissingen, zoals een preventief ingrijpen, te verantwoorden zijn. Ze zijn immers gebaseerd op een voorspelling of afweging. Algoritmen die tot een advies leiden zullen niet altijd even doorgrondelijk zijn. Bovendien geven voorspellingen vaak een probabiliteit aan. Het zijn dus geen harde, feitelijke waarheden, ook al zullen ze in een groot deel van de gevallen juist zijn. Juist daarom is het van belang om de systemen als hulpmiddel te gebruiken om effici?nter en gerichter te kunnen werken. De systemen zijn niet per s? leidend, dat is de kennis en kunde van de ervaren politieagent.

Dan moet de rechtmatigheid van de systemen bekeken worden. Welke waarborgen worden ingebouwd in het systeem of in de organisatie die een systeem gebruikt om te zorgen dat er geen vergissingen worden gemaakt? En in het geval dat er toch iets misgaat, hoe wordt dat dan opgelost? De voorspellingen zijn gebaseerd op patronen en wanneer het om specifieke groepen of personen gaat om profielen. Die profielen zijn ook gemiddelden en geen harde waarheden. Het gevolg kan echter wel zijn dat mensen doordat ze aan een profiel voldoen of daarbij worden ingedeeld een ?stempel? krijgen en verdacht zijn. Of op zijn minst extra aandacht krijgen. Dat zijn risico?s die zoveel mogelijk vermeden moeten worden. In de praktijk kan dit immers betekenen dat latente vooroordelen expliciet worden, omdat causale verbanden onbewust aan die vooroordelen worden gekoppeld, ongeacht of dat terecht is. De onvoorspelbaarheid van een systeem maakt dat er ook extra waarborgen tegenover moeten staan. Een belangrijk deel daarvan bestaat uit de rechtmatigheidstoets. Hoeveel waarde of bewijswaarde kan worden toegekend aan een voorspelling van een systeem en hoeveel aanvullend bewijs is vereist? En wat voor bewijs dan?

Vandaag?beginnen?

Gecontroleerd gaan proberen is gelukkig goed mogelijk. Het is een veilige methode. Je kunt zelfs eerst theoretische tests doen voordat je de praktijk ingaat. Je kunt bestaande producten gebruiken maar met de juiste kennis ook zelf aan de slag. De instap is nu nog laag, omdat het nog eenvoudige methoden betreffen. Als je iets vind of bouwt dat lijkt te werken is het van belang om parallel daaraan de mensen in de loop te nemen. Analisten, maar ook mensen die beslissingen mee nemen op leidinggevend niveau en in de uitvoering.

Je kunt?beginnen door een competitieve test uit te voeren, voor een systeem?kiezen en dat langzaam uitrollen. Dat laatste is belangrijk, omdat mensen een gevoel?moeten krijgen voor de mogelijkheden van het systeem. Invoering van Prescriptive Policing?vraagt dus om professionalisering van de politie. Pas als men meetbaar maakt wat het?effect is van een interventie wordt de stap naar het vierde implementatieniveau mogelijk. De?innovatie moet stapsgewijs plaatsvinden in publiek-private samenwerking met leveranciers?en kennisinstellingen, waarbij in Living Labs wetenschappelijke kennis wordt toegepast in de?politieomgeving, samen met technologieleveranciers.

Vooruitkijkend liggen er op meerdere vlakken nog kansen. Bijvoorbeeld de gemeente Eindhoven is goed op weg om een van de vele Smart Cities te worden die gebruik maakt van Big Data mogelijkheden om inwoners beter van dienst te zijn. Maar deze ontwikkelingen moeten nog regionaliseren, om grotere patronen te ontdekken. Een stad als Eindhoven kan veel leren van intelligence uit omliggende gemeenten en andersom, vooral omdat de mensen overal doorheen stromen en criminelen zich ook niet aan de stadsgrenzen houden. Verderop gelegen liggen uiteraard landelijke inzichten en onderlinge benchmarks van gebieden die op elkaar lijken en ook internationale samenwerking.

Door: Arnout de Vries, programmamanager intelligence en social media specialist en Selmar Smit, data scientist, beiden werkzaam bij TNO

Social Media DNA

SocialMediaDNA richt zich op kennisdeling rondom social media, politie en maatschappelijke veiligheid. Onderwerpen vari?ren van de online aspecten van openbare orde, opsporing, vervolging, rechtspraak tot crisisbeheersing en communicatie.

Tagarchief: hunchlab

Wat er mis is met predictive policing

Predictive policing: een overzicht