big data analytics

Recherchewerk verandert ingrijpend door de mogelijkheden van Big Data analytics. De politie gaat samenwerken met wetenschappers om beter informatie uit in beslag genomen smartphones en computers van verdachten te kunnen halen. Het idee is dat een computer met nieuwe technieken razendsnel miljoenen foto’s, berichten, locatiegegevens en filmpjes kan doorpluizen op zoek naar verbanden die een agent met het blote oog niet snel ziet.

De politie begint daarvoor het project ‘Politielab’ met Amsterdam Data Science. Dat is een samenwerkingsverband van de twee universiteiten en hogeschool in Amsterdam, en het Centrum Wiskunde & Informatica.

Drie promovendi van de Universiteit van Amsterdam gaan hun promotieonderzoek doen bij de politie door de computertechniek deep learning te gebruiken voor opsporingswerk. Deep learning-netwerken zijn goed in het herkennen van patronen.Er is veel belangstelling voor vanuit de wetenschap, zegt de politie. Er moeten programma’s worden ontwikkeld om snelle data-analyse mogelijk te maken. De promovendi worden gefinancierd vanuit de politie.

“Er zijn steeds meer data aan het werk, waardoor het steeds moeilijker is om verbanden te ontdekken. Daarom willen we de expertise van de wetenschap gebruiken”, zegt Theo van der Plas, programmadirecteur digitalisering en cybercrime bij de politie in het NOS Radio 1 Journaal. De ontwikkelingen in de wetenschap gaan volgens hem zo snel dat de politie daar graag bij wil aansluiten.

NOS Tech podcast in gesprek met Theo van der Plas:

Misdaden sneller oplossen

De techniek helpt bij het ontdekken van nieuwe verbanden die rechercheurs niet met het blote oog kunnen zien. De computer kan razendsnel grote hoeveelheden bestanden met elkaar vergelijken en verbanden leggen. “Uiteindelijk zullen we daardoor sneller de onderzoekslijn vinden en sneller tot de oplossing van een misdaad kunnen komen”, zegt Van der Plas.

“Er is bijvoorbeeld een grote hoeveelheid foto’s van huiskamers. Combinatie van die beelden kan tot de conclusie leiden dat het om een clubhuis gaat waarvan een criminele bende gebruikmaakt. Door deze data science kunnen we mogelijk herleiden waar dat clubhuis staat en dat helpt ons enorm in het onderzoek.”

Uitdagingen

De enorme hoeveelheid gegevens in strafrechtelijke onderzoeken waar de politie mee te maken krijgt, brengt nieuwe uitdagingen met zich mee, zegt Theo van der Plas, programmadirecteur digitalisering en cybercrime van de politie. “Zoals hoe je eruit haalt wat je nodig hebt. Of hoe haal je eruit wat je nog niet wist dat je nodig hebt voor het onderzoek? Ik verwacht dat we met de nieuwe technieken verbanden gaan zien die we nooit eerder hebben ontdekt.”

Nu al gebruikt de politie computertools waarmee automatisch kan worden gezocht in gegevens. Politielab moet de volgende stap zetten. Zo moet de rechercheur met een druk op de knop een samenvatting krijgen van wat er interessant kan zijn van alle in beslag genomen apparaten. De computer ziet relaties en (afwijkende) patronen in de gegevens.

Om een voorbeeld te geven: de computer herkent dat twee foto’s op verschillende apparaten op dezelfde plek zijn genomen. Dat kan aan de hand van bijvoorbeeld locatiegegevens en objecten die op de beelden te zien zijn. Voor de politie kan het een indicatie zijn dat twee verdachten op dezelfde plek zijn geweest.

‘Wapenwedloop’

De samenwerking met de wetenschap is voor de politie een belangrijke stap in ‘de wapenwedloop’ met criminelen, zegt Van der Plas. “Criminelen hebben veel mogelijkheden om het ons lastig te maken. Ze versleutelen hun berichten en maken gebruik van allerlei verschillende communicatiemiddelen. Door de nieuwe tools kunnen wij straks hopelijk meer kennis halen uit de berg informatie die we in beslag hebben genomen.”

Daarmee worden niet alle problemen voor de politie opgelost, erkent hij. Gegevens die versleuteld zijn, zijn ook met de nieuwe tools niet te doorzoeken. Daarom is ook de nieuwe Wet Computercriminaliteit, die momenteel in behandeling is in de Eerste Kamer, belangrijk, zegt hij. Die geeft de politie de bevoegdheid computersystemen van verdachten te hacken, wat er onder meer voor moet zorgen dat informatie wordt verzameld vóórdat die versleuteld is.

politielab

Toestemming

Daarnaast heeft de Hoge Raad zich onlangs uitgesproken over het doorzoeken van alle informatie op een smartphone. Dat kan een bijna compleet beeld opleveren van iemands persoonlijke leven en mag volgens het arrest dus niet zonder toestemming van een officier van justitie of rechter-commissaris, wat tot voor kort niet altijd gebeurde.

Ook de nieuwe tools die in het Politielab worden ontwikkeld, zullen aan de waarborgen voldoen, zegt Van der Plas. Zo gaat de politie volgens hem niet ongericht analyses toepassen op de in beslag genomen apparaten als de informatie niet relevant is voor het onderzoek.

Computers kunnen steeds beter rechercheren

Zo kunnen computers steeds beter foto’s interpreteren. De politie kan daar haar voordeel mee doen bij onderzoeken. Oefening baart kunst. Dat geldt voor mensen, maar ook voor computers. Dus als je wilt dat een computer herkent dat er bijvoorbeeld een wapen op een foto staat, dan moet je eerst heel veel voorbeelden van wapens tonen.

Op de Amerikaanse Stanford-universiteit zijn ze om die reden bezig geweest met het invoeren van miljoenen gelabelde foto’s van allerlei voorwerpen en alledaagse taferelen. Van die database wordt nog steeds wereldwijd gebruikgemaakt. Straks ook door de onderzoekers van het ‘Politielab’. Voor Marcel Worring, hoogleraar informatica aan de UvA en een van de initiatiefnemers van Amsterdam Data Science, bekend terrein. “De technieken die we daarvoor gebruiken zijn niet nieuw. Ze zijn wel een stuk beter geworden. Kon een computer eerst nog maar een antwoord geven op de vraag wat er op een foto staat, nu herkent hij losse elementen, en zegt hij bijvoorbeeld: er staan hier vier personen op, een boom een auto.”

Wat is de grootste uitdaging van het project met de politie?

“De computer is steeds beter geworden in het herkennen van wat er op een foto staat, en het begrijpen van onze taal. De volgende belangrijke stap is de verbanden tussen beeld en taal maken. Een foto met daarop een wapen kan een andere lading krijgen als daar een bepaalde tekst bij staat.

“Datzelfde geldt voor het zien van patronen. De computer moet gaan herkennen dat er plotseling een reeks foto’s op dezelfde plek is genomen. Dat kan aan de hand van geografische gegevens in smartphones, maar ook door te herkennen dat bepaalde elementen op twee foto’s hetzelfde zijn. Een zelfde gebouw bijvoorbeeld.”

Heeft de politie wel wat aan de al bestaande database van Stanford? Het zijn niet altijd alledaagse dingen waar agenten naar op zoek zijn in strafrechtelijke onderzoeken.

“Over het algemeen geldt: hoe meer elementen de tools kunnen herkennen, hoe makkelijker het wordt om nieuwe dingen te leren. De politie kan dus voor hen relevante beelden toevoegen, zoals bepaalde wapens.”

Is de computer beter in de analyse dan een mens?

“Ik heb altijd gezegd: de computer is dommer dan de mens, alleen wel veel sneller. Maar computers beginnen langzaam op ons in te lopen. Ze zien patronen die je als mens niet makkelijk zult herkennen. Waar de computer alleen absoluut niet tegenop kan, is de ervaring en het onderbuikgevoel van een rechercheur die belast is met het onderzoek naar een in beslag genomen apparaat. Die onderbuikgevoelens kun je niet in regels vatten, dus kun je het een computer niet leren. Echte experts zijn nog altijd beter in het herkennen van subtiele details in beeld zoals een stopcontact, maar computers lopen op hen in. ”

Is het dan straks de techniek die bepaalt of iemand vervolgd gaat worden?

“De interpretatie van de bevindingen moet altijd aan mensen overgelaten worden. Het is niet zo dat de computer straks kant-en-klaar bewijsmateriaal gaat afleveren in de rechtszaal. Een voorbeeld: een computer kan wel constateren dat criminelen opeens een nieuw woord gaan gebruiken en de rechercheur daarop wijzen. Maar begrijpen dat ze daarmee op drugs doelen, is een tweede.”

Hoe gaat deep learning de politie helpen?

„Eerder waren we blij als de computer een zonsondergang of zebra op een foto herkende. Computers kunnen inmiddels bij een foto met een hond aangeven om welk ras het precies gaat, ze kiezen dan uit honderden soorten. Dit soort software willen wij bijvoorbeeld ombouwen, zodat computers ons vertellen welk merk en type vuurwapen op een foto staat.

„Na herkennen van wat op de foto staat, is verbanden leggen een volgende stap. We willen dat computers binnen enkele seconden uitleg kunnen geven over de inhoud van een in beslag genomen smartphone. Gaat het hierbij bijvoorbeeld om een potentiële terrorist die bezig is geweest met het plannen van een aanslag?

„Daarnaast moet software snel verbanden of afwijkende patronen kunnen vinden in enorme bergen data. Zo moet het mogelijk worden verbanden te vinden tussen beelden en tekst, tussen bijvoorbeeld een foto van Schiphol en dreigende woorden.”

Waarom gebeurt dit niet nu al?

„Wetenschappers werkten natuurlijk al samen met de politie. Zo lukt het computers in onderzoeken naar kinderporno vaak te herkennen of beelden uit dezelfde kamer komen, maar bijvoorbeeld gefilmd vanuit een andere hoek.

„We zetten nu een nieuwe stap. Het Politielab is een groter samenwerkingsproject, en de technieken waarmee wij gaan werken zijn veel intelligenter. Daarmee herkennen computers details – een bepaald behang, een manier van inrichten. Door locatiegegevens van foto’s aan elkaar te koppelen, kunnen ze zien of criminelen misschien samenwerken.”

De ontwikkelingen binnen deep learning gaan snel. Hoe komt dat?

„Deep learning heeft in het vak van data-analyse de afgelopen jaren tot grote revoluties geleid. Daar zijn twee belangrijke oorzaken voor. Netwerken binnen deep learning worden niet geprogrammeerd, maar getraind door ze als het ware te voeden. Afgelopen jaren hebben onderzoekers, onder meer van de fameuze Stanford-universiteit, computers duizenden voorbeelden gegeven om ze slimmer te maken. De techniek van deep learning komt al uit de vorige eeuw, maar in 2006 is er een grote doorbraak geweest uit de game-industrie. Om ingewikkelde fictieve landschappen in de games snel en scherp te laten zien, was er veel rekenkracht nodig. Het lukte om tientallen, soms honderden lagen neuronen tegelijk berekeningen te laten uitvoeren. Het zou zonde zijn dat vermogen niet te benutten voor de bestrijding van criminaliteit.”

Bronnen: Trouw, NRC, NOS, Politie

Gerelateerde berichten:

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Verplichte velden zijn gemarkeerd met *