Engelse onderzoekers van de universiteit in Cardiff schrijven in ACM Transactions on Internet Technology (maart 2017) over hun pogingen om op basis van tweets te voorspellen wanneer en waar er rellen uitbreken. Bij veel van die rellen is achteraf vaak gemakkelijk vast te stellen wat er allemaal op sociale media over gepost is, dat is allemaal te monitoren en bij te houden. Maar een ‘end-to-end integrated event detection framework’ om gebeurtenissen te detecteren, liefst ‘mogelijk ontwrichtende’?

De wetenschappers onderzochten vooral tweets voorafgaande aan de Londense rellen van augustus 2011 en concluderen op basis daarvan dat ‘our system can perform as well as terrestrial sources, and even better in some cases’. Een veelbelovende uitspraak waar we meer over willen weten.

In de afgelopen jaren is er toegenomen interesse in het detecteren van gebeurtenissen met behulp van publiek toegankelijke gegevens (open source) op het internet, zoals Twitter, Facebook en YouTube. Het publiek plaatst op deze platformen real-time reacties op gebeurtenissen in de “echte wereld”, waardoor ze sociale sensoren worden van echte gebeurtenissen (met onder andere ‘facts & feelings‘). Automatisch te detecteren en categoriseren gebeurtenissen, zoals kleinschalige incidenten, is een niet-triviale taak. Maar het is van zeer grote waarde voor diensten die de openbare veiligheid moeten bewaken, zoals de lokale politie.

Om dit verder te onderzoeken gebruikten de onderzoekers van Cardiff een eventdetectie raamwerk dat vijf hoofdcomponenten omvat: het verzamelen van gegevens, pre-processing, classificatie, online clustering en samenvatten. De integratie van classificatie en clustering zorgt ervoor dat gebeurtenissen worden gedetecteerd en verwante (kleinere) incidenten die sociale veiligheid bedreigen of kunnen sociale orde verstoren groepeert. Ze evalueerden het concept met een verscheidenheid aan functies die werden afgeleid van Twitter-berichten, namelijk tijd, ruimte, en tekstuele inhoud.  Ze gebruikten parameters die werden opgebouwd (zgn ground truth) op basis van inlichtingen van de London Metropolitan Police, die een lijst had met daadwerkelijke gebeurtenissen en incidenten tijdens die rellen, en laten zien dat het systeem de gebeurtenissen op social media allemaal kan vinden, in sommige gevallen zelfs beter dan wat de politie had geregistreerd.

Het idee dat sociale media, zoals Twitter, de toekomst zouden kunnen voorspellen heeft een controversiële voorgeschiedenis. In de afgelopen jaren hebben verschillende groepen beweerd dat ze alles kunnen voorspellen, variërend van de uitslag van de verkiezingen tot de omzet van nieuwe films in de bioscoop. Er is dan ook zeker wat af te dingen op deze digitale glazen bollen. Daarom is het interessant te zien hoe dit nieuwe onderzoek stand houdt.

Ook onderzoeker Nathan Kallus van het MIT, het Massachusetts Institute of Technology, uit Cambridge claimt dat hij een manier heeft ontwikkeld om gedrag van het publiek bij bijeenkomsten kan voorspellen met behulp van uitingen op Twitter. Hij heeft een analyse gedaan op de staatsgreep in Egypte uit 2013 en zegt dat de burgeroorlog in verband met dit evenement duidelijk voorspelbaar was.

Het is op zich logisch dat er indicatoren te vinden zijn op social media over toekomstig voorgenomen gedrag van menigten. Mensen plaatsen vaak hun plannen vooraf om te ontmoeten en hun acties te coördineren met behulp van sociale media. Het is eerder zaak de juiste indicatoren uit het grote publieksgedrag eruit te vissen. Kallus zegt dat dit mogelijk is door eerst de tweets te vinden over toekomstige gebeurtenissen en deze vervolgens te vergelijken met trendanalyses die daarmee samenhangen. “Het ontstaan van menigten kun je zien aankomen door trends in social media gegevens,” zegt hij. Recorded Future, gevestigd in Cambridge, is het bedrijf dat dergelijke gegevens voor hem beschikbaar kon stellen. Zij zoeken in 300.000 verschillende online bronnen in zeven verschillende talen over de hele wereld. Kallus gebruikte deze gegevens om protesten te voorspellen. “We kwamen erachter dat de massale informatie een voorspeller kan zijn voor toekomstige protesten van menigten,” zegt hij. Kallus definieert een belangrijk protest als iets dat veel meer media aandacht genereert dan normaal. Hij analyseert vervolgens de media aandacht om te zien wanneer de protesten eigenlijk plaatsvinden en zoekt naar Twitter activiteiten die voorafgegaan zijn aan die protesten. Zo zoekt hij voorspellende indicatoren, om hiermee vervolgens te zoeken naar soortgelijke activiteiten om te bezien of er voorspellende waarde vanuit kan gaan. Op deze manier ontstaat er een lerende machine die steeds betere voorspellingen kan doen.

Toch nuanceert hij in zijn onderzoek nog weinig. Want we zijn er natuurlijk nog lang niet met goede voorspellingen. Zo is het nu wel mogelijk gebleken om Twitter activiteit te correleren aan echte protesten, maar het is ook nodig om valse positieven uit te sluiten. Er kunnen significante Twitter trends zijn die niet leiden tot protesten. Dan is er de vraag of tweets betrouwbaar zijn. Bij grote bewegingen met (inter)nationale gevolgen zien steeds meer propaganda, geruchten en ironie in de berichtgeving. Hoe ga je om met deze toenemende ruis en volumes? Ook de vraag of de gegevens wel representatief zijn voor de gehele bevolking blijft in zijn onderzoek onbeantwoord. Tenslotte is er nog de aard van de voorspelling. Mooi dat je voorspellingen kan doen met terugwerkende kracht, maar hoe blijf je voorspellen in het social media landschap dat continu aan verandering onderhevig is?



Bronnen: Charged Affairs, LinkedIn, ScienceMagazinePredicting Crowd Behavior with Big Public Data

Gerelateerde berichten:

Tagged with →  

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Verplichte velden zijn gemarkeerd met *