Menu

Mooi dat je er weer bent! In ons vorige blog hebben we het begrip Big Data verkend, de fases in een Big-Data-oplossing in het kort besproken, en hoe je met het zogenaamde associatie-algoritme je klant kan adviseren over een volgend aan te schaffen product. In deze blogpost zal ik kort verschillende soorten Big-Data-algoritmes en machine-learning-modellen bespreken. En voor wie modellen en algoritmes niet heel veelzeggend zijn, voeg ik een praktijkvoorbeeld toe van een oplossing voor fraudedetectie in de zorg die we vorig jaar hebben ontwikkeld. Wie weet brengt het je op ideeën voor een eigen applicatie.

Het eerste experiment met machine learning

Machine learning is een vorm van kunstmatige intelligentie (Artificial Intelligence ofwel AI), waarbij de ‘machine’ automatisch leert en zichzelf steeds verbetert, zonder daarvoor expliciet geprogrammeerd te worden. De term is in de jaren ’50 bedacht door Arthur Samuel die een aantal verschillende methodes heeft uitgeprobeerd om een computer een goed potje te leren dammen. Samuel benoemde twee vormen van leren. De eerste is rate learning. Daarbij slaat de computer elke zet en de score van die zet op, om later de beste keuze te kunnen maken als dezelfde situatie zich voordoet. De tweede is leren met behulp van generaliseren. Hierbij slaat de computer niet alle mogelijke uitkomsten op, maar alleen de gegeneraliseerde regels. Door dit in een iteratief proces te doen, worden die regels steeds beter.

Experiment geslaagd

Zo is het mogelijk geworden om op basis van zaken die we uit het verleden weten uitspraken te doen over situaties waar we geen of beperkte kennis over hebben. En dat vind ik wel een mooie definitie van machine learning: ‘op basis van dingen die we weten, iets zinnigs zeggen over dingen die we niet weten.’ Het komt erop neer dat Samuels experiment geslaagd is. Wie wil weten hoe het precies in elkaar zat, kan het hele artikel van Samuel lezen.

Het Azure Machine Learning Platform

Tegenwoordig bestaan er heel veel verschillende tools en platforms om machine-learning-projecten te kunnen uitvoeren. Een platform waar ik zelf best blij mee ben is Azure Machine Learning van Microsoft. En dat komt vooral omdat het een visueel aantrekkelijke en eenvoudig te gebruiken interface heeft. Bovendien is het relatief eenvoudig om getrainde machine-learning-modellen te publiceren als webservice, zodat je ze kunt aanroepen vanuit andere applicaties. Megacool!!

Azure Machine Learning onderscheidt vier families van machine-learning-algoritmes. Niet uitputtend, maar een goed begin! Elke familie bevat verschillende methodes die gebruikt kunnen worden om een bepaald doel te bereiken:

  • Anomalie-detectie: het identificeren van ongebruikelijke datapunten, bijvoorbeeld voor fraudedetectie.
  • Clusteren: het ontdekken van structuur in data, bijvoorbeeld om consumenten in verschillende segmenten te kunnen indelen en zo aparte marketingstrategieën te bepalen.
  • Classificatie: het voorspellen van twee of meer categorieën om bijvoorbeeld te voorspellen of een klant van een bank een lening wel of niet terug zal betalen.
  • Regressie: het voorspellen van een exacte waarde, bijvoorbeeld hoeveel zakken chips je meer zult verkopen als je de prijs met 10% verlaagt.

Een praktijkvoorbeeld: fraudedetectie in de zorg

Voor een zorgverzekeringsmaatschappij buiten Europa hebben wij vorig jaar een applicatie ontwikkeld die gebruik maakt van machine-learning-methodes om zorgverleners die frauderen in hun declaratiegedrag te identificeren. Wat ik vooral interessant vind aan deze applicatie is dat machine learning hier als onderdeel van een compleet systeem wordt ingezet. Daardoor hoeven er tussen het moment van declareren en het maken van een afspraak met de declarerende arts om de conclusies te bespreken geen mensenhanden meer aan te pas te komen. Natuurlijk kan dit, indien gewenst, wel gewoon.

De fases van deze oplossing zien er als volgt uit:


1) Data sources: Gegevens over de zorgverlener en steeds vernieuwende declaratiedata. Het gaat in dit geval om tandartsen.

2) Integratie: De fase waarin de data verplaatst wordt naar de servers waar verdere analyse plaats kan vinden.

3) Data stores: De databases waar de analyse uitgevoerd wordt. We gebruiken hiervoor databases die speciaal zijn ingericht voor analyse. Hierdoor wordt het efficiënter, en hoeven we de bronsystemen niet te verstoren met het bevragen voor analyse.

4) Analytische methodes en technieken:

a) Vooraf clusteren van tandartsen in groepen met een vergelijkbaar profiel om zo onderling vergelijk goed mogelijk te maken. Denk hierbij aan de grootte van de praktijk, maar ook aan verschillende focusprofielen als ‘Orthodontie’ of ‘Kinderen’ of ‘Protheses’.

b) Ongebruikelijke declaraties direct identificeren op het moment dat ze binnenkomen.

c) Categoriseren van zorgverleners in een verschillende groepen van frauderisico’s.

5) Datavisualisatie: De resultaten van de verschillende analyses verschijnen in een rapportage waarin wordt aangegeven om welke redenen een declaratie als frauduleus of verkeerd aangemerkt wordt.

6) Integratie in het verdere business-systeem: De laatste stap in de applicatie is het automatisch generen van een brief aan de zorgverlener waarin de conclusies gepresenteerd worden, en een afspraak gemaakt wordt om de casus te bespreken op het kantoor van de zorgverlener.

Ruim $3 miljoen minder aan claims

En het heeft effect! Dankzij deze applicatie zijn de claims binnen een jaar al met meer dan 3 miljoen dollar gereduceerd!

Welke toepassingen zie je voor jouw business?

Je kunt met deze modellen natuurlijk veel meer dan alleen fraude detecteren. Er zijn talloze andere mogelijke applicaties. En niet alleen grote tech-bedrijven zijn ermee bezig; alle sectoren kunnen veel hebben aan machine learning. Ik ben benieuwd welke mogelijke toepassingen er voor jouw business te bedenken zijn. Heb je vragen of ideeën? Of borrelt er iets maar kun je er nog niet helemaal de vinger op leggen? Aarzel niet – bel ons, mail ons, en we denken mee. Kunnen we er volgende keer weer iets moois over schrijven.

Maurik van den Heuvel

Tecknoworks Nederland BV

Pascalstraat 13H | 2811 EL Reeuwijk | Nederland

T: +31 (0)881 182 200 | M: +31 (0)6 5104 4631

E: maurik.vandenheuvel@tecknoworks.com| W: www.tecknoworks.com

comments powered by Disqus

Let's write our story!

We don't just write code, we write stories! Working with us is fun, inspiring and good for business!