Voorspellend model

Egmont-Petersen

Laten we een concreet voorspellend model maken.

Er komt een onbekende bezoeker op de website van StreamProducts.com binnen. Deze onderneming verkoopt online stream-producten, films. De bezoeker komt binnen om 20.21, zaterdagavond, en zijn/haar IP-adres is afkomstig uit het postcode-gebied 1100AD.

Hieronder is een voorspellend model weergegeven.

Bereken de kans P dat bezoeker een streaming product ook afneemt, P=0.71. Gebruik daarbij de voorspellende variabelen ‘Dag van bezoek‘, ‘Tijdstip‘ en ‘Postcode‘ om de kans 0.71 te berekenen.


Als nou de dag van bezoek dinsdag was geweest, en het tijdstip 10.31, dan was de kans dat deze bezoeker een film had gekocht, P=0.14.

Uitdagingen – voorspellend model

In het voorbeeld hierboven werden voorspellende variabelen met enkele uitkomsten (Dag: maandag, dinsdag, …) in een model gecombineerd met de variabele Tijdstip, een continue getal (bijv. 10.41.32, of 23.12.54). Een voorspellend model bouwen die verschillende soorten variabelen combineert zoals Dag en Tijdstip, is niet recht-toe-recht-aan.

Met de aanpak van Insight Classification Technologies realiseren we dit. We bouwen voorspellende modellen die ook transparant zijn (‘te begrijpen’), voor de mensen bij de business.