Wiskunde

Onderwerp: Overige onderwerpen

Deel 14 uit het thema Perceptielessen...

De resultaten van het wetenschappelijk onderzoek van Raymond van Ee kunnen goed beschreven worden met de wiskundige theorie van een 18e eeuwse dominee Bayes, die wel heel graag wilde winnen bij het spelen van kansspelletjes.... De wiskunde in het Bayes theorema is niet erg ingewikkeld maar om de toepassingen in het onderzoek van Raymond te begrijpen moet je wel even doorzetten.


Om terug of verder te gaan binnen de lessenreeks van perceptie, klik op de pijl van het uitklapmenu onderaan deze bijles en kies de les van jouw keuze.

 

Hoe verwerk je meetresultaten met de wiskunde van Bayes?

 

De formule van Bayes

Een voorwaardelijke kans P(A|B) is een kans op een gebeurtenis A op voorwaarde dat B heeft plaatsgevonden. Dus als P(A én B treden op) / P(B), waarbij P(B) positief moet zijn. De zogenaamde formule van Bayes geeft het verband relatie tussen de twee soorten voorwaardelijke kansen. Hier staat Ac voor het complement van A, dat betekent: de gebeurtenis dat A niet optreedt. De formule van Bayes is af te leiden uit de definitie van voorwaardelijke kans en het feit dat...

P(B) = P(B én A) + P(B én Ac )

Om over na te denken...
Kun je een tweetal gebeurtenissen bedenken en het voorgaande in 'gewone' zinnen beschrijven?

Bijvoorbeeld

Van de studenten die op wintersport gaan (20% van de studenten) komt 1% terug met minstens één been in het gips. Deze 0,01 is een voorwaardelijke kans. Dus noem je deze gebeurtenissen achtereenvolgens W (gaat op wintersport) en G (heeft een been in het gips) dan is: P(G|W)=0,01

Antwoord:

Nee!
Vul maar eens in een kanstabel een voorbeeld in voor bijvoorbeeld 1000 studenten:

Voor de rest van de tabel heb je onvoldoende gegevens. Voorbeeld 3 Laten we eens kijken naar de volgende tabel, waarbij P de gebeurtenis 'eet patat' en F de gebeurtenis 'eet frikadel'.

P(P|F) is de kans op P op voorwaarde van F. Dat betekent dat die P(F)=0,4 bestaat uit 0,3 wel P en 0,1 niet P. Dus:

P(P|F)= 0,3/0,4=0,75

P(F|P) is de kans op F op voorwaarde van P. Dat betekent dat die P(P)=0,55 bestaat uit 0,3 wel F en 0,25 niet F. Dus:

P(F|P)= 0,3/0,55=0,5454


( bron: http://www.wiswijzer.nl/pagina.asp?nummer=321 )

Spamfilters

De formule van Bayes wordt ook gebruikt in spamfilters, programma's die binnenkomende e-mails controleren en proberen eventuele spamberichten eruit te filteren. Deze Bayesiaanse filters werken als volgt. Een Bayesiaans filter moet eerst getraind worden. Het krijgt bijvoorbeeld duizend voorbeelden te zien van spamberichten en duizend voorbeelden van normale e-mails. Neem aan dat het woordje 'seks' voorkomt in 950 van de spamberichten, en in 50 van de niet-spamberichten. Een tweede aanname is dat er op dit moment evenveel spamberichten als normale e-mails verstuurd worden. Met behulp van de formule van Bayes (wat zijn nu de gebeurtenissen A en B?) kun je laten zien dat een bericht met het woordje 'seks' erin met kans 95/100 spam is. Hetzelfde procede geldt voor combinaties van woorden. Echter, het woord 'seks' kan ook voorkomen in reguliere berichten, bijvoorbeeld in berichten over onderzoek naar de verspreiding van AIDS. Een Bayesiaans filter kijkt daarom ook naar de andere woorden in de e-mail. Als bijvoorbeeld één van de duizend spamberichten de woorden AIDS, seks en 'verspreiding' bevat, en ook één van de duizend niet-spamberichten, dan concludeert het filter weer met de formule van Bayes dat een bericht met deze drie woorden met kans 1/2 een spambericht is. In het algemeen zal het bericht dan worden doorgelaten, afhankelijk van de persoonlijke instelling van het filter.

( bron: https://www.nemokennislink.nl/publicaties/pepmiddelen-tests-en-spamfilters/ )