Hoe werken die zelflerende systemen?

< Kunstmatige intelligentie

Een zelflerend model, wat moeten we ons daarbij voorstellen?

Een computermodel wordt vaak een algoritme genoemd: een stappenplan met een reeks als-dit-dan-dat-instructies om naar een einddoel te komen. We horen vaak dat algoritmen alleen dingen doen waarvoor ze geprogrammeerd zijn, maar dat is tegenwoordig niet altĳd het geval. Een zelflerend computersysteem, haalt zelfstandig patronen uit onze data, bouwt modellen en doet voorspellingen zónder voorgeprogrammeerde regels.

Er zijn grofweg drie manieren waarop computersystemen kunnen leren:

1. Supervised Learning: bij deze methode wordt de trainingsdata vooraf door programmeurs gelabeld. Bijvoorbeeld ‘dit is een hond, dat niet’. Op deze manier leren computersystemen objecten categoriseren.

2. Unsupervised Learning: hier leren algoritmen om zelfstandig naar patronen te zoeken in grote hoeveelheden data zonder labels. Programmeurs geven op voorhand een bereik aan waarmee de afstand tussen de verschillende dataresultaten gemeten kan worden. Het algoritme ordent de data zodat datasets met een kleine afstand bĳ elkaar in een cluster komen. De muziekgenres in Spotify werken bijvoorbeeld op deze manier.

3. Reinforcement Learning: Hier leren algoritmen door middel van trial and error. De voorbeelden worden niet vooraf gelabeld, maar het algoritme krĳgt op basis van de resultaten achteraf feedback met een beloning als het de juiste oplossing aandraagt. AlphaGo Zero, het algoritme dat heel goed het spel Go kan spelen, is hier een voorbeeld van.