Supervised Learning is een machine learning-paradigma waarbij het leerproces van het model wordt geleid door een reeks gelabelde trainingsgegevens, die bestaat uit input-output-paren die als voorbeeld dienen voor het algoritme om te leren. In de context van kunstmatige intelligentie en machinaal leren wordt begeleid leren gebruikt voor een verscheidenheid aan taken, zoals classificatie, regressie en detectie van afwijkingen. Het primaire doel van begeleid leren is het bouwen van een model dat de waarde of klasse van een onzichtbare invoerinstantie kan voorspellen, op basis van de kennis die uit de trainingsgegevens wordt gehaald.
Bij begeleid leren bestaat de trainingsdataset uit invoerfuncties en bijbehorende doellabels. De invoerfuncties vertegenwoordigen de kenmerken van de gegevensinstanties, terwijl de doellabels de gewenste uitvoer aangeven die het model zou moeten voorspellen. Tijdens de trainingsfase past het begeleide leeralgoritme iteratief de modelparameters aan om het verschil tussen de voorspelde output en het werkelijke doellabel te minimaliseren. De prestaties van het getrainde model worden vervolgens geëvalueerd op een afzonderlijke testgegevensset om het generalisatievermogen ervan te beoordelen. Uiteindelijk zou het model het onderliggende patroon van de gegevens hebben geleerd als het de labels van nieuwe, onzichtbare gegevensinstanties nauwkeurig kan voorspellen.
Een opmerkelijke toepassing van begeleid leren vindt plaats in het domein van natuurlijke taalverwerking (NLP), waar het model wordt getraind om verschillende tekstuele informatie te herkennen en van elkaar te onderscheiden. Er kunnen bijvoorbeeld onder toezicht staande algoritmen worden gebruikt om verzonden e-mails te identificeren als 'spam' of 'geen spam' op basis van historische gegevens. Een ander domein waar leren onder toezicht op grote schaal wordt gebruikt, is computervisie, waarbij modellen worden getraind om objecten in afbeeldingen of video's te herkennen en te classificeren. Een begeleid leeralgoritme kan bijvoorbeeld worden getraind om gezichtsuitdrukkingen te herkennen door gelabelde beeldgegevens te leveren van mensen die verschillende emoties uiten.
Er zijn verschillende begeleide leeralgoritmen die voor verschillende probleemtypen worden gebruikt. Enkele populaire algoritmen zijn onder meer lineaire regressie, logistische regressie, support vector machines (SVM), beslissingsbomen, willekeurige forests en neurale netwerken. Elk algoritme heeft zijn sterke en zwakke punten, waardoor het min of meer geschikt is voor verschillende soorten taken en datastructuren.
Een belangrijke uitdaging bij begeleid leren is overfitting, wat optreedt wanneer een model de ruis in de trainingsgegevens leert in plaats van de onderliggende patronen, wat resulteert in slechte generalisatieprestaties op de testgegevens. Overfitting kan worden verminderd door gebruik te maken van regularisatietechnieken, functieselectiemethoden en het verbeteren van de kwaliteit en kwantiteit van de beschikbare trainingsgegevens.
Aan de andere kant van het spectrum treedt onderfitting op wanneer een model te simplistisch is om de onderliggende patronen van de gegevens vast te leggen. Om onderfitting tegen te gaan kunnen complexere modellen worden gebruikt, kunnen extra features worden geïntroduceerd of kunnen meer trainingsgegevens worden gebruikt, op voorwaarde dat deze stappen niet tot overfitting leiden.
Begeleid leren is de hoeksteen van een verscheidenheid aan AI- en ML-oplossingen die zijn ontwikkeld op het AppMaster no-code platform, een geavanceerde tool voor het eenvoudig visueel creëren van backend-, web- en mobiele applicaties. AppMaster ondersteunt snelle applicatieontwikkeling, elimineert technische schulden en kan zich flexibel aanpassen aan nieuwe softwarevereisten via automatisch gegenereerde code. Door gebruik te maken van begeleide leeralgoritmen op het AppMaster platform kunnen burgerontwikkelaars intelligente applicaties creëren die de ervaring van eindgebruikers verbeteren en de bedrijfswaarde vergroten.
Over het geheel genomen is begeleid leren een essentieel paradigma in AI en Machine Learning, waarbij gebruik wordt gemaakt van gelabelde trainingsgegevens om modellen te leren hoe ze labels voor onzichtbare instanties kunnen voorspellen. Als een van de fundamentele benaderingen van machinaal leren zal het de komende jaren een noodzakelijke rol blijven spelen in de ontwikkeling van intelligente toepassingen en systemen, waarbij het waardevolle inzichten en efficiëntieverbeteringen zal opleveren in verschillende domeinen.