De Toverkracht van Harry Potter: Een Onwaarschijnlijk Hulpmiddel voor AI-Onderzoek

FFrits 28 december 2023 07:02

Harry Potter-boeken blijken een onverwachte bron van data voor AI-onderzoek. Onderzoekers maken gebruik van deze populaire reeks om AI-modellen te trainen en te testen, en om de impact van het verwijderen van specifieke data op de prestatie van deze modellen te onderzoeken.

Harry Potter als dataset voor generatieve AI

Generatieve kunstmatige intelligentie is afhankelijk van een goed gekozen dataset. In dit geval heeft de populaire Harry Potter-reeks van J.K. Rowling zich bewezen als waardevol studiemateriaal. Door zijn bekendheid is deze reeks makkelijk te controleren op de nauwkeurigheid van de gegenereerde output door de AI.

AI die 'vergeet': een nieuwe techniek van Microsoft

In het onderzoek getiteld 'Who's Harry Potter?' hebben Microsoft-onderzoekers een methode ontwikkeld waarbij AI-modellen specifieke informatie kunnen 'vergeten', zonder dat het hele model opnieuw getraind hoeft te worden. Dit werd aangetoond door het AI-model personages en plotpunten uit Harry Potter te laten vergeten, wat nuttig kan zijn bij het verwijderen van auteursrechtelijk beschermde content uit de dataset van een AI-model.

Naast het Microsoft-onderzoek, worden de Harry Potter-boeken ook ingezet in andere AI-studies. Zo is er een samenwerking tussen de Universiteit van Washington, Universiteit van Californië en de Allen Institute bij het maken van AI-model Silo. Dit onderzoek bekijkt wat de impact is van het verwijderen van specifieke data op de prestatie van het AI-model. Daarbij bleek dat het verwijderen van één Harry Potter-boek de nauwkeurigheid van het AI-model aanzienlijk vermindert.

Waarom Harry Potter? De aantrekkingskracht van een magische leerling

Wat maakt de Harry Potter-reeks zo geschikt voor AI-onderzoek? Volgens onderzoeker Leila Wehbe is de overvloed aan scènes, dialogen en emotionele momenten in de reeks een belangrijke factor. Bovendien hebben veel jongere onderzoekers deze boeken in hun jeugd gelezen, wat de keuze voor deze specifieke dataset kan beïnvloeden.

Meer artikelen

Lees ook

Hier zijn een aantal interessante artikelen op andere sites uit ons netwerk.