Begrippenlijst AI-techniek

Eval

Wat zijn evals?

Evals zijn geautomatiseerde tests voor AI-functies die meten hoe accuraat, veilig en stabiel ze presteren op een vaste set representatieve voorbeelden.

Ook bekend als evalsevaluatieAI-evaluatie

Zonder evals weet je niet of je AI-functie goed werkt, je weet alleen dat hij iets teruggeeft. Een eval-set is een verzameling realistische voorbeelden met het gewenste resultaat, waarmee je objectief meet of het systeem klopt, en of een aanpassing iets verbetert of stiekem iets anders breekt.

Checks kunnen hard zijn (klopt het bedrag exact), beoordeeld door een model (is dit antwoord behulpzaam en netjes), of door een mens nagekeken bij de twijfelgevallen. Samen geven ze een cijfer dat je bij elke wijziging opnieuw draait.

Eerlijk: evals zijn het meest onderschatte onderdeel van de meeste AI-projecten. Iedereen wil bouwen, bijna niemand wil meten. Juist daarom is het ons onderscheid tussen een demo die het "meestal wel doet" en een systeem waar je productie op durft te draaien. Bouw de eval-set vanaf dag één.

Je voelt al dat het anders moet,
wij laten zien hoe.

Je weet zelf waar het schuurt. Wij denken mee hoe AI daar écht iets aan kan doen.

Nog niet toe aan een gesprek? Krijg eerst eerlijk AI-advies →

30 minuten. Digitaal of in Enschede. Jij bepaalt.