Tier 3 · Guard & build3.512 min

Op welk modelniveau draait je agent

A fiery orange-and-pink sunset over a harbour ringed by dark hillsAgents at Work — CC BY 4.0

In de vorige les werd één vraag over je model gesteld: op wiens computer draait het? (beheer). Deze les behandelt de andere helft: op welk modelniveau moet deze agent draaien? Als je één agent draait, maakt het nauwelijks uit. Als je er meerdere draait, of één ervan dagelijks, wordt het een echte afweging — over kosten en over kwaliteit — en is het Anker 2, continue verbetering, in een heel concrete vorm: zet de capaciteit in waar het zijn geld waard is, en geen dollar meer.

De twee instincten die allebei falen

„Gebruik altijd het beste.” Comfortabel, duur, en het leert je niets over waar het geld daadwerkelijk werk verricht. „Gevoel” — deze agent voelt belangrijk aan, dus krijgt hij het topmodel. Maar hoe belangrijk een agent aanvoelt, hangt nauwelijks samen met het specifieke soort moeilijkheid dat een sterker model daadwerkelijk aanpakt. De meeste agenten worden niet beperkt door de capaciteit van het model; ze worden beperkt door een vage opdracht of rommelige invoer, en een groter model lost geen van beide op.

Het gedisciplineerde antwoord is dezelfde triage die de hele cursus heeft bijgebracht, gericht op je galerij: beoordeel elke agent op de kenmerken die een sterker model daadwerkelijk belonen, en betaal de topklasse alleen waar die kenmerken aanwezig zijn.

En de twee dingen die een groter model niet zal oplossen — wat de eerdere niveaus je al hebben geleerd:

Dan twee eenvoudige controles: gereedheid — een agent die veel capaciteit nodig heeft en een vage opdracht krijgt, zorgt voor dure verwarring, niet voor briljante resultaten — en volume — prijs per niveau doet er nauwelijks toe voor een agent die één keer per week draait, maar wordt steeds belangrijker voor een agent die de hele dag draait.

De stap die het modelonafhankelijk houdt

Dit is waarom dit naadloos aansluit bij de vorige les in plaats van ermee in conflict te komen: het raamwerk maakt het niet uit van wie het model is. Het laat zien waar capaciteit zijn geld waard is — en dat geldt net zo goed voor de soevereine, in Nieuw-Zeeland of de EU gehoste modellen uit les 3.4 als voor elke openbare frontier-laag. De twee vragen vormen dus samen één raster:

Een agent die met gevoelige gegevens werkt, hoort thuis op soevereine infrastructuur, ongeacht het niveau; een agent die veel capaciteit nodig heeft voor niet-gevoelig werk kan kiezen voor het sterkste beschikbare niveau. Je wijst bewust toewijzingen toe op beide assen, in plaats van de hele vloot standaard naar de duurste optie te sturen.

Het niveau zorgvuldig benoemen

Op het moment van schrijven is het meest capabele, algemeen beschikbare model Claude Fable 5, boven de niveaus Opus, Sonnet en Haiku — maar dat is nu juist het soort feit dat snel veroudert: namen, capaciteiten en prijzen veranderen vaak, en ook de beschikbare opties verschuiven. De blijvende conclusie is simpelweg dat een hoger niveau meer capaciteit heeft dan de niveaus daaronder. Raadpleeg voor actuele details de bron (anthropic.com/news, docs.claude.com) in plaats van af te gaan op een cursuspagina uit je geheugen — dezelfde discipline met betrekking tot bewijs die je ook zou eisen van de agent zelf. (De wetgevingsmonitor van deze cursus houdt in de gaten wanneer deze feiten veranderen.)

De opbouwstap

Neem de agenten in je galerij. Voor welke zou je daadwerkelijk het hoogste niveau betalen — en kun je aangeven welke van redenering, synthese of strategische diepgang dit rechtvaardigt? Als het eerlijke antwoord is “het voelt gewoon belangrijk”, dan is dat het instinct dat deze les juist komt controleren.

Vervolgens

Dat was het ‘bewaken en bouwen’-niveau: reikwijdte, criteria, vangrails, testen, de twee builds en de twee vragen over je model — wiens computer en welk niveau. Niveau 4 zet de agent aan het werk en houdt je daar verantwoordelijk voor.

Als je deze les als voltooid markeert, wordt je voortgang op dit apparaat opgeslagen — geen account, geen tracking.

Vrij gedeeld, te goeder trouw. Als je er iets aan hebt gehad, is een koha voor ontwikkelings- en exploitatiekosten van harte welkom.

Laat een koha achter →

Nuttig? Deel deze les met een collega.