Wat is chain-of-thought prompting?

Een workflowdiagram met grijze en blauwe stippen.

Wat is chain-of-thought prompting?

Zelfs als een LLM chatbot geen gebruik maakt van chain-of-thought redeneringen, kun je chain-of-thought prompting gebruiken om de kwaliteit van je antwoorden te verbeteren.

27 sep 2024

-

Bijgewerkt op

Geschreven door

Sarah Chudleigh

Sarah Chudleigh

Onderzoeker en AI-inhoudsleider

Inhoudsopgave

Wat is chain-of-thought prompting?

Voorbeelden van chain-of-thought prompting

Wanneer moet ik de gedachteketen gebruiken?

Prompting veranderen vs. chain-of-thought prompting

Gedachtenkronkels op Botpress

Een aangepaste autonome agent bouwen

Samenvatting

Chain-of-thought prompting begeleidt AI-modellen om stap voor stap te redeneren, waardoor ze complexe taken nauwkeuriger kunnen oplossen dan door simpelweg het volgende woord te voorspellen.
Het kan het beste worden gebruikt voor problemen die uit meerdere stappen bestaan, zoals wiskunde, logische puzzels of procedurele taken, maar is onnodig voor eenvoudige feitelijke of eenstapsvragen.
Prompt chaining verschilt van chain-of-thought prompting door een taak op te splitsen in meerdere afzonderlijke prompts, terwijl chain-of-thought binnen één prompt-response flow blijft.

Als je wel eens een GPT chatbot zoals ChatGPT hebt gebruikt, is je waarschijnlijk de wisselende kwaliteit van de output opgevallen.

Soms spuugt het precies uit wat je nodig hebt. Andere keren vermoed je dat de 'intelligentie' in AI een beetje een farce is.

Je kunt je ChatGPT -spel naar een hoger niveau tillen door de manier waarop je het aanstuurt te verbeteren. Chain-of-thought prompting moedigt LLM agenten aan om een taak stap voor stap te overdenken voordat ze een reactie genereren.

Nieuwere AI-modellen en functies beginnen het redeneren in een gedachteketen direct in te bouwen, zodat hun modellen automatisch door het probleem redeneren zonder extra vragen.

AI bouwen Chatbots

Aangepaste chatbots bouwen

Wat is chain-of-thought prompting?

Chain-of-thought prompting is een prompttechniek in AI die modellen instrueert om complexe taken op te splitsen, waarbij elke stap wordt beredeneerd voordat er wordt gereageerd.

Je hoort ook wel eens de term 'chain-of-thought reasoning'. Dit verwijst naar het stapsgewijze proces dat het model zal doorlopen om door de taak heen te redeneren.

De OpenAI o1 modellen hebben geen chain-of-thought prompting nodig, omdat ze al een ingebouwde chain-of-thought redenering hebben. Maar u kunt chain-of-thought prompting gebruiken op elke chatbot met LLM.

Hoe werkt chain-of-thought redeneren?

Chain-of-thought redeneren houdt in dat een probleem wordt opgesplitst in kleinere, logische stappen die de AI-chatbot achtereenvolgens kan oplossen.

Eerst identificeert de AI de belangrijkste onderdelen van het probleem. Daarna verwerkt hij elk onderdeel in volgorde, waarbij hij bekijkt hoe de ene stap tot de volgende leidt. Elke stap bouwt voort op de vorige, waardoor de AI methodisch naar een logische conclusie toewerkt.

Voorbeelden van chain-of-thought prompting

De beroemde 'aardbei' prompt

ChatGPT en andere LLMs hebben goed gedocumenteerde zwakheden. Een daarvan is hun onvermogen om correct te identificeren hoeveel 'R'en er in het woord 'aardbei' zitten (waarschijnlijk de beroemde beperking achter de codenaam van de o1-modellen: Aardbei).

ChatGPT-4o maakt geen gebruik van een gedachtegang. In plaats daarvan verwijst het naar zijn trainingsgegevens en genereert het een antwoord op basis van hoe waarschijnlijk het is dat elk woord op het vorige volgt. Hoewel dit meestal correct klinkt, is het alleen bedoeld om menselijke taal na te bootsen - niet om te redeneren of onderzoek te doen.

Als je ChatGPT-4o de beroemde aardbeienvraag stelt, kan het niet het juiste antwoord geven:

Screenshot: ChatGPT antwoordt dat er 2 'r's in het woord aardbei zitten. — ChatGPT-4o gebruikt geen redenering in de denkketen en komt tot een onjuist antwoord.

‍

Je kunt echter een 'chain-of-thought prompting'-techniek gebruiken om de LLM chatbot te helpen tot het juiste antwoord te komen:

Screenshot: ChatGPT wordt gevraagd zijn denkvermogen te tonen en het woord aardbei te spellen, waarbij de 3 'r's' correct worden herkend. — ChatGPT-4o spelt het woord aardbei, waarbij het aantal 'R's' correct is.

‍

De nieuwste versie van ChatGPT, aangedreven door OpenAI o1-preview, is de eerste grote LLM die gebruik maakt van chain-of-thought redenering zonder extra prompting.

Het antwoord is meteen duidelijk, omdat het automatisch hetzelfde proces moet volgen als de tweede ChatGPT-4o prompt hierboven. Het enige verschil is dat het dit proces uitvoert zonder extra vragen.

Screenshot: ChatGPT met een o1-model antwoordt dat het 'even nadenkt' voordat het antwoordt dat er 3 'r's in het woord aardbei zitten. — Het o1-preview model 'denkt een paar seconden na' om het juiste getal correct te identificeren.

Wiskunde

Als je een oudere versie van ChatGPT een wiskundevraag uit een basisschoolboek zou stellen, zou hij het niet altijd goed hebben.

Voor wiskundeproblemen in meerdere stappen is redeneren nodig, iets wat vroeger niet aanwezig was op LLMs. Je kon elke stap van het probleem uitsplitsen, maar als je de juiste stappen niet wist, kon een LLM je niet helpen.

ChatGPT-4o kan het antwoord op de vraag beredeneren door de reeks stappen in het probleem op te splitsen:

Screenshot: ChatGPT-4o somt de stappen van een wiskundeprobleem op om het op te lossen. — ChatGPT-4o somt de stappen van een wiskundeprobleem op om het op te lossen.

AI-agenten aangesloten op Hubspot

Voor een toepassing in de echte wereld nemen we een AI-agent LLM die is geïntegreerd in Hubspot. Een verkoopteam gebruikt deze AI-agent om nieuwe leads te verwerken wanneer ze via verschillende kanalen worden verzameld.

Scenario

Eenverkoper stuurt een nieuwe lead naar de AI-agent en vraagt deze om deze te registreren in Hubspot en een eerste touchpoint-e-mail te sturen, maar om deze niet in te vullen als de lead bij een bedrijf werkt dat al een prospect is.

LLM zonder gedachtegang

De LLM AI-agent registreert de lead en verstuurt de e-mail zonder te controleren of het bedrijf al een prospect is, waardoor de belangrijkste voorwaarde ontbreekt.

LLM met redeneren in de gedachteketen

De LLM AI-agent controleert of het bedrijf al een prospect is voordat hij actie onderneemt. Als het een prospect is, slaat het de registratie en e-mailing over; zo niet, dan registreert het de lead en verstuurt het de e-mail, waarbij het nauwkeurig de instructies van de verkoper volgt.

Wanneer moet ik de gedachteketen gebruiken?

Chain-of-thought prompting wordt het best gebruikt in scenario's die stapsgewijs redeneren vereisen.

Taken waarbij logische gevolgtrekkingen moeten worden gemaakt, wiskundeproblemen, procedurele taken of elke andere situatie waarbij antwoorden in meerdere stappen nodig zijn, zijn ideale kandidaten.

Maar wacht: redeneren klinkt geweldig - waarom zou ik het niet altijd gebruiken?

Goede vraag. Niet alle vragen vereisen redenering. Bijvoorbeeld:

Eenvoudige feitelijke vragen, zoals 'Wat is de hoofdstad van Canada?
Problemen in één stap, zoals 'Wat is 145 + 37?
Taken voor het genereren van inhoud, zoals 'Schrijf een beleefde e-mail van 3 zinnen waarin ik mijn collega vraag of hij al klaar is met zijn project'.

Prompting veranderen vs. chain-of-thought prompting

Hoewel de naam van prompt chaining en chain-of-thought prompting op elkaar lijkt, zijn het verschillende promptingstrategieën om generatieve AI-uitvoer te verbeteren.

AI-agenten inzetten?

Lees onze Blauwdruk voor de implementatie van AI-agenten

Gedachtenkronkels

Met chain-of-thought prompting laat een gebruiker de AI in één antwoord de redenering achter zijn antwoord uitleggen. Dit vraagt de AI om elke stap van het probleemoplossingsproces te doorlopen, maar dit wordt bereikt in een enkele prompt en reactie.

Een chain-of-thought prompt kan bijvoorbeeld in één bericht worden uitgevoerd:

"Een HR-team moet 5 functioneringsgesprekken van werknemers beoordelen. Elke evaluatie duurt 30 minuten en ze hebben 15 minuten nodig om ze voor te bereiden. Voor senior evaluaties is elk 10 minuten extra nodig. Hoe lang duurt het om 5 senior en 25 junior evaluaties af te ronden? Zet je redenering stap voor stap uiteen."

Prompt ketenen

Met prompt chaining wordt de taak opgedeeld in afzonderlijke stappen met meerdere prompts, die elk voortbouwen op het vorige resultaat. Dit helpt om de AI te structureren en door een complexe taak te leiden waarbij waarschijnlijk redeneringen nodig zijn.

De eerste prompt kan er zo uitzien:

Opdracht 1: Identificeer de belangrijkste uitdagingen waarmee een bedrijf te maken kan krijgen bij de overgang naar werken op afstand.

Uitgang:

Communicatiehiaten
Productiviteit behouden
Technologie-infrastructuur
Betrokkenheid van werknemers

De volgende vragen kunnen dieper op deze concepten ingaan. Bijvoorbeeld:

Opdracht 2: Vertel me hoe een bedrijf oplossingen kan vinden voor communicatiekloven bij de overgang naar werken op afstand.

Na de volgende uitvoerronde kan de volgende schakel van de ketting zijn:

Opdracht 3: Wat zijn de gemeenschappelijke uitdagingen waarmee bedrijven te maken krijgen als ze deze oplossingen invoeren?

Hoewel de twee dus op elkaar lijken, hanteren ze verschillende benaderingen om de meest diepgaande en relevante inhoud uit generatieve AI-tools te halen.

Gedachtenkronkels op Botpress

Botpress gebruikers zijn al bekend met een functie die gebruik maakt van redeneringen op basis van de gedachteketen.

De Autonomous Node debuteerde in juli 2024 op Botpress, een platform voor het bouwen van AI-agenten. De Autonomous Node kan workflows met meerdere stappen automatiseren en autonoom beslissingen nemen.

Een autonome node kan worden gemaakt en worden aangegeven met een eenvoudige regel tekst, zoals 'Uw doel is om gekwalificeerde leads te genereren. Creëer leads in Salesforce wanneer een gebruiker aangeeft een aankoop te willen doen.

Autonome knooppunten

De AI-agent die je bouwt met deze autonome node zal verschillende acties ondernemen om zijn doel te bereiken, onafhankelijk van werkstromen die door mensen zijn ontworpen. Hij kan ook schakelen tussen verschillende LLMs als dat nodig is, door een beslissing te nemen om snelheid of kracht prioriteit te geven.

Een aangepaste autonome agent bouwen

Botpress is het enige AI-agent platform waarmee je echt autonome agents kunt bouwen.

De open en flexibele Botpress Studio maakt eindeloze gebruiksmogelijkheden mogelijk in verschillende sectoren, van HR tot leadgeneratie. Dankzij onze kant-en-klare integratiebibliotheek en uitgebreide tutorials kunnen gebruikers AI-agenten eenvoudig vanaf nul opbouwen.

Begin vandaag nog met bouwen. Het is gratis.

Of neem contact op met ons verkoopteam.

AI-agent bouwen

Aangepaste autonome agenten bouwen

FAQs

Is chain-of-thought prompting alleen nuttig voor AI-modellen, of weerspiegelt het ook het oplossen van menselijke problemen?

Het weerspiegelt eigenlijk hoe mensen complexe problemen oplossen door ze op te splitsen in stappen, dus het is zowel een nuttige techniek voor AI als een weerspiegeling van de natuurlijke menselijke redenering.

Hoe verschilt chain-of-thought redeneren van gewoon "stap voor stap denken"?

Ze zijn nauw verwant, maar chain-of-thought redeneren is meer gestructureerd en opzettelijk. Het stimuleert de AI om zijn logica hardop uit te leggen, in plaats van zomaar naar een antwoord te springen.

Waarom gebruiken sommige LLMs chain-of-thought redeneren niet standaard?

Eerdere of kleinere modellen waren niet getraind om expliciet te redeneren, dus voorspellen ze antwoorden eerder op basis van patronen dan op basis van logische stappen, tenzij anders gevraagd.

Is chain-of-thought prompting een vorm van "training" van het model tijdens inferentie?

Niet precies. Je verandert de kennis van het model niet, je beïnvloedt alleen hoe het op dat moment denkt over een probleem door zijn gedrag te sturen met betere instructies.

Verbetert chain-of-thought prompting altijd de nauwkeurigheid?

Niet altijd. Het werkt het beste bij taken die een redenering vereisen, maar het kan de zaken eigenlijk overcompliceren voor eenvoudige vragen en leiden tot onnodige stappen of zelfs fouten.

Gerelateerd

$25M om de infrastructuurlaag voor AI-agenten te bouwen

De 11 meest voorkomende Chatbot-fouten (van AI-implementatie-experts)

Sarah Chudleigh

Botpress vs. Dialogflow CX: Welk chatbot platform is geschikt voor jou?

Bouw

betere

met Botpress

Ga aan de slag met

Een illustratie van boeken, een plant en een laptop op een tafel.

Alle systemen operationeel

SOC 2

Gecertificeerd

GDPR

Conform