Wenn du dich mit KI-Automatisierung beschäftigst, bist du wahrscheinlich schon auf Function Calling gestoßen. Die Idee: Du definierst Funktionen, die ein Sprachmodell wie ChatGPT aufrufen kann — zum Beispiel "suche_kunde(name)" oder "sende_email(empfaenger, text)". Klingt elegant. Ist es auch. Aber ein erfahrener Agent-Entwickler, der zwei Jahre lang genau damit gearbeitet hat, ist kürzlich zu einem radikal anderen Ansatz gewechselt.
Seine Erkenntnis: Function Calling ist oft der kompliziertere Weg. Und es gibt eine Alternative, die einfacher, flexibler und in der Praxis robuster ist.
Was ist Function Calling eigentlich?
Function Calling ist ein Feature moderner KI-Modelle (ChatGPT, Claude, Gemini). Du beschreibst dem Modell eine Liste verfügbarer Funktionen mit ihren Parametern im JSON-Schema-Format. Das Modell entscheidet dann selbstständig, welche Funktion es aufrufen will und mit welchen Parametern.
Das Problem: Du brauchst für jede Aktion eine exakt definierte Funktion. Bei einem komplexen Workflow mit 20+ Aktionen wird das schnell unübersichtlich. Die JSON-Schemas werden riesig, das Modell macht häufiger Fehler bei der Parameterwahl, und du verbringst mehr Zeit mit Debugging als mit der eigentlichen Logik.
Die Alternative: Strukturierte Textausgabe
Der alternative Ansatz ist überraschend simpel: Statt dem Modell Funktionen zu geben, bittest du es einfach, seine Antwort in einem bestimmten Format zu strukturieren. Zum Beispiel:
Statt: "Hier sind 15 Funktionen die du aufrufen kannst..."
Besser: "Antworte mit AKTION: [name] und PARAMETER: [wert], ich kümmere mich um die Ausführung."
Das Modell gibt dir einen strukturierten Text zurück, den du mit einfachem String-Parsing verarbeitest. Kein JSON-Schema, keine Tool-Definitionen, keine verschachtelten Objekte.
Warum funktioniert das besser?
Drei Gründe sprechen dafür:
- Weniger Fehler: Sprachmodelle sind besser im Textschreiben als im JSON-Generieren. Wenn du sie Text produzieren lässt, spielen sie ihre Stärke aus.
- Einfacheres Debugging: Du siehst sofort im Klartext, was das Modell vorhat. Bei Function Calling musst du erst die JSON-Struktur parsen und verstehen.
- Flexiblere Workflows: Du kannst Aktionen jederzeit ändern, ohne ein Schema anzupassen. Ein neuer Befehl? Einfach in den Prompt schreiben.
Wann Function Calling trotzdem Sinn macht
Function Calling ist nicht schlecht — es hat seinen Platz. Wenn du eine fest definierte API anbindest (z.B. eine Datenbank-Abfrage oder einen externen Service), ist Function Calling sauberer. Die strikte Typisierung schützt vor Fehlern.
Auch wenn du mehrere Tools parallel aufrufen willst (z.B. gleichzeitig Wetter und Kalender abfragen), ist Function Calling effizienter.
Die Faustregel: Wenige, klar definierte Aktionen → Function Calling. Viele, flexible Aktionen in einem komplexen Workflow → strukturierte Textausgabe.
Was das für deine KI-Workflows bedeutet
Wenn du mit KI-Automatisierung arbeitest — sei es mit Make.com, Zapier oder eigenen Scripts — lohnt es sich, beide Ansätze zu kennen. Nicht jeder Workflow braucht die volle Function-Calling-Maschinerie.
Gerade wenn du mit ChatGPT oder Claude Agents baust, die mehrere Schritte hintereinander ausführen sollen, kann der einfachere Ansatz über strukturierten Text den Unterschied machen zwischen einem Agenten der zuverlässig funktioniert und einem der ständig hängt.
Ein praktisches Beispiel: Statt einem Agenten 12 Funktionen zu geben, gibst du ihm eine einfache Anweisung wie "Antworte mit einem dieser Befehle: SUCHE, EMAIL, NOTIZ, FERTIG — gefolgt von den Details." Das ist für das Modell leichter zu befolgen, und für dich leichter zu debuggen.
Fazit: Einfachheit gewinnt
Die wichtigste Lektion aus der Praxis: Der einfachste Ansatz ist oft der beste. Function Calling ist ein mächtiges Werkzeug, aber es ist nicht immer das richtige. Bevor du einen komplexen Agent mit dutzenden Tool-Definitionen baust, frag dich: Würde ein gut formulierter Prompt mit klaren Textanweisungen nicht reichen?
In vielen Fällen lautet die Antwort: Ja. Und dein Agent wird dadurch nicht nur einfacher zu bauen, sondern auch zuverlässiger im Alltag. Welches KI-Modell sich am besten für Agents eignet, erfährst du in unserem Vergleich: ChatGPT vs Claude vs Gemini.