Anthropic hat Fable 5 wieder freigeschaltet: das stärkste Modell, eine Stufe über Opus. Der Haken: Es ist doppelt so teuer wie Opus 4.8 und seit dem Comeback bremsen strengere Sicherheitsfilter, die eine Coding-Anfrage auch mal auf Opus 4.8 umleiten. Heißt: Es frisst Tokens, und dein Limit ist schnell erreicht.
Die Lösung sind drei Plugins, die den Token-Verbrauch drücken. Genau die nutze ich, um länger auf dem besten Modell zu bleiben.
Zwei Skills für Claude Code und ein Tool von Microsoft für deine Dokumente. Jedes senkt den Token-Verbrauch an einer anderen Stelle, damit du mehr aus jedem Fable-5-Token holst.
01
Ponytail: weniger Code, weniger Tokens
Für Claude Code · ~70k Sterne
Ponytail bringt Claude dazu, wie ein fauler Senior-Entwickler zu denken und nur den Code zu schreiben, der wirklich nötig ist. Offizielle Messungen im Median: 80 bis 94 Prozent weniger Code, 3 bis 6 mal schneller, 47 bis 77 Prozent weniger Kosten. Weniger generierter Code heißt direkt weniger Ausgabe-Token.
GitHub: DietrichGebert/ponytail · MIT, kostenlos · steuerbar über /ponytail lite | full | ultra
02
Caveman: Fülltext raus
Für Claude Code · ~79k Sterne
Caveman wirft den Fülltext aus jeder Antwort, also Höflichkeitsfloskeln und Wiederholungen, und lässt nur den Kern stehen. Im Schnitt 65 Prozent weniger Ausgabe-Token (je nach Aufgabe 22 bis 87 Prozent), teils sogar genauere Antworten. Mit einem Befehl schrumpfst du auch deine CLAUDE.md um rund 46 Prozent.
GitHub: JuliusBrussee/caveman · MIT, kostenlos · steuerbar über /caveman lite | full | ultra
03
MarkItDown: Dokumente als sauberes Markdown
Von Microsoft · ~160k Sterne
MarkItDown von Microsoft wandelt PDFs, Word, PowerPoint und Excel in sauberes Markdown um, bevor das Dokument überhaupt beim Modell ankommt. Eine rohe PDF frisst ein Vielfaches an Token, das schlanke Markdown nur einen Bruchteil. Anders als im Video gedacht ist es kein reines Windows-Tool: Es läuft genauso auf Mac und Linux.
Willst du Claude Code wirklich von Grund auf beherrschen? Auf der SKAILE Academy zeige ich dir Schritt für Schritt das komplette Setup, die Skills und die Workflows, die im Alltag wirklich Tokens und Zeit sparen.
Zwei Skills gehen direkt in Claude Code, MarkItDown ist ein kleines Python-Tool für deine Dokumente. Hier ist alles zum Kopieren, so wie ich es installiere.
claude-code · fable-5token-save
✓Ponytail installiert, /ponytail full aktiv
✓Caveman installiert, Fülltext fliegt raus
✓CLAUDE.md verkleinert (/caveman:compress)
✓MarkItDown wandelt PDFs in sauberes Markdown
✓Fable 5 läuft, dein Limit hält länger
Drei Plugins, und dein Token-Verbrauch sinkt spürbar.
1 · Die zwei Skills für Claude Code
Ponytail drückt die Menge an generiertem Code, Caveman den Fülltext in den Antworten. Beide zusammen sparen bei fast jeder Antwort Token.
# Ponytail: weniger Code, weniger Tokens
/plugin marketplace add DietrichGebert/ponytail
/plugin install ponytail@ponytail
# danach steuern: /ponytail lite | full | ultra | off
# Caveman: Fülltext raus, kürzere Antworten
npx skills add JuliusBrussee/caveman
# danach steuern: /caveman lite | full | ultra
# CLAUDE.md verkleinern: /caveman:compress CLAUDE.md
2 · MarkItDown für deine Dokumente
So installierst du das Microsoft-Tool und wandelst eine Datei in Markdown um, bevor du sie an Claude gibst. Optional als MCP-Server, damit Claude selbst konvertiert.
# Installieren (Python, läuft auf Windows, Mac und Linux):
pip install 'markitdown[all]'
# Ein Dokument in sauberes Markdown umwandeln:
markitdown bericht.pdf > bericht.md
# dann bericht.md an Claude geben statt der rohen PDF
# Optional als MCP-Server, damit Claude selbst konvertiert:
pip install markitdown-mcp
# in die Claude-Config unter mcpServers -> markitdown eintragen
So gehst du vor
Fable 5 an, Tokens gespart.
Erst Fable 5 aktivieren, dann die drei Plugins scharf stellen. Danach holst du deutlich mehr aus jedem Token.
01
Fable 5 aktivieren
In App und Claude Code
Fable 5 ist seit dem 1. Juli wieder da, in der Claude-App, in Claude Code und in Cowork. Wähl es im Modell-Menü oder per /model. Denk dran: Es kostet doppelt so viel wie Opus 4.8, Tokensparen lohnt sich also ab der ersten Anfrage.
Installier Ponytail und Caveman mit den Befehlen aus Block 1. Ponytail hält die Code-Menge klein, Caveman wirft den Fülltext raus. Zusammen sparst du bei fast jeder Antwort Ausgabe-Token, ohne an Qualität zu verlieren.
03
Dokumente vorher umwandeln
MarkItDown
Bevor du eine PDF oder Office-Datei an Claude gibst, jag sie durch MarkItDown (Block 2). Das saubere Markdown kostet nur einen Bruchteil der Eingabe-Token, die die rohe Datei verschlingen würde.
04
Fable 5 clever nutzen
Mehr Leistung pro Limit
Mit den drei Plugins holst du mehr aus jedem Token und erreichst dein Wochenlimit später. Ehrlich bleibt: Fable 5 hat seit dem Comeback strengere Filter, die eine Anfrage auch mal auf Opus 4.8 umleiten. Das ist von Anthropic so bestätigt. Sparsame Prompts kosten dich in dem Fall wenig.
SKAILE Academy
Claude Code richtig lernen.
Diese drei Plugins sind der Anfang. Wenn du Claude Code wirklich von Grund auf produktiv und günstig nutzen willst, mit den richtigen Skills, Workflows und Automationen, dann bist du auf der SKAILE Academy richtig.
SKAILE Academy
Zur Academy
Kein langes Formular: ein Klick und du bist direkt da.