Paperclip a páleni tokenů

Při rozcházení a prvním delegování mi to hlásí, že to pálí 10,4M tokenů (a v detailu píše jen 133tis.). I na fórech píší, že to píše občas blbě.

Započítává nejspíš i několik M, které u sebe cachuje (nepopisuje ale jak).

Tak jsem si na to napojil i lokální modely (Code mi to pripravil přes proxy liteLLM), ale nefunguje to korektně - jsou problémy s komunikací: Claude modely automaticky “znají” agentku komunikaci a odpovídají korektně i na zadání v JSON.

Male modely to neumí - např. qwen 8b. Logocky to bude chtít každý.