Při rozcházení a prvním delegování mi to hlásí, že to pálí 10,4M tokenů (a v detailu píše jen 133tis.). I na fórech píší, že to píše občas blbě.
Započítává nejspíš i několik M, které u sebe cachuje (nepopisuje ale jak).
Tak jsem si na to napojil i lokální modely (Code mi to pripravil přes proxy liteLLM), ale nefunguje to korektně - jsou problémy s komunikací: Claude modely automaticky “znají” agentku komunikaci a odpovídají korektně i na zadání v JSON.
Male modely to neumí - např. qwen 8b. Logocky to bude chtít každý.