Самое простое — сразу ставить лимиты на запросы и токены. Я сначала не заморачивался и в итоге счёт подскочил, как будто за месяц жизни оплатил. Еще помогла замена GPT-4 на 3.5 там, где можно — она реально дешевле и тоже нормально пашет. И промпты короче делал — лишний текст потом дорого обходится. Просто базовые штуки, но они сильно экономят деньги.