Jailbreak и инъекции — это, конечно, серьезный вызов для LLM, но без автоматизации и системной проверки реально сложно поймать все подводные камни. Ручные трюки давно всем известны, сейчас главное — это грамотно связать разные защитные уровни и регулярно тестить через что-то типа Garak или PyRIT, иначе быстро всплывут дырки, о которых и не подумал. Без метрик и автоматизации защиту строить — как стрелять вслепую.