![]() |
Сколько памяти нужно для локальной LLM
Введение
Решил поставить на свой ПК локальную LLM (большую языковую модель) — возник вопрос: сколько же на самом деле памяти для этого нужно? Если вдруг тоже задумываетесь, вот мой опыт, полезные наблюдения и советы. Что это такое LLM — это большая языковая нейросеть, которая умеет работать с текстом, генерировать ответы и распознавать смысл, вроде ChatGPT, но локально, то есть без облака и интернета. Такие модели часто весят гигабайты и требуют кучу ресурсов, особенно оперативной памяти (RAM) или видеопамяти (VRAM). Где применяется Локальные LLM нужны, если хочешь: - Использовать AI без передачи данных в облако - Экспериментировать с настройками и «тонкой» подгонкой моделей - Работать с AI в офлайне - Разрабатывать и тестировать свои решения на базе AI Кому-то просто нравится идея полного контроля, без подписок и ограничений. Практические примеры Например, при пробе популярных open source моделей типа GPT-J или LLaMA: - GPT-J (6B параметров) кушает минимум 12-16 ГБ VRAM для адекватной работы - LLaMA 7B можно запустить на 8 ГБ VRAM, но будет тормозить - Более крупные модели 13B и выше требуют уже 24 НИЖЕ Для CPU-версий уже речь идёт о 32-64 ГБ RAM и выше (и это без учёта системы и приложений). |
Судя по моему опыту, для нормального запуска хотя бы модели с 7 миллиардов параметров на видеокарте 8 ГБ – это практически минимум, и всё равно иногда тормозит. CPU-версии требуют уже реально много оперативки, 32 гб и выше, иначе работать будет очень медленно или даже не запустится. Так что ставь калькулятор рядом, если хочешь попробовать домашний LLM.
|
Честно, не уверен, что все так сильно надо прям гонять на 8 ГБ видеопамяти, чаще всего реально начинаются тормоза и проблемы с запуском. Вдруг лучше просто что-то полегче искать, вместо этих огромных моделей, если комп слабенький.
|
Ну 8 ГБ — это, конечно, начальный минимум, но если модель чуть посерьёзнее, да ещё и с запасом хочешь, то лучше сразу копить на 16 и выше. А то запустил, а она у тебя как черепаха по тормозам ползёт — толку мало. Кто лень с железом заморачиваться, пусть берёт что попроще, но затормозит оно в итоге всё равно. В локалке без мощной жёсткой памяти особо разгуляться сложно.
|
| Время: 03:04 |