Я переделал немного TrueSort теперь она при сортировке удаляет строки меньше 8 символов. Разделяет их по файлам 8,9,10,11,12,13,14,15,16 и более символов. Может отделять при сортировке числа, русские или символы в отдельный файл.
Я тоже только начал копаться в этой теме, и честно, словари с русскими словами реально помогают. Там хотя бы что-то понятное, а не какие-то наборы символов. Попробовал ссылки, которые тут давали — норм для первого этапа. Главное не заморачиваться на гигантах, а брать что попроще и постепенно расширять. У меня пока так, может потом пойму больше.
В старые времена словари собирали по крупицам, сейчас, кажется, проще — русские слова реально ускоряют дело. Главное, не пытаться сразу весь интернет перетереть, лучше маленькими партиями тестить, чтоб не сойти с ума. Ссылки в теме норм, качай и пробуй, со временем поймёшь, что к чему.