Мне понравилось говорить с Алисой и я решил сделать свой личный ИИ помощник.
Назову его в честь персонажа-робота из романа Пелевина Snuff.
Движок распознавания голоса будет wav2vec2 https://huggingface.co/jonatasgrosman/wav2vec2-large-xlsr-53-russian, который у меня успешно заработал.
Языковые модели буду пробовать разные, начну с ЯндексГПТ как самой русскоязычной из лёгких.
Модель генерации голоса найду позже - думаю они тоже есть в открытом доступе, а будут проблемы с нейросетевыми - создам свою на дифтонгах, наработки есть.
Основным преимуществом перед Алисой будет локальная обработка данных, без интернета и различные конфигурации в зависимости от мощности оборудования.
Возможность управления умным домом, уже реализованная в Алисе, тоже будет полезна.