Внедрить оффлайн языковую модель в голосового помощника
В проекте на Python имеются: ASR (2 модели оффлайн, 1 онлайн), выбор языковых моделей через g4f при помощи провайдера (онлайн), TTS модели для озвучки ответа GPT (2 модели оффлайн, 1 онлайн). Голосовой помощник умеет выполнять запросы пользователя в браузере с помощью Selenium, управлять файлами компьютера при помощи GPT , открывать программы, искать по файлам, выполнять элементы навигации: вперед, назад, приближать, отдалять, напоминать, записывать в заметки. На данный момент запросы гпт выполняются в отдельных потоках при помощи библиотеки threading.
Необходимо внедрить русскую языковую модель gpt (аналог), которая будет работать без интернета. Дообучить её на тематику параллельного программирования С++, С#, Python, если это возможно. Разбить все по потокам: 1 - основной поток с окошком
2 - голос захватывает и распознает
3,4,5.... - работа с gpt (использовать popen, multiprocessing).
Возможно засунуть в отдельные потоки управление компьютером и управление браузером
Если придумаете, что можно и нужно распараллелить в проекте - можно не дообучать языковую модель
Собрать проект в exe и сделать простенький интерфейс заместо консольного.
Ищу ответственного разработчика на Python, которому близка данная тематика.
Срок 2-3 недели - не затягивать с проектом.
Десктоп программирование