Разработка ПО C++/Python: обработка документов с ИИ
Разработка программы для автоматизированной обработки документов
Требуется создать приложение для Windows, которое будет автоматизировать обработку текстовых документов, таблиц и сканов. Основной функционал включает:
Загрузка и обработка файлов:
Поддержка форматов: PDF, DOC/DOCX, XLS/XLSX, PNG, JPG, TXT.
Возможность перетаскивания файлов в окно загрузки.
Автоматическое разделение многостраничных документов (например, PDF) на части.
Обработка документов:
Распознавание текста из сканов с использованием OCR (например, Tesseract).
Определение типа документа по ключевым словам (госконтракты, отчёты, резюме и т.д.).
Автоматическое извлечение ключевых данных (даты, суммы, стороны договора).
Интеграция с API нейросети:
Передача данных в API для выполнения задач (например, краткий пересказ, анализ данных).
Получение результатов от API и отображение их в структурированном виде.
Интерфейс:
Минималистичный дизайн на базе Qt:
Слева список задач (обработка контрактов, отчётов, резюме и т.д.).
Справа — зона загрузки файлов.
Внизу — область вывода результатов с кнопками для сохранения документов или уточнения деталей.
Функции редактирования:
Настройка промтов для API (доступно только администратору).
Возможность внесения изменений в регулярные выражения и настройки обработки.
Технические требования:
Основной функционал реализуется на C++ (Qt), дополнительные задачи — на Python.
Хранение временных данных и настроек в JSON-файлах.
Десктоп программирование