Выгрузка и нейрообработка множества xlsx таблиц в одну
Есть большие базы данных клиентов (множество схожих таблиц xlsx, но немного отличающихся по структуре данных), в них есть общая инфа, типа ФИО, номеров телефонов и т.д., но есть и отличающиеся (например, в одном есть кадастровый номер, а в другом нет). Мне нужно, чтобы скопом все файлы брались из папки (ну или как-либо ещё), упорядочивались и отправлялись в одну общую таблицу (чтобы при этом нейросеть упорядочила её, к пример, в одной из таблиц в сточке ФИО указано 2 ФИО разных людей, нужно, чтобы нейронка оставляла только одно имя, которое вероятнее подходит). но есть и отличающиеся инфа. Типа кадастровый номер в одной таблице есть, а в другой нет. Площадь квадратов в одной есть, а в другой нет.
Мне нужно, чтобы все эти таблицы подбивались под один шаблон, в котором будет, (например), 6 строчек:
ФИО правообладателя
телефон
АДРЕС
площадь объекта
кадастровый НОМЕР
заметки
Понятное дело, что заметки и кадастр номер будет не у всех, а также во многих таблицах будет инфа, по типу: "корпус", "площадь кладовки" ну и некоторые другие, которые мы брать в большую таблицу не будем. Также важный момент, в строчке ФИО в некоторых таблицах будут другие ФИО, которые нейронка должна отсеивать и оставлять только одно ФИО, которое относится к правообладателю. пример: "Нисанов Саул Годович
Елена Середа - представитель Года Нисанова +7 (926) 243-32-23" - должна определить, кто правообладатель и оставить только его.
Юзабилити, тесты и помощь