Работа с dataframe в c++
я предоставлю код python, который вы должны преобразовать в c++ и использовать многопоточность, использовать 100% процессора, чтобы использовать максимум 64 ГБ ОЗУ,
должен быть очень быстрым
описание задачи:
предположим, у нас есть dataframe со столбцами 0, 1, 2, target
мы получим пары столбцов, такие как это, за исключением целевого столбца
(0, 1), (0, 2), (1, 0), (1, 2), (2, 0), (2, 1)
или три пары:
(0, 1, 2), (0, 2, 1), (1, 0, 2), (1, 2, 0), (2, 0, 1), (2, 1, 0),
(0, 1, 0), (0, 2, 0), (1, 0, 1), (1, 2, 1), (2, 0, 2), (2, 1, 2)
мы выполняем некоторые математические итерации для пар, таких как:
0 * 1 или 1*0 / 0
мы генерируем новые столбцы
мы вычисляем корреляцию с целью
мы получаем столбец с наивысшей корреляцией
мы добавляем его в наш исходный фрейм данных
для каждой математической итерации мы делаем это, пока не получим новый фрейм данных
это одна итерация, мы можем запустить ее столько итераций, сколько захотим
в каждой итерации мы сохраняем новые фреймы данных, сгенерированные с их информацией о корреляции
также мы должны сохранять математические операции, которые приводят к новому столбцу
например:
(0 *1) / (2 *0 * 1) нам нужно сохранить операции, чтобы выполнить их на другом фрейме данных
шаг 1: 0 * 1
шаг 2: 2 * 0
шаг 3: 2*0*1
шаг 4: (0*1)/(2*0*1)
Десктоп программирование