Сгенерировать данные для регрессии и t-теста
Исходные данные:
Есть две группы по 115 студентов, назовем их группа 1 и группа 2.
Есть их оценки, точнее итоговые баллы.
Баллы лежат в диапазоне от 20 до 100.
Группа 2 показала результаты лучше группы 1.
Баллы в обеих группах распределены нормально (визуально это похоже на колокол).
При обучении группа 1 имела доступ к электронному курсу не более 4 часов в неделю, а группа 2 – неограниченный доступ.
Предположим, что семестр длится 16 недель.
Тогда для студентов группы 1 максимальное значение – 64 часа.
Для группы 2 максимума нет. Однако они не будут изучать курс вечно, поэтому положим максимум, например, 132 часа.
То есть время, которое провел произвольный студент из группы 1 в курсе, будет лежать в диапазоне, например, 12-64. А для произвольного студента из группы 2 в диапазоне, например, 12-132.
При этом в среднем предполагается, что чем больше времени студент провел в курсе, тем выше его балл.
Разумеется, плюс-минус, как это бывает в реальной жизни. Собственно, как и с колоколом, он тоже не будет идеальной формы.
Продолжение в ТЗ
Десктоп программирование