April 11th, 2019

Мета-ML

Мета-ML: алгоритм ML, который подбирает алгоритм ML, который может себя хорошо проявить на заданном датасете.
- берем датасет, нормализуем, начинаем последовательно применять к нему все известные ML-алгоритмы (регрессии, кластеризации, категоризации и т.п.) применительно ко всем комбинациям входных признаков
- параметры алгоритма перебираем, комбинируя диапазоны, или (если возможно) следуем отдельному алгоритму подбора параметров
- оставляем те модели, для которых метрики качества дают результат лучше порогового значения
- (бонус) модуль "интуиция": датасет из, например, визуализаций датасетов (точечные графики в 2д или 3д), для которых заранее известно, что к ним применима хорошая модель (например, к этому облаку точек хорошо подходит модель линейной регрессии, а к этому - кластеризация методом k средних). Для текущего датасета проверяется похожесть его визуализации на визуализации известных датасетов (обычная нейронка) и если есть сходство, в первую очередь тестируется модель, соответствующая найденному похожему образцу.

П.С. товарищи пишут, что в прошлом году уже сделано в Самсунге.

Если не сделано, оставляю пока за собой.