Навчання моделі рекомендаційної системи
Навчання моделі — це не просто model.fit(). Мусимо правильно сформувати навчальні дані (неявна зворотна сполука проти явних рейтингів), обрати негативні приклади, налаштувати функцію втрати та оцінити на правильних метриках. Помилки на будь-якому етапі нулюють точність навіть з хорошою архітектурою.
Формування навчальної вибірки
Правильна часова розбивка для рекомендаційних систем: Не робіть випадкову розбивку! Навчайтеся на минулому, тестуйте на майбутньому. Графік навчання: підготовка даних 2-4 години, базова модель (ALS) 15-30 хв, навчання двобашненої (CPU) 4-8 годин, навчання двобашненої (GPU A100) 30-60 хв, настоювання гіперпараметрів 1-3 дні, A/B тест у виробництві 2-4 тижні.
Мінімальний обсяг для успішного навчання: 50K унікальних пар користувач-товар.







