Время обучения (Training Time)
Что такое Время обучения (Training Time)?
Период, необходимый для того, чтобы модель машинного обучения или нейронная сеть достигла заданного уровня производительности (например, определённой точности предсказаний) на обучающей выборке посредством итеративного обновления параметров в процессе оптимизации.
- Времени вывода (inference time) — сколько модель тратит на обработку одного примера после обучения (например, классификация изображения).
- Времени сходимости (convergence time) — момента, когда функция потерь перестаёт заметно уменьшаться; не всегда совпадает с «практическим» временем обучения, так как иногда модель продолжают дообучать для тонкой настройки.
- Обучение GPT-3 (175 млрд параметров) на кластере из тысяч GPU заняло несколько недель.
- Обучение небольшой свёрточной сети (например, ResNet-18) на наборе данных CIFAR-10 может занять от нескольких минут до часа на одном GPU.
- В промышленном ML часто используют техники ускорения обучения: распределённое обучение, смешанную точность (mixed precision), предварительную инициализацию весов (pretraining), чтобы сократить время обучения без потери качества.
