Глоссарий

Вес модели

Узнай о важности весов моделей в машинном обучении, их роли в предсказаниях и о том, как Ultralytics YOLO упрощает их использование для задач ИИ.

Обучай модели YOLO просто
с помощью Ultralytics HUB.

Узнай больше

Веса модели - это основные параметры, которые модель машинного обучения (ML) получает в процессе обучения. Эти числовые значения представляют собой знания, полученные из обучающих данных, и являются основополагающими для того, как модель делает предсказания или принимает решения на новых, невидимых данных. По сути, веса определяют силу и важность связей внутри модели, например между нейронами в нейронной сети (NN). Они являются регулируемыми "ручками", которые фиксируют шаблоны, изучаемые моделью.

Понимание веса моделей

Представь себе сложную машину с множеством регулируемых ручек; веса модели действуют подобно этим ручкам. В процессе обучения модели ей показывают примеры из набора данных, и она делает первоначальные предсказания. Разница между этими предсказаниями и реальными правильными ответами (ground truth) измеряется функцией потерь. Затем алгоритм оптимизации, такой как стохастический градиентный спуск (SGD) или Adam, систематически корректирует эти веса, используя такие техники, как обратное распространение, чтобы минимизировать эти потери. Этот процесс повторяется в течение многих итераций, или эпох, постепенно уточняя веса.

Изначально веса часто устанавливаются на небольшие случайные значения, но в процессе обучения они сходятся к значениям, которые отражают основные закономерности в данных. Очень важно отличать веса от гиперпараметров, таких как скорость обучения или размер партии. Гиперпараметры - это параметры конфигурации, заданные до начала обучения и определяющие сам процесс обучения, в то время как веса - это параметры, изучаемые в процессе обучения. Биасы, еще один тип обучаемых параметров, часто встречающийся наряду с весами в NN, представляют собой базовый уровень активации нейрона, не зависящий от его входов. В то время как веса масштабируют влияние входов, смещения изменяют выход функции активации.

Значимость весов моделей

Веса модели очень важны, потому что они напрямую кодируют изученные закономерности и взаимосвязи из обучающих данных. Хорошо подобранные веса позволяют модели достичь хорошей обобщенности, делая точные предсказания на данных, с которыми она раньше не сталкивалась. Качество весов напрямую влияет на такие показатели эффективности модели, как точность, прецизионность, отзыв и надежность, которые часто обобщаются в таких метриках, как mAP. Плохо обученные веса, часто являющиеся следствием таких проблем, как недостаточное количество данных, недостаточное время обучения или чрезмерная подгонка (когда модель слишком хорошо изучает обучающие данные, включая шум), приводят к ненадежным предсказаниям на новых данных.

Во многих современных приложениях ИИ, особенно в компьютерном зрении (КЗ), модели часто предварительно обучаются на больших общих наборах данных, таких как ImageNet или COCO. Полученные веса отражают широкие визуальные характеристики, применимые для многих задач. Эти предварительно обученные веса, такие как те, что доступны для моделейUltralytics YOLO , могут затем использоваться непосредственно для выводов или в качестве отправной точки для тонкой настройки на конкретной задаче или пользовательском наборе данных. Эта техника, известная как трансферное обучение, значительно ускоряет обучение и часто приводит к лучшей производительности, особенно когда пользовательские данные ограничены. Платформы вроде Ultralytics HUB позволяют пользователям управлять наборами данных, обучать модели и эффективно работать с полученными весами моделей.

Применение в реальном мире

Весовые коэффициенты моделей - это двигатель бесчисленных приложений искусственного интеллекта:

Управление и отслеживание веса

По мере усложнения моделей управление их весами и экспериментами, которые их создают, становится крайне важным для воспроизводимости и совместной работы. Такие инструменты, как Weights & Biases (Weights & Biases ), предоставляют платформу специально для MLOps, позволяя командам отслеживать гиперпараметры, метрики, версии кода и результирующие веса моделей для каждого эксперимента. Важно отметить, что платформаWeights & Biases" отличается от понятий "веса" и "смещения" как параметров в нейронной сети; платформа помогает управлять процессом поиска оптимальных weights and biases. Подробнее об интеграции Ultralytics с W&B ты можешь узнать из документации. Эффективное управление - ключ к решению самых разных задач, от настройки гиперпараметров до развертывания модели с помощью таких фреймворков, как PyTorch или TensorFlow.

Читать полностью
OSZAR »