Функциональные возможности модели (Model Functional Capabilities)
Совокупность задач и операций, которые способна выполнять модель машинного обучения или нейронная сеть в рамках поставленной при её разработке цели.
По сути, функциональные возможности определяют «круг компетенций» модели: что она умеет «делать» с входными данными, какие результаты способна выдавать и в каких сценариях её можно применять. Это своего рода «должностная инструкция» для ИИ‑системы: она описывает, какие интеллектуальные операции модель освоила в процессе обучения и может воспроизводить на новых данных.
Аналогия из бытового мира
Представьте себе кухонного робота‑помощника. Его функциональные возможности — это список действий, которые он умеет выполнять: нарезать овощи, варить суп, выпекать хлеб, разогревать еду и т. п. Точно так же и модель ИИ имеет свой «набор навыков»: например, распознавать лица, переводить тексты, прогнозировать цены, генерировать изображения. Чем шире этот набор, тем универсальнее модель.
Исторический контекст
Понятие функциональных возможностей стало особенно актуальным с развитием глубокого обучения и появлением крупных мультимодальных моделей (конец 2010‑х — начало 2020‑х годов). Ранние модели машинного обучения обычно решали одну узкую задачу (например, классификация изображений на Cats vs Dogs). С появлением трансформеров (Transformer, 2017) и масштабных предобученных моделей (BERT, GPT, 2018–2019) стало возможным создавать системы с широким спектром функций: одна и та же модель могла и переводить тексты, и отвечать на вопросы, и генерировать код. Это сдвинуло фокус с «модели под задачу» на «модель с множеством возможностей».
Смежные понятия и различия
- Архитектура модели — описывает её внутреннее устройство (слои, механизмы внимания и т. п.), тогда как функциональные возможности говорят о том, что модель умеет делать, а не как она это делает.
- Производительность модели — характеризует качество выполнения задач (точность, скорость, ресурсоёмкость), а не перечень самих задач.
- Обучающий датасет — определяет, на чём модель училась, а функциональные возможности — что она в итоге умеет.
Примеры использования
- Модель GPT‑4 обладает такими функциональными возможностями, как: генерация текста, перевод, суммирование, ответы на вопросы, написание кода, создание сценариев и т. д.
- Модель Stable Diffusion умеет генерировать изображения по текстовому описанию, редактировать существующие изображения, расширять границы картинки (outpainting).
- Модель Whisper (от OpenAI) способна транскрибировать аудио на множестве языков, определять язык речи, выделять спикеров.
- В компьютерном зрении модели типа YOLO (You Only Look Once) имеют функциональность реального времени обнаружения и классификации объектов на изображениях.
Таким образом, когда мы говорим о функциональных возможностях модели, мы отвечаем на вопрос: «Что эта модель может сделать для пользователя или системы, в которую она интегрирована?»
