Google представил сервер MCP для доступа к публичным данным через ИИ
Google превращает свои обширные запасы публичных данных в источник для развития ИИ с помощью запуска сервера Data Commons Model Context Protocol (MCP). Сервер позволяет разработчикам, специалистам по данным и ИИ-агентам получать доступ к реальной статистике с помощью естественного языка и улучшать обучение ИИ-систем.
Запущенный в 2018 году проект Data Commons от Google собирает публичные наборы данных из различных источников, включая государственные опросы, локальные административные данные и статистику от таких глобальных организаций, как ООН. С выпуском сервера MCP эти данные теперь доступны через естественный язык, что позволяет разработчикам интегрировать их в ИИ-агенты или приложения.
Системы ИИ часто обучаются на шумных и непроверенных веб-данных. В сочетании с их склонностью «заполнять пробелы» при отсутствии источников это приводит к «галлюцинациям». В результате компаниям, которые хотят настроить ИИ-системы под конкретные задачи, часто нужны большие и качественные наборы данных. Публичный запуск сервера MCP для Data Commons призван решить обе эти проблемы.
Новый сервер MCP от Data Commons связывает публичные наборы данных — от данных переписи населения до статистики климата — с ИИ-системами, которые всё больше зависят от точного и структурированного контекста. Предоставление доступа к этим данным через подсказки на естественном языке призвано сделать ИИ более обоснованным и опирающимся на проверяемую информацию из реального мира.
«Протокол контекста модели позволяет нам использовать интеллект большой языковой модели, чтобы выбирать нужные данные в нужное время, без необходимости понимать, как мы моделируем данные или как работает наш API», — сказал в интервью руководитель Google Data Commons Прем Рамасуами.
MCP — это открытый отраслевой стандарт, который впервые был представлен Anthropic в ноябре прошлого года. Он позволяет ИИ-системам получать данные из различных источников, включая бизнес-инструменты, репозитории контента и среды разработки приложений, предоставляя общую основу для понимания контекстных подсказок. С момента запуска его приняли такие компании, как OpenAI, Microsoft и Google, для интеграции своих ИИ-моделей с различными источниками данных.
В то время как другие технологические компании изучали, как применить этот стандарт к своим ИИ-моделям, Рамасуами и его команда в Google начали исследовать, как можно сделать платформу Data Commons более доступной с помощью этой структуры.
Google также сотрудничал с некоммерческой организацией ONE Campaign, которая занимается улучшением экономических возможностей и общественного здравоохранения в Африке, для запуска ONE Data Agent. Этот ИИ-инструмент использует сервер MCP для предоставления десятков миллионов точек данных о финансах и здравоохранении на простом языке.
Организация ONE Campaign обратилась к команде Google Data Commons с прототипом реализации MCP на собственном сервере. По словам Рамасуами, это стало поворотным моментом, который привёл команду к созданию специального сервера MCP в мае.
Однако возможности сервера не ограничиваются ONE Campaign. Открытый характер сервера Data Commons MCP делает его совместимым с любой языковой моделью. Google предоставил несколько способов для начала работы разработчиков. Пример агента доступен через набор для разработки агентов (ADK) в блокноте Colab, а к серверу также можно получить доступ напрямую через Gemini CLI или любой MCP-совместимый клиент с помощью пакета PyPI. Пример кода также доступен в репозитории GitHub.
