OpenAI запустили поискового робота GPTBot для тренировки GPT-5
Источник: Rusbase.
Разрабатывающая чат-бота ChatGPT компания представила поискового робота GPTBot, который собирает информацию со всего интернета для тренировки новых языковых моделей компании.
ИИ-разработчик OpenAI запустил GPTBot — новый инструмент для сканирования веб-страниц, который может быть использован для улучшения будущих моделей ChatGPT. По словам компании, использование поискового робота повысит точность ответов и расширит возможности искусственного интеллекта.
Поисковой робот — это тип бота, который перебирает контент всех веб-сайтов в Интернете, структурирует его и затем заносит в свою базу. Такими инструментами обычно пользуются поисковики вроде Google и Яндекс.
По словам OpenAI, GPTBot будет собирать лишь общедоступные данные, фильтруя источники, которые собирают личную информацию или нарушают правила сервиса. Помимо этого, у бота не будет доступа к платному контенту.
Для тех, кто не хочет использовать свой сайт для тренировки будущих версий чат-бота ChatGPT, OpenAI представила инструкцию, которая призвана огородить контент от поискового робота. Для этого достаточно добавить в код сайта строки: «User-agent: GPTBot» и «Disallow: /».