Модель Google S2R: новая эра голосового поиска
2025 Google представил новую систему Speech-to-Retrieval (S2R). И это можно назвать новой эрой голосового поиска.
В отличие от прежней модели, преобразовывавшей речь в текст, S2R использует аудиозапрос напрямую для поиска и ранжирования.
Какие плюсы это даёт?
- Повышается точность поиска.
- Сохраняется контекст.
- Сокращается количество неточностей и потенциальных ошибок в поисковой выдаче.
Голосовой поиск отлично работает на детализацию. А чем точнее информация и ближе к запросу пользователя, тем лучше индексация.
Роль голосового поиска для бизнеса
Голосовой поиск отлично поддерживает локальный, навигационный поиск, выигрышен для быстрых продаж товаров и услуг, которые являются прямыми ответами на такие запросы, как «Срочно нужен корм для кота», «Болит зуб. Где рядом стоматолог?», «Cел аккумулятор, где купить?», «Есть ли рядом ремонт обуви?»
Он помогает автоматизировать заказы, добавлять товары в корзину и улучшать клиентский сервис через голосовых ассистентов.
Как работает новая модель голосового поиска?
Технология Speech-to-Retrieval (S2R) напрямую интерпретирует и извлекает информацию из устного запроса. Нет промежуточной паузы в виде текстовой расшифровки. Если раньше система базировалась на принципе «Какие слова были произнесены?», то с новой моделью S2R в фокусе находится вопрос: «Какая информация ищется?».
Традиционная система распознавания речи (ASR) преобразует аудио в одну текстовую строку, она может потерять контекстные подсказки, которые могли бы помочь в распознавании смысла.
Если система неверно интерпретирует аудио на ранней стадии, эта ошибка передаётся поисковой системе, которая, как правило, не может её исправить. В результате конечный результат поиска может не отражать намерение пользователя. Сейчас же благодаря S2R всё иначе.
Архитектура и принцип работы S2R
Для понимания взаимосвязей между речью и информацией нейронные сети обучаются на огромных объёмах данных.
В основе модели S2R лежит архитектура с двумя кодировщиками:
-
Аудиокодер обрабатывает необработанный аудиозапись запроса, преобразует её в расширенное векторное представление, соответствующее семантическому значению.
-
Кодировщик документов обучается векторному представлению для документов.
Используя большой набор данных, состоящий из парных аудиозапросов и соответствующих документов, система обучается настраивать параметры обоих кодировщиков одновременно.
Обучение модели обеспечивает геометрическую близость вектора аудиозапроса к векторам соответствующих документов в пространстве представления. Такая архитектура позволяет модели изучать информацию, более близкую к основной цели, необходимой для извлечения, непосредственно из аудиозаписи, минуя сложный промежуточный этап транскрибирования каждого слова, который является главным недостатком каскадной модели.
Когда пользователь произносит запрос, аудиозапись передается в предварительно обученный аудиокодер, который генерирует вектор запроса.
Было: речь - текст - поиск - результат.
Стало: речь - семантический вектор - поиск - результат.Поисковой алгоритм при голосовом поиске ищет не просто страницы с отдельными словами, а страницы, которые семантически близки к смыслу запроса. В этом и принципиальная разница.
SEO тоже существенно изменяется. S2R требует смещения фокуса с ключевых слов на глубинные намерения (интенты) и смысловую близость. В принципе здесь много общего с LSI-индексированием, когда учитываются слова и фразы, дополняющие основной запрос. Но особое место уделяется именно «хвостам», которые поддерживают именно «живой» диалог.
Что это значит для вашего бизнеса?
Вы больше не конкурируете за ключевые слова — вы конкурируете за доверие.Та страница, которая чётко, естественно и полно отвечает на реальный голосовой запрос - получает все клики. Остальные - исчезают.
Локальный бизнес новой моделью голосового поиска получает огромное преимущество:
Если вы представляете стоматологию, автосервис, аптеку, ремонт обуви - ваш потенциальный клиент точно говорит в голосовом помощнике:
Конверсия растёт - потому что голосовой поиск - это моментальное действие.
Когда человек говорит: «Где купить аккумулятор прямо сейчас?» - он не хочет думать.
Он хочет найти, позвонить, приехать, купить.
Что делать прямо сейчас?
1. Создайте страницы, представляя будто вы отвечаете на звонок от клиента.2. Добавьте FAQ-секции с вопросами в разговорной форме - «Как быстро починят обувь?», «Есть ли доставка корма сегодня?»
3. Оптимизируйте бизнес-профили в Google и Яндекс - часы, фото, ответы на отзывы, категории.
4. Проверьте скорость сайта. Если грузится дольше 3 секунд, голосовой ассистент столкнётся с трудностями.
5. Запустите голосовые сценарии в чат-ботах.
S2R - это новые возможности для конверсии. Ваш выбор - адаптироваться или остаться в тени.

