Понимание естественного языка, которое всегда было довольно сложным для поисковых систем, сейчас выходит на совершенно новый уровень. На конференции Google I/O 2021 глава поискового бизнеса Google Прабхакар Рагхаван (Prabhakar Raghavan) представил новую технологию многозадачной унифицированной модели - MUM (Multitask Unified Model), которая поможет Google отвечать на сложные поисковые запросы. 

MUM — это инструмент на базе искусственного интеллекта, предназначенный для упрощения поиска в Интернете. Эта система предназначена для того, чтобы понять неявные сравнения в поисковом запросе и дать наиболее подходящий ответ.

Например, обработать такой запрос:

«Я поднялся на гору Адамс и теперь хочу подняться на гору Фудзи следующей осенью, что мне сделать по-другому, чтобы подготовиться?».

MUM могла бы понять, что пользователь сравнивает две горы, поэтому информация о высоте и тропе может быть актуальной. Модель также могла бы понять, что в контексте пеших прогулок «подготовка» может включать в себя такие вещи, как фитнес-тренировки, а также поиск подходящего снаряжения.

Ответ на вопрос о походе не обязательно будет представлен в виде списка ссылок на веб-сайты, которые могут быть полезны. Но это будет ответ, основанный на различных фрагментах информации, собранной из Интернета. В будущем Google хочет сократить количество поисковых запросов, которые кто-то должен выполнять, и вместо этого использовать возможности MUM, чтобы обеспечить более последовательный и упрощенный ответ.

По данным Google, новая языковая модель в 1000 раз мощнее, чем BERT, выпущенная в 2019 году.

В чем особенность системы MUM и как она работает

Многозадачность — главная особенность MUM. Модель обучается на 75 языках и одновременно выполняет множество различных задач, что позволяет развивать более полное понимание информации и знаний о мире, чем предыдущие модели.

MUM является мультимодальной технологией, поэтому она понимает информацию через текст и изображения и в будущем может расширяться до большего количества модальностей, таких как видео и аудио.

Второй гипотетический сценарий, приведенный на конференции, описывает ситуацию, в которой пользователь фотографирует свои походные ботинки и спрашивает: «Могу ли я использовать их для подъема на гору Фудзи?». MUM сможет понять содержание изображения и цель запроса, а также сообщит пользователю, подходит ли его снаряжение, и укажет ему на список рекомендованного снаряжения для подъема на Фудзи.

Как подготовиться к новому алгоритму

Появление MUM в Google уже сейчас называют «новой вехой в понимании информации». Алгоритмы Google всё больше приближаются к тому, чтобы читать и понимать текст подобно человеку. Как же подготовиться к новой модели понимания текста? 

Чтобы сделать контент наиболее понятным для поисковых систем, нужно как минимум начать с внедрения микроразметки на страницы сайта. Это поможет поисковику понять контент страницы и даст возможность оказаться сайту в расширенных результатах поисковой выдачи.

Какие сервисы помогут внедрить структурированные данные в контент корректно:

Ну и конечно же, важно писать качественные тексты, которые легко читаются и оптимизированы естественным образом. Не стоит злоупотреблять ключевыми фразами, чтобы ранжироваться выше — думайте о пользователе и пишите только то, о чем он хотел бы прочесть на сайте. Текст должен быть уникальным, грамотным, полезным и хорошо структурированным.

Технология MUM пока находится на стадии эксперимента. Прямо сейчас Google проводит внутреннее тестирование, чтобы лучше понять типы запросов, которые могут быть решены.