Представленная Google нейросеть MUM в 1000 раз ускорит обработку сложных поисковых запросов
Разработчики Google занялись созданием новой технологии MUM . Данная мультимодальная нейросеть предназначена для улучшения результатов органического поиска в процессе обработки сложных поисковых запросов. О том, как многозадачную унифицированную модель будут внедрять и каков принцип ее работы рассказал глава поискового бизнеса корпорации Прабхакар Рагхаван на ежегодной конференции для разработчиков Google I/O 2021.
Особенности технологии MUM
Мультимодальная нейросеть работает на архитектуре глубоких нейронных сетей Transformer. В сравнении с проектом BERT, MUM в 1000 раз мощнее и эффективнее.
Среди отличительных характеристик унифицированной модели можно выделить:
- работа на 75 языках и совмещение сведений из всех полученных источников;
- многозадачность — MUM предназначена для выполнения нескольких задач одновременно, предоставляя пользователям наиболее релевантные результаты;
- распознавание нескольких модальностей — на данный момент модель приспособлена к пониманию текстовых запросов и изображений, а в будущем будет работать с данными в формате видео и аудио.
Как показывают подсчеты системы, чтобы решить комплексные, многокомпонентные задачи, пользователям необходимо около восьми поисковых запросов. Внедрение унифицированной модели даст возможность не только ускорить обработку сложных задач, но и сократить количество поисковых сессий.
Как работает мультимодальная нейросеть?
Примером для демонстрации принципа работы технологии послужил следующий запрос: «Я поднялся на гору Адамс и следующей осенью хочу подняться на гору Фудзи. Что мне нужно для подготовки к подъему в следующий раз?». Подобные запросы системы сложно распознают, поэтому не могут предоставить наиболее подходящие сведения в поисковой выдаче. Внедрение мультимодальной нейросети поможет Google обрабатывать сложные запросы и подбирать релевантные данные в результатах поиска.
Кроме текстовых запросов, технология MUM способна распознавать изображения. Например, если пользователь сфотографирует свою обувь и задаст системе вопрос: «Можно ли данное снаряжение использовать для подъема на гору?» — Google сможет не просто понять содержание фото, но и дать ответ на поставленный вопрос. Также системой будет предложен перечень подходящей экипировки для подъема на вершину.
На данный момент мультимодальная нейросеть находится на стадии внутреннего тестирования. Дата публичного запуска модели пока неизвестна.