BERT поможет Google точнее понимать запросы пользователей


Содержание материала:

Как оптимизировать сайт под Google BERT?

Всем мы помним, что новый алгоритм Google BERT появился недавно, и уже многие интересуются вопросом можно ли оптимизировать сайт под Google BERT? В целом нет, так как обычному SEOшнику это будет недоступно.

«Эй, Гугл, поделись с нами, что теперь, после запуска BERT, нужно делать в плане создания контента? Как нам заставить клиентов по-новому подходить к этому вопросу? Раскрой свои тайны, и мы поможем наполнить поиск лучшим контентом для миллиардов пользователей Google».

На этот раз вопрос был адресован Дэнни Салливану (Danny Sullivan):
«Если интересно мое мнение, то алгоритм BERT никоим образом не подрывает основы нашего поиска. Исходя из этого – пишите контент для людей! Только это и передайте своим клиентам. Им не нужно думать о чем-то новом, выдумывать свой велосипед. Оптимизировать сайт под новый алгоритм невозможно в принципе. Он о том, как мы интерпретируем запросы и контент».

А значит получается, что только правильный контент (копирайт или рерайт) для людей может помочь вашему сайту занять хорошую позицию в поисковой системе.

рекомендованная Статья

Последние и важные новости SEO, которые возможно вы упустилиSEO. Главная новость прошлой недели — это новый алгоритм BERT в Google.…

Контент недорого

Мы создадим для вас качественный контент по доступным ценам, который будет занимать топовые позиции в ПС.

«Самый большой прорыв в поиске за последние пять лет»: Google запустил BERT

Разбираемся, а в чём, собственно, прорыв и как это работает.

С помощью технологии BERT (Bidirectional Encoder Representations from Transformers — NLP на базе нейронных сетей) результаты поиска станут более осмысленными, приближенными к тому, что на самом деле хотел узнать пользователь. Просто специальные модели теперь будут обрабатывают слова в поисковом запросе не по порядку, а с учётом контекста. Уже сейчас поиск на основе BERT помогает лучше понять каждый десятый запрос в США на английском языке, а со временем, после успешного обучения обновление заработает для других языков и локализаций.

Отпадёт необходимость формулировать запрос специально — Search сможет понять контекст слов даже в длинном запросе со множеством предлогов типа “for” и “to”, иногда радикально меняющих смысл фразы.

Например, поиск “2020 brazil traveler to usa need a visa”. Здесь “to” и его связь с другими словами в запросе особенно важны для понимания смысла. Речь идёт о путешествии бразильца в США, а не наоборот. Раньше алгоритм не видел этой связи, и в выдачу попадали материалы о гражданах США, путешествующих в Бразилию. С помощью BERT поиск предоставит более релевантный результат для этого запроса.

Давайте посмотрим на другой запрос: “do estheticians stand a lot at work”. Раньше термин «автономный» воспринимался как слово «стоять» (“stand”). BERT всё поймёт правильно:

Вот ещё несколько примеров, когда BERT словит нюансы языка там, где компьютеры не воспринимают текст как люди.

Только с появлением BERT “for someone” стало важной смысловой частью этого запроса

Раньше при поиске вообще игнорировали слово “no”, не понимая, насколько оно важно для правильного ответа

BERT выбирает более полезный результат именно для взрослой категории пользователей

Понимание языка останется вечной проблемой, а значит совершенствовать Поиск придётся бесконечно. Конечно, лучше не испытывать BERT запросом “what state is south of Nebraska” («какой штат находится к югу от Небраски») — скорее всего, она выдаст “South Nebraska” («Южная Небраска»). Хотя очевидно, что это Канзас :–) Тем не менее модели, обучаемые на английском, уже пытаются применить к другим языкам. И даже успели получить ощутимый эффект на таких языках, как корейский, хинди и португальский.

Google станет лучше понимать запросы пользователей

Google анонсировал обновление поисковой системы и внедрении технологии BERT (Bidirectional Encoder Representations from Transformers) на основе нейросети. «Это самый большой рывок за последние пять лет и один из главнейших рывков в истории Google Search», – говорится в пресс-релизе компании.

Новая технология будет анализировать не отдельные слова в запросе, как это происходит сейчас, а слова в контексте, с учетом предыдущего и следующего слов. В частности, BERT будет больше уделять внимания предлогам, которые играют важную роль в запросах.

Технология позволит пользователям задавать более естественно сформулированные запросы, а не вводить набор ключевых слов. Тестирование показало, что технология BERT помогла улучшить результат поиска по каждому десятому запросу на английском в США.

Особенностью BERT является то, что обученная на одном языке нейросеть может применяться для других языков.

Google представила BERT — революционную технологию, которая наделит поисковик способностью понимать человеческий язык

Поделитесь в соцсетях:


Google на этой неделе не только совершила прорыв в области квантовых вычислений — группа исследователей поискового гиганта первой достигла квантового превосходства (53-кубитный компьютер Google Sycamore решил задачу, которую невозможно решить на обычных компьютерах), но и добилась огромных успехов на основном поприще. В частности, Google анонсировала крупное обновление поискового алгоритма. Новая технология, основанная на нейронных сетях и глубинном обучении, позволит поисковику лучше понимать запросы на естественном языке.

Топ-пост этого месяца:  Закладки в браузере Яндекса, Гугл Хром и Фаерфорс, а так же виртуальные онлайн-закладки

Речь о технологии BERT (полное название — Bidirectional Encoder Representations from Transformers или Двунаправленная нейросеть-кодировщик). Если раньше поисковик Google «понимал» каждый запрос как набор слов, подбирая релевантные результаты по ключевым словам, то с BERT он научится понимать контекст благодаря способности анализировать не только основные, но и вспомогательные слова в запросе, например, словосочетания и предлоги. В итоге пользователям больше не придется адаптировать свои запросы под машинный язык для получения релевантных результатов, а использовать естественный язык — «общаться» с поисковиком, как с живым человеком. Иными словами, находить нужную информацию должно стать проще.

Google называет создание технологии BERT «крупнейшим прорывом за последние пять лет и одним из самых крупных достижений в истории поиска». Компания приводит несколько наглядных примеров, как BERT улучшила поисковую выдачу.

Впервые Google рассказала о BERT в ноябре 2020 года. Изначально BERT будет использоваться только для обработки запросов на английском, но в будущем алгоритм научится распознавать и другие языки.

Поисковик Google будет лучше понимать запросы на естественном языке

Поисковая система Google является одним из самых популярных и широко используемых средств поиска нужной информации и ответов на разные вопросы. Поисковик используется по всему миру, предоставляя пользователям возможность быстро отыскать необходимые данные. Именно поэтому команда разработчиков Google непрерывно работают над тем, чтобы улучшить собственную поисковую систему.

В настоящее время каждый запрос воспринимается поисковиком Google как набор слов, под которые подбираются релевантные результаты. С разговорными и сложными запросами система справляется хуже, а понимание языка остаётся актуальной проблемой на протяжении длительного времени.

В ближайшее время компания намерена внедрить новый алгоритм обработки запросов на естественном языке, основой для которого стала нейронная сеть BERT (Bidirectional Encoder Representations from Transformers), представленная в прошлом году. Алгоритм способен анализировать запрос полностью, не разбивая его на слова и учитывая предлоги и союзы. Такой подход позволит получать полный контекст запроса, находя более подходящие ответы.

Разработчики Google говорят о том, что создание алгоритма на основе нейронной сети BERT является «важнейшим достижением за последние 5 лет и одним из наиболее значимых событий за всю историю поисковой системы». В настоящее время новый алгоритм используется для обработки части запросов к поисковой системе Google, выполняемых на английском языке. В дальнейшем действие алгоритма распространится на все поддерживаемые языки, но, когда это произойдёт, пока сказать трудно.

Поисковик Google начнёт лучше понимать запросы

Компания Google выпускает крупное обновление для основного алгоритма поиска. Новая технология, основанная на передовых методах обработки естественного языка, точнее понимает запросы пользователей.

Как отметили в Google, разработчики научили алгоритм соотносить слова в предложении друг с другом. Если раньше при вводе запроса «Можете ли вы получить лекарство для кого-то в аптеке» поисковик рассматривал фразу по важным словам (лекарство и медицина) и выдавал локальные результаты, то сейчас он понимает весь контекст (возможность получить таблетки по чужому рецепту), показывая более точную информацию.

Алгоритм работает на основе нейросети BERT, которая и обрабатывает предложения на естественном языке. Сейчас нововведение используется во время каждого десятого поискового запроса на английском языке в США. В дальнейшем новый алгоритм появится в других странах и будет поддерживать больше языков.

Ранее News.ru рассказал, что пользователи онлайн-магазина Google Play столкнулись с 42 приложениями, заражёнными рекламным программным обеспечением (ПО). Общее число их загрузок превысило отметку в 8 млн скачиваний.

Самое интересное — в нашем канале Яндекс.Дзен

Google BERT — новый поисковый алгоритм. Как изменится ранжирование и что делать сейчас?

Официально: Google представил новый поисковый алгоритм — Google BERT.

Какая информация есть на данный момент?

Как работает поисковый алгоритм? Что изменится в поисковой оптимизации?

Разберемся с вопросами далее.

Google BERT

Что такое Google BERT? Google BERT является алгоритмом поисковой системы, который призванн улучшить релевантность результатов поисковой выдачи за счет способности анализировать не ключевые фразы, а предложения.

Для достижения цели используется нейронная сеть, которая призвана наделить поисковую систему пониманием текста на разных языках. Аббревиатура BERT означает следующее — Bidirectional Encoder Representations from Transformers или Двунаправленная нейронная сеть кодировщик.

Где применяется алгоритм? На данный момент алгоритм тестируется в следующей выдаче — Соединенные Штаты Америки, английский язык. Технология применяется на 10% запросов к поисковой системе. В перспективе данный алгоритм будет применяться для SERP большинства стран и языков.

Что меняется? Ранее Google анализировал каждый запрос как набор ключевых фраз, и подбирал релевантные результаты используя анализ ключевых фраз. С BERT поисковая система будет понимать весь контекст запроса. Такая возможность достигается благодаря способности анализировать не только ключевые фразы, но и вспомогательные слова в поисковых запросах (например, словосочетания и предлоги).

Итак, без Google BERT поисковая система анализирует ключевые фразы. С применения нейронной сети Google BERT будет достигаться цель понимания предложений.


Изменения скажутся и на сниппетах, так как технология будет использоваться и для формирования фрагментов в поисковой выдачи.

Примеры

Как Google BERT улучшает поисковую выдачу, есть примеры? Для наглядности рассмотрим ряд примеров.

Имеем поисковый запрос:

parking on a hill with no curb

В запросе речь о следующем: парковка на холме без бордюра.

Ранее слову бордюр придавалось излишнее значение и, как следствие, результаты поисковой выдачи были нерелевантными.

Топ-пост этого месяца:  Апдейты Яндекса — какие бывают, как отслеживать ап Тиц, изменения поисковой выдачи и все другие

Использование BERT изменяет результат поисковой выдачи:

Такие варианты переосмысления привели к масштабным изменениям в поисковой выдачи на английском.

Еще пример. Имеем поисковый запрос:

brazil traveler to usa need a visa

В запросе речь о следующем: нужна ли виза бразильцу для путешествия в штаты.

Из-за предлога to алгоритм поисковой системы не правильно понимал интент.

До BERT в результатах выдачи были страницы о поездке граждан из США в Бразилию, а с BERT — наоборот.

Как оптимизировать сайт под Google BERT? На данный момент единственная рекомендация заключается в написании текстов для людей и расширении семантического ядра страницы. Привлечь больше трафика смогут страницы, на которых:

  • Содержание размещается с учетом информационной архитектуры;
  • Контент закрывает потребности в части интента.

Что имеет смысл сделать в плане информационной архитектуры:

  • Спроектировать информационное пространство сайта так, чтобы дизайн способствовал выполнению задач и интуитивному доступу к содержимому;
  • Структурировать информацию, которая представлена на страницах сайта.

Что имеет смысл сделать на страницах в плане улучшения интента:

  • Расширить страницы текстом, с вхождением дополнительных релевантных ключевых фраз из поисковой видимости. Поисковая видимость выгружается через специальные сервисы;
  • Анализировать поисковые запросы, по которым был привлечен трафик на сайт и добавлять релевантные фразы в контент;
  • Добавлять в контент релевантные фразы из поисковых подсказок Google, Bing и Yandex. В данном источнике появляются низкочастотные фразы, которых нет в других системах;
  • Анализировать логи внутреннего поиска и добавлять в контент найденные релевантные ключевые фразы.

Как выгружать ключевые фразы сайтов из поисковой видимости? Самое простой способ заключается в выгрузке данных из базы MegaIndex.

Робот регулярно сканирует поисковую выдачу, собирает и обновляет списки ключевых фраз, по которым ранжируются сайты.

Пример отчета далее:

Рекомендованный материал в блоге MegaIndex по теме расширения списка ключевых фраз похожими по ссылке далее — Как находить дополнительные ключевые фразы, чтобы привлечь больше трафика?.

Наглядный пример по использованию сервиса:

Вопросы и ответы


Правда ли, что Google способен анализировать такие объемы данных?

Для реализации таких решений как BERT требуются серьезные вычислительные ресурсы. Данный вопрос часто поднимается в комментариях. На самом деле такие ресурсы есть. Но на перспективу в Google разрабатывается ряд технологий, которые потенциально могут решать серьезные вычислительные задачи путем использования специфических технологий.

К примеру, квантовая система Google Symcore. Данная система способна выполнять расчеты в тысячи раз быстрее, нежели самые производительные суперкомпьютеры.

BERT vs альтернативы?

Визуализация архитектуры нейронной сети BERT по сравнению с предыдущими современными методами показана далее. Стрелки указывают на поток информации от одного слоя к следующему. Зеленые прямоугольники в верхней части рисунка указывают на окончательное контекстуализированное представление каждого входного слова:

Ниже приведены данные об эффективности использования алгоритма BERT в сравнении с пользовательским выбором и схожими технологиями обработки естественного языка.

  • EM — показатель точности;
  • F1 — показатель аккуратности (баланс точности и полноты классификации).

Выводы

Google начал использовать алгоритм ранжирования BERT. Анонс про новый алгоритм размещен в официальном блоге.

Google называет алгоритм BERT крупнейшим прорывом за последние пять лет и одним из самых крупных достижений в истории поиска.

Данная технология направлена на решение задач по natural language processing, иными словами речь про задачи на тему обработке естественного языка.

В целом данная технология ложится в канву стратегии Google AI First.

Рекомендованный материал на сайте MegaIndex про AI first по ссылке далее — Стало известно как изменится формат поисковой выдачи в Google в 2020 году.

Кстати, Google BERT является полностью открыткой технологией, а значит есть данные для изучения.

Алгоритм влияет на:

  • Ранжирование части страниц в поисковой выдаче;
  • Формирование сниппетов.

Как подготовиться к приходу алгоритма? Имеет смысл расширить список ключевых фраз похожими. Как источники для выгрузки таких фраз следует рассматривать:

  • Систему поиска на сайте;
  • Систему аналитики;
  • Поисковые подсказки;
  • Поисковую видимость.

Как вариант, ключевые фразы из поисковой видимости можно выгружать применяя сервис по поиску похожих ключевых фраз.

Сервис бесплатный.

Что хорошего в Google BERT для поисковых оптимизаторов? При создании title и h1 зачастую возникает дилемма: выбрать title для SEO или title для CTR? С введением Google BERT для ряда страниц станет возможным адаптировать title под требования CTR, без ущерба для поисковой оптимизации. Но надо тестировать.

Что хорошего в Google BERT для пользователей? Получить релевантные результаты в поисковой выдаче станет проще. Использование голосового поиска будет давать более релевантные результаты.

Остались ли у вас вопросы, замечания или комментарии по теме алгоритма? Что вы думаете о Google BERT? Напишите в комментариях.

Технология BERT от Google – главный прорыв в поиске за 5 лет

Новая технология BERT, созданная на базе нейросетей, сможет сделать результаты поиска более осмысленными и полезными для пользователей. Система будет обрабатывать слова в поисковой строке не по порядку, а учитывая контекст.


Пока BERT работает только для англоязычных запросов и уже показала выдающиеся результаты. Поисковая система Google стала лучше понимать даже длинные и не совсем корректно сформулированные запросы.

Результаты поиска стали более релевантны запросам и полезны для пользователей. Дело в том, что технология BERT хорошо понимает тонкости языка и лучше улавливает то, что именно нужно человеку.

Сейчас модель уже тестируется на других языках и позволяет получить заметный эффект на португальском, корейском и хинди.

Топ-пост этого месяца:  Кодекс — WordPress

Александра, специалист в области интернет-маркетинга

Google представил BERT Update – крупнейший прорыв в работе поиска за последние 5 лет

Google официально представил BERT Update – обновление, которое компания назвала «крупнейшим прорывом за последние 5 лет и одним из самых крупных качественных скачков в истории поиска».

Новый алгоритм помогает Google лучше понимать запросы на естественном языке. Он охватывает 1 из 10 запросов в США на английском языке. Со временем Google планирует расширить этот подход на большее количество стран и языков.

Google открыл исходный код технологии Bidirectional Encoder Representations from Transformers или сокращённо BERT, работающей на базе машинного обучения, в прошлом году. Эта технология позволяет тренировать системы ответа на вопросы.

Google применяет модели BERT в ранжировании и при формировании избранных сниппетов (featured snippets). В ранжировании – только для запросов на английском языке, для избранных сниппетов – в более чем 20 странах мира, где работает эта функция. Благодаря BERT поисковику удалось достичь значительных улучшений в области featured snippets на таких языках, как корейский, португальский и хинди.

BERT помогает Google «понимать» более длинные запросы, сформулированные на естественном языке, где большое значение имеют предлоги, такие как «for» и «to».

В качестве одного из примеров Google привёл запрос [2020 brazil traveler to usa need a visa]. Раньше поисковик возвращал по нему результаты о гражданах США, путешествующих в Бразилию. Хотя на самом деле речь идёт о о посещении Соединённых Штатов бразильскими туристами. Теперь Google правильно понимает такие запросы, учитывая предлог «to».

Google также применяет BERT для улучшения поиска по всему миру – выводы, сделанные в отношении одного языка, применяются к другим. Это помогает возвращать более релевантные результаты не только на английском, но и на многих других языках.

Данный прорыв стал результатом исследований Google в области «трансформеров» — нейросетей новой архитектуры для работы с последовательностями, которые обрабатывают слова в их связи со всеми остальными словами в предложении, а не по порядку. Анализируя слова перед словом и после него, модели BERT способны определять его полный контекст, что особенно полезно для понимания интента, стоящего за поисковым запросом.

При этом некоторые из моделей BERT настолько сложны, что Google пришлось использовать новое аппаратное обеспечение. В частности, компания впервые начала использовать для предоставления результатов поиска новейшие облачные TPU.

Согласно Search Engine Roundtable, в конце прошлой недели зарубежные вебмастера начали замечать признаки обновления поискового алгоритма Google. Есть предположения, что эти колебания были связаны с запуском BERT Update.

Дмитрий Запорожец — руководитель SEO-отдела Profitator (Kokoc Group):

«Все поисковики с каждым годом всё дальше будут уходить от классических алгоритмов ранжирования в сторону машинного обучения. Надо сказать, что тут Яндекс сильно опередил Google и начал использовать нейросети для понимания смысла запроса и сопоставления его с текстом ещё в 2020 году с алгоритмом Палех и годом позже, введя алгоритм Королёв. Так что принципиально нового нас ничего не ждёт.

Из-за обновления алгоритма, скорее всего, станет меньше нерелевантных ответов, особенно по НЧ-запросам. По частотным же запросам, вероятно, ничего не поменяется.

Если вспомнить ввод Палеха Яндексом — тогда они говорили, что алгоритм не заменяет основную формулу, а дополняет её, ещё один параметр в ней. Так же и Google говорит, что BERT не заменит тот же RankBrain. Где-то будут применяться оба, где-то только один — тот, который даст тут лучший результат».

Google запустила крупнейшее обновление поисковика за пять лет

Google начала внедрять обновление алгоритма своего поисковика, которое в своем блоге называет крупнейшим как минимум за последние пять лет.

Financial Times отмечает, что это первый случай, когда на практике будет применена технология естественной обработки языка, привлекшая внимание ученых еще в прошлом году. Понимание языка — одна из самых больших сложностей для искусственного интеллекта из-за его изменчивости, пишет газета. Значение слов может меняться в зависимости от того, кто и в каком контексте использует те или иные слова.

До сих пор алгоритм поисковой системы Google пытался определить, какое из слов в пользовательском запросе имеет наибольшее значение. Короткие или часто встречающиеся слова он игнорировал. Это позволяло поисковику определить основную тему запроса, но часто мешало понять, чего конкретно хотел пользователь.

Новая технология, известная как BERT, полагается на языковую модель, созданную на основе анализа огромных объемов текста в сети. Вместо того чтобы анализировать слова в запросе одно за другим, BERT анализирует их одновременно, включая игнорировавшиеся раньше короткие слова. В качестве примера запроса, с которым поисковик теперь научился справляться, представители компании привели такой: «Сколько лет было Тэйлор Свифт, когда Канье прыгал на сцене?»

При этом компания сообщает, что изменения останутся незаметными для большинства пользователей. Обновление повлияет на один из десяти запросов, рассказал FT вице-президент по вопросам поиска Панду Найак. В последние дни Google уже начала обновлять программное обеспечение своих дата-центров, чтобы изменить процесс обработки запросов на английском, а в ближайшее время займется запросами и на других языках.

Найак также подчеркнул, что в некоторых случаях новый алгоритм находит информацию хуже, чем старый. Он подчеркнул, что работа над проектом будет постоянно продолжаться. «Я не думаю, что мы близки к решению проблемы языка, но это хороший шаг», — заявил газете глава отдела искусственного интеллекта Google Джефф Дин.

Добавить комментарий