Компания «Яндекс» представила новую версию поиcка на основе алгоритма «Королёв», который с помощью нейросетей сопоставляет смысл запроса и страниц сайтов.
Новый алгоритм получил название в честь основоположника космонавтии Сергея Королёва. По словам представителей «Яндекса», такое название выбрано из-за технологической значимости внедрения нового алгоритма для поисковика компании.
Ключевые отличия нового алгоритма «Королёв» заключаются в том, что он оценивает всю страницу целиком, а не только заголовок, как раньше. Во-вторых, условный «поисковый документ» теперь состоит не только из пары запрос-страница, но и включает в себя информацию о предыдущих поисковых запросах, которые ранее привели пользователей на эту страницу. В-третьих, предыдущий алгоритм мог выдавать 150 документов по одному запросу, «Королёв» теперь выдает 200 тысяч.
Чтобы оценить совпадение по смыслу запроса и страницы требовалась большая обучающая выборка, которую специалисты «Яндекса» составили из обезличенных данных о поисковых запросах пользователей. Если пользователь после запроса и перехода на страницу из поиска проводил там какое-то время, а не закрывал ее сразу, то такая страница считалась подходящей по смыслу к запросу и пример попадал в обучающую выборку. В качестве негативных примеров для выборки использовались пары случайно сопоставленных текстов, отмечает научно-популярный портал N+1.
Благодаря такому подходу в обучении алгоритм научился понимать сложные запросы. Например, при запросе «ленивая кошка из монголии» поисковик понимает, что речь идет о мануле.