Вчера, то есть 10-ого апреля 2009 года в 20:47 по МСК Александр Садовский объявил в своем блоге о запуске нового алгоритма выдачи ПС Яндекс “Арзамас”, как ранее известный Анадырь. По его словам поиск будет более точный. Вот цитата с его блога: “Мы реализовали алгоритм снятия омонимии, позволяющий во многих случаях определить, какое слово имеется в виду, и предлагаем в ответ только документы с формами нужного слова. По запросу [фото африканских львов] пользователь получит в ответ документы со словами “лев”, “льва”, “льву”, но не получит документы, где встречаются лишь слова “Львова” или “Львову”
Как мы научили машину отличать, когда речь идет о животных, а когда — о городах? Алгоритм снятия омонимии основан на анализе данных запросов наших пользователей, учитывает частоту слов в Интернете и их сочетаемость, а также опирается на лексическую статистику слов из Национального корпуса русского языка — академического проекта, разрабатываемого при поддержке Яндекса. При анализе неоднозначного запроса мы выбираем наиболее частотную модель. Выбор в пользу наиболее вероятной конструкции помогает понять, что “день рыбака” — это не призыв, а праздник, а “платья придворных дам” — не обещание поделиться одеждой.

А любимый наш вопрос — тот, на который мы знаем целых два правильных ответа. Звучит он так: “Сколько голов у Павлюченко?” ”

Чтож, весь результат мы увидим при следующих АПах