Январь 2009
Пн Вт Ср Чт Пт Сб Вс
« Дек   Март »
 1234
567891011
12131415161718
19202122232425
262728293031  

«Сигналы» в алгоритмах ранжирования Яндекса +

13.01.2009 от Sonja

Об изменениях поисковых алгоритмов, о преимуществах этих изменений для пользователей Яндекс повествует на страницах блога-Поиска. В интервью на Хабре Илья Сегалович коротко описал, подвел итоги усовершенствований последних 2-х лет.
*Форматирование цитат мое*.

Теперь мы имеем дело с базой из десятков тысяч размеченных запросов, в ранжировании участвует около двух сотен сигналов, а правила 1) переформулировки, 2) расширения и 3) классификации запроса включают
тезаурус,
аббревиатуры,
транслитерацию,
перевод,
определение темы и иных аспектов запроса, и многое-многое другое.

Из того же интервью, интересное:

[...] в Яндексе есть
отдел компьютерной лингвистики,
есть группа извлечения фактов,
есть группа ранжирования, по сути «машинного обучения ранжированию» (machine-learned ranking). [...]

***

Автоматический выбор, что и когда начинать индексировать и включать в поиск — только один из таких решателей.

***

Основной поток сигнала от пользователей мы собираем уже давно: это и посещение страниц, и переформулировки запросов, и переходы с поиска, и многое другое.

Отойдя от поисковой темы отмечу, что интервью не только суммирует итоги Я.П, но и итоги поисковых и околопоисковых вех 2008, интервью очень насыщенное, как энциклопедия.

PS Как по вашему, какое может быть определение для «определения темы» (см. первую цитату) от Яндекса?

Google Bookmarks Digg Reddit del.icio.us Technorati Yahoo My Web News2.ru БобрДобр.ru RUmarkz

Рубрики: search-люди, Яндекс, инструментарий, исследования | Комментарии (2) »