Эту инструкцию раздавали всем желающим на Яндекс.Студне, который проходил 1 апреля. Инструкция, которую выдают настоящим асессорам, скорее всего устроена иначе, хотя по существу едва ли сильно отличается.
Никакого палева в этой бумажке нет. Более того, основные тезисы оглашались Садовским почти дословно еще на ашмановской конференции 2007 года (презентация.ppt, см. слайд 5). Там же, кстати, есть и асессорская панелька.
1. Предварительная оценка
Шкала предварительной оценки состоит из оценок "404", "Вирус", ..., "Порноконтент", "Порнореклама", "Порноконтент+реклама"
Это технические опции, которые непосредственно не относятся к релевантности. Если документ с виду не содержит порноконтент, ставим оценку "не порно" и т.д.
После того, как предварительная оценка поставлена, открывается основная шкала.
2. Оценка по шкале релевантности
Шкала релевантности содержит семь оценок: "Витальны", "Полезный", "Релевантный+", "Релевантный-", "Нерелевантный", "Спам", "Не про то".
2.1. Витальный сайт - официальный сайт предприятия, товара, услуги, сервиса или человека. Также витальные страницы есть у законов, официальных документов (в том числе инструкций) и художественных произведений. Далеко не каждый запрос предполагает существование витального сайта, но по некоторым запросам их может быть два и больше. Одним словом, главный критерий витального сайта - официальный ответ на запрос.
2.2. Полезный ресурс не только отвечает на запрос, но кроме этого дает пользователю дополнительную информацию по его запросу. Также оценку "Полезный" заслуживают тематические сайты, с большим количеством информации по интересующей теме, а еще поддомены витального сайта, сайты филиалов искомой фирмы или факультетов искомого вуза.
2.3. Релевантный+ - документ отвечает на запрос пользователя.
2.4. Релевантный- документ соответствует теме запроса, но на сам запрос не отвечает. Например, для запроса "карта-схема города Твери" релевантным- будет либо карта не того типа (топографическая или др.), либо карта одного района Твери вместо всего города, либо карта в слишком мелком масштабе.
2.5. Нерелевантный документ не отвечает запросу.
2.6. Спам - это вредоносные сайты и страницы. Обман пользователя, бессмыслица и мусор.
2.7. Не про то - это оценка для документов, которые содержат слова запроса, но смысл запроса в них искажен. Это может происходить из-за омонимии, разрыва словосочетания, пропуска важного слова, поиска других форм слова. Когда по запросу "Лев Толстой" находят Татьяну Толстую или вообще материалы про полных людей - это "не про то".
http://dubrowsky.ya.ru/replies.xml?item_no=4226&ncrnd=7015
7 апр. 2010 г.
Подписаться на:
Комментарии к сообщению (Atom)
Комментариев нет:
Отправить комментарий