11 янв. 2010 г.

Основные термины, используемые в SEO

SERP (англ. Search Engine Result Position) — положение заданного URL в выдаче результатов поиска поисковой системой.

Также так называют страницы выдачи результатов поисковиков (search engine result pages). Результат выдачи зависит от релевантности сайта запросу.

Ранжирование (англ. ranking) — применительно к работе поисковой системы — это процесс выстраивания найденных по запросу пользователя страниц в порядке наибольшего соответствия искомому запросу.

Ранжирование — процесс, при котором поисковая система:
  • принимает запрос пользователя;
  • находит все подходящие веб-страницы и
  • выстраивает их в определенном порядке по принципу наибольшего соответствия конкретному запросу.
Выведение рейтинга зависит от алгоритма ранжирования, которым пользуется поисковая машина.

Релева́нтность (англ. relevant) — применительно к результатам работы поисковой системы — степень соответствия запроса и найденного, то есть уместность результата. В более общем смысле, одно из наиболее близких понятию качества «релевантности» — «адекватность», то есть оценка степени соответствия, но и степени практической применимости результата, а также степени социальной применимости варианта решения задачи.

Релевантность поиска
Это субъективное понятие, поскольку результаты поиска, уместные для одного пользователя, могут быть неуместными для другого.

Индекс цитирования (тИЦ). Величина индекса определяется количеством ссылок на сайт из других источников. Однако для действительно точного определения значимости сайта важно не только количество ссылок на него, но и качество этих ссылок. Так, на сайт может ссылаться авторитетный академический ресурс, популярная портал или развлекательный сайт. Значимость у таких ссылок разная.

Тематический индекс цитирования (тИЦ) определяет «авторитетность» интернет-ресурсов с учетом качественной характеристики ссылок на них с других сайтов. Эта качественная характеристика называется «весом» ссылки. Рассчитывается она по специально разработанному алгоритму. Большую роль играет тематическая близость ресурса и ссылающихся на него сайтов. Само по себе количество ссылок на ресурс также влияет на значение его тИЦ, но тИЦ определяется не количеством ссылок, а суммой их весов.

тИЦ как средство определения авторитетности ресурсов призван обеспечить релевантность расположения ресурсов в рубриках каталога Яндекса. тИЦ не является чисто количественной характеристикой, поэтому мы показываем некоторые округленные значения, которые помогают ориентироваться в «значимости» («авторитетности») ресурсов в каждой области (теме).

СДЛ — сайты для людей.

Поисковая система состоит из следующих основных компонентов:
  • Spider (паук) — браузероподобная программа, которая скачивает веб-страницы. Spider скачивает веб-страницы тем же способом, что и браузер пользователя. Отличие состоит в том, что браузер отображает информацию, содержащуюся на странице (текстовую, графическую и т.д.), паук же не имеет никаких визуальных компонент и работает напрямую с html-текстом страницы (вы можете сделать «просмотр html-кода» в вашем браузере, чтобы увидеть «сырой» html-текст).
  • Crawler (краулер, «путешествующий» паук) — программа, которая автоматически проходит по всем ссылкам, найденным на странице. Crawler выделяет все ссылки, присутствующие на странице. Его задача — определить, куда дальше должен идти паук, основываясь на ссылках или исходя из заранее заданного списка адресов. Краулер, следуя по найденным ссылкам, осуществляет поиск новых документов, еще неизвестных поисковой системе.
  • Indexer (индексатор) — программа, которая анализирует веб-страницы, скаченные пауками.Индексатор разбирает страницу на составные части и анализирует их. Выделяются и анализируются различные элементы страницы, такие как текст, заголовки, структурные и стилевые особенности, специальные служебные html-теги и т.д.
  • Database (база данных) — хранилище скачанных и обработанных страниц. База данных — это хранилище всех данных, которые поисковая система скачивает и анализирует. Иногда базу данных называют индексом поисковой системы.
  • Search engine results engine (система выдачи результатов) — извлекает результаты поиска из базы данных. 
  • Web server (веб-сервер) — веб-сервер, который осуществляет взаимодействие между пользователем и остальными компонентами поисковой системы. Как правило, на сервере присутствует html-страница с полем ввода, в котором пользователь может задать интересующий его поисковый термин. Веб-сервер также отвечает за выдачу результатов пользователю в виде html-страницы. 
  • Search Engine Results Engine. Система выдачи результатов занимается ранжированием страниц. Она решает, какие страницы удовлетворяют запросу пользователя, и в каком порядке они должны быть отсортированы. Это происходит согласно алгоритмам ранжирования поисковой системы. Эта информация является наиболее ценной и интересной для нас – именно с этим компонентом поисковой системы взаимодействует оптимизатор, пытаясь улучшить позиции сайта в выдаче, поэтому в дальнейшем мы подробно рассмотрим все факторы, влияющие на ранжирование результатов.
Детальная реализация поисковых механизмов может отличаться друг от друга (например, связка Spider+Crawler+Indexer может быть выполнена в виде единой программы, которая скачивает известные веб-страницы, анализирует их и ищет по ссылкам новые ресурсы), однако всем поисковым системам присущи описанные общие черты.

Комментариев нет: