Поисковые системы сети интернет виды и названия. Краткий обзор основных поисковых систем Интернета

Подписаться
Вступай в сообщество «sinkovskoe.ru»!
ВКонтакте:

Здравствуйте, дорогие читатели! С вами Екатерина Калмыкова. Сегодняшняя статья будет посвящена такому понятию, как поисковая система, что это такое, для чего она нужна. Также мы подробно рассмотрим разновидности поисковых систем в интернете.

Если у вас возник вопрос: «Зачем мне знать про эти поисковые системы?», то я отвечу так. Когда вы едите вкусный суп в ресторане, хотелось бы вам знать, из каких ингредиентов он приготовлен, чтобы повторить его самостоятельно дома? Ведь если вас устраивает конечный результат, то есть вкус супа, то наверняка вам интересно было бы узнать, что привело к такому результату?

И для компаний, как вы можете прочитать на следующих страницах, последствия могут быть гораздо более серьезными. Его рассуждения были простыми: при поиске имени первые результаты пошли именно на эти объявления, но информация, о которой идет речь, стала неактуальной, поскольку принудительное исполнение закончилось много лет назад. Вышеупомянутая история ознаменовала начало одного из самых противоречивых процессов в короткой истории Интернета. Суд Европейского союза дал вердикт; когда он был дан, он удивил всех.

Суд постановил, что компания, работающая в поисковой системе Интернета, отвечает за обработку отображаемых ею данных, даже если они опубликованы третьей стороной. Лицо может потребовать удаления гиперссылок из индекса поисковой системы. Иными словами, решение Суда означает, что лицо может попросить, чтобы определенная информация больше не появлялась при обыске. На первый взгляд, поскольку решение не ссылалось на страницы, на которых размещена информация, но только на поисковую систему, которая в конце концов является своего рода посредником, все не так важно; анализируя что-то более глубокое, Гонсалес против Аргумент в этом направлении настолько прост, насколько это может быть: подавляющее большинство пользователей Интернета проверяют информацию о поисковых системах.

Также можно сказать и про работу с поисковой системой (ПС). Если вы в будущем создадите свой блог, то зная работу ПС вам не придется обращаться за помощью к специалистам. Вы сможете самостоятельно вести таким образом свой проект, чтобы поисковая система его видела и показывала другим пользователям. Ведь именно от этого будет зависеть посещаемость вашего ресурса и соответственно заработок.

Тем не менее, Суд выделил информацию, касающуюся обычных граждан, и данные, относящиеся к общественным деятелям, которые считаются общественными интересами. Удаление ссылок из списка результатов может в зависимости от рассматриваемой информации иметь последствия для законных интересов потенциально заинтересованных интернет-пользователей для доступа к этой информации, - говорится в заявлении суда. Суд отмечает, что, хотя права субъекта данных превалируют, следует также учитывать заинтересованность общественности в предоставлении этой информации, «которая может различаться, в частности, в зависимости от роли, которую играет лицо в общественной жизни».

Итак, приступим.

Что такое поисковая система?

Поисковая система — это специальный ресурс в Интернете, который выдает информацию пользователю в соответствии с его запросом. То есть этот ресурс собирает все данные в глобальной сети, все веб-проекты и при поступлении от пользователя определенного запроса выдает необходимую искомую информацию путем направления его, например, на тематический блог или сайт.

Вывод: Гонсалес против Последние утверждают, что людей нужно «забыть», а это значит, что они имеют право удалить свои цифровые следы из Интернета. Таким образом, право забыть - это один из вариантов, который есть у человека, когда он хочет, чтобы определенная информация «исчезла» из Интернета. Насколько эффективен этот вариант?

Будьте в курсе последних бизнес-анализов. Как можно развивать бизнес, если один из самых популярных рекламных методов воспринимается не в Интернете? Или это знание основано не на соответствующей информации, а на слухах и дезинформации? Пора понять, что ваша веб-страница - это не просто виртуальная вещь. Это один из наиболее эффективных рекламных каналов наряду с телевидением, печатью, наружной рекламой, радио и бизнес-подарками. Он эффективен как по цене, так и по простоте обслуживания, а также досягаемости целевой аудитории целевой аудитории.

Таким образом, после создания своего проекта ваша задача будет попасть в выдачу, то есть в «список» или базу поисковой системы. Поскольку продвижение сайта в интернете просто не возможно без использования какой-либо поисковой системы, поэтому вам необходимо будет позаботиться о качестве своего ресурса, о внутренней и внешней его оптимизации. Как это сделать мы поговорим в следующих статьях. Так что , чтобы не пропустить.

Интернет-реклама отличается. Это визуальная, текстовая и интерактивная реклама, целью которой является привлечение посетителей на страницу, а иногда и прямые продажи определенных товаров или услуг. Напрямую ориентированных посетителей на оптимизированные страницы на сайте, содержащие продукты или услуги, которые они хотят продать.

Те, кто уже сталкивался с онлайн-рекламой, четко осознают - если мы покупаем рекламу на определенном хорошо посещаемом портале, он покажет либо согласованное время, либо определенное количество обращений, либо определенное количество кликов. Когда срок действия объявления истечет, он больше не будет отображаться, и новых посетителей больше не будет.

А пока, если вы решили создать свой блог, то рекомендую прочитать вот эти статьи:

Поскольку новые веб-ресурсы появляются практически каждый день, то соответственно и база поисковых систем должна постоянно обновляться. Каждый вновь созданный сайт должен проиндексироваться роботом. Говоря простыми словами, помощники ПС – роботы должны познакомиться с новым ресурсом и передать эти данные самой поисковой системе.

Вложив несколько тысяч литов через пару месяцев, вы сможете наслаждаться следующими 12 месяцами, а иногда и дольше. Таким образом, веб-страница будет выполнять свою реальную работу - сама генерировать продажи. Тем не менее, основные принципы остались прежними.

Удалите все, что останавливает ваш сайт!

Например, функции ключевых слов изменились, теперь не стоит отмечать определенные ключевые слова, чтобы ранжировать ваши поисковые системы, но ключевые слова по-прежнему необходимы. И вы можете использовать этот список, когда вам это нужно. Как только скорость сайта была не столь важна. Мы даже можем вспомнить, когда нам пришлось ждать почти 5 минут, прежде чем один сайт полностью заполнился.

Ну, тут вы, наверное, догадались, что при посещения вашего блога роботом ему все должно понравиться. От этого гостя и будет зависеть ваша дальнейшая судьба.

Как сделать, чтобы робот от вашего проекта остался в полном восторге я расскажу в одной из следующих статей. Не пропустите, будет интересная и весьма любопытная информация, которой я с вами поделюсь.

Это не приятный опыт, и на текущем рынке это всего лишь смертный приговор для вашего сайта. Медленная работа сайта может отпугнуть ваших покупателей от покупки продукта или услуги. В глазах потенциальных покупателей сайт с медленным ходом в равной степени ненадежен для веб-сайта.

Самостоятельно поощрять надежные страницы для ссылок на ваши ссылки

По мнению некоторых экспертов, почти 40% пользователей покидают сайт, если его зарядка занимает более 3 секунд. Вероятно, это очень ясно, это показывает, насколько важен веб-сайт. Кроме того, при копировании мета-описаний вы можете столкнуться с проблемами. Даже если вы не загружаете, вы все равно не будете предлагать пользователям ничего нового.

Работа поисковых систем

Вся работа, связанная с ПС, начинается с ввода искомого запроса в поисковой строке. Что могут искать пользователи? Да что угодно, начиная от рецепта пирожков с капустой и заканчивая извечным вопросом «как заработать денег побольше ничего не делая».

Чтобы именно ваш ресурс выходил в качестве ответа на вопрос, необходимо опережать своих конкурентов. Для этого и нужно обратить особое внимание на продвижение своего проекта, куда входят такие мероприятия как написание качественного оптимизированного контента, то есть отвечающего на запросы статьи, улучшение поведенческого фактора, то есть чтобы вашему читателю было интересно находится на ресурсе, это улучшение юзабилити, то есть удобство посетителя и многие другие факторы. Это мы все научимся с вами делать.

# Ускорить с помощью социальных сетей

Вы не можете использовать одну и ту же страницу описания метаданных как тему электронной коммерции и страницу, на которой она написана. Существует большая разница между этими двумя темами, и ваше описание должно быть создано в свете этого факта. Да, социальные сигналы очень важны, и вы должны попытаться улучшить свои собственные.

Для изображений используйте правильные ключевые слова

Несколько исследований в этой области доказали, что различные хиты, такие как «как» клики или «твиты» в социальных сетях, оказывают огромное влияние на положение ключевых слов в поисковых системах. Создавайте полезный контент и обменивайтесь только полезным контентом; Добавьте разделенные кнопки в свои сообщения и сделайте их видимыми; Поощряйте людей делиться своими сообщениями; Отозвать конкурсы, чтобы узнать больше дивизий; Марк затронул людей и сообщил им об этом. Изображения очень важны для оптимизации поисковой оптимизации.

Компоненты поисковых систем

А что же помогает поисковикам, например, тому же Гугл индексировать ваш ресурс?

  1. Агенты — это работники, выполняющий основную часть работу — индексируют и анализируют сайты.
  2. Пауки (spider) – программа, которая может скачивать страницы веб-ресурса и собирать общую информацию о нем.
  3. Кроулеры (crawler) – программа, отыскивающая все ссылки на страницах, переходя по которым разыскивает новые данные не знакомые поисковикам.
  4. Индексатор (indexer) – анализирует текст, заголовки, стиль и др.
  5. Роботы - индексируют страницы вашего контента, а также изучают разнообразные ссылки.

Для того чтобы индексация происходила так, как нужно вам вы и создаете специальный документ «robots.txt». Он позволяет системе проверять только те страницы, которые вам нужно, и убирать то, что видеть не следует.

Когда пользователь ищет конкретный образ, как он это делает? Вот почему вам нужно выбрать правильные ключевые слова и описания для ваших фотографий. Конечно, это не дает вам право злоупотреблять ключевыми словами. Другими словами, если ваша фотография - «голубая шляпа», не вводите ее «нажмите здесь, чтобы купить шляпу».

Согласно Институту Маркетинга Контента, создание уникального и привлекательного контента для многих специалистов по маркетингу является самой сложной частью. Это касается и самих себя. Это даже более важно, чем вы думаете! Некоторые даже называют это свежестью. Потому что уникальный контент является одним из самых важных, когда речь идет о свежести, новизне и непрерывном ранжировании в поисковых системах.

Виды поисковых систем

Существуют несколько вариантов информационно — поисковых систем:

  • Каталоги. Простое сравнение поиска – это книжная полка в библиотеке. Там все хранится в подкатегориях и категориях определенной тематики. Если вы попали в такой поисковик, то поверьте, информация, которую вы там найдете, будет более чем полезна и понятна для вашего восприятия. Догадались о каком распространенном сайте идет речь? Конечно же о википедии, которая собрала в себе целый справочник полезной информации.
  • Поисковые указатели. Поиск в данных осуществляется за счет ключевых фраз. Это и удобно и неудобно одновременно. Думаю, меня поймут те люди, которые ищут, например, «Девушка показывает класс», чтобы найти как девушка показывает большой палец вверх, а в поиске вылезает что-то не очень приличное. 🙂 Такой вид поиска характеризирует большую часть поисковых систем.
  • Рейтинговые системы. Определяют вашу популярность за счет количества посещений. Конечно, не самый лучший критерий, так как не всегда учитывается полезность и качественность самого ресурса. Пример такой системы – это интернет ресурс alexa.com.

Поисковые сервера подразделяются также на общие и специализированные . Общие поисковики сортируют информационные данные без всякого отбора по всем известным им веб-ресурсам. К ним относятся Яндекс, Рамблер, Гугл. Специализированные — осуществляют сортировку по используемому языку.

Если вы не Брайан Дин, который овладел искусством управления контентом и постоянно привлекал десятки тысяч читателей, которые едва публикуют новое сообщение, то самым простым способом оптимизации новизны сайта является постоянное создание уникального контента.

Поэтому не изменяйте свое доменное имя. Выберите его и используйте, если у вас нет веских оснований для его изменения. Такие случаи происходят, просто убедитесь, что вращение имен не становится обычным делом. Таким образом, вы сохраните свои обратные ссылки, социальные сети и другие детали вашего сообщения, которые уже были на месте.

Также поисковые системы могут делиться на региональное и мировое распространение .

На сегодняшний день все поисковики постоянно совершенствуют свои алгоритмы по отбору качественных, релевантных ресурсов.

Немного истории

В Рунете ПС появились в 1996 года – это Апорт и Рамблер. Годом позже в 1997 году образовался Яндекс, а еще годом позже в 1998 году появился еще один конкурент – Google. В настоящий момент наиболее популярные – это Яндекс и Google.

В конце концов, сконцентрируйтесь и научитесь строить содержание долгосрочной ценности. Когда вы делитесь ссылками, подумайте о качестве, а не о количестве. И не забудьте настроить свою страницу для мобильных устройств. Этот пост основан на опыте гуру онлайн-маркетинга Нейла Пателя и других ведущих экспертов в этой области.

Оптимизация сайта

Поделитесь им с другими социальными сетями! Очевидно, что результат позиции веб-страницы среди результатов поисковой системы зависит от ее популярности, видимости, потока клиентов и, конечно же, прибыли компании. В этом разделе анализируются ключевые слова, ориентированные на наиболее целенаправленные фразы, соответствующие теме определенной веб-страницы. Данные, полученные при анализе ключевых слов, приводят к использованию метатегирования для страниц.

Какие же поисковики сейчас наиболее популярны?

Приведем статистику:


Как вы видите, сейчас в России наибольшей популярностью пользуется Яндекс, наряду с Гугл и Мэйл.

Таким образом, вы можете увидеть топ поисков, на которые вам следует ориентироваться при создании и продвижении своего проекта.

Оптимизация структуры внутренних ссылок

Очень важно обратить внимание на порядок компоновки внутренних ссылок на сайте - они должны быть упорядочены в иерархическом порядке, потому что только тогда ссылки ценны.

Оптимизация контента сайта

Он оценивает качество контента сайта и, при необходимости, делает некоторые улучшения, дополнения и т.д.

В конце концов, аккуратный веб-сайт не роскошь, а необходимость. Наибольшее влияние оказывают результаты процесса ранжирования веб-сайта, что дает веб-страницам особый характер. Таким образом, они становятся более популярными и популярными. Кроме того, не следует забывать, что удобство использования и скорость веб-сайта очень важны. Вам нужно иметь хороший просмотр для посетителей вашего сайта, и это невозможно, если веб-сайт не открывается, не спешит или не испортит его структуру в течение длительного времени.

Поисковая система Яндекс (Yandex)

Принцип работы следующий: в поисковую строку вводите искомый запрос, нажимаете «Найти» и смотрите выдачу. Яндекс подобрал вам 13 млн. ответов на ваш запрос. Искать можно также в картинках, видео, маркете (смотрим левую колонку).


Если посетители сталкиваются с подобными проблемами, есть очень небольшой шанс, что они вернутся сюда. Если вы не обновите свой сайт. Однако, как бы неудачно, первое впечатление самое главное, поэтому большинство людей не могут дать второй шанс. Поэтому вы должны произвести хорошее впечатление с первого раза.

Оптимизация поисковой системы сайта

Поэтому важно сначала организовать внутреннюю структуру веб-сайта, правильно представить текстовую информацию, выбрать соответствующие иллюстрации и т.д. Одним из ключевых действий является качество обратных ссылок. Однако для их создания у вас должно быть достаточно людей для публикации опубликованного контента. Помните, что качество обратных ссылок не имеет значения. Лучше иметь несколько качественных взаимных ссылок, чем дюжину с половиной достойных.

Дополнительно вы можете настроить регион для поиска. Для этого необходимо в строке поиска нажать на значок рядом с крестиком и в окне фильтра выбрать нужный регион.


Поисковая система Гугл (Google)

Гугл работает по аналогии с Яндекс. Искать информацию можно в разных разделах: картинки, видео, новости, карты и т.д.

Еще один отличный способ повысить наглядность веб-сайта и в то же время привлечь новых клиентов - это сигналы социальных сетей. Кроме того, социальные сети - отличный способ вернуть ссылки с высококачественных сайтов. В конце концов, общественные лидеры, лидеры различных сфер деятельности особенно активны в социальных сетях. Используя социальные сети, вы повышаете вероятность того, что эти руководители будут замечены и оценены ими, получить их комментарии, мнения и, самое главное, ссылки со своих веб-страниц.

Обратные ссылки для ссылок на сайты

Именно эти ссылки считаются высококачественными ссылками, которые чрезвычайно трудно получить без существования социальных сетей. Необходимо напомнить вам, что вы будете тщательно выбирать, какие веб-страницы, учетные записи социальных сетей содержат ссылки на вашу веб-страницу.


Если вы нажмете на «Инструменты поиска», то откроется панель с настройками, где вы можете выбрать регион, язык и за какое время осуществить поиск информации.

Теперь вы знаете, какие системы поиска существуют в интернете, также вы увидели самые популярные из них, и теперь, вооруженные информацией вы можете налаживать свои связи и взаимодействие с поисковиками.

На сегодня все. Как Вам статья?

Всем пока.

Советую на обновление блога, чтобы не пропустить выход свежих новостей.

Екатерина Калмыкова

Рассмотрим подробнее понятие поискового запроса на примере поисковой системы «Яндекс». Поисковый запрос должен быть сформулирован пользователем в соответствии с тем, что он хочет найти, максимально кратко и просто. Допустим, мы хотим найти информацию в «Яндексе» о том, как выбрать автомобиль. Для этого, открываем главную страницу «Яндекса», и вводим текст поискового запроса «как выбрать автомобиль». Далее, наша задача сводится к тому, чтобы открыть предоставленные по нашему запросу ссылки на источники информации в Интернет. Однако, вполне можно и не найти нужную нам информацию. Если таковое произошло, то либо нужно перефразировать свой запрос, либо в базе поисковой системе действительно нет никакой актуальной информации по нашему запросу (такое может быть при задании очень «узких» запросов, как, например «как выбрать автомобиль в Архангельске»)

Первоочередная задача любой поисковой системы – доставлять людям именно ту информацию, которую они ищут. А научить пользователей делать «правильные» запросы к системе, т.е. запросы, соответствующие принципам работы поисковых систем, невозможно. Поэтому разработчики создают такие алгоритмы и принципы работы поисковых систем, которые бы позволяли находить пользователям искомую ими информацию.

Это означает, поисковая система должна «думать» так же, как думает пользователь при поиске информации. Когда пользователь обращается с запросом к поисковой машине, он хочет найти то, что ему нужно, максимально быстро и просто. Получая результат, он оценивает работу системы, руководствуясь несколькими основными параметрами. Нашел ли он то, что искал? Если не нашел, то сколько раз ему пришлось перефразировать запрос, чтобы найти искомое? Насколько актуальную информацию он смог найти? Насколько быстро обрабатывала запрос поисковая машина? Насколько удобно были представлены результаты поиска? Был ли искомый результат первым или же сотым? Как много ненужного мусора было найдено наравне с полезной информацией? Найдется ли нужная информация, при обращении к поисковой системе, скажем, через неделю, или через месяц?

Для того, чтобы удовлетворить ответами все эти вопросы, разработчики поисковых машин постоянно совершенствуют алгоритмы и принципы поиска, добавляют новые функции и возможности, всячески пытаются ускорить работу системы.

3. Основные характеристики поисковой системы

Опишем основные характеристики поисковых систем:

  • Полнота

    Полнота - одна из основных характеристик поисковой системы, представляющая собой отношение количества найденных по запросу документов к общему числу документов в сети Интернет, удовлетворяющих данному запросу. К примеру, если в Интернете имеется 100 страниц, содержащих словосочетание «как выбрать автомобиль», а по соответствующему запросу было найдено всего 60 из них, то полнота поиска будет 0,6. Очевидно, что чем полнее поиск, тем меньше вероятность того, что пользователь не найдет нужный ему документ, при условии, что он вообще существует в Интернете.

  • Точность

    Точность - еще одна основная характеристика поисковой машины, которая определяется степенью соответствия найденных документов запросу пользователя. Например, если по запросу «как выбрать автомобиль» находится 100 документов, в 50 из них содержится словосочетание «как выбрать автомобиль», а в остальных просто наличествуют эти слова («как правильно выбрать магнитолу и установить в автомобиль»), то точность поиска считается равной 50/100 (=0,5). Чем точнее поиск, тем быстрее пользователь найдет нужные ему документы, тем меньше различного рода «мусора» среди них будет встречаться, тем реже найденные документы не будут соответствовать запросу.

  • Актуальность

    Актуальность - не менее важная составляющая поиска, которая характеризуется временем, проходящим с момента публикации документов в сети Интернет, до занесения их в индексную базу поисковой системы. Например, на следующий день после появления интересной новости, большое количество пользователей обратились к поисковым системам с соответствующими запросами. Объективно с момента публикации новостной информации на эту тему прошло меньше суток, однако основные документы уже были проиндексированы и доступны для поиска, благодаря существованию у крупных поисковых систем так называемой «быстрой базы», которая обновляется несколько раз в день.

  • Скорость поиска

    Скорость поиска тесно связана с его устойчивостью к нагрузкам. Например, по данным ООО «Рамблер Интернет Холдинг», на сегодняшний день в рабочие часы к поисковой машине Рамблер приходит около 60 запросов в секунду. Такая загруженность требует сокращения времени обработки отдельного запроса. Здесь интересы пользователя и поисковой системы совпадают: посетитель желает получить результаты как можно быстрее, а поисковая машина должна отрабатывать запрос максимально оперативно, чтобы не тормозить вычисление следующих запросов.

  • Наглядность

4. Краткая история развития поисковых систем

В начальный период развития Интернет, число его пользователей было невелико, а объем доступной информации сравнительно небольшим. В большинстве своем, доступ к сети Интернет имели лишь сотрудники научно-исследовательской сферы. В это время задача поиска информации в Интернете не была столь актуальной, как в настоящее время.

Одним из первых способов организации доступа к информационным ресурсам сети стало создание открытых каталогов сайтов, ссылки на ресурсы в которых группировались согласно тематике. Первым таким проектом стал сайт Yahoo.com, открывшийся весной 1994 года. После того, как количество сайтов в каталоге значительно увеличилось, была добавлена возможность поиска нужной информации по каталогу. В полном смысле это еще не было поисковой системой, так как поисковая область была ограничена только ресурсами, присутствующими в каталоге, а не всеми Интернет ресурсами.

Каталоги ссылок широко использовались ранее, однако практически полностью утратили свою популярность в настоящее время. Так как даже современные, огромные по своему объему каталоги, содержат информацию лишь о ничтожно малой части сети Интернет. Самый большой каталог сети DMOZ (его еще называют Open Directory Project) содержит информацию о 5 миллионах ресурсов, тогда как база поисковой системы Google состоит из более чем 8 миллиардов документов.

В 1995 году появились поисковые системы Lycos и AltaVista. Последняя долгие годы была лидером в области поиска информации в сети Интернет.

В 1997 году Сергей Брин и Ларри Пейдж создали поисковую машину Google в рамках исследовательского проекта в Стэндфордском университете. В настоящий момент Google - самая популярная поисковая система в мире!

В сентябре 1997 года была официально анонсирована поисковая система Yandex, являющаяся самой популярной в русскоязычном Интернете.

В настоящее время существуют три основные поисковые системы (международные) – Google, Yahoo и , имеющие собственные базы и алгоритмы поиска. Большинство остальных поисковых систем (коих насчитывается большое количество) использует в том или ином виде результаты трех перечисленных. Например, поиск AOL (search.aol.com) использует базу Google, а AltaVista, Lycos и AllTheWeb – базу Yahoo.

5. Состав и принципы работы поисковой системы

В России основной поисковой системой является «Яндекс», далее - Rambler.ru, Google.ru, Aport.ru, Mail.ru. Причем, на данный момент, Mail.ru использует механизм и базу поиска «Яндекса».

Практически все крупные поисковые системы имеют свою собственную структуру, отличную от других. Однако можно выделить общие для всех поисковых машин основные компоненты. Различия в структуре могут быть лишь в виде реализации механизмов взаимодействия этих компонентов.

Модуль индексирования

Модуль индексирования состоит из трех вспомогательных программ (роботов):

Spider (паук) – программа, предназначенная для скачивания веб-страниц. «Паук» обеспечивает скачивание страницы и извлекает все внутренние ссылки с этой страницы. Скачивается html-код каждой страницы. Для скачивания страниц роботы используют протоколы HTTP. Работает «паук» следующим образом. Робот на сервер передает запрос “get/path/document” и некоторые другие команды HTTP-запроса. В ответ робот получает текстовый поток, содержащий служебную информацию и непосредственно сам документ.

  • URL страницы
  • дата, когда страница была скачана
  • http-заголовок ответа сервера
  • тело страницы (html-код)

Crawler («путешествующий» паук) – программа, которая автоматически проходит по всем ссылкам, найденным на странице. Выделяет все ссылки, присутствующие на странице. Его задача - определить, куда дальше должен идти паук, основываясь на ссылках или исходя из заранее заданного списка адресов. Crawler, следуя по найденным ссылкам, осуществляет поиск новых документов, еще неизвестных поисковой системе.

Indexer (робот- индексатор) - программа, которая анализирует веб-страницы, скаченные пауками. Индексатор разбирает страницу на составные части и анализирует их, применяя собственные лексические и морфологические алгоритмы. Анализу подвергаются различные элементы страницы, такие как текст, заголовки, ссылки структурные и стилевые особенности, специальные служебные html-теги и т.д.

Таким образом, модуль индексирования позволяет обходить по ссылкам заданное множество ресурсов, скачивать встречающиеся страницы, извлекать ссылки на новые страницы из получаемых документов и производить полный анализ этих документов.

База данных

База данных, или индекс поисковой системы - это система хранения данных, информационный массив, в котором хранятся специальным образом преобразованные параметры всех скачанных и обработанных модулем индексирования документов.

Поисковый сервер

Поисковый сервер является важнейшим элементом всей системы, так как от алгоритмов, которые лежат в основе ее функционирования, напрямую зависит качество и скорость поиска.

Поисковый сервер работает следующим образом:

  • Полученный от пользователя запрос подвергается морфологическому анализу. Генерируется информационное окружение каждого документа, содержащегося в базе (которое и будет впоследствии отображено в виде , то есть соответствующей запросу текстовой информации на странице выдачи результатов поиска).
  • Полученные данные передаются в качестве входных параметров специальному модулю ранжирования. Происходит обработка данных по всем документам, в результате чего, для каждого документа рассчитывается собственный рейтинг, характеризующий релевантность запроса, введенного пользователем, и различных составляющих этого документа, хранящихся в индексе поисковой системы.
  • В зависимости от выбора пользователя этот рейтинг может быть скорректирован дополнительными условиями (например, так называемый «расширенный поиск»).
  • Далее генерируется сниппет, то есть, для каждого найденного документа из таблицы документов извлекаются заголовок, краткая аннотация, наиболее соответствующая запросу и ссылка на сам документ, причем найденные слова подсвечиваются.
  • Полученные результаты поиска передаются пользователю в виде SERP (Search Engine Result Page) – страницы выдачи поисковых результатов.

Как видно, все эти компоненты тесно связаны друг с другом и работают во взаимодействии, образовывая четкий, достаточно сложный механизм работы поисковой системы, требующий огромных затрат ресурсов.

6. Заключение

Теперь подытожим все вышесказанное.

  • Первоочередная задача любой поисковой системы – доставлять людям именно ту информацию, которую они ищут.
  • Основные характеристики поисковых систем:
    1. Полнота
    2. Точность
    3. Актуальность
    4. Скорость поиска
    5. Наглядность
  • Первой полноценной поисковой системой стал проект WebCrawler, вышедший в свет в 1994 году.
  • В состав поисковой системы входят компоненты:
    1. Модуль индексирования
    2. База данных
    3. Поисковый сервер

Надеемся, наш мастер-класс позволит Вам поближе ознакомиться с понятием ПС, лучше узнать основные функции, характеристики и принцип работы поисковых систем.


По материалам сайта: http://www.seonews.ru/

Справочники и поисковые системы глобального масштаба

Все перечисленные системы предназначены для поиска информации в Интернет в целом, без относительно к какому либо региону мира. При необходимости выявления исчерпывающей информации рекомендуется провести последовательный поиск с использованием нескольких поисковых машин или справочников.


About

Справочник, поддерживаемый экспертами различных областей знания. Основная задача - отразить не все, а лишь наиболее ценные ресурсы. Описания сайтов составлены очень квалифицированно. Удобен при необходимости отбора самых качественных ресурсов по конкретной тематике. Основной недостаток - медленное обновление материала.


AlltheWeb

Изначально - поисковая система, расположенная в Европе и ориентированная преимущественно на европейские сайты. С марта 2004 года под брэндом AlltheWeb была размещена и запущена поисковая система Yahoo! и в настоящее время AlltheWeb представляет собой фактическое “зеркало” поисковой системы Yahoo! Serach, с той лишь разницей, что в его модуле выдачи результатов гораздо лучше решены проблемы вывода документов на разных языках, использующих кодировки, отличные от расширенной латиницы. В число 36 языков, с которыми система работает вполне корректно, попал и русский.


Alta Vista

В прошлом одна из наиболее популярных поисковых систем мира. С марта 2004 года под брэндом Alta Vista была размещена и запущена поисковая система Yahoo! и в настоящее время Alta Vista представляет собой фактическое “зеркало” поисковой системы Yahoo! Serach.


Excite

Поисковая система, объем базы данных которой насчитывает более 250 миллионов документов. Имеет развернутую подсистему поиска мультимедийных источников.


Google

Мировой лидер поискового сервиса. Поисковая система последнего поколения, декларирующая самый большой объем базы данных - более 8 миллиардов документов. Обеспечивает интерфейс на языке пользователя, а также возможность разыскания иллюстраций. Google был первой поисковой машиной, начавшей индексацию документов в форматах PDF, PS, DOC, XLS, PPT, RTF, WP5.


HotBot

Поисковая система, объем индекса базы данных которой не превышает 500 миллионов документов. Имеет возможность поиска иллюстраций, аудио и видео файлов. Не допускает выявление документов на русском языке.


LookSmart

Справочник ресурсов, ориентированный на интересы среднестатистического пользователя Интернет.


Lycos

Проект пережил несколько кардинальных преобразований. В 1996 году был начат как поисковая система, в 1999 году Lycos преобразован в справочник ресурсов, но с июля 2002 года, с введением в эксплуатацию поискового механизма Search Lycos 6.0, вновь используется в основном как поисковая система. Допускает поиск иллюстраций, аудио и видеофайлов. Декларируя наибольший объем индексного файла, тем не менее, не указывает его точный объем. С русскоязычными ресурсами работает плохо.


MSN Search

Поисковая система, созданная компанией Microsoft. С февраля 2005 года окончательно перешла на использование собственного поискового модуля. Декларируется учет более 5 миллиардов документов. Система обладает возможностью поиска на новостных сайтах, поиском иллюстраций, поиска в принадлежащей Microsoft энциклопедии Encarta, а также модулем, который, после бесплатной выгрузки и установки, производит поиск на собственном компьютере пользователя.


Open Directory

Справочник ресурсов Интернет, являющийся на сегодня одним из наиболее полных в мире: отражено порядка 4 миллионов ресурсов. Является некоммерческим проектом, формируясь силами Интернет-сообщества. По этой причине множество разделов Open Directory выполнены полностью на национальных языках, включая русский.


Teoma

Поисковая система, открытая для использования в начале третьего тысячелетия. Единственным достоинством является внушительный объем индексного файла. Не способна осуществлять поиск документов на русском языке.

Webtop

Поисковая система, декларирующая объем базы данных более 500 миллионов документов. В настоящее время располагает примитивным механизмом составления запроса. Не обладает возможностью поиска документов на русском языке.


WiseNut

Поисковая система последнего поколения. Главное достоинство - большое число проиндексированных документов. Не способна осуществлять поиск материалов на русском языке.

Yahoo! Directory

Один из наиболее авторитетных и полных справочников ресурсов Интернет. Имеет внушительный объем (порядка 2 миллионов учтенных ресурсов) и хорошо разветвленную иерархическую структуру. Удобен при разыскании перечней зарубежных, прежде всего англоязычных, сайтов по заданной тематике. Поскольку за отражение ресурса взимается ежегодная плата, многие ценные ресурсы были исключены из Yahoo! Directory и справочник в настоящее время не может претендовать на исчерпывающую полноту.

Поисковая система Yahoo!, выделившаяся в отдельный сервис после преобразования портала в 2004 году. По результатам тестов, включает порядка 4 миллиардов документов. Имеет хорошие возможности поиска иллюстраций и видеофайлов. Допускает поиск на русском языке.

Метапоисковые системы

Метапоисковые системы являются разновидностью поисковых инструментов, не имеющих собственных поисковых роботов и баз данных (индексных файлов). Их главное достоинство заключается в умении рассылать запрос сразу в несколько "реальных" поисковых систем и затем суммировать результаты. Пользование ими рекомендуется в случае разыскания сведений предположительно об очень редком объекте или при крайнем недостатке времени, поскольку метапоисковые средства очень часто не в состоянии корректно обработать запрос для различных поисковых систем, а также правильно совместить результаты, полученные разными системами.

Dogpile

Обращается к различным поисковым средствам последовательно, а не одновременно. Обеспечивает выявление данных в конференциях UseNet и на FTP-серверах, а также поиск иллюстраций, аудио- и видеофайлов.

Ez2find.com

Система обеспечивает релевантный поиск на русском языке. Имеет неплохие возможности для формирования запроса. Поиск производится в Google, AllTheWeb, Altavista, Yahoo, Open Directory. Результаты сортируются по разделам.

Ixquick Metasearch

Система по умолчанию обращается к 14 ведущим поисковым средствам, за исключением Google. В запросе используется традиционный синтаксис, в точности соответствующий используемому в Alta Vista. Перечень поисковых систем, к которым происходит обращение, может быть легко задан пользователем. Обеспечивает также поиск в новостях, разыскание иллюстраций и аудиофайлов.

KartOO

Отличительной особенностью является использование в интерфейсе flash-технологии. За счет этого достигается быстрая загрузка страницы, а также визуализация связей между сайтами, посвященными конкретной теме.

Mamma Meta Search

Относительно новая разработка. Наряду с текстовым поиском, обеспечивает выявление мультимедийных файлов. Имеет простой интерфейс, который, однако, не поддается настройке.

MetaСrawler

Ветеран метапоискового сервиса. По умолчанию обращается к 14 самым авторитетным поисковым средствам. Допускает поиск по любому слову запроса, всем словам или точной фразе. Имеет самые богатые возможности по настройке (пункт верхнего меню - Customize).

Vivisimo

Система обладаем множеством настраиваемых опций. Результаты поиска автоматически сортируются по разделам. Позволяет просматривать превью найденных страниц непосредственно из перечня результатов.


Web Crawler

Ветеран поискового сервиса, перешедший из самостаятельных поисковых ситем в метапоисковый сервис. Отличается высокой скоростью работы и достаточно высоким уровнем релевантности ссылок.

Национальные и региональные справочники и поисковые системы

В настоящее время в большинстве развитых стран существует минимум две-три справочника и поисковых систем, отражающих содержание ресурсов Интернет конкретного государства. Их использование наиболее эффективно при выявлении материалов, расположенных на серверах определенной страны. Российские инструменты поиска отражены .

Африка

Wo Yaa Africa Search (http://www.woyaa.com)

Южная Африка

Ananzi (http://www.ananzi.co.za)
Zebra (http://www.zebra.co.za)
Aadvark (http://www.aardvark.co.za)

Другие страны

(http://www.balaa.com) Справочник. Новая Зеландия (http://nzexplorer.co.nz) Carrefour.net (http://www.yupi.com) Справочник. URUGUAY GUIA MUNDIAL Уругвай (http://web2mil.intercanal.com/uruguay) Справочник.

По материалам сайта: http://library.vadimstepanov.ru/

Приходько Валентин Иванович, Copyright © 2010 - 2016 E-mail: [email protected] , Украина.
Перепечатка материалов с обязательной ссылкой на сайт - ПРИВЕТСТВУЕТСЯ!.
Все материалы на сайте предоставлены исключительно в ознакомительных и образовательных целях,
администрация сайта не претендует на их авторство и не несёт ответственности за их содержание.

← Вернуться

×
Вступай в сообщество «sinkovskoe.ru»!
ВКонтакте:
Я уже подписан на сообщество «sinkovskoe.ru»