Поисковые системы википедия. История развития поисковых систем

На первоначальной стадии развития Интернета пользователи были привилегированным меньшинством и объем доступной информации относительно небольшой. В тот период доступ к ней имели, в основном, работники различных крупных учебных заведений и лабораторий, и полученные данные использовались в научных целях. В то время использование Сети не имело такой актуальности, как сейчас.

Каждая поисковая система использует другой метод или синтаксис, чтобы каталогизировать веб-страницы и искать их. Другими словами, каждая поисковая система возвращает разные результаты для одного и того же объекта. Помимо предоставления дополнительных услуг, поиск определенного контента, использование разных поисковых систем увеличивает массу результатов. Поэтому не просто используйте один и тот же сайт, знаете новые поисковые системы и находите новые возможности.

Его система была простой в середине 1990-х годов, но по мере того, как сеть росла экспоненциально, поиск становился все более и более необходимым. Даже с помощью системы регистрации вручную сайт совершил невероятный успех за короткое время и превратил проект вакантных часов двух молодых людей в бизнес миллионера. В отличие от других, эта служба не включала в себя новые функции и практически не изменилась с течением лет, сохранившись до тех пор, пока не появятся поисковые системы конца прошлого века.

В 1990 году британский ученный Тим Бернерс-Ли (который также является изобретателем URI, URL, HTTP, World Wide Web) создал сайт info.cern.ch , который является первым в мире доступным каталогом интернет-сайтов. С этого момента Интернет начал набирать популярность не только среди научных кругов, но и среди простых обладателей персональных компьютеров.

Рассматривая пример сегодняшних замечательных поисковых сайтов, нетрудно сделать вывод, что будущее Интернета заключается в интеграции нескольких сервисов в один и тот же домен. Кто не случайно нашел этот длинный потерянный мяч при поиске коробки? Пользователь Интернета любит практичность, так как узнать, не попадает ли какая-либо из последних новостей во время поиска?

Ранжирование большинства поисковых сайтов бразильцами

Ваш браузер также может быть интегрирован с браузером и в настоящее время представляет собой один из лучших вариантов поиска. Сайт обещает развиваться в ближайшие годы, принося отличные новости пользователям в доступных странах: Бразилии, Объединенных Арабских Эмиратах и США.

Таким образом, первым способом облегчения доступа к информационным ресурсам в Интернете стало формирование каталогов сайтов. Ссылки на ресурсы в них были сгруппированы по тематике.

Первым проектом такого рода принято считать Yahoo, открытый в апреле 1994 года . В связи со стремительным ростом количества сайтов в нём, вскоре появилась возможность поиска необходимой информации по запросу. Конечно же, это ещё не было полноценной поисковой системой. Поиск был ограничен только данными, которые находились в каталоге.

И здесь, в Бразилии, ничего другого! Но в других странах это не сильно отличается. Поисковая система «Поиск» имеет другое предложение из первых 4 наших списков. На сайте имеется коллекция статей самых разных предметов, организованных по категориям и странам.

Это традиционная поисковая система, которая ищет на нескольких языках в разных странах. Он работает по-другому: вы можете одновременно искать несколько поисковых систем. С другой стороны, инструмент оставляет желать лучшего в результатах поиска. Многие слова не имеют никаких результатов.

На ранних этапах развития сети интернет каталоги ссылок использовались очень активно, но постепенно утрачивали свою популярность. Причина проста: даже при наличии множества ресурсов в современных каталогах, они все равно показывают только малую часть имеющейся в сети Интернет информации. К примеру, самым большим каталогом сети является — DMOZ (Open Directory Project). Он содержит информацию о чуть более пяти миллионах ресурсов, что несоизмеримо с поисковой базой Google, содержащей более восьми миллиардов документов.

Лучшие сайты для инвестиций в спонсируемую ссылку

Как уже сказано, это поисковая система, которая дает результаты на бразильских сайтах. Это смесь сайта поиска, с рекламным порталом и блогом. У многих людей все еще есть вопросы, по которым лучшие поисковые сайты инвестируют в рекламу. В основном у нас есть три платформы, доминирующие на бразильском сценарии спонсируемых ссылок.

Это не только крупнейшая поисковая система в мире, но и потому, что она управляет релевантными посетителями с почти идеальной платформой для создания рекламы, а другая для измерения. Особенности этих инструментов влияют на тип, количество и качество ресурсов, восстановленных через них. В этой статье представлен обзор основных категорий инструментов поиска в Интернете, их сходства, различия и характеристики, а также преимущества и недостатки, связанные с каждым из них, чтобы предоставить профессионалу инструментальной информации возможность повысить эффективность поиска в информационные ресурсы.

Самым крупным русскоязычным каталогом является Яндекс-каталог. Он содержит информацию о чуть более ста четырёх тысячах ресурсов.

Хронология развития поисковых систем

1945 год – американский инженер Ванневар Буш опубликовал записи идеи, которая привела в дальнейшем к изобретению гипертекста, и рассуждение о необходимости разработки системы быстрого извлечения данных из таким образом хранимой информации (эквивалент сегодняшних поисковых систем). Введённое им понятие устройства-расширителя памяти содержало оригинальные идеи, которые, в конце концов, воплотились в Интернете.

Аннотация В настоящее время существует сотни различных инструментов для поиска по оценкам одного миллиарда веб-страниц. Их особенности влияют на тип, количество и качество ресурсов, полученных при их использовании. В этой статье представлен обзор основных категорий инструментов веб-поиска, их сходства, различия и характеристики, чтобы предоставить специалистам в области информации инструмент для повышения их эффективности при поиске информации.

С первых дней существования Интернета возникла проблема создания инструментов для поиска их информационных ресурсов. С появлением Интернета и последующим взрывом публикаций, доступных через него, стали появляться специальные инструменты для поиска ваших страниц.

1960-е — Джерард Сэлтон и его группа в Корнелльском университете разработали «Остроумную систему извлечения информации» (SMART information retrieval system). SMART - аббревиатура от Salton’s Magic Automatic Retriever of Text, то есть «Волшебный автоматический извлекатель текста Сэлтона». Джерард Сэлтон считается отцом современной поисковой технологии.

1987-1989 – разработана Archie — поисковая система для индексации FTP архивов. Archie представлял из себя сценарий, автоматизирующий внедрение в листинги на ftp-серверах, которые затем переносились в локальные файлы, а уже потом в локальных файлах осуществлялся быстрый поиск необходимой информации. Поиск основывался на стандартной grep-команде Unix, а доступ пользователя к данным осуществлялся на основе telnet.

Существуют два основных типа инструментов веб-поиска: поисковые системы и каталоги. Однако из этих двух основных категорий появились другие типы инструментов, что делает мир поисковых служб сложным и неустойчивым. Из-за специфических характеристик каждого инструмента тип, количество и качество ресурсов, восстановленных при его использовании, могут сильно различаться. Для получения наилучших результатов при поиске информации первым шагом является понимание особенностей различных типов инструментов веб-поиска.

В этой статье представлен обзор основных категорий инструментов поиска в Интернете, их сходства, различия и характеристики, а также анализы, а также преимущества и недостатки, связанные с каждым из них, с тем чтобы предоставить профессионалу инструментальной информации возможность повысить эффективность поиска информационных ресурсов.

В следующей версии данные были разбиты на отдельные базы, одна из которых содержала только текстовые названия файлов; а другая — записи со ссылками на иерархические директории тысячи хостов; и еще одна, соединяющая первые две. Эта версия Archie была эффективней предыдущей, так как поиск производился только по именам файлов, исключая множество существующих ранее повторов.

Каталоги были первым решением, предлагаемым для организации и поиска веб-ресурсов, предшествовавших поисковым системам для ключевых слов. Они были введены, когда веб-контент был все еще достаточно мал, чтобы позволить ему собираться неавтоматически. Они организуют сайты, которые составляют свою базу данных, в категории, которые могут содержать подкатегории, то есть сайты получают иерархическую тематическую организацию и позволяют пользователям находить информацию, постепенно переходя в подкатегории.

Поскольку они являются универсальными инструментами, предназначенными для разнообразной аудитории, они пытаются включить в свои иерархические темы темы темы, которые представляют большой интерес. Они часто включают, например, предметы, связанные с образованием, спортом, развлечениями, путешествиями, покупками или вычислениями. Тематические рубрики назначаются последовательно, так что пользователи могут полагаться на помощь контролируемой лексики.

Поисковая система становилась всё популярнее, и разработчики задумались, как ускорить её работу. Упомянутая выше база данных была заменена на другую, основанную на теории сжатого дерева. Новая версия, по существу, создала полнотекстную базу данных вместо списка имен файлов и была значительно быстрее, чем раньше. В дополнение, второстепенные изменения позволили системе Archie индексировать web-страницы. К сожалению, по различным причинам, работа над Archie вскоре прекратилась.

Количество издателей, которые могут варьироваться от 30 до более 15 тысяч, является признаком качества и обновления данных, но не является гарантией. Хотя обычно используемые критерии выбора не раскрываются, для включения выбираются только лучшие функции. Несмотря на этот скрининг, из-за огромного количества предложений, сотни сайтов могут быть добавлены еженедельно. Большие каталоги могут содержать десятки тысяч категорий и подкатегорий и более миллиона веб-сайтов.

Хотя все справочники соответствуют общим принципам, изложенным выше, они различаются в организационных принципах, описаниях ресурсов и предметах, имеющих свои особенности. Что касается организационных принципов, большинство каталогов используют иерархические тематические списки. Как правило, они создаются и поддерживаются информационными специалистами или библиотекарями, пытаясь продвигать более эффективные способы доступа к веб-ресурсам.

В 1993 году была создана первая в мире поисковая система для Всемирной сети Wandex . В её основу был заложен World Wide Web Wanderer бот, разработанный Метью Греем из Массачусетского технологического института.

1993 год – Мартин Костер создаёт Aliweb – одну из первых поисковых систем по World Wide Web. Владельцы сайтов должны были сами их добавлять в индекс Aliweb, чтобы они появлялись в поиске. Поскольку слишком мало вебмастеров это делали, Aliweb не стал популярным

Что касается описаний сайтов, большинство коммерческих бизнес-каталогов ограничены названиями и краткими сводками до 30 слов. Некоторые каталоги отличаются от других, предоставляя подробные и находчивые описания ресурсов и могут включать обзоры и обзоры. Для подготовки анализа эти оценочные или академические справочники используют мастеров или магистров в области библиотечного дела и информатики или специалистов по конкретным предметам. Они обычно связаны с библиотеками или учебными заведениями, используют более строгий процесс отбора и не включают рекламу.

20 апреля 1994 г. – Брайан Пинкертон из университета Вашингтон выпустил WebCrawler — первого бота, который индексировал страницы полностью. Основным отличием поисковой системы от своих предшественников является предоставление возможности пользователям осуществлять поиск по любым ключевым словам на любой веб-странице. Сегодня эта технология является стандартом поиска любой поисковой системы. Поисковая система «WebCrawler» стала первой системой, о которой было известно широкому кругу пользователей. Увы пропускная способность была невысокой и в дневное время система часто была недоступной.

Однако в эту категорию входит несколько каталогов. Среди них Аргус, начатый как проект Мичиганского университета и в настоящее время управляемый информационными профессионалами, выделяется своим качеством. Он собирает только сайты, которые являются справочниками ресурсов в Интернете по конкретному вопросу, которые собираются экспертами в их областях и предоставляют соответствующие ссылки в охватываемой области.

Некоторые каталоги охватывают определенные области и называются тематическими или специализированными каталогами. Существуют, например, каталоги, специализирующиеся на изображениях, газетах и журналах, программное обеспечение, списки рассылки; другие собирают сайты по конкретным предметам, таким как здравоохранение, наука, право, компьютерные науки и т.д.; другие же перечисляют инструменты поиска из определенных стран или для определенной целевой аудитории. Из-за частоты появления новых инструментов поиска, в то время как другие выходят из употребления, был создан новый тип каталога: каталоги инструментов поиска.

20 июля 1994 г. – открылся Lycos — серьезная разработка в технологии поиска, созданная в университете Карнеги Мелон. Майкл Малдин был ответственен за эту поисковую систему и до сих пор остаётся ведущим специалистом в Lycos Inc. Lycos открылся с каталогом в 54,000 документов. И в дополнение к этому результаты, которые он предоставлял, были ранжированными, кроме того он учитывал приставки и приблизительное совпадение. Но главным отличием Lycos был постоянно пополняемый каталог: к ноябрю 1996 было проиндексировано 60 миллионов документов — больше, чем у любой другой поисковой системы того времени.

В отличие от каталогов, поисковые системы не иерархически упорядочивают страницы, которые они собирают. Они менее озабочены селективностью, чем с полным набором своих баз данных, стремясь собрать как можно больше ресурсов за счет использования программных средств, называемых роботами. Поскольку их базы данных чрезвычайно велики, достигая сотен миллионов предметов, они позволяют пользователям находить нужные элементы, ища ключевые слова, а иногда и на естественном языке.

Поисковые системы начали появляться, когда количество ресурсов в Сети приобрело такие пропорции, что они предотвратили их сбор с помощью ручных средств и поиск только посредством навигации. Большинство из них были получены от работы аспирантов, профессоров, сотрудников отдела системных систем или других заинтересованных лиц в Интернете. Многие из них не добились преемственности, поскольку задача, которую необходимо выполнить, стала требовать больших человеческих и технических ресурсов, Те, кто выжил, были приобретены компаниями или финансировались рекламой, инвесторами и исследовательскими ресурсами.

Январь 1994 г. — был основан Infoseek . Он не был по-настоящему инновационным, но имел ряд полезных дополнений. Одним из таких популярных дополнений была возможность добавления своей страницы в реальном времени.

1995 год – запустилась AltaVista . Появившись, поисковая система AltaVista быстро получила признание пользователей и стала лидером среди себе подобных. У системы была практически неограниченная на то время пропускная способность, она была первой поисковой системой, в которой было возможно формулировать запросы на естественном языке, а также формулировать сложные запросы. Пользователям было разрешено добавлять или удалять их собственные URL в течение 24 часов. Также AltaVista предлагала много советов и рекомендаций по поиску. Основной заслугой системы AltaVista считается обеспечение поддержки множества языков, в том числе китайского, японского и корейского. Действительно, в 1997 году ни одна поисковая машина в Сети не работала с несколькими языками, тем более с редкими.

Все текущие двигатели используют метод роботов, состоящий из четырех компонентов: робота, который находит и ищет документы в Интернете; индексатор, который извлекает информацию из документов и строит базу данных; сама поисковая система; интерфейс, который используется пользователями. Роботы, также называемые пауками, агентами, путешественниками, ползучести или червями, являются программами, которые компьютер-хост поисковой системы регулярно запускает в Интернете, в целях получения данных по как можно большему количеству документов для их интеграции, в вашу базу данных.

1996 год — поисковая машина AltaVista запустила морфологическое расширение для русского языка. В этом же году были запущены первые отечественные поисковые системы – Rambler.ru и Aport.ru. Появление первых отечественных поисковых систем ознаменовало новый этап развития Рунета, позволяя русскоязычным пользователям осуществлять запрос на родном языке, а также оперативно реагировать на изменения, происходящие внутри Сети.

20 мая 1996 г. — появилась корпорация Inktomi вместе со своим поисковиком Hotbot . Его создателями были две команды из калифорнийского университета. Когда сайт появился, то он быстро стал популярным. В октябре 2001 Дэнни Салливан написал статью под названием «База данных спам сайтов Inktomi открыта для публичного пользования», в которой рассказывалось о том, как Inktomi случайно сделал свою базу данных спам сайтов, которая к тому времени насчитывала уже около 1 миллиона URL, доступной для всеобщего использования.

1997 год – в западных странах наступает переломный момент в развитии поисковых систем, когда С. Брин и Л. Пейдж из Стэндфордского университета основали Google (первоначальное название проекта BackRub). Они разработали собственную поисковую машину, которая дала пользователям возможность осуществлять качественный поиск с учетом морфологии, ошибок при написании слов, а также повысить релевантность в результатах выдачи запросов.

23 сентября 1997 года – анонсирован Yandex , который быстро стал самой популярной у русскоязычных пользователей Интернета системой поиска. С запуском в поисковой системы Яндекс отечественные поисковые машины начали конкурировать между собой, улучшая систему поиска и индексации сайтов, выдачи результатов, а также предлагая новые сервисы и услуги

Таким образом, развитие поисковых систем и их становление можно охарактеризовать перечисленными выше этапами.

На сегодняшний день на мировом рынке обосновались три лидера – Google, Yahoo и Bing. Они имеют свои собственные базы, и свои алгоритмы поиска. Многие другие поисковые системы используют результаты этих трех основных поисковых систем. Например, AOL использует базу данных Google в то время как AltaVista, Lycos и AllTheWeb используют базу данных Yahoo Все остальные поисковые системы в различных комбинациях, используют результаты (выдачу) перечисленных систем.

Если же провести аналогичный анализ поисковых систем, популярных в странах СНГ, то мы увидим, что mail.ru транслирует поиск Google, при этом накладывая свои новые наработки, Rambler, в свою очередь, транслирует Яндекс. Поэтому весь рынок рунета можно разделить между этими двумя гигантами.

Именно поэтому, в странах СНГ продвижение сайта, как правило, осуществляется только в этих двух ПС.

Игорь Кокорев

Хорошая история

Андрей

действительно хорошая

Для того, чтобы успешно вести и развивать свой блог, нам, прежде всего, необходимо знать, и по каким алгоритмам они работают. Четкое понимание ответов на эти вопросы позволит нам успешно решать задачи продвижения сайтов в поисковых системах. Но о поисковой оптимизации сайтов разговор еще впереди, а пока немного теории о поисковиках.

Что такое поисковые системы интернета?

Если обратиться к Википедии, то вот что мы узнаем:

“Поисковая система - это программно-аппаратный комплекс с веб-интерфейсом, предоставляющий возможность поиска информации в Интернете.”

А теперь на понятном нам языке. Допустим нам срочно нужна информация по определенной теме. Чтобы мы быстро смогли ее найти и созданы поисковики – сайты, где введя в форму поиска поисковый запрос, нам будет выдан список сайтов, на которых, с большой долей вероятности, мы найдем то, что ищем. Этот список называется поисковая выдача. Он может состоять из миллионов страниц по 10 сайтов на каждой. Основная задача вебмастера – попасть, как минимум, в первую десятку.

Вспомните, что когда Вы что либо ищете в сети, то обычно находите это на первой странице выдачи, редко переходя на вторую и тем более на последующие. Значит, чем выше место занимает сайт, тем больше посетителей зайдут на его страницы. А большой трафик (количество посетителей в сутки) – это, в том числе, возможность хорошо .

Как же поисковые системы интернета находят информацию в интернете и по какому принципу распределяют места в поисковой выдаче?

В нескольких словах, поисковая система интернета – это целая паутина, в которой роботы-пауки постоянно сканируют сеть и запоминают все тексты, попадающие в интернет. Анализируя полученные данные, поисковики отбирают документы, наиболее соответствующие поисковому запросу, т. е. релевантные, из которых формируется поисковая выдача.

Самое интересное, что поисковики не умеют читать. Так как же тогда они находят информацию? Алгоритмы поисковых систем сводятся к нескольким основным принципам. Они, первым делом, обращают внимание на заголовок и описание статьи, заголовки абзацев, смысловые выделения в тексте и плотность ключевых слов, которые обязательно должны соответствовать тематике статьи. Чем точнее это соответствие, тем выше в поисковой выдаче будет сайт. Кроме этого обязательно учитывается , объем информации и еще множество факторов. Например, авторитет веб-ресурса, зависящий от количества и авторитетности ссылающихся на него сайтов. Чем больше авторитет, тем выше в выдаче.

Комплекс мер направленный на поднятие позиций сайта в поисковой выдаче по определенным запросам называется поисковой оптимизацией. Сейчас это целая наука – . Но об этом потом.

На данный момент в мире насчитывается множество поисковых систем. Назову самые популярные. На западе это: Google, Bing и Yahoo. В Рунете – Яндекс, Mail.ru, Рамблер и Нигма. В основном пользователи отдают предпочтение мировому лидеру , а самой популярной в русскоязычном интернете стала система Яндекс .

Немного истории. Google был создан в 1997 году выходцем из Москвы Сергеем Брином и его другом американцем Ларри Пейджем во время их учебы в Стэнфордском университете.

Особенностью Google стало то, что она выводила на первые позиции в поисковой выдаче наиболее релевантные результаты поиска в логической последовательности, в то время как остальные поисковики занимались простым сравнением слов в запросе со словами на веб-странице.

23 сентября того же года была анонсирована и система Yandex, которая уже с 2000 года стала существовать как отдельная компания “Яндекс “.

Не буду больше утомлять, надеюсь теперь немного стало ясно, что такое поисковые системы интернета . Стоит сказать, что алгоритмы работы поисковых систем постоянно развиваются. С каждым днем поисковики все лучше определяют потребности пользователей и показывают им в выдаче наиболее релевантную информацию, основанную на множестве факторов (региональность, какие запросы пользователь уже запрашивал, какие сайты посещал в процессе поиска, куда он с них переходил и т.д.).

Скоро Гугл и Яндекс будут лучше нас знать, что нам нужно и о чем мы думаем.!