вторник, 16 декабря 2014 г.

Популярные поисковые системы

Поисковая система — программно-аппаратный комплекс с веб-интерфейсом, предоставляющий возможность поиска информации в Интернете.

Под поисковой системой обычно подразумевается сайт, на котором размещён интерфейс (фронт-энд) системы. Программной частью поисковой системы является поисковая машина (поисковый движок) — комплекс программ, обеспечивающий функциональность поисковой системы и обычно являющийся коммерческой тайной компании-разработчика поисковой системы.

Большинство поисковых систем ищут информацию на сайтах Всемирной паутины, но существуют также системы, способные искать файлы на FTP-серверах, товары в интернет-магазинах, а также информацию в группах новостей Usenet.

Улучшение поиска — это одна из приоритетных задач современного Интернета.

По данным компании Net Applications в ноябре 2011 года использование поисковых систем распределялось следующим образом:

Гугл поисковик — 83,87 %;
Yahoo! — 6,20 %;
Baidu — 4,22 %;
Bing — 3,69 %;
Поиковая система Yandex — 1,7 %;
Ask — 0,57 %;
AOL — 0,36 %.

История

Одним из первых инструментов поиска в интернете (до Всемирной паутины) был Archie.

Первой поисковой системой для Всемирной паутины был «Wandex», уже не существующий индекс, который создавал «World Wide Web Wanderer» — бот, разработанный Мэтью Грэем (англ. Matthew Gray) из Массачусетского технологического института в 1993. Также в 1993 году появилась поисковая система «Aliweb», работающая до сих пор.

Первой полнотекстовой (т. н. «crawler-based», то есть индексирующей ресурсы при помощи робота) поисковой системой стала «WebCrawler», запущенная в 1994. В отличие от своих предшественников, она позволяла пользователям искать по любым ключевым словам на любой веб-странице — с тех пор это стало стандартом во всех основных поисковых системах. Кроме того, это был первый поисковик, о котором было известно в широких кругах. В 1994 был запущен «Lycos», разработанный в университете Карнеги Мелона.

Вскоре появилось множество других конкурирующих поисковых машин, таких как «Excite», «Infoseek», «Inktomi», «Northern Light» и «AltaVista». В некотором смысле они конкурировали с популярными интернет-каталогами, такими, как «Yahoo!». Позже каталоги соединились или добавили к себе поисковые машины, чтобы увеличить функциональность.

В 1996 году русскоязычным пользователям интернета стало доступно морфологическое расширение к поисковой машине Altavista и оригинальные российские поисковые машины «Рамблер» и «Апорт». 23 сентября 1997 была открыта поисковая система Яндекс.

В последнее время завоёвывает всё большую популярность практика применения методов кластерного анализа и поиска по метаданным. Из международных машин такого плана наибольшую известность получила «Clusty» компании Vivisimo.

В 2005 году на российских просторах при поддержкеМГУ запущен поисковик «Нигма», поддерживающий автоматическую кластеризацию. В 2006 году открылась российская метамашина Quintura, предлагающая визуальную кластеризацию в виде облака тегов. «Нигма» тоже экспериментировала[2] с визуальной кластеризацией.
Помимо поисковых машин для Всемирной паутины, существовали и поисковики для других протоколов, такие как Archie для поиска по анонимным FTP-серверам и «Veronica» для поиска в Gopher.

Хронология
ГодСистемаСобытие
1993W3CatalogЗапуск
AliwebЗапуск
JumpStationЗапуск
1994WebCrawlerЗапуск
InfoseekЗапуск
LycosЗапуск
1995AltaVistaЗапуск
DaumОснование
Open TextWeb IndexЗапуск
MagellanЗапуск
ExciteЗапуск
SAPOЗапуск
Yahoo!Запуск
1996DogpileЗапуск
InktomiОснование
РамблерОснование
HotBotОснование
Ask JeevesОснование
1997Northern LightЗапуск
ЯндексЗапуск
1998GoogleЗапуск
1999AlltheWebЗапуск
GenieKnowsОснование
NaverЗапуск
TeomaОснование
VivisimoОснование
2000BaiduОснование
ExaleadОснование
2003Info.comЗапуск
2004Yahoo! SearchОкончательный запуск
A9.comЗапуск
SogouЗапуск
2005MSN SearchОкончательный запуск
Ask.comЗапуск
GoodSearchЗапуск
SearchMeОснование
2006wikiseekОснование
QuaeroОснование
Ask.comЗапуск
Live SearchЗапуск
ChaChaЗапуск (бета)
Guruji.comЗапуск (бета)
2007wikiseekЗапуск
SprooseЗапуск
Wikia SearchЗапуск
Blackle.comЗапуск
2008DuckDuckGoЗапуск
ToobyЗапуск
PicollatorЗапуск
ViewziЗапуск
CuilЗапуск
BoogamiЗапуск
LeapFishЗапуск (бета)
ForestleЗапуск
VADLOЗапуск
PowersetЗапуск
2009BingЗапуск
KAZ.KZЗапуск
YebolЗапуск (бета)
MugurdyЗакрытие
GobyЗапуск
2010Яндекс (англ.)Запуск
CuilЗакрытие
BlekkoЗапуск (бета)
ViewziЗакрытие
2012WAZZUBЗапуск

Самые популярные поисковые системы

Согласно данным LiveInternet в 2012 году об охвате русскоязычных поисковых запросов:

Всеязычные:
Google поисковик (24,9 %)
Bing (0,8 %)
Yahoo! (0,2 %) и принадлежащие этой компании поисковые машины:
Inktomi
AltaVista
Alltheweb
Англоязычные и международные:
Ask, ранее известная как AskJeeves (механизм Teoma)
 Много.ru
Русскоязычные — большинство «русскоязычных» поисковых систем индексируют и ищут тексты на многих языках — украинском, белорусском, английском, татарском и др. Отличаются же они от «всеязычных» систем, индексирующих все документы подряд, тем, что в основном индексируют ресурсы, расположенные в доменных зонах, где доминирует русский язык или другими способами ограничивают своих роботов русскоязычными сайтами.
Поисковая система Яндекс (61,3 %)
Mail.ru (8,5 %)
Рамблер (1,9 %)
Нигма (0,3 %)
Некоторые из поисковых систем используют внешние алгоритмы поиска. Так, Qip.ru использует поисковый механизм Яндекса, а Nigma сочетает в себе как свой алгоритм, так и сборную выдачу от других поисковиков.

Необычные поисковые системы

DuckDuckGo — гибридная поисковая система с политикой конфиденциальности пользователя и его поисковых запросов.
Koogle (с его помощью ортодоксальные иудеи могли найти контент, признанный раввинами удовлетворяющим религиозным требованиям). На сегодняшний день поисковик не работает.
Yauba (индийский поиск «для параноиков» — в отличие от привычных поисковиков, за пользователями не следят, а все записи о его действиях удаляются с сервера). На сегодняшний день поисковик не работает.
TinEye — поисковая система, специализирующаяся на поиске изображений в Интернете. С недавнего времени теряет свою актуальность, после того, как Гугл поисковик ввел функцию поиска по картинкам.
Генон — поисковая система, собирающая и создающая контент у себя на сайте.
ImHalal — первый исламский поисковик. Новый поисковик может отличить разрешённые для мусульман (халяльные) результаты поиска от запретных (харамных). Был открыт в 2009 году. Ориентировочно с начала сентября 2011 прекратил функционирование в связи с недостатком финансирования.

Комментариев нет:

Отправить комментарий