Поисковые системы и технологии поиска в сети Интернет

IX Международный конкурс научно-исследовательских и творческих работ учащихся
Старт в науке

Поисковые системы и технологии поиска в сети Интернет

Малышев Е.А. 1
1Муниципальное автономное общеобразовательное учреждение «Средняя общеобразовательная школа № 18»
Шувалова Е.Н. 1
1Муниципальное автономное общеобразовательное учреждение «Средняя общеобразовательная школа № 18»
Автор работы награжден дипломом победителя II степени
Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF

Введение.

При изучении темы «Передача информации в компьютерных сетях» на уроке информатики в 8 классе мы проводили практическую работу «Работа в Интернете с поисковыми программами». Многообразие поисковых систем, релевантность результатов поиска очень заинтересовали меня, и я решил исследовать этот вопрос глубже.

Актуальность темы:

Почему я выбрала именно эту тему? Мне кажется, что современному человеку важно знать топовые веб-сервисы для поиска информации во Всемирной паутине.

Тема: «Поисковые системы и технологии поиска в сети Интернет».

Объект исследования: поисковые системы.

Цель: выявление рейтинга использования поисковых систем.

Задачи:

1. Изучить историю появления поисковых систем.

Исследовать рейтинг поисковых систем.

Исследовать использование поисковых систем участниками образовательных отношений в МАОУ «СОШ № 18».

В сети Интернет огромное количество разнообразной информации, и если бы не поисковые системы, то, наверное, Вы толком никогда не смогли бы найти то, что Вам нужно.

Поисковая система - это компьютерная система, предназначенная для поиска информации. Одно из наиболее известных применений поисковых систем — веб - сервисы для поиска информации во Всемирной паутине.

Для поиска информации с помощью поисковой системы пользователь формулирует поисковый запрос. Работа поисковой системы заключается в том, чтобы по запросу пользователя найти документы, содержащие либо указанные ключевые слова, либо слова, как-либо связанные с ключевыми словами. При этом поисковая система генерирует страницу результатов поиска. Такая поисковая выдача может содержать различные типы результатов, например: веб - страницы, изображения, аудиофайлы. Некоторые поисковые системы также извлекают информацию из подходящих баз данных и каталогов ресурсов в Интернете.

Поисковая система тем лучше, чем больше документов, релевантных запросу пользователя, она будет возвращать. Результаты поиска могут становиться менее релевантными из-за особенностей алгоритмов или вследствие человеческого фактора. По состоянию на 2015 год самой популярной поисковой системой в мире является Google, однако есть страны, где пользователи отдали предпочтение другим поисковикам. Так, например, в России «Яндекс» обгоняет Google больше, чем на 10 %.

По методам поиска и обслуживания разделяют четыре типа поисковых систем: системы, использующие поисковых роботов, системы, управляемые человеком, гибридные системы и мета-системы. В архитектуру поисковой системы обычно входят:

поисковый робот, собирающий информацию с сайтов сети Интернет или из других документов;

индексатор, обеспечивающий быстрый поиск по накопленной информации;

поисковик — графический интерфейс для работы пользователя.

Глава 1. История развития поисковых систем.

Появление поисковых систем.

Первой компьютерной программой для поиска в Интернете, была программа Арчи (англ. archie — архив без буквы «в»). Она была создана в 1990 году Аланом Эмтэджем, Биллом Хиланоми Дж. Питером Дойчем, студентами, изучающими информатику в университете Макгилла в Монреале. Программа скачивала списки всех файлов со всех доступных анонимных FTP-серверов и строила базу данных, в которой можно было выполнять поиск по именам файлов. Однако, программа Арчи не индексировала содержание этих файлов, так как объём данных был настолько мал, что всё можно было легко найти вручную.

Развитие и распространение сетевого протокола Gopher, придуманного в 1991 году Марком Маккэхиломв университете Миннесоты, привело к созданию двух новых поисковых программ, Veronica и Jughead. Как и Арчи, они искали имена файлов и заголовки, сохраненные в индексных системах Gopher. Veronica позволяла выполнять поиск по ключевым словам большинства заголовков меню Gopher во всех списках Gopher. Программа Jughead извлекала информацию о меню от определённых Gopher-серверов. Хотя название поисковика Арчи не имело отношения к циклу комиксов «Арчи», тем не менееVeronica и Jughead — персонажи этих комиксов.

К лету 1993 года ещё не было ни одной системы для поиска в вебе, хотя вручную поддерживались многочисленные специализированные каталоги. Оскар Нирштрасс в Женевском университете написал ряд сценариев на Perl, которые периодически копировали эти страницы и переписывали их в стандартный формат. Это стало основой для W3Catalog, первой примитивной поисковой системы сети, запущенной 2 сентября 1993 года.

Вероятно, первым поисковым роботом, написанным на языке Perl, был «WorldWideWebWanderer» — бот Мэтью Грэя из Массачусетского технологического института в июне 1993 года. Этот робот создавал поисковый индекс «Wandex». Цель робота Wanderer состояла в том, чтобы измерить размер всемирной паутины и найти все веб-страницы, содержащие слова из запроса. В 1993 году появилась и вторая поисковая система «Aliweb», которая не использовала поискового робота, но вместо этого ожидала уведомлений от администраторов веб-сайтов о наличии на их сайтах индексного файла в определённом формате.

JumpStation, созданный в декабре 1993 года Джонатаном Флетчером, искал веб-страницы и строил их индексы с помощью поискового робота, и использовал веб-форму в качестве интерфейса для формулирования поисковых запросов. Это был первый инструмент поиска в Интернете, который сочетал три важнейших функции поисковой системы (проверка, индексация и собственно поиск). Из-за ограниченности ресурсов компьютеров того времени индексация и, следовательно, поиск были ограничены только названиями и заголовками веб-страниц, найденных поисковым роботом.

Первой полнотекстовой индексирующей ресурсы при помощи робота поисковой системой, стала система «WebCrawler», запущенная в 1994 году. В отличие от своих предшественниц она позволяла пользователям искать по любым словам, расположенным на любой веб-странице — с тех пор это стало стандартом для большинства поисковых систем. Кроме того, это был первый поисковик, получивший широкое распространение. В 1994 году была запущена система «Lycos», разработанная в Университете Карнеги-Меллон и ставшая серьёзным коммерческим предприятием.

Вскоре появилось множество других конкурирующих поисковых машин, таких как: «Magellan», «Excite», «Infoseek», «Inktomi», «NorthernLight» и «AltaVista». В некотором смысле они конкурировали с популярнымиинтернет-каталогами, такими как «Yahoo!». Но поисковые возможности каталогов ограничивались поиском по самим каталогам, а не по текстам веб-страниц. Позже каталоги объединялись или снабжались поисковыми роботами с целью улучшения поиска.

В 1996 году компания Netscape хотела заключить эксклюзивную сделку с одной из поисковых систем, сделав её поисковой системой по умолчанию на веб-браузере Netscape. Это вызвало настолько большой интерес, что Netscape заключила контракт сразу с пятью крупнейшими поисковыми системами (Yahoo!, Magellan, Lycos, Infoseek и Excite). За 5 млн долларов США в год они предлагались по очереди на поисковой странице Netscape.

Google взял на вооружение идею продажи ключевых слов в 1998 году, тогда это была маленькая компания, обеспечивающая работу поисковой системы по адресу goto.com. Этот шаг ознаменовал для поисковых систем переход от соревнований друг с другом к одному из самых выгодных коммерческих предприятий в Интернете. Поисковые системы стали продавать первые места в результатах поиска отдельным компаниям.

Поисковая система Google занимает видное положение с начала 2000-х. Компания добилась высокого положения благодаря хорошим результатам поиска с помощью алгоритма PageRank. Этот итеративный алгоритм ранжирует веб-страницы, основываясь на оценке количества гиперссылок на веб-страницу в предположении, что на «хорошие» и «важные» страницы ссылаются больше, чем на другие. Интерфейс Google выдержан в спартанском стиле, где нет ничего лишнего, в отличие от многих своих конкурентов, которые встраивали поисковую систему в веб-портал. Поисковая система Google стала настолько популярной, что появились подражающие ей системы, например, MysterySeeker(тайный поисковик).

К 2000 году Yahoo! осуществлял поиск на основе системы Inktomi. Yahoo! в 2002 году купил Inktomi, а в 2003 году купил Overture, которому принадлежали AlltheWeb и AltaVista. Затем Yahoo! работал на основе поисковой системе Google вплоть до 2004 года, пока не запустил, наконец, свой собственный поисковик на основе всех купленных ранее технологий.

Фирма Microsoft впервые запустила поисковую систему MicrosoftNetworkSearch (MSN Search) осенью 1998 года, используя результаты поиска от Inktomi. Совсем скоро в начале 1999 года сайт начал отображать выдачу Looksmart, смешанную с результатами Inktomi. Недолго (в 1999 году) MSN search использовал результаты поиска от AltaVista. В 2004 году фирма Microsoft начала переход к собственной поисковой технологии с использованием собственного поискового робота — msnbot. После проведения ребрендинга компанией Microsoft 1 июня 2009 года была запущена поисковая система Bing. 29 июля 2009 Yahoo! и Microsoft подписали соглашение, согласно которому Yahoo! Search работал на основе технологии MicrosoftBing. На момент 2015 года союз Bing и Yahoo! дал первые настоящие плоды. Теперь Bing занимает 20,1 % рынка, а Yahoo! 12,7 %, что в общем занимает 32,60 % от общего рынка поисковых систем в США по данным из разных источников.

Хронология появления поисковых систем.

Хронология появления поисковых систем представлена в приложении 1.

1.3. Развитие поисковых систем на русском языке.

В 1996 году был реализован поиск с учётом русской морфологии на поисковой машине Altavista и запущены оригинальные российские поисковые машины Рамблер и Апорт. 23 сентября 1997 года была открыта поисковая машина Яндекс. 22 мая 2014 года компанией Ростелеком была открыта национальная поисковая машина Спутник, которая на момент 2015 года находится в стадии бета-тестировании. 22 апреля 2015 года был открыт новый сервис Спутник. Дети специально для детей с повышенной безопасностью.

Большую популярность получили методы кластерного анализа и поиска по метаданным. Из международных машин такого плана наибольшую известность получила «Clusty» компании Vivisimo https://en.wikipedia.org/wiki/Vivisimo. В 2005 году в России при поддержке МГУ запущен поисковик «Нигма», поддерживающий автоматическую кластеризацию. В 2006 году открылась российская метамашинаQuintura, предлагающая визуальную кластеризацию в виде облака тегов. «Нигма» тоже экспериментировала[13] с визуальной кластеризацией.

Как работает поисковая система.

Основные составляющие поисковой системы: поисковый робот, индексатор, поисковик.

Как правило, системы работают поэтапно. Сначала поисковый робот получает контент, затем индексатор генерирует доступный для поиска индекс, и наконец, поисковик обеспечивает функциональность для поиска индексируемых данных. Чтобы обновить поисковую систему, этот цикл индексации выполняется повторно.

Поисковые системы работают, храня информацию о многих веб-страницах, которые они получают из HTML страниц. Поисковый робот или «краулер» (англ. Crawler) — программа, которая автоматически проходит по всем ссылкам, найденным на странице, и выделяет их. Краулер, основываясь на ссылках или исходя из заранее заданного списка адресов, осуществляет поиск новых документов, ещё не известных поисковой системе. Владелец сайта может исключить определённые страницы при помощи robots.txt, используя который можно запретить индексацию файлов, страниц или каталогов сайта.Высокоуровневая архитектура стандартногокраулера представлена в приложении 2.

Поисковая система анализирует содержание каждой страницы для дальнейшего индексирования. Слова могут быть извлечены из заголовков, текста страницы или специальных полей — метатегов. Индексатор — это модуль, который анализирует страницу, предварительно разбив её на части, применяя собственные лексические и морфологические алгоритмы. Все элементы веб-страницы вычленяются и анализируются отдельно. Данные о веб-страницах хранятся в индексной базе данных для использования в последующих запросах. Индекс позволяет быстро находить информацию по запросу пользователя. Ряд поисковых систем, подобных Google, хранят исходную страницу целиком или её часть, так называемый кэш, а также различную информацию о веб-странице. Другие системы, подобные системе AltaVista, хранят каждое слово каждой найденной страницы. Использование кэша помогает ускорить извлечение информации с уже посещённых страниц. Кэшированные страницы всегда содержат тот текст, который пользователь задал в поисковом запросе. Это может быть полезно в том случае, когда веб-страница обновилась, то есть уже не содержит текст запроса пользователя, а страница в кэше ещё старая. Эта ситуация связана с потерей ссылок (англ. linkrot) и дружественным по отношению к пользователю (юзабилити) подходом Google. Это предполагает выдачу из кэша коротких фрагментов текста, содержащих текст запроса. Действует принцип наименьшего удивления, пользователь обычно ожидает увидеть искомые слова в текстах полученных страниц (Userexpectations). Кроме того, что использование кэшированных страниц ускоряет поиск, страницы в кэше могут содержать такую информацию, которая уже нигде более не доступна.

Поисковик работает с выходными файлами, полученными от индексатора. Поисковик принимает пользовательские запросы, обрабатывает их при помощи индекса и возвращает результаты поиска.

Когда пользователь вводит запрос в поисковую систему (обычно при помощи ключевых слов), система проверяет свой индекс и выдаёт список наиболее подходящих веб-страниц (отсортированный по какому-либо критерию), обычно с краткой аннотацией, содержащей заголовок документа и иногда части текста. Поисковый индекс строится по специальной методике на основе информации, извлечённой из веб-страниц. С 2007 года поисковик Google позволяет искать с учётом времени, создания искомых документов (вызов меню «Инструменты поиска» и указание временного диапазона). Большинство поисковых систем поддерживает использование в запросах булевых операторов И, ИЛИ, НЕ, что позволяет уточнить или расширить список искомых ключевых слов. При этом система будет искать слова или фразы точно так, как было введено. В некоторых поисковых системах есть возможность приближённого поиска, в этом случае пользователи расширяют область поиска, указывая расстояние до ключевых слов. Есть также концептуальный поиск, при котором используется статистический анализ употребления искомых слов и фраз в текстах веб-страниц. Эти системы позволяют составлять запросы на естественном языке. Примером такой поисковой системы является сайт askcom.

Полезность поисковой системы зависит от релевантности найденных ею страниц. Хоть миллионы веб-страниц и могут включать некое слово или фразу, но одни из них могут быть более релевантны, популярны или авторитетны, чем другие. Большинство поисковых систем использует методы ранжирования, чтобы вывести в начало списка «лучшие» результаты. Поисковые системы решают, какие страницы более релевантны, и в каком порядке должны быть показаны результаты, по-разному. Методы поиска, как и сам Интернет со временем меняются. Так появились два основных типа поисковых систем: системы предопределенных и иерархически упорядоченных ключевых слов и системы, в которых генерируется инвертированный индекс на основе анализа текста.

Большинство поисковых систем являются коммерческими предприятиями, которые получают прибыль за счёт рекламы, в некоторых поисковиках можно купить за отдельную плату первые места в выдаче для заданных ключевых слов. Те поисковые системы, которые не берут денег за порядок выдачи результатов, зарабатывают на контекстной рекламе, при этом рекламные сообщения соответствуют запросу пользователя. Такая реклама выводится на странице со списком результатов поиска, и поисковики зарабатывают при каждом клике пользователя на рекламные сообщения.

Типы поисковых систем.

Существует четыре типа поисковых систем: с поисковыми роботами, управляемые человеком, гибридные и мета-системы.

системы, использующие поисковых роботов

Состоят из трёх частей: краулер («бот», «робот» или «паук»), индекс и программное обеспечение поисковой системы. Краулернужен для обхода сети и создания списков веб-страниц. Индекс — большой архив копий веб-страниц. Цель программного обеспечения — оценивать результаты поиска. Благодаря тому, что поисковый робот в этом механизме постоянно исследует сеть, информация в большей степени актуальна. Большинство современных поисковых систем являются системами данного типа.

системы, управляемые человеком (каталоги ресурсов)

Эти поисковые системы получают списки веб-страниц. Каталог содержит адрес, заголовок и краткое описание сайта. Каталог ресурсов ищет результаты только из описаний страницы, представленных ему веб-мастерами. Достоинство каталогов в том, что все ресурсы проверяются вручную, следовательно, и качество контента будет лучше по сравнению с результатами, полученными системой первого типа автоматически. Но есть и недостаток — обновление данных каталогов выполняется вручную и может существенно отставать от реального положения дел. Ранжирование страниц не может мгновенно меняться. В качестве примеров таких систем можно привести каталог Yahoo, dmoz и Galaxy.

гибридные системы

Такие поисковые системы, как Yahoo, Google, MSN, сочетают в себе функции систем, использующие поисковых роботов, и систем, управляемых человеком.

мета-системы

Метапоисковые системы объединяют и ранжируют результаты сразу нескольких поисковиков. Эти поисковые системы были полезны, когда у каждой поисковой системы был уникальный индекс, и поисковые системы были менее «умными». Поскольку сейчас поиск намного улучшился, потребность в них уменьшилась. Примеры: MetaCrawler и MSN Search.

Глава 2.Исследование поисковых систем.

2.1. Рынок поисковых систем.

Для исследования поисковых систем мы использовали Интернет - ресурс LiveInternet(http://www.liveinternet.ru/stat/ru/searches.html). LiveInternet–тематический рубрификатор сайтов русскоязычного сегмента интернета, ранжированных по посещаемости за текущие сутки. Интернет-портал, собравший в 2003 году воедино счётчик статистики rax.ru и сервис дневников li.ru, разработанные командой разработчиков под руководством Германа Клименко.

Изучение популярности поисковых систем показало, что Google — самая популярная поисковая система в мире. Основные показатели посещаемости поисковой системы Google представлены в приложении 3.

Рейтинг популярности поисковых систем в мире, согласно сайту «Глобальная статистика Интернета» (https://www.gs.seo-auditor.com.ru/sep) представлен в приложении 4.

Согласно статистике поисковой системой Google пользуются 57,3% пользователей в России, Яндексом - 40,5 %, Search.Mail.ru – 2%, Rambler – 0,1%, Bing-0,1% (приложение 5). За последние 4 года количество пользователей, использующих поисковую систему Google увеличилось на 15,3%.

Число пользователей Интернета и поисковых систем и требований пользователей к этим системам постоянно растёт. Для увеличений скорости поиска нужной информации, крупные поисковые системы содержат большое количество серверов. Сервера обычно группируют в серверные центры (дата центры). У популярных поисковых систем серверные центры разбросаны по всему миру.

Большинство изученных нами поисковых систем имеют дополнительные возможности: прогноз погоды, новостная лента, карты, курс валют и т.д.

2.2. География поисковых систем.

Для изучения развития поисковых систем мы использовали статистику за 3 месяца. В рейтинг вошли страны, набравшие в сумме 90,5% запросов. 74,3% пользователей поисковых систем шлют запросы из России, 7,5% - из Украины. 3,9% - из республики Беларусь, 3,8% - из Казахстана, 1% - из США. Ниже в этом рейтинге Германия, Узбекистан, Молдавия, Чехия. Оставшиеся 9,5% распределены между оставшимися 58 странами, заявленными на рубификаторе. Рейтинг развития поисковых систем в различных странах представлен в приложении 6.

В нашей стране больше всего ищут информацию в Москве (30,6%), Санкт-Петербурге (8,8%), Новосибирске (4,7%), Екатеринбурге (4,6%), Нижнем Новгороде (4,3%).Наш регион в количестве запросов заметно отстает - Вологда (0,4%), Череповец (0,1%). Количество посетителей поисковых сайтов в различных регионах РФ представлено в приложении 7.

Следует отметить, что 65,7% запросов по поисковым системам организуется на русском языке.

Кроме того, мы изучили браузеры, которые используют пользователи для организации запросов. Со значительным преимуществом лидирует GoogleChrome (61,7%), что на 15,9% выше, чем в 2016 году; на втором месте Яндекс Браузер (13,9%), далее MobileSafari (9,7%), на четвертом месте рейтинга разместился браузер Opera (4,5%) и замыкает пятерку лидеров Firefox (3,1%). Результаты отчета представлены в приложении 8.

Отчет о количестве посетителей с разными операционными системами позволяет сделать вывод о том, что большинство запросов осуществляется с помощью Android (53,2%), далееврейтингестоят Windows 10 (13,8%), Windows 7 (14,2%), iOS iPhone (11%), Windows 8 (2,8%). Результаты отчета представлены в приложении 9.

2.3. Результаты исследования использования поисковых систем участниками образовательных отношений в МБОУ «СОШ № 18».

С целью изучения использования поисковых систем участниками образовательных отношений в МАОУ «СОШ № 18» нами была разработана анкета (Приложение 10).

В период с 01 по 13 марта 2020 года были опрошены 21 педагог и 75 учащихся 7-11 классов. Результаты анкетирования подтверждают данные статистики по России. Так, 95 % педагогов осуществляют поиск информации ежедневно, а 5% - иногда (2-3 раза в неделю). Учителя владеют информацией о следующих поисковых системах: Google, Yandex, Mail.ru, Bing, Rambler, Yahoo!, Weblist. Из них чаще всего педагоги пользуются поисковой системой Yandex (67%) и Google(33%).

73% учеников нашей школы ищут информацию в сети Интернет часто, а другие 27% - иногда. Среди опрошенных не оказалось школьников, использующих поисковые системы редко или никогда. Следует отметить, что школьники знают гораздо больше названий поисковых систем, ими было предложено 10 вариантов, с которыми они знакомы: Google, Yandex, Mail.ru, Bing, Yahoo!, Rambler, Спутник, Нигма, Baidu, Aol. Но, не смотря на это, самыми популярными среди школьников также являются поисковые системы Yandex (31%) и Google(69%).

Итак, педагоги отдают предпочтение поисковой системе Yandex, а ученики, следуя мировым тенденциям, используют Google (Приложение 11).

2.4. Исследования релевантности поисковых систем.

С целью определения рейтинга поисковых систем мы экспериментальным путем проверили релевантность поисковых систем. Одноименные запросы были заданы нами в поисковых системах, вошедших в пятерку лидеров по результатам общественного мнения. Полученные результаты представлены в приложении 12.

Как показало исследование самая продуктивная поисковая система – Нигма, но к сожалению, она не пользуется популярностью среди участников образовательных отношений нашего учреждения.

Заключение.

Итак, подводя итог вышесказанному, отмечу, что поисковые системы – это интереснейшая тема для изучения и исследования. Желаю участникам конференции изучить возможности поисковой системы Нигма и использовать ее для поиска информации среди детей.

Список использованных источников и литературы.

Ашманов И. С., Иванов А. А. Продвижение сайта в поисковых системах. — М.: Вильямс, 2007. — 304 с. — ISBN 978-5-8459-1155-1.

Байков В.Д. Интернет. Поиск информации. Продвижение сайтов. — СПб.: БХВ-Петербург, 2000. — 288 с. — ISBN 5-8206-0095-9.

Колисниченко Д. Н. Поисковые системы и продвижение сайтов в Интернете. — М.: Диалектика, 2007. — 272 с. — ISBN 978-5-8459-1269-5.

Ландэ Д. В. Поиск знаний в Internet. — М.: Диалектика, 2005. — 272 с. — ISBN 5-8459-0764-0.

Ландэ Д. В., Снарский А. А., Безсуднов И. В.Интернетика: Навигация в сложных сетях: модели и алгоритмы. — M.: Либроком (Editorial URSS), 2009. — 264 с. — ISBN 978-5-397-00497-8.

Chu H., Rosenthal M. Search engines for the World Wide Web: A comparative study and evaluation methodology (англ.) // PROCEEDINGS OF THE ANNUAL MEETING-AMERICAN SOCIETY FOR INFORMATION SCIENCE : journal. — 1996. — Vol. 33. — P. 127-135.

Gandal, Neil The dynamics of competition in the internet search engine market. — 2001. — Vol. 19. — P. 1103–1117. — DOI:10.1016/S0167-7187(01)00065-0.

Introna L. D.,Nissenbaum H. Shaping the Web: Why the Politics of Search Engines Matters (англ.) // The Information Society: An International Journal. — 2000. — Vol. 16. — DOI:10.1080/01972240050133634.

Jawadekar, Waman S.8. Knowledge Management: Tools and Technology // Knowledge management: Text & Cases. — New Delhi: Tata McGraw-Hill Education Private Ltd, 2011. — С. 278. — 319 с. — ISBN 978-0-07-07-0086-4.

PariserE.The Filter Bubble: What The Internet Is Hiding From You. — NY: Penguin Group, 2011. — 257 с. — ISBN 978-0-14-196992-3.

Risvik K. M., Michelsen R. Search engines and web dynamics (англ.) // Computer Networks : journal. — 2002. — Vol. 39, no. 3. — P. 289-302.

SegevEl.Google and the Digital Divide: The Biases of Online Knowledge. — Oxford: Chandos Publishing. — 2010. — 171 с. — ISBN 978-1-84334-565-7.

Tarakeswar M. K., Kavitha M. D. Search Engines:A Study (англ.) // Journal of Computer Applications (JCA) : journal. — 2011. — Vol. 4, no. 1. — P. 29-33. — ISSN0974-1925.

Vaughan L., Thelwall M. Search engine coverage bias: evidence and possible causes (англ.) // Information Processing &Management : journal. — 2004. — Vol. 40. — P. 693–707. — DOI:10.1016/S0306-4573(03)00063-3.

Zhang, Séaghdha, Quercia, Jambor Auralist: introducing serendipity into music recommendation (англ.) // ACM WSDM. — 2012. — P. 13-22. — ISSN978-1-4503-0747-5. — DOI:10.1145/2124295.2124300.

Browser Deals Push Netscape Stock Up 7.8% (англ.) // Los Angeles Times : journal. — 1996.

«Глобальная статистика Интернета» (https://www.gs.seo-аuditor.com.ru/sep)

Приложение.

Приложение 1.

Хронология появления поисковых систем.

Год

Система

Событие

1993

W3Catalog

Запуск

Aliweb

Запуск

JumpStation

Запуск

1994

WebCrawler

Запуск

Infoseek

Запуск

Lycos

Запуск

1995

AltaVista

Запуск

Daum

Основание

Open Text Web Index

Запуск

Magellan

Запуск

Excite

Запуск

SAPO

Запуск

Yahoo!

Запуск

1996

Dogpile

Запуск

Inktomi

Основание

Рамблер

Основание

HotBot

Основание

AskJeeves

Основание

1997

NorthernLight

Запуск

Яндекс

Запуск

1998

Google

Запуск

1999

AlltheWeb

Запуск

GenieKnows

Основание

Naver

Запуск

Teoma

Основание

Vivisimo

Основание

2000

Baidu

Основание

Exalead

Основание

2003

Info.com

Запуск

2004

Yahoo! Search

Окончательный запуск

A9.com

Запуск

Sogou[en]

Запуск

2005

MSN Search

Окончательный запуск

Ask.com

Запуск

Нигма

Запуск

GoodSearch

Запуск

SearchMe[en]

Основание

 

2006

wikiseek

Основание

Quaero

Основание

LiveSearch

Запуск

ChaCha

Запуск (бета)

Guruji.com

Запуск (бета)

2007

wikiseek

Запуск

Sproose[en]

Запуск

WikiaSearch

Запуск

Blackle.com

Запуск

2008

DuckDuckGo

Запуск

Tooby

Запуск

Picollator

Запуск

Viewzi

Запуск

Cuil

Запуск

Boogami

Запуск

LeapFish

Запуск (бета)

Forestle

Запуск

VADLO

Запуск

Powerset

Запуск

2009

Bing

Запуск

KAZ.KZ

Запуск

Yebol

Запуск (бета)

Mugurdy

Закрытие

Scout

Запуск

2010

Cuil

Закрытие

Blekko

Запуск (бета)

Viewzi

Закрытие

2012

WAZZUB

Запуск

2014

Спутник

Запуск (бета)

Приложение 2.

Высокоуровневая архитектура стандартного краулера.

Приложение 3.

Основные показатели посещаемости поисковой системы Google.

Приложение 4.

Отчет о динамике изменения популярности поисковых систем: июл. 2018 г. - июн. 2019 г.

 

сен. 2018

дек. 2018

янв. 2019

июн. 2019

Яндекс

41.86%

42.71%

40.58%

42.27%

Google

53.51%

53.53%

56.09%

54.24%

Mail.ru

2.40%

2.25%

2.31%

1.77%

Рамблер

0.37%

0.38%

0.48%

0.24%

Bing

0.28%

0.51%

0.50%

0.50%

Yahoo!

0.17%

0.18%

0.17%

0.20%

Ask

0.02%

0.01%

0.01%

0.01%

Nigma

0.01%

0.01%

0.01%

0.01%

QIP

0.04%

0.04%

0.04%

0.04%

Приложение 5.

Частота использования поисковых систем.

Приложение 6.

Рейтинг развития поисковых систем в различных странах

Приложение 7.

Количество посетителей поисковых сайтов в различных регионах РФ.

Приложение 8.

Количество посетителей с различными браузерами.

Приложение 9.

Приложение 10.

Анкета.

Уважаемые участники образовательных отношений!

Просим Вас ответить на вопросы анкеты.

Как часто Вы ищете информацию в сети Интернет?

- часто (ежедневно);

- иногда (2-3 раза в неделю);

- редко (1-2 раза в месяц);

- никогда.

Перечислите известные Вам поисковые системы ____________________________

__________________________________________________________________________

__________________________________________________________________________

2. Какую поисковую систему Вы чаще всего используете для поиска информации в сети Интернет? _____________________________________________________________

Чем привлекает Вас выбранная поисковая система? ___________________________

____________________________________________________________________________________________________________________________________________________

Спасибо за Ваши ответы!

Приложение 11.

Результаты анкетирования участников образовательных отношений МАОУ «СОШ № 18».

Учителя Ученики

Приложение 12.

Результаты изучения релевантности поисковых систем.

п/п

Поисковая система

Количество найденных страниц в запросе

Биография Пушкина

Достопримечатель-

ности Крыма

Новости в России

Лучшие

Книги

Купить

авто

1.

Google

524000

651000

78 млн

18 млн

23 млн

2.

Bing

975000

750000

61 млн

365 млн

159 млн

3.

Yandex

2 млн

3 млн

1653 млн

378 млн

172 млн

4.

Rambler

3 млн

4 млн

2 млрд

363 млн

151 млн

5.

Нигма

8 млн

17 млн

3.4 млрд

756 млн

936 млн

Просмотров работы: 191