![]() |
|
сделать стартовой | добавить в избранное |
![]() |
Компьютеры, Программирование
Программное обеспечение
Справочно-поисковые системы сети Интернет |
Содержание Введение 1. Структура справочно-поисковых систем сети Интернет 1.1 Как работают механизмы поиска 2. Сравнительный обзор справочно-поисковых систем 2.1 Gopher 2.2 WAIS 2.3 WWW 2.4 Al aVis a 2.5 Yahoo 2.6 Ope ex 2.7 I foseek 3. Поисковые роботы 4. Наиболее популярные русскоязычные справочно-поисковые системы в Интернет 4.1 Rambler 4.2 Ya dex 4.3 Apor 5. Наиболее популярные зарубежные поисковики для русскоязычного пользователя 5.1 Googlе 5.2 Al aVis a 5.3 Yahoo Список литературы Введение В Сети существует большое число сервисов. Нас в дальнейшем будет интересовать WWW или просто Web (Word-Wide Web- всемирная паутина). Это самый популярный сервис Сети и удобный способ работы с информацией. Основные протоколы, используемые в Интернет (в дальнейшем также Сеть), не обеспечены достаточными встроенными функциями поиска, не говоря уже о миллионах серверах, находящихся в ней. Протокол H P, используемый в Интернет, хорош лишь в отношении навигации, которая рассматривается только как средство просмотра страниц, но не их поиска. То же самое относится и к протоколу F P, который даже более примитивен, чем H P. Из-за быстрого роста информации, доступной в Сети, навигационные методы просмотра быстро достигают предела их функциональных возможностей, не говоря уже о пределе их эффективности. Не указывая конкретных цифр, можно сказать, что нужную информацию уже не представляется возможным получить сразу, так как в Сети сейчас находятся миллиарды документов и все они в распоряжении пользователей Интернет, к тому же сегодня их количество возрастает согласно экспоненциальной зависимости. Количество изменений, которым эта информация подвергнута, огромно и, самое главное, они произошли за очень короткий период времени. Основная проблема заключается в том, что единой полной функциональной системы обновления и занесения подобного объема информации, одновременно доступного всем пользователям Интернет во всем мире, никогда не было. Для того, чтобы структурировать информацию, накопленную в сети Интернет, и обеспечить ее пользователей удобными средствами поиска необходимых им данных, были созданы поисковые системы. 1. Структура справочно-поисковых систем сети интернет Поисковые cистемы обычно состоят из трех компонент: агент (паук или кроулер), который перемещается по Сети и собирает информацию; база данных, которая содержит всю информацию, собираемую пауками; поисковый механизм, который люди используют как интерфейс для взаимодействия с базой данных. 1.1 Как работают механизмы поиска Средства поиска и структурирования, иногда называемые поисковыми механизмами, используются для того, чтобы помочь людям найти информацию, в которой они нуждаются. Средства поиска типа агентов, пауков, кроулеров и роботов используются для сбора информации о документах, находящихся в Сети Интернет. Это специальные программы, которые занимаются поиском страниц в Сети, извлекают гипертекстовые ссылки на этих страницах и автоматически индексируют информацию, которую они находят для построения базы данных. Каждый поисковый механизм имеет собственный набор правил, определяющих, как находить и обрабатывать документы.
Некоторые следуют за каждой ссылкой на каждой найденной странице и затем, в свою очередь, исследуют каждую ссылку на каждой из новых страниц, и так далее. Некоторые игнорируют ссылки, которые ведут к графическим и звуковым файлам, файлам мультипликации; другие игнорируют cсылки к ресурсам типа баз данных WAIS; другие проинструктированы, что нужно просматривать прежде всего наиболее популярные страницы. Агенты - самые &quo ;интеллектуальные&quo ; из поисковых средств. Они могут делать больше, чем просто искать: они могут выполнять даже транзакции от Вашего имени. Уже сейчас они могут искать cайты специфической тематики и возвращать списки cайтов, отсортированных по их посещаемости. Агенты могут обрабатывать содержание документов, находить и индексировать другие виды ресурсов, не только страницы. Они могут также быть запрограммированы для извлечения информации из уже существующих баз данных. Независимо от информации, которую агенты индексируют, они передают ее обратно базе данных поискового механизма. Общий поиск информации в Сети осуществляют программы, известные как пауки. Пауки сообщают о содержании найденного документа, индексируют его и извлекают итоговую информацию. Также они просматривают заголовки, некоторые ссылки и посылают проиндексированную информацию базе данных поискового механизма. Кроулеры просматривают заголовки и возращают только первую ссылку. Роботы могут быть запрограммированы так, чтобы переходить по различным cсылкам различной глубины вложенности, выполнять индексацию и даже проверять ссылки в документе. Из-за их природы они могут застревать в циклах, поэтому, проходя по ссылкам, им нужны значительные ресурсы Сети. Однако, имеются методы, предназначенные для того, чтобы запретить роботам поиск по сайтам, владельцы которых не желают, чтобы они были проиндексированы. Агенты извлекают и индексируют различные виды информации. Некоторые, например, индексируют каждое отдельное слово во встречающемся документе, в то время как другие индексируют только наиболее важных 100 слов в каждом, индексируют размер документа и число слов в нем, название, заголовки и подзаголовки и так далее. Вид построенного индекса определяет, какой поиск может быть сделан поисковым механизмом и как полученная информация будет интерпретирована. Агенты могут также перемещаться по Интернет и находить информацию, после чего помещать ее в базу данных поискового механизма. Администраторы поисковых систем могут определить, какие сайты или типы сайтов агенты должны посетить и проиндексировать. Проиндексированная информация отсылается базе данных поискового механизма так же, как было описано выше. Люди могут помещать информацию прямо в индекс, заполняя особую форму для того раздела, в который они хотели бы поместить свою информацию. Эти данные передаются базе данных. Когда кто-либо хочет найти информацию, доступную в Интернет, он посещает страницу поисковой системы и заполняет форму, детализирующую информацию, которая ему необходима. Здесь могут использоваться ключевые слова, даты и другие критерии. Критерии в форме поиска должны соответствовать критериям, используемым агентами при индексации информации, которую они нашли при перемещении по Сети.
База данных отыскивает предмет запроса, основанный на информации, указанной в заполненной форме, и выводит соответствующие документы, подготовленные базой данных. Чтобы определить порядок, в котором список документов будет показан, база данных применяет алгоритм ранжирования. В идеальном случае, документы, наиболее релевантные пользовательскому запросу будут помещены первыми в списке. Различные поисковые системы используют различные алгоритмы ранжирования, однако основные принципы определения релевантности следующие: Количество слов запроса в текстовом содержимом документа (т.е. в h ml-коде). Тэги, в которых эти слова располагаются. Местоположение искомых слов в документе. Удельный вес слов, относительно которых определяется релевантность, в общем количестве слов документа. Эти принципы применяются всеми поисковыми системами. А представленные ниже используются некоторыми, но достаточно известными (вроде Al aVis a, Ho Bo ). Время - как долго страница находится в базе поискового сервера. Поначалу кажется, что это довольно бессмысленный принцип. Но, если задуматься, как много существует в Интернете сайтов, которые живут максимум месяц! Если же сайт существует довольно долго, это означает, что владелец весьма опытен в данной теме и пользователю больше подойдет сайт, который пару лет вещает миру о правилах поведения за столом, чем тот, который появился неделю назад с этой же темой. Индекс цитируемости - как много ссылок на данную страницу ведет с других страниц, зарегистрированных в базе поисковика. База данных выводит ранжированный подобным образом список документов с H ML и возвращает его человеку, сделавшему запрос. Различные поисковые механизмы также выбирают различные способы показа полученного списка - некоторые показывают только ссылки; другие выводят cсылки c первыми несколькими предложениями, содержащимися в документе или заголовок документа вместе с ccылкой. Когда Вы щелкаете на ссылке к одному из документов, который вас интересует, этот документ запрашивается у того сервера, на котором он находится. 2. Сравнительный обзор справочно-поисковых систем 2.1 Gopher Gopher – был широко распространен в интернете и являлся предшественником World Wide Web. По некоторым данным, до 1995 года Gopher был самой динамично развивающейся технологией интернета. Темпы роста числа соответствующих серверов опережали темпы роста серверов всех других типов. В 1993 году в мире было более полутора тысяч gopher-серверов. Gopher фактически являлся системой распределенного поиска и передачи документов одновременно. Причем эти возможности реализовывались не как дополнительные сервисы-надстройки, подобно современным поисковым машинам, а были встроены в систему как ее базовые функции. С помощь специальной программы Vero ica непосредственно в системе Gopher осуществлялся поиск с использованием специального языка запросов, построенного на ключевых словах. Эта система работала не только задолго до появления GOPHER (RFC-1436) представляет собой систему для поиска и доставки документов, хранящихся в распределенных хранилищах-депозитариях. Система была разработана в университете штата Миннесота (на гербе этого штата изображен хомяк, по-английски gopher).
Поисковая система определяет индекс текстовых документов, которые были выбраны специальной автоматической программой, которая собирает информацию на сайтах по всей Сети. Это немного напоминает пропускание вещества через гигантскую воронку с различными фильтровыми ячейками. Вам придется вытягивать информацию, сужать фокус поиска и в конце концов получить как раз тот самый сайт, который подпадает под ваше описание. Решение, предлагаемое системой Yahoo! - начать с определения понятия в указателе сайтов, организованном на иерархической основе предметов, или тематического поиска. В декабре 1998 года Yahoo! создала реестр 1 200 000 веб-сайтов по следующим 14 основополагающим категориям: искусство и общество; бизнес и экономика; компьютеры и Интернет; образование; развлечения; правительство; здоровье; новости и средства массовой информации; спорт и отдых; справочные материалы; регионы; наука; общественные науки; общество и культура. Далее веб-сайты подбирают под наименования в рамках этих главных наименований по иерархическому принципу
1. Международные экономические отношения: промышленность, сельское хозяйство и транспортная система
2. Разработка системы управления работой коммерческой компании
3. Физическая культура в системе социальной работы с населением
4. Система творческих работ учащихся в 5–6-х классах
5. Упражнения, системы оздоровления, работа мышц
9. Разработка модели информационной системы предприятия ОАО "Токаревский комбинат хлебопродуктов"
10. Экономическая информационная система предприятия ООО "Дайджекс Технолоджи"
11. Разработка маркетинговой информационной системы предприятия
12. Организация производственной системы предприятия на примере ЗАО "Колос"
13. Системы групповой работы с документацией
14. Система профориентационной работы классного руководителя
15. Методика психосоциальной деятельности в системе социальной работы
16. Применение информационных технологий в системе социальной работы с детьми-инвалидами
18. К вопросу о технологии создания ситуации успеха в воспитательной работе с подростками
19. Банковская система: виды банков, их роль и функции в экономике. Банковская система Крыма
20. Организационно-правовая система управления сельским хозяйством
25. Активизация самостоятельной работы студентов средствами Интернет-ресурсов
26. Финансы предприятий сельского хозяйства
27. Работа с удаленными интернет-ресурсами, электронные библиотеки
28. Экономика предприятия коллективного доступа в интернет
29. Автоматизированная справочно-информационная система учета и контроля поставок на предприятии
30. Разработка информационно-справочной системы "Сводка погоды" /Prolog/
31. Разработка информационно-справочной системы "Картотека ГАИ" /Prolog/
32. Разработка информационно-справочной системы "Технический паспорт автомобиля" /Prolog/
33. Разработка информационно-справочной системы "Технический паспорт автомобиля" /Prolog/
34. Разработка информационно-справочной системы
35. Разработка информационно-справочной системы
36. Разработка информационно-справочной системы "Зарплата по НИР"
37. О создании системы непрерывного образования учителей физики (из опыта работы)
42. Справочная система продавца–консультанта компьютерного салона
43. Справочно-правовая система
44. Справочно-правовые системы
45. Работник, коллектив, предприятие в новой системе трудовых правоотношений
46. Принципы работы системы управления параллельными процессами в локальных сетях компьютеров
47. Информационно-поисковые системы на примере "Рамблера"
48. Инженерия знаний. Создание системы "Посредник", заключающей договоры на поставку стройматериалов
50. Методические рекомендации и задания для лабораторных работ по дисциплине «Вычислительные системы»
51. Работа с командами операционной системы MS - DOS
53. Проект создания системы поддержки принятия решений оперативно-дежурной службы милиции
57. Система учета затрат и калькулирования себестоимости продукции (работ, услуг)
58. История создания кредитной системы в России
60. Предприятие в системе рыночных отношений
61. Предприятие в системе национальной экономики
62. Экономические вопросы развития системы торговых предприятий в муниципальных структурах
63. Дебаты о создании системы ПРО в конгрессе США в 1995-1996 годах и российско-американские отношения
66. Попытка создания системы коллективной безопасности в Европе накануне 2 МВ
67. Организация системы управления рисками на предприятии
68. Совершенствование системы управления персоналом на предприятии
69. Формирование системы управленческого контроля на промышленном предприятии
73. Готовьтесь к непредсказуемому будущему: создание системы раннего оповещения
75. Создание и развитие системы репрессивных органов в советский период
76. Концепция создания автоматизированной информационной системы "Спорт"
77. Денежный оборот и система расчетов на предприятии
78. Финансы предприятий - основная составляющая финансовой системы
80. Валютная система ес и проблемы создания валютного союза
81. Система тестов по оценке кредитоспособности предприятий и организаций
82. Экономические вопросы развития системы торговых предприятий в муниципальных структурах
83. О возможностях создания модели реформ в системе государственного пенсионного страхования
84. Издержки обращения в современной системе управления торговым предприятием
85. Создание и будущее европейской валютной системы
89. Некоторые аспекты обеспечения эффективности работы системы управления базами данных
90. Полезные функции для работы с файловой системой
92. Процессы и системы в управлении предприятием
93. Факторы, влияющего на создание системы стратегического планирования
95. История создания и принципы функционирования системы автоматических котировок
96. Предприятие в системе рыночных отношений
97. Анализ затрат предприятия на охрану окружающей среды в системе финансовой деятельности предприятия