Реферат

«Поиск информации в Интернет. Web-индексы. Web-каталоги.»

  • 16 страниц(ы)
  • 6115 просмотров
фото автора

Автор: vlad1245

Введение 3

1 Теория поиска информации 4

2 Обзор возможностей поисковых систем и каталогов 7

2.1 YAHOO 8

2.2 GOOGLE 9

2.3 ALTAVISTA 9

2.4 LYCOS 10

2.5 YANDEX RU 10

2.6 RAMBLER RU 11

2.7 APORT RU 11

3 Реконструкция документов и перевод на иностранный язык 13

Заключение 15

Библиографический список 16

Рано или поздно, каждый пользователь Всемирной паутины сталкивается с проблемой поиска информации. Будь то реферат, курсовая работа либо документация к новой стиральной машине, поиск этой информации может занять у вас от пяти минут до нескольких часов – все зависит от умения искать и находить нужные данные в Интернете. В этом случае нам на помощь приходят всевозможные поисковые машины, каталоги и базы знаний. Рассмотрим их по отдельности.

Интернет – абсолютно децентрализованная система. И если сначала анархия и свобода казались замечательным достижением, то сейчас хаотичность расположения информации зачастую порождает значительные трудности. Тут-то на помощь и приходят поисковые машины.

Справедливости ради надо заметить, что поиск во Всемирной сети был возможен и до появления на свет сегодняшних гигантов вроде ALTAVISTA или YAHOO!. Даже в те далекие годы, когда не существовало самой WWW, одним из основных сервисов Интернет был Gopher. Эта система кажется сейчас чрезвычайно неудобной с практической точки зрения (впрочем, на наш взгляд, ни одна из первых Интернет-служб не могла похвастаться ни простотой принципа работы, ни хотя бы интерфейсом).

1 Теория поиска информации

Большинство современных молодых людей имеют мобильные телефоны, подавляющее большинство из них не знает, как работает сеть мобильной связи.

Поисковыми системами можно пользоваться так же, как мобильными телефонами – освоив нехитрые элементы управления ими, научившись нажимать нужные кнопочки. Для того чтобы уметь пользоваться поисковой машиной (или поисковой системой), не обязательно понимать, как она работает, и тем более знать ее внутреннее устройство.

Однако ситуация здесь примерно такая же, как с автомобилем: на нем можно ездить, умея лишь заправлять его, управлять им и зная правила дорожного движения. Но тот, кто хочет чувствовать себя за рулем уверенно и при необходимости самостоятельно устранять мелкие неисправности, должен знать устройство автомобиля, названия и принципы функционирования хотя бы важнейших узлов. Поэтому далее мы будем говорить об устройстве поисковых машин и основных терминах, которые приступающий к поиску информации в интернет пользователь должен знать так же хорошо, как автомобилист термины «карбюратор» и «зажигание».

Как работают поисковые машины Поисковая машина (для краткости ее часто называют просто поисковик) представляет собой комплект программ, в основе которого лежат следующие пять:

1 Spider («паук») – программа, которая загружает в поисковую машину Web-страницы. Работает аналогично браузеру, установленному на компьютере пользователя, но ничего не отображает ни на каком экране. Если вы хотите иметь представление о том, что именно загружает в поисковую систему «паук», откройте какую-нибудь Web-страницу и выберите в меню Вид браузера пункт Просмотр HTML (или «исходного») кода.

2 Crawler («червяк», или «путешествующий паук») – программа, способная найти на Web-странице все ссылки на другие страницы. Ее задача определить, куда дальше должен ползти «паук», руководствуясь ссылками или заранее заданным списком адресов.

3 Indexer (индексатор) – программа, которая «разбирает» страницу на составные части и анализирует их. Вычленяются и анализируютсязаголовки Web-страниц, заголовки документов, ссылки, текст документов, отдельно – текст, выделенный полужирным шрифтом, курсивом и т. д.

4 Database (база данных) – хранилище всех данных, которые поисковая система загружает и анализирует. Требует огромных ресурсов как для хранения, так и для последующей обработки.

5 Search Engine Results Engine (система выдачи результатов поиска) решает, какие страницы удовлетворяют запросу пользователя и в какой степени. Именно с этой частью поисковой системы «общается» пользователь.

Первые две программы, работающие «в связке», часто называют поисковый робот (а иногда – НТТР-робот).

Как видите, поисковая машина, получив запрос на поиск, не отправляется в длительное путешествие по «Всемирной паутине, как полагают некоторые пользователи, а анализирует лишь ту информацию, которую собрала ранее. С одной стороны, это позволяет резко повысить скорость обработки запроса на поиск. С другой, ограничивает область поиска внутренними ресурсами поисковой системы, которые, во-первых, ограниченны (ни одна поисковая машина не в состоянии загрузить в свою базу данных информацию со всех узлов Сети), во-вторых, уже в какой-то степени устарели. Ситуация в интернет изменяется очень быстро. Если «паук» с целью обновления информации об уже проиндексированных однажды Web-страницах «заползает» на них раз в два месяца, пользователь рискует получить в результатах запроса ссылку на уже несуществующую Web-страницу.

Процесс загрузки из Сети информации и предварительного анализа ее поисковой машиной называется индексация, а сама база данных поисковой машины, в которой хранится собранная информация, – индекс.

Глубина индексации может быть разной. Полные тексты документов, размещенных на странице, в базу данных копируют не все поисковые роботы – некоторые ограничиваются лишь заголовками. Когда пользователь формирует запрос на поиск, поисковая машина просматривает свою базу данных и выдает перечень Web-страниц, содержащих слова, введенные пользователем в поле ввода (их часто называют ключевые слова). Таких страниц может быть очень много. Задача поисковой машины – отобрать те из них, которые в наибольшей степени отвечают запросу пользователя (т.е. релевантны ему) и указать ссылки на них в числе первых.

По моему мнению, проблема поиска информации стоит достаточно остро, несмотря на множество поисковых машин и каталогов наводнивших Интернет. Именно поиск информации является основной задачей сервиса.

Если заглянуть в будущее российских поисковых систем, становится очевидно, что новичкам выйти на этот рынок будет довольно сложно, значительно сложнее, чем на рынок счетчиков. Иллюстрацией этому уже сейчас служат такие проекты, как Lupa.r* и Punto, которые, хотя и стартовали, со своими обязанностями справляются пока крайне слабо. Лидерство описанных в статье поисковых машин определяется сложными технологиями, полнотой базы, большим парком компьютеров и сформировавшимися привычками пользователей. В то же время они страдают одним большим недостатком – «замусоренностью» своих баз данных, и для решения этой проблемы, возможно, в один прекрасный день придется проиндексировать русскую часть Интернета практически заново.

1 Всемирная паутина Интернет.– h**t://sesia5.r*/blok/8/83_10.htm

2 Левчук Ю.П., Охинченко Е.П., Сотников А.Д., Фоменко Т.А. Информатика.– h**t://dvo.sut.r*/libr/ite/i280levc/index.htm

3 Поиск в Сети: обзор возможностей поисковых систем и каталогов.– h**t://w*w.geocities.com/patan4ik/comp_artical_5.htm

4 Поиск информации в Интернет.– h**t://dev.ingate.r*/develop-targets/information-popular/

5 Поиск информации в Интернет.– h**t://w*w.extranom.r*/

6 Поиск информации в Интернете.– h**t://mirsovetov.r*/a/hi-tech/network/search-information.html

7 Поиск информации в интернете.– h**t://w*w.homebusiness.r*/ideas/506.htm

Нужна похожая работа?
Закажите авторскую работу по вашему заданию.
  • Цены ниже рыночных
  • Удобный личный кабинет
  • Необходимый уровень антиплагиата
  • Прямое общение с исполнителем вашей работы
  • Бесплатные доработки и консультации
  • Минимальные сроки выполнения

Мы уже помогли 24535 студентам

Средний балл наших работ

  • 4.89 из 5
Узнайте стоимость
написания вашей работы

Не подошла эта работа?

Воспользуйтесь поиском по базе из более чем 40000 работ

Другие работы автора
Наши услуги
Дипломная на заказ

Дипломная работа

от 8000 руб.

срок: от 6 дней

Курсовая на заказ

Курсовая работа

от 1500 руб.

срок: от 3 дней

Отчет по практике на заказ

Отчет по практике

от 1500 руб.

срок: от 2 дней

Контрольная работа на заказ

Контрольная работа

от 100 руб.

срок: от 1 дня

Реферат на заказ

Реферат

от 700 руб.

срок: от 1 дня

682 автора

помогают студентам

23 задания

за последние сутки

10 минут

среднее время отклика

Похожие материалы