Реферат
«Информационные поисковые системы в Интернет.»
- 31 страниц
Введение 3
1. Поисковые системы 4
1.1. Поисковая система Google 9
1.2. Поисковая система Yandex 12
1.3. Поисковая система Rambler 13
2. Метапоисковые машины 16
2.1. Метапоисковая машина Metacrawler 16
3. Поисковые программы на вашем компьютере 18
3.1. Copernic 20
3.2. Wanderer 23
4. Сложный поиск в интернет 24
5. Алгоритм поиска информации в сети 28
Заключение 30
Список литературы 31
Как известно, Интернет называют Глобальной Информационной Системой. Однако куда чаще со страниц компьютерной прессы слышится куда менее почетное определение — Глобальная Информационная Свалка.
И в чем-то скептики правы.
Ведь собрать информацию, накопить ее — это даже не полдела. Скорее — десятая часть. А главная задача — структурировать ее, обеспечить быстрые возможности поиска и доступа к любым нужным сведениям. Этот принцип лежит в основе любой базы данных, любого собрания информации.
Но только не в основе Интернет.
Много лет назад один великий слепец (нет, не Гомер, а Хорхе Луис Борхес) в одном из своих рассказов описал немыслимый кошмар: безграничную Вавилонскую библиотеку, которая хранит в себе все книги, которые когда-либо были и будут написаны на всех языках мира. Все возможные сочетания букв всех алфавитов.
Среди бесконечного множества томов можно найти все что угодно. Историю вашей жизни, точную хронику конца Света и даже подлинное имя Бога. Но в том-то все и дело, что найти нельзя ничего — каталог библиотеки, конечно, существует, но он затерян в бесконечной книжной массе .
Борхес и не подозревал, что его рассказ столь точно предугадает судьбу тогда еще не существовавшей сети Интернет .
Свобода Сети, доступность и простота размещения информации и полная независимость серверов друг от друга помогла Интернет стать явлением всемирного масштаба. Но она же и превратила Сеть в хаос .
1. Поисковые системы
Все инструменты поиска, описанные в предыдущих главах, сами по себе неплохи.
Более того — они очень удобны!
Но не стоит слишком рассчитывать на их таланты и умения. Ведь все «готовые» подборки ссылок, независимо от их размера и структуры, пригодны лишь в качестве инструментов для грубого поиска. То есть — очертить границы интересующего нас района Сети можно, а вот нанести точечный удар, обнаружить на «карте» Паутины не город, не деревню, а крохотный пригорок.
Подумайте, — ведь чаше всего мы с вами ищем в Сети не абстрактный сайт, будь он хоть трижды специализированным, а конкретную информацию, участок текста, содержащий нужные нам сведения.
1.2. Поисковая система Yandex
Когда-то эта «искалка» едва ли не в одночасье лишила королевского титула знаменитого Рэмблера — и сегодня именно она продолжает оставаться самой модной и умелой поисковой системой в русской Сети. В частности, Яндекс — едва ли не единственный поисковик, способный отыскать информацию на страничке, проживающей в каком-нибудь «виртуальном городе» типа Narod.r*.
В поисках информации Яндекс отнюдь не ограничивает себя территорией Российской Федерации: система с легкостью отыскивает сайты, расположенные в доменных зонах республик бывшего СССР. А иногда — и вовсе за пределами постсоветского пространства.
Основным достоинством Yandex является способность находить заданные слова независимо от формы, в которой они употребляются в документах. Интересно, что система может образовывать словоформы даже для тех слов, которых нет в словаре. Система поддерживает логические операции И, ИЛИ и НЕ, логические группы, поиск по фразам, причем действие операторов И и НЕ может распространяться как на один абзац, так и на весь документ в целом. Поиск может вестись как по всем формам ключевых слов, так и по конкретно заданной форме. Возможно определение расстояния между словами с учетом их порядка, указание различной значимости ключевых слов, а также использование уточняющих слов. Специальный поиск можно вести по заголовкам документов и находящимся в них ссылкам. Кроме того, имеется возможность попросить систему найти документы, схожие с наиболее приглянувшимися вам из найденных по предыдущему запросу. Можно также ограничить поиск уже найденными документами. А в том случае, если нужные документы не будут найдены, можно продолжить поиск через AltaVista, куда автоматически передается уже обработанный системой запрос. Поиск в различных кодировках дает одинаковый результат.
1.3. Поисковая система Rambler
На протяжении всей книги автор только и делал, что без конца критиковал этот сервер, — хотя только из уважения к стажу и пионерству последнего к нему следовало бы относиться гораздо более почтительно.
Рэмблер — типичный сервер типа «все в одном флаконе». Здесь вы найдете громадное количество поисковых сервисов: и знаменитый каталог-рейтинг Rambler Top 100, и отдельные каталоги по таким темам, как сетевые магазины, подарки, здоровье, работа, право, компьютеры, и службы поиска файлов, и отличную справочную систему по различным вопросам .
2. Метапоисковые машины
Как мы видим, каждый вид поисковых механизмов имеет свои достоинства и недостатки. Каталоги лучше справляются с поиском сайтов, поисковики — страничек.
Да и самих серверов не так уж мало: одних только поисковиков в мире насчитывается несколько десятков. И попробуй тут сделать выбор, если одна удобнее по интерфейсу, другая лучше ищет, третья тщательнее сортирует.
Потому редко кто из пользователей Интернет ограничивается одним поисковиком — даже той же знаменитой AltaVista или Google. Большинство же, не отловив нужной ссылки ни на одном из лидеров, начинают лихорадочно перебирать поисковик за поисковиком. А вдруг отыщется?
Однако запускать одну за другой несколько поисковых машин — не самое лучшее решение. Ведь в итоге вы получите несколько громадных списков результатов с большим количеством повторов. Да и открывать для этого несколько окон Internet Explorer не слишком удобно. А сколько драгоценного времени теряется!
Именно поэтому все большую популярность в Сети завоевывают поисковики третьего типа — так называемые метапоисковые (или мультипоисковые) машины. Сами по себе они ничего не ищут, их задача другая - переадресовать ваш запрос на как можно большее число поисковых машин (как каталогов, так и «пауков»), а затем суммировать полученное, удаляя дублирующие друг друга записи.
2.1. Метапоисковая машина Metacrawler
Один из лидеров метапоиска в западном сегменте Интернет. Позволяет отправить запрос сразу на полтора десятка(!) крупнейших поисковиков и каталогов:
• Yahoo
• AltaVista
• Lycos
• DirectHit
• WebCrawler
• Excite
• Find What
• GoTo.com
• Internet Keywords
• Kanoodle
• MetaCatalog
• LookSmart
• Sprinks by About
Понятно, что имена большинства этих сайтов (кроме первой четверки) мало что скажут не только новичкам, но и большинству пользователям со стажем. Однако «халявы много не бывает» — почему бы заодно не пошерстить в этих укромных уголках, ежели система дозволяет? Переключившись в режим «расширенного поиска» (advanced search), вы, впрочем, можете уточнить, каким именно поисковикам вы доверите обработку своего запроса.
Разумеется, Metacrawler не будет вываливать вам весь массив ссылок с каждого поисковика, ограничившись «первой тридцаткой». Кстати, точное количество ссылок с каждого ресурса можно установить здесь же, в меню расширенного поиска.
При использовании нескольких ключевых слов Metacrawler может работать в режиме поиска страниц, содержащих все слова (all), любое из указанных слов (any) или словосочетание целиком (phrase).
3. Поисковые программы на вашем компьютере
Поисковые машины, каталоги, рейтинги, архивы ссылок. Все — чертовски уникальны, безумно незаменимы и раздражающе полезны. И шагу без них, кормильцев, не ступить! Да только вот ведь какая закавыка получается — много их, помощников, развелось. Слишком много. И каждый со своими особенностями и изюминками.
4. Сложный поиск в интернет
Помимо использования уже знакомых нам форм «расширенного поиска» существует другой, значительно более гибкий и профессиональный метод: создание «запроса-формулы», разделяя слова специальными логическими операторами. Эти команды-разделители в профессиональной среде называются «операторами Буля» — термин из области высшей математики. И действительно — наш «сложный запрос» будет очень похож на математическую формулу: в нем можно использовать даже скобки!
У разных поисковых серверов существует свой собственный язык запросов, с использованием самых различных операторов. Чаще всего в «сложном поиске» задействуются следующие операторы:
AND — «и». Этот оператор подразумевает, что в искомом документе обязательно должны содержаться все слова, которые оператор разделяет в запросе. При этом совершенно безразлично, стоят ли они рядом или находятся в разных частях документа:
Пример: (electronic music) software
Как правило, логическому «И» в запросе соответствует простой пробел между словами, однако в большинстве случаев вместо пробела можно использовать знак & или +:
electronic & music
Учтите, что знаки + и — в запросе размещаются не так, как в математической формуле: перед любым из них обязательно ставится пробел, а вот с последующим словом они должны находиться в близком соседстве:
Beatles +Lennon Компьютеры +железо
OR - «или». В документе должно находиться хотя бы одно слово из тех, которые разделяет этот оператор.
Пример: (klinton AND scandal) OR monica
Эквивалент — знак |
Пример: klinton +scandal | monica
NOT - «без». Подразумевает, что выбраны будут все документы, содержащие слово перед этим оператором, но исключая содержащие слова после него.
Этому оператору соответствуют знаки — или ~ beatles +lennon — mccartney реферат +педагогика —социальная
NEAR— «близко». Подразумевает, что слова, разделенные этим оператором, должны находиться максимально близко друг от друга. Например, запрос «компьютерная NEAR пресса» позволит вам получить список страниц, на которых встречается именно СЛОВОСОЧЕТАНИЕ «компьютерная пресса».
Эквивалент — знак &&
социальная && педагогика
Можно, правда, поступить и проще — заключив нужное вам словосочетание в кавычки, вы ясно дадите ПОНЯТЬ ПОИСКОВОЙ системе, что искать следует именно словосочетание, а не комбинацию двух слов.
«военный» оператор используется в тех случаях, когда вам необходимо «заострить» запрос: он укажет поисковику, что разделенные им слова должны располагаться в пределах одного абзаца. Так, по запросу социальная —педагогика будут найдены все страницы, в каждом абзаце которого НЕ встречаются слова «социальная» и «педагогика». В разных абзацах — пожалуйста, на этот счет ограничений нет. А вот если вы используете запрос
социальная ~ педагогика
социальная — педагогика
то в результатах будет напрочь исключена возможность появления этих слов в одном документе.
Помимо операторов, при формировании запроса часто используются и специальные символы, позволяющие уточнить запрос либо, наоборот, предоставить поисковику большую свободу.
5. Алгоритм поиска информации в сети
Теперь, познакомившись с основными группами поисковых ресурсов Сети, самое время сесть и, аккуратно разложив перед собой полученные информационные обрывки, постараться сложить их в единую картину. В четкий и выверенный алгоритм поиска информации в Сети.
Поиск группы сайтов по интересующей теме. Для такой нехитрой операции проще всего воспользоваться каталогом, информация в котором представлена в максимально удобной для пользователя форме. Для ускорения работы воспользуйтесь поиском по каталогу, набрав нужные ключевые слова или их сочетания в строке поиска.
Для поиска больших информационных ресурсов, таких как сайты крупных компаний, известные сетевые средства массовой информации и так далее, проще всего воспользоваться каталогом Rambler (для русскоязычных ресурсов) или Yahoo (англоязычные ресурсы).
Если вы желаете получить доступ к самым известным и популярным ресурсам по той или иной теме, отправьтесь в гости к одному из популярных рейтингов, — например, Rambler Top 100. В том случае, если вы не хотите ограничиваться крупными сайтами, и желаете выделить лучшие персональные сайты и странички, созданные любителями, воспользуйтесь услугами рейтингов типа Spylog или того же List.r*.
Если же сфера ваших интересов охватывает сразу несколько смежных тем или достаточно широкую область знаний, вы можете сделать своим каждодневным инструментом отдельные тематические каталоги сайтов Сети. Адреса таких каталогов вы можете найти, в частности, в каталоге поисковых систем Search Kit.
Поиск отдельных сайтов. В этом случае, помимо уже знакомых вам инструментов поиска, можно прибегнуть к помощи локальных коллекций ссылок, расположенных на любом сайте по интересующей вас теме. В качестве дополнительного средства можно воспользоваться метапоис-ковыми системами типа Metacrawler — они помогут вам снять «сливки» с результатов, выдаваемых крупнейшими поисковыми системами.
Поиск отдельных страниц. Для тех, кто ищет в Сети ответ на конкретный вопрос или определенный текст основным инструментом должны стать поисковые системы, выдающие результаты с высокой степенью релевантности. В Рунете лучшим поисковиком такого типа является Hndex, а желающим поискать информацию на англоязычных страницах придется выбирать между AltaVista и Google.
Однако самым предпочтительным, по мнению автора, будет использование поисковых программ, позволяющих не только осуществлять тематический поиск, но и обрабатывать результаты из множества поисковых и метапоисковых систем. Лучшей поисковой программой для англоязычной части Сети пока что остается Copernic, российские же пользователи имеют в своем распоряжении отличную программу Search+ .
Поиск справочной информации. Не забывайте о возможностях «электронных версий» традиционных справочных изданий — энциклопедий, словарей. Телефонных книг, наконец! Порой именно они могут стать для вас главным источником справочной информации, в противовес «рыхлым» и малодостоверным сайтам. Там, где нужна точность и не слишком важна оперативность, энциклопедии по-прежнему вне конкуренции.
И последнее: каким бы видом поиска вы не пользовались, старайтесь грамотно формулировать ваш запрос и выбирать правильные ключевые слова. В особо ответственных случаях используйте возможности сложного поиска, применяя специальные логические операторы.
Почему web сайт действительно может стать действенным инструментом распространения информации о компании и ее бизнесе?
Полноценный Интернет-сайт компании может предоставить всем желающим документы, фото, аудио - и видеоматериалы, необходимые для формирования правильного представления о деятельности и возможностях компании.
В рамках интернет ресурса можно мгновенно поставить в известность миллионы пользователей (например, акционеров или инвесторов) о новых продуктах или услугах, событиях или документах.
Посещаемость среднестатистического корпоративного ресурса составляет 100 уникальных посетителей в день, осуществляющих поиск различной информации в Интернете, или около 2500 посетителей в месяц, с учетом выходных и праздничных дней, когда посещаемость традиционно ниже, чем в будни. Не каждая компания в месяц раздает столько рекламных материалов. При сравнительно низкой себестоимости рекламы компания получает мощное средство продвижения на рынке.
После публикации web сайт становится доступен пользователям Интернет всего мира. Это означает, что посетители из регионов, где отсутствует представительство вашей компании, в результате поиска информации в Интернет окажутся на вашем сайте. Если вы позаботились о переводе контента на разные языки, то в поиске нужной информации, к вам придут пользователи из других стран.
1. Плющев Александр. Полный Плющев. Интернет на каждый день СПб.: Питер, Коммерсантъ, 2007. – 416с.
2. Жвалевский Андрей, Кондратьев Геннадий. Интернет без напряга СПб.: Питер, 2007. – 352с.
3. Леонтьев В. П. Новейшая энциклопедия Интернет 2004 М.: Олма-Пресс, 2004. – 784с.
4. Ашманов И., Иванов А. Продвижение сайта в поисковых системах М.: Вильямс, 2007 . – 304с.
5. Леонтьев Виталий. Большая энциклопедия компьютера и Интернета (Новая) М.: Олма Медиа Групп, 2006. – 1084с.
6. Аксак В. А. Новейшая энциклопедия Интернет М.: Новейшая энциклопедия Издательство: Эксмо, 2007. – 912с.
Закажите авторскую работу по вашему заданию.
- Цены ниже рыночных
- Удобный личный кабинет
- Необходимый уровень антиплагиата
- Прямое общение с исполнителем вашей работы
- Бесплатные доработки и консультации
- Минимальные сроки выполнения
Мы уже помогли 24535 студентам
Средний балл наших работ
- 4.89 из 5
написания вашей работы
У нас можно заказать
(Цены могут варьироваться от сложности и объема задания)
682 автора
помогают студентам
42 задания
за последние сутки
10 минут
время отклика
Информационные поисковые системы в Интернет.
Контрольная работа:
Назначение и основные понятия поисковых систем в Интернете. Понятие и субъекты электронного документооборота
Курсовая работа:
Реклама в интернете
Дипломная работа:
Функциональные возможности информационно коммпьютерных средств в обучении обществознанию и праву
Курсовая работа:
Применение информационных коммуникативных технологий в психологическом образовании.