Оргтехника

Вид информационных ресурсов преобладающий в сети интернет. Виды информационных ресурсов в Internet. Создание и настройка FTP-сервера на примере FileZilla Server

Основные типы информационных ресурсов Интернет.

Оформление заказа;

ТЕМА ПОИСКОВАЯ МАШИНА ИНТЕРНЕТ. пРАВИЛА поиска информации.

Структурно-функциональная организация типовой поисковой машины Интернет.

Простой и расширенный поиск информации в Интернет.

Тема 3 Информационные ресурсы интернет (4 ч.)

Основные типы информационных ресурсов Интернет.

Принцип построения групп Usenet.

Информационная система Gopher.

Система архивов FTP и их структура.

Распределенная гипертекстовая информационная система World Wide Web.

Основные типы информационных ресурсов Интернет.

Классификация источников информации в Интернете может проводиться по разным основаниям.

По способам представления информации могут быть выделены следующие виды:

Web-страницы - наиболее распространенный и используемый из информационных ресурсов. Этот ресурс представляет собой страницы гипертекста. Страницы наряду с текстовой могут содержать графическую, звуковую, видеоинформацию;

Файловые серверы представляют собой реализацию в Интернете традиционного способа представления информации;

Телеконференции могут являться важным источником информации. Они разбиваются на группы (рубрики) по тематике. Участвующие в телеконференциях могут написать свое сообщение или послать комментарии на чужое сообщение;

Базы данных могут быть доступны через сеть Интернет. В них часто содержатся, кроме текстовой, также и другие виды информации.

Информационные ресурсы также могут быть разделены по языковому признаку. В сети Интернет представлены практически все основные языки, однако главным языком в силу исторически сложившихся традиций является английский. Ряд сайтов представляет информацию на нескольких языках.

В сети имеет место классификация и по территориальному признаку. Ряд сайтов предоставляет свою информацию для потребителей определенного региона, хотя доступ к сайту возможен и из любой точки сети.

Наиболее важным аспектом классификации информационных ресурсов сети Интернет является содержание информации. Деловая информация, необходимая в предпринимательской деятельности, по этому критерию может быть разделена на следующие группы.

1. Сведения о фирмах, организациях. Эта группа сведений существенно различается по своему наполнению для различных организаций. Различия определяются степенью освоения организацией возможностей Интернета по продвижению продукции или услуг. Различают три типа серверов данной группы (категории):

Серверы присутствия в Интернете. Они могут быть разделены на рекламные и информирующие. Рекламный сервер обычно содержит одну или несколько страниц. Информирующий сервер содержит более подробную информацию о фирме и производимой ею продукции или оказываемых услугах;

Информационные серверы. Целью этих серверов является предоставление различного рода информации потребителям. Серверы данной группы ведут информационно-аналитические агентства и другие структуры, в том числе государственные, чья деятельность связана с предоставлением различного рода информации потребителям;

Интерактивные магазины. Серверы этой группы обеспечивают продажи товаров посредством Интернета. При этом могут быть реализованы в электронном виде следующие функции:

Предоставление клиенту необходимой информации о товаре или услуге;

Оформление заказа;

Оплата заказа (при использовании онлайновых платежных систем);

Отправка полученного товара, если товаром является информация.

2. Сведения о состоянии мировой экономики и экономики отдельных стран. Данная информация представлена достаточно широко в профессиональных базах крупнейших информационно-аналитических агентств мира. Серверы этих агентств входят в состав информационных ресурсов сети Интернет. Однако сама информация, как правило, платная. Информация о состоянии национальной экономики обычно размещается на серверах государственных структур, отвечающих за государственную поддержку экономики, государственных статистических органов, различных экономических институтов.

3. Сведения о состоянии отраслевых рынков. Анализ отраслевых рынков осуществляют специализированные маркетинговые и консалтинговые агентства, а также маркетинговые службы фирм или организаций. Результаты этих исследований, используя Интернет, можно получить:

Из профессиональных баз крупнейших мировых информаци-онных агентств, найдя сведения о технологиях доступа к этим базам на сайтах Интернета;

В самих консалтинговых или маркетинговых агентствах, чьи сайты также представлены в Интернете;

В многопрофильных и отраслевых журналах, публикующих обзоры рынков. Одни издания, например многопрофильный журнал «Эксперт», представляют на сайтах оглавления номеров журналов. Другие, как, например, журнал «Профиль», размещают в открытом доступе публикуемые материалы.

4. Деловые новости. Подавляющее большинство мировых информационных агентств предоставляют потребителям доступ к профессиональным базам, содержащим деловые новости. Из зарубежных агентств крупнейшими поставщиками деловых новостей являются LEXIS-NEXIS, Dialog, Reuters. Среди отечественных агентств следует выделить:

- «Интегрум-Техно», предоставляющий доступ к материалам 250 центральных и крупнейших региональных газет, а также к зарубежным новостям;

РИА «Новости» - государственное информационно-аналитическое агентство РФ;

- «ИТАР-ТАСС» - государственное информационное телеграфное агентство РФ;

Агентство «Интерфакс», входящее в состав международной информационной группы Interfax Information Services.

Интернет предоставляет бесплатный доступ к ежедневной электронной интернет-газете «Gazeta.ru». Ряд крупнейших газет имеют в Интернете электронные версии. Доступ к некоторым из них платный, например к электронным версиям печатных изданий Издательского дома «Коммерсантъ». К другим, например к электронной версии газеты «Аргументы и факты», - бесплатный.

5. Справочная информация представлена в сети Интернет весьма широко. Это и списки web-сайтов компаний, отобранных по определенному принципу, и телефонно-адресный справочник «Желтые страницы» с возможностью поиска информации по названию фирмы и виду деятельности, и телефонные справочники городов Российской Федерации, стран СНГ и Балтии. Также в Интернете имеется информация о расписании движения поездов, авиарейсов, о погоде и многое другое.

В настоящее время интенсивно развивается Интернет - компьютерная сеть, охватывающая весь мир. В архивах свободного доступа сети Интернет можно найти информацию по всем сферам человеческой деятельности, начиная с новых научных открытий до прогноза погоды на завтра. Кроме того, Интернет предоставляет уникальные возможности дешевой, надежной и конфиденциальной глобальной связи по всему миру.

Пользователи Internet получают информацию в виде гипертекста, являющегося основным способом представления данных. Термин Гипертекст, применяемый в последнее время в сочетании с прилагательным мультимедийный, означает документ, содержащий текстовые, звуковые и изобразительные фрагменты. Особенностью такого документа является наличие выделенных ключевых слов, всякого рода кнопочек и иконок, щелчки по которым воспроизводят соответствующие фрагменты, которые могут и не входить в состав данного документа, а находиться в памяти другого компьютера. Выделенные поля, активизация которых вызывает отображение следующих кадров, представлены в гипертекстовом документе ссылками на соответствующий фрагмент в пределах файловой системы данного компьютера или адресами URL для вызова недостающих компонентов из сети. Идеи гипертекста в том или ином виде присутствуют в различных справочных системах, в частности в системе помощи Windows всех версий (Help-система). Для описания гипертекстовых документов в Internet используется специальный язык HTML - HyperText Markup Language. Таким образом, можно сказать, что гипертекст - это многостраничная информация различного вида, связанная в различных страницах многочисленными ссылками.

Несмотря на то, что современные навигаторы «понимают» наиболее распространённые протоколы, в сетях постоянно возникают новые изобразительные средства. Навигаторы начинают разбухать, но угнаться за валом этих нововведений они не могут. Поэтому в 1994 возникла идея создания алгоритмического языка интерпретирующего типа, на котором можно было бы писать «проигрыватель» документа любого формата. Так в мае 1995 в компании Sun Microsystems появился язык Java, интерпретаторы с которого были реализованы на большинстве вычислительных платформ сети Internet. На этом языке пишутся приложения для Internet - апплеты, которые могут исполняться на любом компьютере, снабжённом Java-интерпретатором.

В настоящее время Internet не является отдельной сетью – на самом деле это сообщество сетей (именно поэтому Internet называют "сетью сетей"), в которое сейчас входит более 2 миллионов компьютеров во всем мире. И если вы подключены к сети, являющейся частью Internet, то вы имеете доступ к ресурсам любого из них.

Все программное обеспечение, которым можно пользоваться для работы в сети Интернет, можно поделить на две части. Это телекоммуникационные пакеты и абонентское программное обеспечение для работы в сети Интернет.

Телекоммуникационные пакеты используют для подключения к хосту сети, пользуясь обычными телефонными линиями. При этом пользователю предоставляется возможность работы на одном из хостов сети в режиме online, т.е. он может пользоваться всеми ресурсами узла сети так, как если бы он работал на его терминале.

Абонентское программное обеспечение обеспечивает обслуживание процессов получения и просмотра информации абонентом сети Интернет. Среди огромного количества программ этого назначения наиболее широко известны web-обозреватели Internet Explorer, Opera и Mozilla, пакеты обслуживания почты и новостей Eudora, службы Microsoft Outlook, Outlook Express и др.

Информационный ресурс - это данные в любом виде, которые можно многократно использовать для решения проблем пользователей. Например, это может быть файл, документ, веб-сайт, фотография, видеофрагмент. Для информационных ресурсов в Интернете характерно определённое время жизни и доступность более чем одному пользователю.

Также информационным ресурсом можно назвать отдельно взятый сайт, портал или несколько интернет-проектов. Информационный ресурс в Интернете может быть узкой (специализированной) направленности (например онлайновый словарь или сайт биржевых новостей), или общетематический.

Поиск информации в Интернете

Если ваш компьютер имеет подключение к Интернету и на нем установлена программа просмотра web-страниц – браузер (например, в операционной системе Windows стандартное приложение Интернет Explorer), то у вас есть возможность поиска информации в Интернете из любого места на компьютере. Такая возможность обеспечивается наличием в Интернете поисковых серверов.

Поиск в сети – непростое занятие, которое зачастую занимает много времени и не приводит к желаемому результату. Причины затруднений при поиске информации в сети разнообразны и зависят как от личности «следопыта», так и от наличия и принципа организации данных в сети Интернет. Начиная поиск, необходимо понимать, во-первых, что Вы хотите найти, во-вторых, основные принципы работы в глобальной сети.

Поисковыми серверами называют выделенные компьютеры, которые автоматически просматривают все ресурсы Интернета и индексируют их содержание.

Затем вы можете передать такому серверу фразу или набор ключевых слов, описывающих интересующую вас тему, и сервер возвратит вам список ресурсов, соответствующих вашему запросу. Таких серверов существует довольно много, например: Google (www. google .com ), Yahoo! (www.yahoo.com); российские поисковые серверы: Rambler (www.rambler.ru ), Яндекс (www.yandex.ru ) и др. Если в Интернете есть информация, которая вас интересует, то ее наверняка можно найти при помощи поисковых серверов.

Задавая образ поиска в поисковой системе, следует иметь в виду, что алгоритмы поиска информации в сети , подобно поиску информации в базе данных, основаны на логике. Перед вводом запроса нужно его обдумать. Чем конкретней задана тема поиска, чем уникальней сочетание слов, тем больше вероятность получения верного, быстрого и лаконичного ответа. Необходимо обратить внимание на необходимость использования поискового языка . Разные поисковые системы «говорят» на сходных языках, но имеют свои «диалекты». Один и тот же поисковый запрос (сочетание слов, отвечающее интересующей Вас информации) в разных поисковых системах может быть понят по-разному. Знакомясь с поисковыми системами, необходимо обратить внимание на ввод специальных символов, с помощью которых можно отмечать слова, которые ОБЯЗАТЕЛЬНО должны присутствовать в результатах поиска (обычно это знак +) или, которые НЕ ДОЛЖНЫ БЫТЬ среди результатов (обычно это знак -) . Это поможет быстрее найти данные.

1. Несколько ключевых слов, разделенных пробелом, соответствуют операции логического сложения: ИЛИ (OR). Например, указав ключ: <Школьная информатика>, мы получим список всех документов, в которых встречается слово «Школьная» или слово «информатика».

2. Несколько слов, заключенных в кавычки, воспринимаются как единое целое. Например, «Школьная информатика».

3. Знак + между словами равносилен операции логического умножения: И (AND). Указав в запросе ключ <Школьная + информатика>, получим все документы, в которых имеются эти два слова одновременно, но они могут быть расположены в любом порядке и в разброс.

Нахождение информационных ресурсов в каталогах . В каталогах Интернета хранятся тематически систематизированные коллекции ссылок на различные сетевые ресурсы, в первую очередь на документы World Wide Web. Ссылки в такие каталоги заносятся не автоматически, а их администраторами. Занимающиеся этим люди стараются сделать свои коллекции наиболее полными, включающими все доступные ресурсы на каждую тему. В результате пользователю не нужно самому собирать все ссылки по интересующему его вопросу, но достаточно найти этот вопрос в каталоге - работа по поиску и систематизации ссылок уже сделана за него.

Каталоги обычно имеют древовидную структуру и похожи на очень большой список закладок. Когда World Wide Web только начинала развиваться и ее серверы еще можно было пересчитать, некоторые пользователи вели их списки. Со временем WWW-серверов становилось все больше, каждый день появлялись новые, и механизма закладок стало недостаточно для того, чтобы хранить эту информацию. Некоторые пользователи WWW стали создавать специальные программы для поддержания базы данных по ссылкам на ресурсы Интернета, ее автоматической синхронизации и управления ею. Именно так и родились глобальные каталоги сети, как, например, Yahoo! (www.yahoo.com), Lycos (www.lycos.com) , российский каталог ресурсов List (www.list.ru) и др.

Как правило, хорошие каталоги сети Интернет обеспечивают разнообразный дополнительный сервис: поиск по ключевым словам в своей базе данных, списки последних поступлений, списки наиболее интересных из них, выдачу случайной ссылки, автоматическое оповещение по электронной почте о свежих поступлениях.

Существуют также специализированные поисковые серверы:

1. Поиск E-mail, адресов и людей/компаний: Fourl I Directory, Lookup, Nynex Inreactive Yellov Pages for business, Phone Directory.

2. Поиск программного обеспечения: FTP Search, Snoopie, Jumbo.

3. Поиск в телеконференциях: DejaNews.

4. МЕТАПОИСК-универсальный метод поиска: SavvySearch, All-in-One Search Page, Metasearch, Searchers, Starting Pointmetasearch, W3 Search Engines.

На многих информационных серверах имеются ссылки на такие поисковые серверы.

Поиск информации на отдельном web-узле. Каждому пользователю Интернета часто приходится решать задачу поиска информации на отдельном web-узле. Если вы связываетесь с Интернетом через модем, то, очевидно, что чем больше вы тратите времени на поиски, тем дороже стоит получаемая информация. Следовательно, умение быстро разобраться в структуре узла и способах навигации (т.е. путей перемещения с одной web-страницы узла на другую) становится полезным навыком.

Для быстрого поиска информации на web-узле можно предложить следующие варианты:

а) путем начального задания адреса вручную в строке URL(Адрес) или выбора документа из списка истории браузера (программы просмотра web-страниц), если таковая уже накоплена;

в) по каталогам узла с помощью обрезания строки ранее введенного адреса (URL), последовательно поднимаясь от каталога к каталогу вверх к корню сервера.

Один из самых эффективных способов ускорения работы с web-страницей - это активное использование средств автоматического поиска. Такой подход особенно практичен для многоэкранных страниц с информационных узлов, когда визуальное ознакомление с материалом становится слишком трудоемким. Поиск на странице можно произвести по терминам, введенным в специальный поисковый шаблон, который активизируется в браузерах клавишами Ctrl+F или через меню Правка-Поиск на этой странице или нечто подобное.

Примечания :

1. Поиск на web-странице всякий раз проводится вверх или вниз по странице в зависимости от указания направления в шаблоне, начиная с начала (если вниз) или с конца документа (если вверх), независимо от того, какая часть страницы отображается на экране на момент начала поиска.

2. Допустимо введение в шаблон не только единичного термина, но и фразы, что делается одной строкой без использования специального синтаксиса. Специальная пометка в шаблоне позволяет искать с учетом регистра символов.

3. Найденное слово или фраза выделяются в тексте, и происходит автоматическое перемещение к их местоположению, однако выделенное поле не всегда можно наблюдать.

4. Если при старте поиска уже есть выделенная область текста, то поиск начинается именно с нее в заданном в шаблоне направлении, само содержимое выделенного поля участия в поиске уже не принимает, так же как и оставшаяся часть страницы. Отметим, что всякий раз, когда поисковая процедура закончена, на странице остается выделенная область текста, соответствующая последнему совпадению. Если необходимо выполнить поиск с новыми терминами, то следует сначала снять уже существующее выделение кликом мыши в любой точке текста, иначе в новом поиске будет участвовать только часть страницы вверх или вниз от выделенной области в зависимости от направления, заданного в шаблоне.

5. Надписи, выполненные в графике, не откликаются на поисковые запросы.

На многих серверах предусмотрена страница, которая предлагает более детальное изложение его содержания, чем основное меню. Такая страница называется «Карта сервера» («Sitemap»).

Аналогично используют функцию поиска по странице для того, чтобы найти ссылку на локальную поисковую машину, если она организована разработчиком узла. Тогда после нажатия Ctrl+F следует ввести в шаблон слово «поиск» («search»), и ссылка будет найдена в течение секунды.

Еще одно замечание сделаем относительно возможности еще до нажатия на гиперссылку отследить адрес (URL), по которому она осуществит переход. Когда указатель мыши встает на ссылку (без нажатия), то в строке состояния браузера появляется соответствующий адрес. Эту информацию можно использовать для предварительной оценки целесообразности такого перехода, она также полезна и в случае применения разработчиком специальной графической карты гипертекстовых ссылок (UsemapClientSide), когда отдельные фрагменты сомкнутой воедино картинки могут являться ссылками на различные ресурсы.

Работая в сети Интернет, не забывайте, что Вы имеете дело как с людьми, так и с машинами. Причем не в самом лучшем проявлении тех и других. Люди часто оформляют информацию так, как им нравится, а не так, как многим удобно. А машины БУКВАЛЬНО разыскивают те слова, которые Вы им задаете, не понимая, что, например, по запросу «клетка» следует искать клетки для канареек.

Глобальная сеть – очень подвижная система, которая постоянно меняется и по структуре, и по содержанию. Там, где сегодня Вы нашли массу интересной информации, завтра Вы ее можете не увидеть. Адреса сайтов могут со временем изменяться.

Путеводитель по интернет ресурсам (п римеры информационных ресурсов сети Интернет):

Поисковые системы.

Справочно-правовые системы

Информационные центры и агентства

Агентство социальной информации (http://www.asi.org.ru/)

Открытое информационное агенство (

    Две последние рубрики, представляют собой основу путеводителя РНБ. Опыт показал, что именно эти рубрики пользуются наибольшим вниманием пользователей, и поэтому их развитию придается особенное значение. "Периодика" включает в себя перечень web-станций, содержащие полные тексты статей либо бесплатно, либо после регистрации (WebMedLit, Medscape, Ideal и др.) и издательства, частично предоставляющие полные тексты (Wiley, Laser, Springer), список полнотекстовых журналов в алфавите названий и по темам. Здесь же помещена небольшая памятка "Как самому найти статью из журнала".

    Учитывая значительный объем данных в последней рубрике, для нее было разработано стандартизированное описание. За основу взят ГОСТ 7.70-96 "Описание баз данных и машиночитаемых информационных массивов", который был переработан и адаптирован к БД on-line. В результате были получены следующие поля для их описания:

    1. Наименование БД (имя, адрес).

    2. Версия (сведения о версии – выпуске, редакции, генерации или иной модификации БД, включая дату создания).

    3. Владелец (сведения о юридической или физическом лице, обладающем правами собственности на БД).

    4. Основание прав собственности (вид основания права собственности на БД).

    5. Ограничение прав (указывают ограничения прав владельца на дальнейшую продажу (передачу) БД).

    6. Тип БД (указание на общий характер содержания и организции БД. Указывают одно из значений перечня любого уровня): документальная, фактографическая, лексикографическая гипертекстовая

    7. Тематика (область деятельности, отрасль народного хозяйства, научная дисциплина).

    8. Тип объекта (указание на типы объектов, представленных в БД).

    9. Источник данных (указание на характер источников, используемых для наполнения БД, с точки зрения их официальности; степень официальности определяет и степень достоверности данных)

    10. Естественный язык (указание на естественный язык (языки), используемый для предоставления текстовых данных в БД)

    11. Число записей (число описанных в БД объектов).

    12.Число элементов данных (число элементов данных, информационных элементов, характеристик и т.п., объявленных для описания одного объекта).

    13. Период обновления (период времени между очередными актами пополнения (обновления) БД) и интенсивность обновления (объем изменения (пополнения) БД за какой-либо период).

    14. Протокол теледоступа (сведения о протоколе телекоммуникационного доступа для обращения к БД).

    15. ИПЯ (сведения о типах и наименованиях языковых средств, используемых в БД для выражения основного содержания документов, содержания информационных запросов и описания фактов в целях последующего поиска).

    16. Грамматические средства (сведения о грамматических средствах, используемых для формирования поискового образа документа и запроса).

    17. Цены (прейскурант информационных услуг).

    18. Расписание доступа (расписание доступа к БД).

    19. Примечания (дополнительные сведения о БД).

    Примеры записи в путеводителе:

    Стандарты ИСО

    http://www.iso.ch

    Владелец – Международная организация по стандартизации. Тип БД – документальная, гипертекстовая. Тематика – технические науки. Тип объекта – описание стандартов. Источник данных – официально-публикуемые документы. Естественный язык базы – английский, французский. Для описания объектов используются следующие поля: номер, название, ключевые слова. База постоянно обновляется. Протокол теледоступа – http. ИПЯ – рубрикатор стандартов, дескрипторный словарь. Доступ бесплатный и круглосуточный.

    Free Medline

    http://www.nlm.nih.gov/databases/freemedl.html

    Владелец базы – Medline Industries, Inc. Тип базы – документальная: реферативная, частично полнотекстовая. Тематика – медицина. Тип объекта – библиографическое описание с аннотацией. Язык базы – английский. Представлено около 9 млн. записей (из 3900 биомедицинских журналов). Число элементов данных – 6 (Источник, автор, название, реферат, организация (принадлежность автора), номер статьи). База обновляется еженедельно. Протокол теледоступа – http, ftp. ИПЯ – язык ключевых слов (простой поиск), сложный поиск имеет 21 поисковый вход. Доступ к базе бесплатный, осуществляется круглосуточно.

    http://chemweb.com/databases/databases.exe

    Ведется ориетировочно с 1998 г. Владелец – Elsevier Science. Тип базы – библиографическая реферативная. Тематика – науки о Земле, экология, геомеханика, человеческая география и океанография. Объекты, представленные в базе – библиографические записи и рефераты из журналов (3 тыс. наим.), из более чем 2 тыс. др. источников (книги, труды конференций, карты и тезисы диссертаций). Источник данных – официальные публикуемые документы. Язык базы – английский. База насчитывает более 600 000 записей, при описании используется 13 полей. Период и интенсивность обновления неизвестны. Протокол доступа – http. ИПЯ – язык библиографических данных. Все записи проаннотированы. Библиографическая информация – бесплатно, доступ – круглосуточно. Примечание: для доступа требуется предварительная несложная регистрация. Для входа в базу выберите в списке на указанной странице Geobase.

    Что касается обновления информации в справочнике "Информационные ресурсы Интернет", то она обеспечивается еженедельным пополнением базы и ежемесячной верификацией существующих в справочнике ссылок.

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Подобные документы

    Интернет - мощное глобальное средство обмена информацией. Классификация источников информации в Интернете. Электронная почта - один из видов информационных услуг, которые предоставляют компьютерные сети. Понятие и особенности телеконференции в Интернете.

    презентация , добавлен 18.04.2012

    Понятие, развитие, формы организации Интернет. Сеть Интернет как информационный канал. Особенности средств массовой информации в глобальной сети, ее функции и возможности. Исследование электронных версий газет и информационных агентств в сети Интернет.

    курсовая работа , добавлен 09.04.2011

    Средства поиска информации в сети Интернет. Основные требования и методика поиска информации. Структура и характеристика поисковых сервисов. Глобальные поисковые машины WWW (World Wide Web). Планирование поиска и сбора информации в сети Интернет.

    реферат , добавлен 02.11.2010

    Рост количества информации в мире, его увеличение в сети Интернет в геометрической прогрессии. Количество сайтов, зарегистрированных в поисковой системе Яндекс. Особенности эффективного поиска информации в сети Интернет. Схема информационных потоков.

    презентация , добавлен 27.08.2013

    Теоретические основы Интернет-технологий и основных служб сети Интернет. Ознакомление с возможностями подключения к сети Интернет. Основные службы сети. Принципы поиска информации в WWW. Обзор современных Интернет браузеров. Программы для общения в сети.

    курсовая работа , добавлен 18.06.2010

    Понятие системы "Интернет", использование, размер сети, количество абонентов и пользователей. Поисковые системы, подход к сбору информации о ресурсах Интернет. Современные поисковые серверы. Работа с каталогами ресурсов, сохранение информации в Интернете.

    реферат , добавлен 02.12.2010

    Особенности поиска информации в Интернет: стратегия и методика. Поисковые машины, каталоги и порталы информационных ресурсов. Подбор и введение ключевых слов. Использование режима "расширенный поиск", который имеет каждая из поисковых систем в Интернете.

    реферат , добавлен 06.08.2014

    Характеристика методов поиска информации в Интернете, а именно - с использованием гипертекстовых ссылок, поисковых машин и специальных средств. Анализ новых интернет ресурсов. История возникновения и описание западных и русскоязычных поисковых систем.

    Если бы моей целью было – написать самую короткую книгу об Интернете, то в этой книге была бы всего одна строчка–

    http://www.yahoo.com

    адрес грандиозную тематического каталога YAHOO.

    Но тема моего реферат – ресурсы Интернет, поэтому опишу основные виды ресурсов сети.

    Развитие сферы сетевых услуг привело к массовому появлению серверов, ориентированных на предоставлении информации по определённой тематике. Появились, например, информационные центры в крупных зарубежных библиотеках, которые перевели большую часть своих фондов в электронный формат и продолжают оперативно вносить в эти архивы новые поступления. Это особенно ценно для наших читателей, т.к. многие отечественные библиотеки влачат жалкое существование. Но библиотечное дело — только капля в информационном океане. Перечень услуг, предоставляемых серверами Internet, достигает нескольких тысяч наименований.

    Глобальная сеть Internet

    Несколько десятков тысяч компьютерных сетей, связанных между собой и объединяющих несколько миллионов пользователей, образуют всемирную паутину World Wide Web (сокращённо WWW). Организационному становлению Web содействовало появление универсальных сетевых навигаторов — браузеров (от англ. browse — пролистывать), таких как Netscape Navigator или Microsoft Internet Explorer. Браузер - это программа, которая запускается на вашем компьютере и обеспечивает работу с сетью Internet. Браузеры обеспечивают доступ к любому пункту сети по 2-разрядному адресу IP, который для удобства разделяют на байтовые компоненты — 192.34.101.23. Так как человеку числовыми адресами пользоваться неудобно, то в навигаторах адрес источника информации задаётся символьным кодом URL (Uniform Resource Locator), по которому сама сеть Internet осуществляет поиск адреса IP. Существует довольно много разных форматов URL:

    http://www.sportsnetwork.com

    ftp://ftp.unt.edu/library

    gopher://ulkyvm.loisville.edu

    Начало URL соответствует используемому протоколу передачи данных. В частности, сокращение http происходит от HyperText Transmission Protocol — протокол передачи гипертекстовых документов.

    Пользователи Internet получают информацию в виде гипертекста, являющегося основным способом представления данных. Термин Гипертекст, применяемый в последнее время в сочетании с прилагательным мультимедийный, означает документ, содержащий текстовые, звуковые и изобразительные фрагменты. Особенностью такого документа является наличие выделенных ключевых слов, всякого рода кнопочек и иконок, щелчки по которым воспроизводят соответствующие фрагменты, которые могут и не входить в состав данного документа, а находиться в памяти другого компьютера. Выделенные поля, активизация которых вызывает отображение следующих кадров, представлены в гипертекстовом документе ссылками на соответствующий фрагмент в пределах файловой системы данного компьютера или адресами URL для вызова недостающих компонентов из сети. Идеи гипертекста в том или ином виде присутствуют в различных справочных системах, в частности в системе помощи Windows всех версий (Help-система). Для описания гипертекстовых документов в Internet используется специальный язык HTML — HyperText Markup Language. Таким образом, можно сказать, что гипертекст — это многостраничная информация различного вида, связанная в различных страницах многочисленными ссылками.

    Несмотря на то, что современные навигаторы «понимают» наиболее распространённые протоколы, в сетях постоянно возникают новые изобразительные средства. Навигаторы начинают разбухать, но угнаться за валом этих нововведений они не могут. Поэтому в 1994 возникла идея создания алгоритмического языка интерпретирующего типа, на котором можно было бы писать «проигрыватель» документа любого формата. Так в мае 1995 в компании Sun Microsystems появился язык Java, интерпретаторы с которого были реализованы на большинстве вычислительных платформ сети Internet. На этом языке пишутся приложения для Internet — апплеты, которые могут исполняться на любом компьютере, снабжённом Java-интерпретатором.

    В настоящее время Internet не является отдельной сетью – на самом деле это сообщество сетей (именно поэтому Internet называют «сетью сетей»), в которое сейчас входит более 2 миллионов компьютеров во всем мире. И если вы подключены к сети, являющейся частью Internet, то вы имеете доступ к ресурсам любого из них.

    Internet — не говоря уже о том, что его появление ознаменовало новую эпоху в развитии коммуникации — позволяет человеку расширить свои познания в любой, даже самой немыслимой, сфере деятельности или исследований. А так как развитию Internet, с одной стороны, способствовали коммерческие организации, фирмы, использующие Сеть для обмена деловой информации и публикации рекламы, а с другой — студенты, помещающие на всеобщее обозрение множество материалов развлекательного характера, то здесь много полезного для себя найдут все – от бизнесменов до любителей со вкусом отдохнуть.

    Спектр услуг в Internet к настоящему времени стал просто необозрим, поэтому начнем с самых известных и доступных.

    Электронная почта

    Один из видов информационных услуг, которые предоставляют компьютерные сети, - электронная почта (E-mail). В этом случае оба абонента - отправитель и получатель - имеют дело с посредниками (провайдерами), выполняющими функции местных отделений почтовой связи. Сервер посредника включен постоянно и на его винчестере официально зарегистрированным абонентам выделены «почтовые ящики» для временного хранения входящей и исходящей переписки.

    Для обеспечения функционирования локальной сети часто выделяется специальный компьютер - сервер, или несколько таких компьютеров. На дисках серверов располагаются совместно используемые программы, базы данных и т.д. Остальные компьютеры локальной сети часто называются рабочими, станциями. На тех рабочих станциях, где требуется обрабатывать только данные на сервере (например, вводить сведения в совместно используемую базу данных о заказах и продажах), часто для экономии (или по соображениям безопасности) не устанавливают жестких дисков. В сетях, состоящих более чем из 20-25 компьютеров, наличие сервера обязательно - иначе, как правило, производительность сети будет неудовлетворительной. Сервер необходим и при совместной интенсивной работе с какой-либо базой данных.

    Иногда серверам назначается определенная специализация (хранение данных, программ, обеспечение модемной и факсимильной связи, вывод на печать и т.д.). Серверы, как правило, не используются в качестве рабочих мест пользователей. Серверы, обеспечивающие работу с ценными данными, часто размещаются в изолированном помещении, доступ в которое имеют только специально уполномоченные люди (как в банковское хранилище).

    Местный сервер, как правило, располагает достаточно качественными каналами связи с одним из узлов сети, входящей в состав Internet. Посредник взимает со своих абонентов небольшую ежемесячную плату и выписывает дополнительный счёт, пропорциональный объёму передаваемой информации (в пределах страны и за её границами действуют разные тарифы).

    Одновременно с регистрацией в местном «почтовом отделении» абоненту сообщается уникальный (с точки зрения местного сервера) электронный адрес и выдаётся специально настроенное программное обеспечение, которое позволяет автоматически установить связь с посредником, за несколько минут получить поступившую в ваш адрес корреспонденцию и отправить заранее подготовленные вами сообщения. На сеанс связи с провайдером можно выйти в любое удобное для вас время. Но длительно не востребованные поступления сервер возвратит отправителю.

    Взаимодействие с программой обслуживания почты очень напоминает работу в текстовом редакторе. Заголовок электронного письма включает три обязательные раздела. Во-первых, это адрес отправителя, который располагается вслед за символами «From:». Такая строка автоматически включается в состав письма почтовой программой. Во-вторых, за ключевым словом «То:» необходимо набрать электронный адрес получателя. В некоторых сетях используются свои форматы для представления адреса. Наиболее распространённый формат электронного адреса в Internet предполагает задание пяти компонент:

    Код_Получателя_Код_ПК.Код_Организации. Код_Города.Код_Страны

    Однако и этот формат допускает отклонения. Например, вместо обычного двухсимвольного кода страны можно встретить код принадлежности к группе учебных заведений (.edu). Также вместо кода страны можно встретить коды принадлежности к коммерческим организациям (.сот)’, американским правительственным учреждениям (.gov); американским военным организациям (.mil)’, к прочим организациям.

    Третья компонента в заголовке, располагаемая вслед за ключевым словом Subject, раскрывает тематику письма. Иногда её используют как дополнение к электронному адресу получателя. Обнаружив, например, в письме строку «Subject: to Sergey», получатель понимает, что в его почтовый ящик положили письмо для приятеля по имени Сергей, который не имеет собственного электронного адреса.

    Письмо, переданное провайдеру, немедленно обрабатывается, и специальная программа-маршрутизатор определяет оптимальный путь передачи послания следующему компьютеру сети. От пользователя скрыты такие внутренние детали, как разбивка передаваемой информации на порции - пакеты, присоединение к пакетам служебной информации, сжатие данных, контроль за передаваемой порцией и повторная её посылка в случае обнаружения неустранимой ошибки и т.п.

    Для передачи электронных писем в Internet используются три протокола. Старейший из них — SMTP — Simple Mail Transfer Protocol (Протокол передачи простой почты) был разработан еще в 1982. Спустя пару лет появился Протокол Почтового Отделения POP — Post Office Protocol (Протокол почтового отделения). С появлением в Internet почтовых сообщений, содержащих звуки и изображения, возник протокол MIME — Multipurpose Internet Mail Extension.

    В некоторых сетях используется программное обеспечение с поддержкой национальной версии языка. Тогда можно набрать текст письма, используя, например, русский алфавит. Но в большинстве случаев приходится ограничиваться первой половиной набора ASCII, и тогда письма, адресованные за рубеж русским абонентам, могут иметь вид: «Privet, Sereja! Ja poluchil tuoe poslanie ot 25.03.97… ».

    Следует обратить внимание на оперативность и дешевизну электронной почты по сравнению с традиционными средствами общения - телеграммами, междугородними телефонными разговорами, обычными письмами. Электронная почта доходит до абонента, расположенного в любой точке земного шара за считанные минуты. Скорость передачи информации между серверами достигает 3600 символов в секунду, что эквивалентно примерно 2 страницам текста. В отличие от обычных почтовых отделений, E-mail не теряет свои письма.

    Телеконференции

    Другой вид информационных сетевых услуг под названием «телеконференции» напоминает подписку на электронную газету, в которой появляются сведения по определенной тематике - новости, заметки, ответы на вопросы, отклики на предшествующие публикации и т.п. Авторами этой весьма разнообразной и сверхоперативной информации являются сами пользователи сети, объединённые общими интересами. Многие провайдеры предоставляют своим абонентам перечень конференций, в которых можно участвовать за умеренную плату. При этом вы будете регулярно получать электронные письма с заголовками статей по соответствующей тематике. Заголовки сопровождаются идентификационными номерами, объёмом статьи и, иногда, краткой аннотацией в 1-2 строки. За дополнительную плату, пропорциональную размеру статьи, вы можете заказать нужную публикацию. Только делать это нужно оперативно, т.к. сервер хранит содержимое очередного выпуска порядка 10 дней.

    Телеконференции по оформлению и способу работы очень похожи на электронную почту с тем лишь отличием, что ваше письмо может прочитать огромное количество людей, а в свою очередь сможете поинтересоваться тем, что пишут вам совершенно незнакомые люди. Конференции подразделяются по темам, название конференции состоит из нескольких слов, разделенных точками, каждое последующее из которых сужает тему. Вот стандартное обозначение некоторых групп телеконференций Usenet:

    Comp — конференции, где обсуждается все, что связано с компьютерами и программированием;

    News — обмен новостями, вопросы развития системы телеконференций;

    Rec — отдых, хобби, увлечения;

    Sci — все, что связано с наукой;

    Soc — вопросы общественной жизни;

    Talk — группа для любителей поспорить или просто поговорить на любую тему.

    Начиная работать с какой-либо группой, в первую очередь нужно прочитать правила работы в ней, которые регулярно помещаются в эти группы человеком, добровольно взявшим на себя обязанности координатора группы (модератора). На самом деле, группы новостей бывают двух типов — модерируемые и обычные. Сообщения, появляющиеся в модерируемых группах, прежде чем быть разосланными по сети, просматриваются модератором. Это, конечно, является своего рода цензурой, но в таком огромном сообществе, как Usenet, невозможно поддерживать порядок без подобных строгостей.

    Сегодня всякий компьютер, полноценно подключенный к Интернет, имеет доступ к новостям Usenet, но новости Usenet распространяются и по другим сетям, применяясь столь же широко, как и электронная почта. Способы и удобство работы с новостями сильно зависят от того, каким образом Вы получаете их. В Интернет Ваша программа-клиент напрямую получает новости с сервера Usenet, и между просмотром списка сообщений, содержащихся в группе, и чтением этих сообщений нет задержки. Если Вы пользуетесь новостями через электронную почту, то Вы сначала получаете список статей, а уже потом принимаете по электронной почте статьи из списка, отдельно Вами заказанные.

    File Transfer Protocol (FTP) – передача файлов

    FTP сервис Интернет — сервис, который дает максимальную нагрузку на каналы связи. Расшифровывается эта аббревиатура как протокол передачи файлов, но при рассмотрении ftp как сервиса Интернет имеется в виду доступ к файлам на удаленных компьютерах и в файловых архивах. FTP — стандартная программа, работающая по протоколу TCP, как правило, поставляющаяся с операционной системой. Ее исходное предназначение — передача файлов между разными компьютерами, работающими в сетях TCP/IP: на одном из компьютеров работает программа-сервер, на втором пользователь запускает программу-клиента, которая соединяется с сервером и передает или получает файлы. Тут предполагается, что пользователь зарегистрирован на обоих компьютерах и соединяется с сервером под своим именем и со своим паролем на этом компьютере. Протокол FTP, разумеется, оптимизирован для передачи файлов.

    Данная черта и послужила причиной того, что программы FTP стали частью отдельного сервиса Интернет. Дело в том, что сервер FTP можно настраивается таким образом, что соединиться с ним можно не только под своим именем, но и под условным именем anonymous. Тогда Вам становятся доступна не вся файловая система компьютера, но некоторый набор файлов на сервере, которые составляют содержимое FTP-сервера anonymous — публичного файлового архива. Итак, если кто-то хочет предоставить в публичное пользование файлы с информацией, программами и прочим, то ему достаточно организовать на своем компьютере, включенном в Интернет, FTP сервер.

    Если Вы, например, хотите представить миру демо-версию Вашего программного продукта — использование FTP сервера является удачным решением такой задачи. Если, с другой стороны, Вы хотите найти, скажем, последнюю версию Вашей любимой свободно распространяющейся программы, то искать ее нужно именно на серверах FTP.

    Несмотря на распространенность, у FTP есть и множество недостатков. Программы-клиенты FTP могут быть не всегда удобны и просты в использовании. Не всегда можно понять, а что это за файл перед Вами. Нет простого и универсального средства поиска на серверах FTP – хотя для этого и существует специальный сервис ARCHIE, но это независимая программа, неуниверсальная и не всегда применимая. Описания файлов на сервере выдаются в формате операционной системы сервера, а список файлов операционной системы UNIX может привести в недоумение пользователя DOS. Проблема тут в том, что со списком файлов выдается лишняя информация, а слишком много знать вредно.

    Серверы FTP нецентрализованы, и это несет свои проблемы. FTP — сервис прямого доступа, требующий полноценного подключения к Интернет, но возможен и доступ через электронную почту – большая часть FTP серверов может прислать свои файлы по E-mail, а так же существуют серверы, которые могут прислать Вам по электронной почте файлы с любых FTP серверов. Однако это не всегда удобно, ибо такие серверы сильно загружены, и Ваш запрос может долго ждать своей очереди. Кроме того, большие файлы при отсылке делятся сервером на части ограниченного размера, посылаемые отдельными письмами — и если одна часть из сотни потеряется или повредится при передаче, то остальные 99 тоже окажутся ненужными.

    Internet Real Chat

    (реальное общение в Интернете)

    Это можно перевести как «параллельные беседы» в Internet или «переключаемый треп». Представьте себе десятки тысяч людей, которые собрались в Internet поговорить. С друзьями и незнакомыми людьми. Обсудить определенные темы или просто потрепаться. И все это происходит в реальном времени. Для того чтобы поучаствовать в беседе, вам нужно просто подключиться к выбранному каналу. Каждый канал имеет название, которое более или менее отражает тему разговоров (например, на канале warez идет обмен ворованными программами), а иногда и нет.

    Гипертекстовая система GOPHER

    Одним из достаточно известных и распространенных сервисов Интернет является GOPHER (правда устаревшим). Хотя сейчас он уже практически не развивается, или, во всяком случае, развивается гораздо медленнее прочих сервисов похожего назначения, но тем не менее через GOPHER доступно довольно-таки большое количество информации — в первую очередь, по историческим причинам — был период, когда GOPHER был лучшим средством публичного доступа к информации. Современные средства работы с информацией в Интернет (например, WWW просмотрщики) обеспечивают в том числе доступ к серверам GOPHER, поэтому специальных программам-клиентов GOPHER в настоящий момент не используется. Что касается использования сервера GOPHER для предоставления новой информации в публичный доступ — вряд ли целесообразно использовать морально устаревший сервис GOPHER.

    GOPHER — это распределенная система экспорта структурированной информации. При работе с GOPHER Вы находитесь в системе вложенных меню, из которых доступны файлы различных типов — как правило, простые тексты, но это может быть и графика, и звук и любые другие виды файлов. Таким образом, в публичный доступ экспортируются файлы с информацией, но не в виде файловой системы, как в FTP, а в виде аннотированной древовидной структуры. GOPHER — сервис прямого доступа и требует, чтобы и сервер, и клиент были полноценно подключены к Интернет.

    Основное преимущество Gopher состоит в том, что вам не нужно запоминать адрес или название ресурса и последовательность команд, необходимую для доступа к нему: двигаясь по меню программы, вы на самом деле перемещаетесь по разным компьютерам, подключенным к Сети. Однако сегодня Gopher, по всей видимости, доживает последние дни, потому что появился новый сервис, гораздо более удобный.

    Несмотря на то, что Интернет, несомненно, самое мощное средство к сетевой информации, существуют и другие источники, многие из которых предвосхитили взрывообразное увеличение использования Интернет. В их число входят компьютерные доски объявлений и коммерческие информационные службы.

    Всемирная паутина (World Wide Web или WWW)

    На сегодняшний день это наиболее продвинутый и интересный ресурс — гипертекстовая система навигации в Internet. От обычного гипертекста WWW отличается главным образом тем, что позволяет устанавливать ссылки не только на соседний файл, но и на файл, находящийся на компьютере в другом полушарии Земли. От вас же не требуется никаких усилий — компьютер установит связь самостоятельно.

    В WWW, как и в Gopher, к ресурсам можно обращаться, непосредственно указывая их адрес. В этом случае приходится сталкиваться с сокращением URL — Uniform Resourse Locator, универсальный способ обозначения ресурса Internet. Обозначение URL состоит из двух частей: первая указывает тип связи, который следует установить с нужным вам источником, вторая — имя требуемого сервера. Типы связи соответствуют стандартным услугам Internet. Вот основные из них:

    Http — HiperText Transfer Protocol,основа WWW, — тип связи, необходимый при обращении к любому WWW-серверу;

    Ftp — используется при обращении к FTP-серверам;

    Gopher — предназначен для взаимодействия с Gopher;

    Telnet — предназначен для получения терминального доступа к удаленной машине;

    news — открывает доступ к телеконференциям.

    Информация на WWW может включать в себя текст, рисунки, таблицы, звук, мультипликацию и многое другое. Благодаря своим широким возможностям, красоте и простоте в использовании «всемирная паутина» завоевала огромную популярность во всем мире. Информационная навигация в сети InterNet: Введение в инструментальные системы нового поколения — «Навигаторы» системы WWW.

    Если Вы когда-либо имели возможность изумляться возможностям сети InterNet, то Вы уже знаете о феноменальном объеме информации — все от баз данных, текстовых файлов, документов, имидж- аудио- видео- файлов до готовых программ.

    При таком гигантском объеме данных в сети необходимо иметь развитые инструментальные системы, которые делают информационный поиск более эффективным.

    До 1991 года в сети InterNet были разработаны простые инструментальные системы и навигаторы первого и второго поколения. Но затем начался новый этап координированных разработок.

    Именно в том году, в CERN, в Женеве, были разработаны системы, ныне называемые World Wide Web (WWW/3W или просто «Web» — по-нашему «Паутинка»).

    Эта же система является попыткой интегрировать разнообразные инструментальные системы и данные с помощью общего формата данных на базе концепции гипертекста. Результат этих разработок был чрезвычайно успешным. Фактически, они сформировали к настоящему времени лицо сети InterNet .

    Система Web базируется на методе связывания слов и фраз в документе для ссылки к соответствующей информации в этом же или другом документе. Поскольку другие документы могут быть на разных серверах, эти ссылки образуют своеобразную «паутину» взаимных связей, которая пронизывает сеть IntеrNet.

    Но что же можно делать с этой технологией на Вашей локальной сети? Web-технология может использоваться и в том случае, если Ваше сеть не включена в InterNet. Все компоненты этой технологии доступны для многих платформ как FreeWare.

    Ряд ведуших программных фирм срочно реализуют первые коммерческие инструментальные системы для этой новой сетевой Web-технологии. Они ориентированы на более оптимальную интеграцию Web-технологии в среду рабочих станций и будут более удобными с точки зрения системного сопровождения и администрирования.

    Для понимания сути Web-технологии и используемых программных средств, следует напомнить об основных навигационных и инструментальных средствах, доступных пользователям сети InterNet.

    Самыми простые средства — FTP и Telnet. Ftp — это программа, которая использует TCP/IP File Transport Protocol для передачи файлов между компьютерами. Telnet — это программа для доступа к удаленному компьютеру в режиме эмуляции локального терминала.

    Хотя эти программы работают безотказно, они являются «слепыми», поскольку обрабатывают только те данные, размещение которых уже известны Вам и предназначены для выполнения только основных операций. Фактически они были инструментальными средствами первого поколения в сети InterNet.

    Следующее поколение инструментальных средств — «навигационные» — ориентировалось на проблему поиска требуемых информационных ресурсов.

    Гипертекстовая система Hyper-G

    WWW не была единственной попыткой создать глобальную гипермедийную распределенную информационную систему. Другой такой системой является Hyper-G. Этот сервис Интернет менее известен, но весьма интересен. Hyper-G значительно моложе WWW (хотя темпы роста и не указывают на то, что Hyper-G сможет когда-либо сравниться по популярности с WWW) и это академическая разработка — плод стараний технологического университета в Граце (Graz), Австрия. Система эта вряд ли окажется практически полезной для Вас, но заслуживает внимания как очень интересная технология, и ее рассмотрение позволяет многое добавить в картину сервисов Интернет и их развития.

    С общих позиций Hyper-G аналогична WWW, преследуя те же идеи и повторяя многие принципы. Есть клиенты и есть серверы, которые предоставляют информацию в виде коллекций документов. По принципам организации информации в пределах одного сервера Hyper-G является чем-то средним между WWW и GOPHER. Документы доступны из иерархического меню, но сами документы являются гипермедийными. Клиент Hyper-G общается не со множеством серверов, как в случае WWW, но исключительно со «своим» сервером, регистрируясь на нем при подключении. Получение документов с других серверов Hyper-G происходит через «свой» сервер, что позволяет создать более интегрированную систему серверов, чем в случае с WWW. Регистрация же клиента позволяет определить уникальным образом не только ресурсы и сервисы Интернет, но и клиентов, что значительно облегчает обеспечение авторизованного доступа и удаленного управления документами.

    К чертам, препятствующим распространению Hyper-G, следует отнести недостаточно хорошую реализацию программ-клиентов, не полностью свободный доступ к серверной части программного обеспечения, централизованность проекта и отсутствие альтернативных реализаций программного обеспечения, слишком твердую структуру организации документов на сервере, сложность системы. Серверы Hyper-G весьма немногочисленны, следовательно, информации в Hyper-G хранится немного. Отсутствует доступ посредством электронной почты, хотя серверы Hyper-G могут также выполнять роль серверов gopher и WWW.

    Поисковая система WAIS

    WAIS — еще один сервис Интернет, сегодня почти не использующийся, или, по крайней мере, практически не развивающийся. WAIS расшифровывается как информационная система широкого профиля, но на самом деле это комплекс программ, предназначенных для индексирования больших объемов неструктурированной, как правило просто текстовой, информации, поиска по таким документам и их извлечения. Существуют программы для индексирования, для локального поиска по полученным индексам, а также серверная и клиентская программа, общающиеся между собой по специальному протоколу Z39.50. Задача поиска по большим объемам неструктурированной информации весьма нетривиальна и сегодня еще не существует общепринятого ее решения. WAIS во многих случаях является приемлемым вариантом поисковой системы, и коль скоро она имеет свободно распространяемую программную реализацию, то получила достаточную известность как один из сервисов Интернет. На самом деле, она почти не используется сегодня самостоятельно, но во многих случаях применяется как вспомогательное средство, например, для индексирования документов, хранящихся на WWW-сервере. В некоторых случаях она также используется как средство работы со словарями, или для поиска по архивам сетевых новостей Usenet. Если перед Вами стоит задача по индексированию больших объемов неструктурированной информации, то, возможно, WAIS окажется адекватным ее решением. Однако, нужно иметь в виду, что свободно распространяемая реализация системы далека от совершенства, что система достаточна сложна для понимания и изучения, и, что хуже всего, практически не развивается. Поддержкой и развитием свободной версии занимались последовательно несколько организаций, но ни одна из них не довела продукт до приемлемого для реальной работы состояния.

    «Навигация» в сети Internet

    При обширном информационном богатстве, которое возникало в каждом «углу» InterNet, подобно грибам на лесной поляне, главным требованием к новым инструментальным средствам была эффективность при поиске требуемых сетевых ресурсов.

    Ввиду большого многообразия имеющихся ресурсов в сети InterNet, информационный поиск — сложная проблема, особенно с точностью до абсолютного сетевого номера (для примера, имеются сотни сложных баз данных, и десятки тысяч архивных серверов со свободным доступом). Фактически каждый час в сети появляются все новые и новые источники, что и делает обычный поиск практически безнадежным занятием. В настоящее время имеются следующие «навигационные» средства:

    — система Archie;

    — СУБД для поиска файлов в открытых для доступа архивах;

    — Wide Area Information Server, который может использоваться для поиска в большом числе баз данных и документальных архивах.

    Имеется также системы типа Gopher с интерфейсом в виде текстовых экранных форм-меню, которые ссылаются на распределенные по сети информационные источники, образуя тем самым «паутину» связей — так называемые Gopher-пространства. Система Veronica предназначена для поиска объектов в этом Gopher-пространстве.

    Эти навигационные «прилады» (средства) до сих пор широко используются.

    Но, обеспечивая эффективную навигацию по InterNet, они все имеют дело с простым форматом командного файла и манипулируют с ограниченным типом данных.

    Стало ясно, что необходимы более совершенные системы с развитыми сервисными функциями и с возможностями обработки более разнообразных

    форматов данных. И одним из источников разнообразных данных стала сама Web-сеть, послужившая основой для следующего поколения инструментальных средств InterNet — Web-«навигаторов.

    Модификация Web

    Гипертекстовые ссылки системы Web действуют как указатели на другие части единого документа, или на совершенно разные документы, или на другие доступные по сети сервисы. Хотя во многом это кажется несколько абстрактным в теории, на практике — очень эффективно и удобно.

    Если Вы когда-либо использовали подсистему Help для Windows, Вы уже имели практические навыки работы с гипертекстом. Любое слово, фраза, или пиктограмма в документе «Help» может быть описана как самостоятельный объект. Когда Вы выбираете этот объект, происходит переход на соответствующую часть документа.

    Навигаторы Web расширяют эту идею, обеспечивая связи между документами, размещенными в разных узлах сети, и доступ к разнообразным сервисам типа FTP и Gopher-пространствам.

    Для примера, в описании сетей может быть ссылка на Ethernet. Если слово «Ethernet» поддержано гипертекстовой ссылкой, при его выборе, Вы получите переход на описание этой сетевой технологии. В этом описании, в свою очередь, может быть ссылка на документ о поставщиках оборудования Ethernet и выбор какого-то из них обеспечит переход на документ, описывающий все поставляемое им оборудование. Более того, в этом описании может быть список всех драйверов для поставляемых адаптеров сети Ethernet.

    О! и Вы обнаружили, что появилась самая последняя версия драйвера именно для той карты, которую Вы уже давно используете. И эту версию можно заполучить простым нажатием клавиши Вашей «мышки» для активации соответствующей гипертекстовой ссылки.

    Документы в системе Web могут включать, помимо текстов, указания об используемых шрифтах и форматах, ссылки на графические данные и фотоснимки, ссылки на другие данные, документы и сервисы. Все эти документы формируются по правилам Hypertext Markup Language (HTML).

    HTML базируется на промышленном стандарте — Standard General Markup Language (SGML) — для создания машинно-независимых документов, с учетом всего многообразия используемых компьютерных платформ. При этом HTML еще более расширяет определение гипертекстовой ссылки.

    HTML документ состоит из текста, который должен быть выдан на дисплей, и описателей — тэгов (tags), которые определяют, как этот техт должен быть представлен, и как другие типы данных — для примера, видео- и аудио- данные — должны извлекаться и форматироваться, и куда ведет каждая гипертекстовая ссылка.

    HTML-описатели являются полями в документе, которые размещаются между символами «» и содержат директивы и соответствующие параметрические данные — атрибуты директивы.

    Например, в поле

    Hello HTML

    начальный тэг

    указывает на начало заголовка, а директива «H» определяет, что следующий за этим тэгом текст следует разместить в этом заголовке. Следующие за директивой атрибуты доопределяют, что эта директива должна фактически сделать. В нашем примере аргумент «1» указывает, что заголовок должен размещаться на первом уровне. Завершающий тэг

    указывает об окончании этого поля.

    Имеются специальные тэги для описания гипертекстовых ссылок (так называемых anchors), заголовков, изображений и других объектов.

    Базовое понятие в WWW-навигаторах — Унифицированные Указатели Ресурсов (Uniform Resource Locators — URL). URLs используются для идентификации размещения ресурсов, на которые ссылаются в документах. Например, URL для главного индекса (home page) набора документов в Национальном Центре по Прикладным Программам для Суперкомпьютеров (NCSA) задается следующим способом:

    Http://www.ncsa.uiuc.edu/Genaral/NCSAHome.html

    Компонента «http:» определяет метод доступа — через сервер HyperText

    Transfer Protocol (HTTP). Этот протокол определяется его создателем Tim Barners-Lee как » … простейший и достаточно быстрый для распределенных и взаимодействующих информационных гипермедиа систем. Это общий объектно-ориентированный протокол, который может использоваться для многих схожих проблем, таких как Name Servers и распределенных объектно-ориентированных систем».

    Следующая часть URL — «//www.ncsa.uiuc.edu» — описывает, на каком узле размещены данные. Наконец, компонента «/Genaral/» определяет, где размещается файл с документом «NCSAHome.html».

    Для изучения навигации в системе WWW попробуйте начать с главных страниц на серверах в NCSA и CERN. Если Вы размещаетесь в локальной сети типа NetWare, Вы сможете навигировать по всем информационным ресурсам этой сети через Novell’s home page.

    А информацию о новостях в сети InterNet можно найти на «странице» NCSA’s Mosaic «What’s New page» (см. прил. N=1) и Навигаторе Глобальной Сети (Global Network Navigator) — прекрасной программной разработке сотрудников издательства O’Reily Press.

    Хотя было разработано несколько программ для навигации в сети — например, WWW и Lynx для текстового режима, но только система Mosaic завоевала признательность почти всех пользователей сети InterNet. Она была разработана в NCSA в 1993 году и объединяет на базе единого графического интерфейса как несколько традиционных для сети InterNet инструментальных подсистем, так и возможности новых навигаторов.

    Другая альтернативная система Cello в среде Windows была создана на Юридическом факультете Корнельского Университета. Mosaic и Cello обеспечивают эффективную программную среду для успешной навигации любого новичка по информационным «сокровищам» вей глобальной сети InterNet. Используя эти «оболочки», не надо тратить время на изучение всех сложных инструментальных средств первого и второго поколения.

    Из-за удобного и эффективного интерфейса и из-за реализации на многих промышленных платформах, системы Mosaic и Cello стали широко использоваться для информационного сервис в рамках больших компаний.

    Поисковые системы

    Как уже было отмечено, большинство первых приложений, включая FTP и электронную почту, были разработаны исключительно для обмена данными между хост-компьютерами Internet. Другие приложения, такие как Telnet, создавались для того, чтобы пользователь получил возможность доступа не только к информации, но и к рабочим ресурсам удаленной системы. По мере развития Internet (увеличения пользователей и хост-компьютеров) прежние методы обмена данными перестали отвечать возросшим потребностям пользователей. Возникла необходимость разработки новых способов поиска сетевых ресурсов и доступа к ним, которые позволяли бы использовать информацию независимо от ее формата и расположения. Для удовлетворения таких потребностей сначала были созданы поисковая система Archie, решающая задачу локализации ресурсов на FTP-сервере, и система Gopher, упрощающая доступ к различным сетевым ресурсам. Затем были разработаны сетевые информационные системы WWW и WAIS, предлагающие абсолютно новые методы получения информации. Принципы работы этих систем позволяют легко ориентироваться в огромном количестве информационных ресурсов без необходимости предоставления механизмов работы самой сети Internet. Такой подход позволяет говорить уже не просто о ресурсах взаимосвязанных компьютерных систем, а об особых информационных пространствах сети.

    Система Gopher была разработана для упрощения процесса локализации FTP-ресурсов Internet и для более удобного представления сведений о содержании хранящихся на FTP-серверах файлов. Система Gopher дает возможность в удобной форме (в виде меню) представлять пользователям об имеющихся файлах и их содержании. Меню Gopher-серверов могут содержать ссылки на другие Gopher- и FTP-серверы. Ссылка на FTP-сервер позволяет как просмотреть его каталоги, так и автоматически получить файл. Таким образом, пользователь получает возможность «путешествовать» по Internet, не обращая внимания на местонахождение интересующих его ресурсов, и получать доступ к этим ресурсам.

    Система Veronica используется для поиска информации в Gopher-пространстве по заголовкам пунктов меню. После ввода ключевого слова, система Veronica выясняет, встречается ли оно в меню на каком-либо Gopher-сервере, и в качестве результатов поиска выдает список заголовков пунктов меню, содержащих ключевое слово. Поскольку система Veronica не является автономной поисковой программой, а тесно связана с системой Gopher, она обладает тем же, что и система Gopher, недостатком: далеко не всегда по заголовку можно сказать, что собой представляет тот или иной информационный ресурс. Достоинства системы заключается в том, что нет необходимости узнавать, где расположена найденная информация, достаточно выбрать требуемую запись из списка.

    Основой системы WAIS является комплекс глобальных баз данных, в которых содержится индексированная информация о ресурсах сети. Система WAIS обеспечивает распределенный поиск текста в этих базах данных по ключевому слову или строке.

    Самым новым и наиболее совершенным средством поиска, получения и отображения информации в Internet является система World Wide Web (WWW).

    В системе WWW имеется также доступ к специально разработанным поисковым системам (поисковым машинам), которые выполняют поиск WWW-страниц, содержащих информацию на заданную с помощью ключевых слов тему. Поиск производится среди заранее проиндексированных WWW-страниц множества серверов Internet, и результатом поиска является автоматически сгенерированная новая WWW-страница, содержащая ссылки на найденные документы. Это чрезвычайно мощное средство делает весьма легкой и удобной для пользователей процедуру поиска информации в Internet, а результат поиска позволяет представить в наглядной форме. Наиболее мощными поисковыми машинами на сегодняшний день в мире являются: Alta Vista (www.altavista.digital.com ), Yahoo! (www.yahoo.com ), Infoseek (www.infoseek.com ), GoTo (www.goto.com ), FTP search (ftpsearch.ntnu.no – поиск в системе FTP), а также отечественные: Rambler (www.rambler.ru ), Yandex (yandex.ru ), АПОРТ! (www.aport.ru ), Следопыт (www.medialingua.ru/www/wwwsearc.htm ), Compass (compass.tsu.ru ), Russian FTP
    search (ftpsearch.city.ru – поиск в системе FTP). Следует отметить, что результатом поиска могут быть не только HTML-документы, хранящиеся на WWW-серверах, но и другие типы файлов на других типах серверов, если информация об этих документах содержится в соответствующих базах данных поисковых машин.

    ЛИТЕРАТУРА

      Фигурнов В.Э. IBM PC для пользователя: от начинающего до опытного. – М.:ИНФРА – М, 2000. – 640с.: ил.

      Гусева А.И. Работа в локальных сетях Netware 3.12 – 4.1. С.-П.: Питер. – 1999.

      Гусева А.И. Технология межсетевых взаимодействий. Netware – Unix – Windows – Internet. C.-П.: Питер. – 1999. .

      А.В. Фролов и Г.В. Фролов. ПК шаг за шагом. М.: Диалог МИФИ,1998.