информация на диске сервера — веб-сервер — браузер — изображение на экране
Разумеется, информация при прохождении указанной цепочки претерпевает значительные изменения. Они касаются не только ее формы представления, но и содержания. Преобразования формы в этой цепочке настолько многочисленны и многовариантны, что описать их все не представляется возможным.
Постараемся упомянуть хотя бы те преобразования, которые затрагивают содержание информации.Динамические веб-страницы
В самом начале эры WWW, в первой половине 1990-х, веб-страница была эквивалентна файлу на диске веб-сервера. То есть, например, при запросе пользователем веб-страницы «http: //example.com/folder/page.html» сервер, расположенный по адресу «example.com», брал с локального диска из директории «folder» файл «page.html» и отправлял его содержимое пользователю, лишь добавив в начало служебный заголовок. Такие HTML-страницы называются статическими.
Затем появились динамические веб-страницы. По запросу пользователя веб-сервер не просто берет определенный файл, а исполняет более сложную последовательность действий. Из файла или группы файлов или
из базы данных веб-сервер выбирает не просто HTML-код, а программу. Затем эта программа исполняется, а результат ее исполнения отображается браузером пользователя. Причем исполнение программы может производиться: (а) веб-сервером или одним из его модулей; (б) внешней программой на стороне веб-сервера; (в) браузером пользователя или одним из его модулей; (г) внешней программой на стороне пользователя. Понятно, что вид динамической веб-страницы будет зависеть от многих факторов, в том числе от конфигурации ПО на стороне пользователя. В настоящее время практически все веб-страницы в Интернете — динамические.
Особенности браузера
Следует принимать во внимание, что передаваемый от веб-сервера к браузеру код (HTML-код с различными включениями) не воспринимается человеком непосредственно.
Этот код — лишь набор команд браузеру по генерации изображения, которое уже воспринимается человеком, а следовательно, может вызывать какие-либо правовые последствия. Хотя HTML и другие используемые на веб-страницах языки стандартизованы [30, 72], один и тот же код может интерпретироваться по-разному в разных условиях. Отличия в интерпретации (представлении) одного и того же кода разными браузерами, как правило, невелики. Некоторые мелочи и нюансы в стандартах не описаны. Некоторые браузеры немного отклоняются от стандартов или имеют собственные расширения к стандартизованному формату. Все это не может привести к принципиальным отличиям во внешнем виде страницы.Ho есть моменты, которые могут привести к принципиальным, то есть содержательным отличиям. Это прежде всего включенные в HTML-код программы на других языках или объекты, отображаемые другими, внешними приложениями. Получив в составе веб-страницы такой объект, браузер пытается найти и загрузить модуль либо внешнее приложение для выполнения такого кода и отображения результатов. Такие внешние (по отношению к браузеру) модули и приложения значительно менее стандартизированы и могут показывать пользователю существенно отличающиеся изображения или не показывать ничего, если соответствующего модуля или внешнего приложения не нашлось.
Поэтому, фиксируя вид веб-страницы, следует установить, каким именно браузером формируется это изображение и отметить в протоколе версию браузера. Еще более важно установить, только ли браузер формирует изображение на экране, участвуют ли в этом иные модули или внешние программы, а если участвуют, то какие именно.
Адресация
Кроме изменений, связанных с передачей размещенной информации от сервера к пользователю, следует также упомянуть о возможных проблемах, связанных с адресацией.
Утверждение «В Интернете по такому-то адресу (URL) размещена та- кая-то информация» не всегда четко и однозначно задает место размещения этой информации.
В URL [28], как правило, используется доменное имя*.
Оно является средством адресации. Распространено мнение, что каждому доменному имени соответствует определенный IP-адрес. Браузер получает доменное имя, затем при помощи DNS* разрешает его в IP-адрес и обращается к сайту по этому IP-адресу. Это верно лишь в первом приближении. На самом деле адресация эта, во-первых, не статична, а во-вторых, не всегда однозначна. Кроме того, пользователь может быть перенаправлен на иной веб-сервер в зависимости от разных обстоятельств. Для иллюстрации приведем два примера.В первом примере показывается динамическое разрешение доменного имени в IP-адрес, так называемый механизм «Round robin DNS». При разрешении доменного имени «cnn.com» на несколько сделанных подряд запросов возвращаются восемь различных IP-адресов, причем в разной последовательности:
fnn@home$gt;host cnn.com
cnn.com has address 64.236.16.20
cnn.com has address 64.236.16.52
cnn.com has address 64.236.16.84
cnn.com has address 64.236.16.116
cnn.com has address 64.236.24.12
cnn.com has address 64.236.24.20
cnn.com has address 64.236.24.28
cnn.com has address 64.236.29.120
cnn.com mail is handled by 10 atlmail3.turner.com
cnn.com mail is handled by 10 atlmail5.turner.com
cnn.com mail is handled by 20 nycmail2.turner.com
cnn.com mail is handled by 30 nycmaill.turner.com
fnn@home$gt;host cnn.com
cnn.com has address 64.236.29.120
cnn.com has address 64.236.16.20
cnn.com has address 64.236.16.52
cnn.com has address 64.236.16.84
cnn.com has address 64.236.16.116
cnn.com has address 64.236.24.12
cnn.com has address 64.236.24.20
cnn.com has address 64.236.24.28
cnn.com mail is handled by 10 atlmail5.turner.com
cnn.com mail is handled by 20 nycmail2.turner.com
cnn.com mail is handled by 30 nycmaill.turner.com
cnn.com mail is handled by 10 atlmail3.turner.com
fnn@home$gt;host cnn.com
cnn.com has address 64.236.24.28
cnn.com has address 64.236.29.120
cnn.com has address 64.236.16.20
cnn.com has address 64.236.16.52
cnn.com has address 64.236.16.84
cnn.com has address 64.236.16.116
cnn.com has address 64.236.24.12
cnn.com has address 64.236.24.20
cnn.com mail is handled by 10 atlmail3.turner.com
cnn.com mail is handled by 10 atlmail5.turner.com
cnn.com mail is handled by 20 nycmail2.turner.com
cnn.com mail is handled by 30 nycmaill.turner.com
Веб-сайт cnn.com обслуживается сразу несколькими серверами.
При разрешении доменного имени DNS-сервер выдает сразу восемь различных IP-адресов. Браузер может выбрать любой из них, но обычно выбирается первый. Выдавая IP-адреса в разном порядке, DNS-сервер пытается равномерно распределить нагрузку на эти сервера.В данном случае все сервера, обслуживающие веб-сайт, имеют одинаковый контент* (информационное наполнение). Ho могли бы иметь разный.
Второй пример показывает зависимость видимой веб-страницы от IP- адреса пользователя. Автор запросил одну и ту же веб-страницу «www.google.com» с двух различных компьютеров. У первого из них IP- адрес зарегистрирован за российским провайдером, у второго — за немецким. Ответы веб-сервера были различными.
-bash-2.05b$ lynx -noredir -source www.google.com
lt;HTMLxHEADxmeta http-equiv= "content-type" content="text/html;charset=utf-
8"gt;
lt;TITLEgt;302 Movedc/TITLEx/HEADgt;lt;BODYgt;
lt;Hlgt;302 Movedlt;/Hlgt; />The document has moved
lt;A HREF="http://www. google.ru/"gt;herelt;/Agt;.
lt;/BODYx / HTML gt;
fnn@home$gt;lynx -noredir -source www.google.com
lt;HTMLxHEADxmeta http-equiv= "content-type" content="text/html;charset=utf-
8"gt;
lt;TITLEgt;302 Movedc/TITLEX/HEADxBODYgt;
lt;Hlgt;302 Movedlt;/Hlgt;
The document has moved
lt;A HREF= "http://www. google.de/"gt;herelt;/Agt;.
lt;/BODYx / HTML gt;
При совершенно одинаковом запросе в первом случае пользователь был перенаправлен на веб-сайт «www.google.ru», во втором случае — на веб-сайт «www.google.de». Содержимое этих сайтов существенно различается. И не только языком.
Понятно, что контент* одного и того же веб-сайта (на взгляд одного и того же пользователя) может зависеть от времени суток, от просматривающего сайт пользователя, от некоторых случайных факторов.
Еще по теме информация на диске сервера — веб-сервер — браузер — изображение на экране:
- Исследование логов веб-сервера
- Функциональные требования к серверу Интегрированной первичной базы данных
- Исследование логов мейл-сервера и заголовков электронной почты
- ИНФОРМАЦИОННАЯ СТРУКТУРА INTR AN ЕТ-СЕРВЕРА СОВЕТА ФЕДЕРАЦИИ
- Поиск информации на диске
- Реконструкция просмотра веб-страниц
- Размещение на веб-сайте
- Озоновый экран Земли
- Звукоизоляция: метод основан на отражении звуковой волны, падающей на ограждение (экран). ;
- Отдел II Изображения оплечные
- 4.3.1. Объемные изображения
- Изображенный мир