4.1.1 万维网技术架构概述

4.1.1 万维网技术架构概述

1.万维网

万维网,也称Web,是一个构筑在Internet之上的以超媒体形式展现信息的系统,其中储藏了大量遍布全球的相互链接的各类文档并提供了访问这些文档的机制。它由超文本标记语言(HTML,Hyper Text Markup Language)表达的Web页面组成,通过超文本传输协议(HTTP,Hyper Text Transfer Protocol)实现页面传输,并且使用统一资源定位符(URL,Uniform Resource Locator)标识页面在Internet范围内的位置。

万维网服务的基础是Web页面,每个Web页面既可展示文本、图形图像和声音等多媒体信息,又可提供一种特殊的链接点,即超链接。通过超链接,用户可以非常方便地访问Internet上大量的信息。本小节将介绍Web页面的概念。

URL是Internet上标准的资源地址,用来标识定位分布在整个Internet上的万维网页面。4.2节将介绍URL的相关内容。

HTTP是万维网为了实现页面的传输所采用的应用层协议。4.3节将对HTTP的概念和特点进行介绍。

HTML是用于制作万维网页面的一种标记语言。万维网使用HTML将Web页面显示出来,以便让不同结构的计算机都能理解所有的Web页面。4.4节将介绍HTML的相关内容。

2.Web工作模式

万维网以客户/服务器方式进行工作。万维网客户实际就是运行在用户主机上的浏览器,而万维网服务器是存放Web页面的主机,负责运行服务器程序。浏览器向服务器程序发出请求,服务器程序向客户程序送回客户所要的Web页面,如图4-1所示。

图4-1 万维网的客户/服务器工作模式

(1)Web客户——浏览器的结构

Web客户端运行的程序,现在统称为浏览器,用来解释和显示Web页面,不同厂商提供的浏览器品牌不同,如Internet Explorer、火狐等,但是它们都使用几乎相同的体系结构,如图4-2所示。每一个浏览器通常由3个部分组成:控制程序、客户程序和解释程序。控制程序管理客户程序和解释程序,是浏览器的核心部件。它接收来自键盘或鼠标的输入,并调用相关的组件来执行用户指定的操作。例如,当用户用鼠标点击一个链接时,控制程序就调用客户程序从页面所在的远程服务器上取回该页面,并调用解释程序将页面显示在屏幕上。客户程序主要采用TCP/IP的应用层协议,如HTTP、FTP或SMTP等。而解释程序根据页面的类型可以是HTML、Java、JavaScript程序等。

图4-2 浏览器结构

(2)Web服务器

Web服务器是指运行在服务器类计算机上处理Web页面请求的服务器程序。Web页面存放在服务器类计算机上。服务器重复地执行一个简单的任务:每次客户请求到达时,将被请求的页面发送给客户。为提高交互效率,通常会将一些页面存放在缓存中以提高访问速率。服务器也会采用多线程的方式,一次处理多个请求。较为流行的服务器包括Apache和微软的Internet Information Server。