2.11.2HTTP
1.HTTP概述
HTTP是应用层上一种请求响应的协议,实现客户端与服务器的通信,是WWW发布信息的主要协议。HTTP的默认连接端口是TCP 80号。
HTTP通过统一资源定位符(Uniform Resource Locator,URL)来定位Web服务器资源。URL是因特网上用来描述信息资源的字符串,包括服务器的域名、目录和文件。
例如http://www.microsoft.com/windows/default html,其含义如下:
(1)http://。代表超文本传输协议。
(2)www.microsoft.com/。代表Web服务器的域名。
(3)windows/。该服务器上的文件目录。
(4)default.html。文件目录中的一个HTML文件。
浏览器是用户用来获取HTTP服务的软件。浏览器通过DNS服务器将URL中的域名解析成IP地址,根据IP地址向Web服务器发送HTTP请求。Web服务器收到HTTP请求后,会回应一个HTTP应答,HTTP应答内容符合超文本标记语言(Hyper Text Marker Language,HTML)格式。
HTML起源于SGML(标准通用标记语言),它独立于各种操作系统平台(如UNIX、Windows等),指定了文档的数据结构和显示的方式。HTML通过普通文本嵌入到特定的标识符中,使文本在浏览器中呈现不同的格式,并调用各种各样的图片、声音和视频等。HTML的基本标记有HTML、HEAD、TTLE、BODY、META和LINK等。
随着Web的迅速发展,网络安全问题不断地出现。为了保证在HTTP传输中超文本数据的安全性,Netscape开发出安全超文本传输协议(Secure Hypertext Transfer Protocol,S-http)。S-http在传输的前后对超文本数据进行压缩和解压,防止了数据的泄密。
2.HTTP工作原理
Web客户端用户使用浏览器通过默认端口与Web服务器建立HTTP连接,其具体过程如下:
(1)Web客户端与Web服务器建立TCP连接。
(2)Web客户端通过浏览器向Web服务器80号端口发送HTTP连接请求。
(3)如果Web服务器允许访问,则返回连接确认,双方建立HTTP连接。
(4)Web客户端发送HTTP页面请求。
(5)Web服务器寻找该HTTP文件,如果找到则返回该文件的超文本。Web客户端的浏览器对接收到的超文本进行解析,翻译成格式化的页面,显示给用户。
(6)Web服务器发送完HTTP内容后,断开HTTP连接。
(7)双方断开TCP连接。