2.3.2 相关知识:Internet/Intranet/Extranet

2.3.2 相关知识:Internet/Intranet/Extranet

随着Internet的高速发展,目前Internet上的各种服务已多达几万种,其中多数服务是免费提供的。而且随着Internet商业化的发展趋势,它所能提供的服务将会进一步增多。

Internet的基本服务主要有以下几种。

•万维网WWW——world wide web。

•域名系统DNS。

•电子邮件E-mail。

•文件传输协议FTP。

除此之外,还有远程登录TELNET、USENET新闻小组、电子公告栏BBS、网络会议、IP电话、电子商务等应用。

1.WWW服务

(1)万维网概述:WWW简称3W,有时也称为万维网,它拥有图形用户界面,使用超文本结构链接。WWW系统有时也叫做Web系统。它是目前Internet上最方便与最受用户欢迎的信息服务类型,是一种基于超文本(hypertext)方式的信息查询工具,它的影响力已远远超出了计算机领域,并且已经进入广告、新闻、销售、电子商务与信息服务等各个行业。Internet的很多其他功能,如E-mail、FTP、USENET、BBS、WAIS等,都可通过WWW方便地实现。万维网的出现使Internet从仅有少数计算机专家使用变为普通大众也能利用的信息资源,它是Internet发展中的一个非常重要的里程碑。

超文本文件由超文本标记语言(hypertext markup language,HTML)格式写成,这种语言是欧洲粒子物理实验室(CERN)提出的WWW描述语言。WWW文本不仅含有文本和图像,还含有作为超链接的词、词组、句子、图像和图标等。这些超链接通过颜色和字体的改变与普通文本区别开来,它含有指向其他Internet信息的URL地址。单击超链接,Web就根据超链接所指向的URL地址跳到不同站点、不同文件。超链接同样可以指向声音、影像等多媒体,超文本与多媒体一起构成了超媒体(hypermedia),因此万维网是一个分布式的超媒体系统。

WWW由三部分组成:浏览器(browser)、Web服务器(Web server)和超文本传输协议(HTTP)。浏览器向Web服务器发出请求,Web服务器向浏览器返回其所需的万维网文档,然后浏览器解释该文档并按照一定的格式将其显示在屏幕上。浏览器与Web服务器使用HTTP协议进行互相通信。为了制定用户所要求的万维网文档,浏览器发出的请求采用URL形式描述。

(2)统一资源定位符:HTML的超链接使用统一资源定位符URL(uniform resource locator)来定位信息资源所在位置。URL描述了浏览器检索资源所用的协议、资源所在计算机的主机名以及资源的路径与文件名。Web中的每一页以及每页中的每个元素(图形、热字或是帧)也都有自己唯一的地址。

标准的URL如下所示:

这个例子表示用户要连接到名为“www.yrcti.edu.cn”的主机上,采用http方式读取名为“index.asp”的超文本文件。

URL通过访问类型来表示访问方式或使用的协议,例如:

Gopher://gopher.cernet.edu.cn

表示要连接到名为“gopher.cernet.edu.cn”的Gopher服务器;

ftp://ftp.yrcti.edu.cn/software/readme.doc

表示要通过FTP连接来获得一个名为readme.doc的文本文件;

telnet://mail.yrcti.edu.cn:10

表示远程登录到名为mail.yrcti.edu.cn的主机的10号端口。

URL是在一个计算机网络中用来标识、定位某个主页地址的文本。简单地说,URL提供主页的定位信息,用户可以看到浏览器在定位区内显示URL。用户一般不需要了解某一主页的URL,因为有关的定位信息已经被包括在加亮条的链接信息之中,当用户选择某一加亮条时,浏览器就已经知道了它的URL。同时,浏览器提供让用户直接输入URL,以便对WWW进行访问的功能。

Internet采用超文本和超媒体的信息组织方式,将信息的链接扩展到整个Internet上。目前,用户利用WWW不仅能访问到Web server的信息,而且可以访问到Gopher、FTP、E-mail等网络服务。因此,它已经成为Internet上应用最广和最有前途的访问工具,并在商业领域发挥着越来越重要的作用。

(3)超文本传输协议:超文本传输协议HTTP(hypertext transfer protocol)是Web客户机与Web服务器之间的应用层传输协议。HTTP是用于分布式协作超文本信息系统的、通用的、面向对象的协议,它可以用于域名服务或分布式面向对象系统。HTTP协议是基于TCP/IP之上的协议。HTTP会话过程包括以下四个步骤:连接(connection),请求(request),应答(response),关闭(close)。当用户通过URL请求一个Web页面时,在域名服务器的帮助下获得要访问主机的IP地址,浏览器与Web服务器建立TCP连接,使用默认端口80。浏览器通过TCP连接发出一个HTTP请求消息给Web服务器,该HTTP请求消息包含了所要的页面信息。Web服务器收到请求后,将请求的页面包含在一个HTTP响应消息中,并向浏览器返回该响应消息。浏览器收到该响应消息后释放TCP连接,并解析该超文本文件显示在指定窗口中。

2.域名系统

IP地址是访问Internet上某一主机所必需的标识,它是一个用点分隔的4个十进制数,如119.75.213.50代表百度的WWW服务器,但是这种枯燥的数字是很难记忆的,因此需要使用容易记忆的名字代表主机域名(domain name)。例如,“www.baidu.com”代表搜索引擎Baidu上的WWW服务器的名字。Internet使用域名系统DNS来进行主机名字与IP地址之间的转换。

如果要为IP地址取得英文名字,可以通过层次命名系统来实现,有两种方法给Internet上的站点命名。

(1)组织分层(organizational hierarchy):层次命名方法亦称组织分层,组织分层的指导思想是这样的,首先将Internet网络上的站点按其所属机构的性质,粗略地分为几类,形成第一级域名,如图2-12所示。

•com用于商业机构或公司。

图2-12 域名组织分层结构

•edu用于大、中、小学校等教育机构。

•gov用于各级政府机构。

•int用于国际性组织。

•mil用于军事组织或机构。

•net用于网络服务或管理机构。

•org用于非盈利慈善组织及其他机构。

在第一级域名的基础上,再依据该机构本身的名字形成第二级域名,如美国国际商用机器公司,用其公司缩写IBM形成第二级域名。域名组织分层结构如图2-12所示。

第三级域名通常是该站点内某台主机或子域的名字,至于是否还需要第四级,甚至第五级域名,则视具体情况而定。

一个站点的第一级、第二级域名是Internet域名管理机构提供的。如同IP地址一样,在Internet上,域也必须是唯一的。一个Internet上的站点,当它从Internet管理机构获得第一级、第二级域名之后,至于如何定义其站点内每台主机的第三级、第四级甚至第五级的域名,则由该站点自己去决定。若某主机的域名共有三级,则其排列如下所示。

第三级域名.第二级域名.第一级域名

例如,www.baidu.com,表示百度公司的WWW服务器。也就是说,域名的排列是按级别从左至右排列的。

(2)地理分层(geographical hierarchy):按照站点所在地的国名英文名字的两个字母缩写来分配第一级域名的方法叫地理分层。由于Internet已遍及全世界,因此地理分层是一种更好的域名命名方法。然后在此基础上,再按上述组织分层方式命名。例如,www.pku.edu.cn就是中国北京大学WWW服务器的域名,cn是中国的缩写。

显然,用户在使用域名而不是IP地址请求E-mail或WWW等服务时,需要将域名转换为IP地址。在TCP/IP体系中有两种实现这种转换的方式。

对于较小的网络,可以使用TCP/IP体系提供的hosts文件,实现从域名到IP地址的转换,文件hosts上有许多域名到IP地址的映射供主叫主机使用。对于较大的网络,则在网络的一个或几个地方设置DNS,主叫主机中的名字转换软件resolver自动找到网上的DNS,利用DNS上的IP地址映射表,实现这一转换。

3.电子邮件(E-mail)服务

(1)电子邮件概述:电子邮件(electronic mail)简称E-mail,它是一种通过Internet与其他用户进行联系的快速、简便、廉价的现代化通信手段。电子邮件最早出现在ARPANET中,是传统邮件的电子化。它建立在TCP/IP的基础上,将数据在Internet上从一台计算机传送到另一台计算机。电子邮件可以将文字、图像、语音等多种类型的信息集成在一个邮件中传送,因此它已经成为多媒体信息传送的重要手段。

一个电子邮件系统主要由三部分组成:用户代理(user agent)、邮件服务器和电子邮件使用的协议。

用户代理是用户和电子邮件系统的接口,也称为邮件客户端软件,它让用户通过一个友好的接口来发送和接收邮件。如UNIX平台上的mail、Netscape Navigator,Windows平台上的Outlook Express、Foxmail等。用户代理应具有编辑、发送、接收、阅读、打印、删除邮件的功能。

邮件服务器是电子邮件系统的核心构件,其功能是发送和接收邮件,还要向发信人报告邮件传送的情况。邮件服务器需要使用两个不同的协议:SMTP(simple message transfer protocol,简单邮件传输协议)用于发送邮件,邮局协议POP3用于接收邮件。SMTP可以保证不同类型的计算机之间电子邮件的传送。SMTP采用客户机/服务器结构(图2-13),通过建立SMTP客户机与远程主机上的SMTP服务器间的连接来传送电子邮件。POP3协议主要用于PC机从邮件服务器中取回等待的电子邮件。当报文在Internet中传输时,各个主机使用了标准TCP/IP邮件协议,但当报文从邮件服务器发往用户的PC机时,使用的是POP协议。基于POP的用户代理具有一些优点。首先,邮件被直接发送到用户的计算机上,可以少占服务器的磁盘空间;其次,用户可以完全控制自己的电子邮件,可以把邮件作为一般文件进行存储;再次,可以利用用户计算机的特点,使用图形界面收发邮件,操作方便。

图2-13 SMTP客户机/服务器模型

由于电子邮件采用存储转发的方式,因此用户可以不受时间、地点的限制来收发邮件。传统的电子邮件只能传送文字,目前开发的多用途Internet电子邮件系统已经将语音、图像结合到电子邮件中,使之成为多媒体信息传输的重要手段。

4.文件传输(FTP)服务

(1)文件传输的概念:FTP(file transfer protocol)意为文件传输协议,用于管理计算机之间的文件传送。FTP服务可以在两台远程计算机之间传输文件,网络上存在着大量的共享文件,获得这些文件的主要方式是FTP,FTP服务是基于TCP的连接,端口号为21。若想获取FTP服务器的资源,需要拥有该主机的IP地址(主机域名)、账号、密码。但许多FTP服务器允许用户用anonymous用户名登录。密码任意,一般为电子邮件地址。

FTP可以实现文件传输的两种功能。

1)下载download:从远程主机向本地主机复制文件。

2)上传upload:从本地主机向远程主机复制文件。

FTP通常指文件传输服务。一般来说,用户联网的首要目的就是实现信息共享,文件传输是信息共享非常重要的内容之一。Internet上早期实现文件传输,并不是一件容易的事。我们知道,Internet是一个非常复杂的计算机环境,有PC、工作站、大型机等。据统计,连接在Internet上的计算机已有上亿台,而这些计算机可能运行不同的操作系统,有运行UNIX的服务器,也有运行Windows的PC机和运行MacOS的苹果机等,而各种操作系统的文件结构各不相同,要解决这种异种机和异种操作系统之间的文件交流问题,需要建立一个统一的文件传输协议,这就是所谓的FTP。基于不同的操作系统,有不同的FTP应用程序,而所有这些应用程序都遵守同一种协议,这样用户就可以把自己的文件传送给别人,或者从其他用户环境中获得文件。

Internet由于采用了TCP/IP协议作为它的基本协议,所以在Internet中无论两台计算机在地理位置上相距多远,只要它们都支持FTP协议,它们之间就可以随时相互传送文件。这样做不仅可以节省实时联机的通信费用,而且可以方便地阅读与处理传输来的文件。更加重要的是,Internet上许多公司、大学的主机中含有数量众多的公开发行的各种程序与文件,这是Internet上巨大和宝贵的信息资源。利用FTP服务,用户就可以方便地访问这些信息资源。

同时,采用FTP传输文件时,不需要对文件进行复杂的转换,因此具有较高的效率。Internet与FTP的结合,等于使每个联网的计算机都拥有了一个容量巨大的备份文件库,这是单个计算机无法实现的。但是,这也造成了FTP的一个缺点,那就是用户在文件下载到本地之前,无法了解文件的内容。

(2)FTP文件传输方式:文件传送服务是一种实时的联机服务。在进行文件传送服务时,首先要登录到对方的计算机上,登录后只可以进行与文件查询、文件传输相关的操作。

使用FTP可以传输多种类型的文件,如文本文件、二进制可执行程序、声音文件、图像文件与数据压缩文件等。

尽管计算机厂商采用了多种形式存储文件,但文件传输只有两种模式:文本模式和二进制模式。文本传输使用ASCII字符,并由Enter键和换行符分开,而二进制传输不用转换或格式化就可传输字符。二进制模式比文本模式更快,并且可以传输所有ASCII值,所以系统管理员一般将FTP设置成二进制模式。应注意在用FTP传输文件前,必须确保使用正确的传输模式,按文本模式传输二进制文件必将导致错误。

为了减少储存与传输的代价,通常大型文件,如大型数据库文件、讨论组文档、BSD UNIX(全部源代码等)都是按压缩格式保存的。由于压缩文件也是按二进制模式来传送的,因此接收方需要根据文件的后缀来判断它是用哪一种压缩程序进行压缩的,那么解压缩文件时就应选择相应的解压缩程序进行解压缩。

(3)如何使用FTP:使用FTP的条件是用户计算机和向用户提供Internet服务的计算机能够支持FTP命令。UNIX系统与其他支持TCP/IP协议的软件都包含FTP实用程序。FTP服务的使用方法很简单,启动FTP客户端程序,与远程主机建立连接,然后向远程主机发出传输命令,远程主机在接收到命令后,就会立即返回响应,并完成文件的传输。

FTP提供的命令十分丰富,涉及文件传输、文件管理、目录管理与连接管理等方面。根据所使用的用户账户不同,可将FTP服务分为以下两类。

1)普通FTP服务。

2)匿名FTP服务。

用户在使用普通FTP服务时,必须建立与远程计算机之间的连接。为了实现FTP连接,首先要给出目的计算机的名称或地址,当连接到宿主机后,一般要进行登录,在检验用户ID号和密码后,连接才得以建立。因此,用户要在远程主机上建立一个账户。对于同一目录或文件,不同的用户拥有不同的权限,所以在使用FTP过程中,如果发现不能下载或上传某些文件时,一般是因为用户权限不够。但许多FTP服务器允许用户用anonymous用户名匿名登录。密码任意,一般为电子邮件地址。用自己的E-mail地址作为用户密码,匿名FTP服务器便可以允许这些用户登录到这台匿名FTP服务器中,提供文件传输服务。如果是通过浏览器访问FTP服务器,则不用登录就可访问到提供给匿名用户的目录和文件。

目前世界上有很多文件服务系统为用户提供公用软件、技术通报、论文研究报告,这就使Internet成为目前世界上最大的软件与信息流通渠道。Internet是一个资源宝库,保存有很多的共享软件、免费程序、学术文献、影像资料、图片、文字与动画,它们都允许用户使用FTP下载下来。由于仅仅使用FTP服务时,用户在文件下载到本地之前无法了解文件的内容,为了克服这个缺点,人们越来越倾向于直接使用WWW浏览器去搜索所需要的文件,然后利用WWW浏览器所支持的FTP功能下载文件。