4.4.1 HTML概述
1.HTML概述
HTML是Hyper Text Markup Language(超文本标记语言)的缩写。所谓标记语言,是指用一系列约定的标签来对电子文档进行标记的语言,以定义文档的语义、结构、显示格式。HTML中的M(Markup,标签或标记)是指HTML文档中一些使用包含起来的标准化的标签,这些标签有特殊的含义,指明了文本的显示格式和方式。标签使用了格式化的显示命令,易于识别并和文本内容区分。而且标签不能自定义,必须遵循W3C制定的标准。而HTML中的HT(Hyper Text,超文本)是指用超链接的方法,将各种不同空间的信息组织在一起形成网状分布的文本。HTML文档中的文本可以包含指向其他网络位置或者其他文档的链接,允许从当前阅读位置直接跳转到链接所指的位置。
HTML并非编程语言,它提供一套标准化的标签来标记Web页面。与程序设计语言相比,HTML缺少编程语言所需的最基本的变量定义、流程控制等功能,它只是通过一系列的标签对超文本的语义进行描述。HTML文件可以由任何一种文本编辑器来创建和编辑。例如Windows系统中自带的Notepad(记事本),或者一些第三方文本编辑工具如Ultraedit等。文档中涉及的图像、视频、音频等多媒体信息,是以单独的文件形式存放于HTML文档外部并在文档中使用正确的URL进行引用。
HTML语言是建立Web页面的规范或标准,从它出现发展到现在,规范不断完善,尽管依然有缺陷和不足,但是人们仍在持续改进它,使它的功能越来越强、更加便于控制和富有弹性,以适应Web应用需求。自1993年W3C发布HTML1.0版本至今,已经发布了多个HTML版本。目前,规范已经演进到HTML5.0版本。
2.HTML文档构成
一个简单的HTML页面如图4-8所示。
【例4-1】简单的HTML页面示例。
它在浏览器中显示的效果如图4-8所示。
图4-8 简单的HTML页面
从上面的例子可以看到,HTML文档由包含标签在内的元素及其属性构成。
(1)标签
用尖括号括起来的关键字称为标签或标记,它规定了信息类型,如图片、音频、超链接等,并指明了所作用的文本的显示格式和方式。标签本身在浏览器中并不会显示出来,但是浏览器会根据标签来显示标签之间的内容。
一般情况下,标签是成对出现的,例如html和/html成对出现,body和/body成对出现。标签对中,第1个标签叫起始标签(start tag),第2个标签叫结束标签(end tag)。如果忘记了结束标签/p,大多数浏览器也可以显示正确的内容,例如“p段落”,浏览器也能进行正确的解释。但是不应该依赖浏览器对这种错误的处理,因为丢失结束标签会导致意想不到的后果。
某些标签没有内容,不需要成对出现,如br/,表示一个回车符号。
不同的标签所代表的含义不同。标签可以使用大写,也可以使用小写,例如,P和p是等效的,但是在W3C中推荐使用小写。
标签可以嵌套,在【例4-1】中,title就嵌套在head标签中。
(2)元素
HTML元素指的是从开始标签到结束标签之间(包括起始标签和结束标签)的所有代码。在【例4-1】中,p欢迎光临!/p就是一个元素,其中p是标签,文本内容是“欢迎光临!”,它告诉浏览器以段落样式显示中间的文本。
元素的内容是开始标签和结束标签之间的内容。某些HTML元素具有空内容,被称为空元素,例如,br/就是一个空内容的元素。这样的空元素应在开始标签中关闭。
元素内还可以嵌套包含其他元素,在【例4-1】中,元素p欢迎光临!/p就嵌套在body元素中。但是元素的嵌套逻辑必须正确,不能出现交叉嵌套,即子元素在某元素中开始,必须在该元素中结束。
(3)属性
HTML元素可以拥有属性。属性提供了有关HTML元素的更多附加信息。属性总是在HTML元素的开始标签中规定,并且在一个标签中可以出现多个属性。属性以名称/值对的形式出现,比如:name=“value”。属性值应用引号括起来,一般常用双引号。
【例4-2】
h1id=“123“Best book书店/h1
该例子定义了一个一级标题样式,显示的内容为“Best book书店”,id是元素的一个属性,id=“123”规定了该HTML元素唯一的id。
【例4-3】
input type=“text“name=“user“/
该例子定义了一个表单元素input,type属性规定了这是一个常规文本输入的表单元素,在浏览器中会显示一个输入文本框,name属性提供了名称/值对中的名称,它将指代文本框的输入内容。
【例4-4】
l ink rel=“stylesheet“type=“text/css“href=“bestbook.css“/
这个例子定义了一个link元素,rel、type和href是该标签的属性,表示该页面链接了一个外部样式表,类型是CSS的,相对URL是bestbook.css。
(4)HTML的文档结构
HTML文档是结构化的,由嵌套的HTML元素构成。文档的标题、段落、多媒体、超链接等都是元素。文档由一系列遵循HTML语法规范的元素及其属性构成。一个基本HTML页面结构如下。
文档的主体部分包含在html元素中,该元素即为文档的根元素。html标签是所有HTML页面的起始标志,其中嵌套了两个元素head和body。
head元素描述的是页面的头信息,是可选的部分。该元素主要规定HTML文件的显示标题、字符集及一些说明性内容等。头信息是不显示出来的,在浏览器里看不到。但是这并不表示这些信息没有用处。比如可以在头信息里加上一些关键词,有助于搜索引擎能够搜索到本页面。head元素中可以嵌套title元素,它描述的是页面的标题信息,可以在浏览器最顶端的标题栏看到这个标题。
body元素是页面主体部分,描述的是用户可见的内容。它包含了各种标签定义的子元素,元素不能出现交叉嵌套。在元素的开始标签可以定义属性,完整元素结构如下。
标签1 属性名1=“属性值1“ 属性名2=“属性值2“
其中的斜体部分是可选项。