7.1.1 文件概述

7.1.1 文件概述

文件是一个存储在辅助存储器上的数据序列,可以包含任何数据内容。从概念上说,前面学到的函数是程序的集合和抽象,而文件则是数据的集合和抽象。

一个文件需要有唯一确定的文件标识,以便用户找到确定的文件。文件的标识包括3个部分,即文件路径、文件名、文件扩展名,如D:\Python\example.txt。

·文件路径:D:\Python\。

·文件名:example。

·文件扩展名:.txt。

文件的组织形式和表达数据方式更有效、更灵活。文件按编码方式一般分为两大类型:文本文件和二进制文件。

文本文件是由单一特定编码的字符组成的,如ASCII、Unicode、utf-8等编码,内容容易统一展示和阅读。大部分文本文件都可以通过文本编辑软件或文字处理软件创建、修改和展示。由于文本文件存在编码,所以也可以将它看成一个存储在磁盘上的长字符串,如一个txt格式的文本文件,可以读成一个字符串。

二进制文件直接由比特0和1组成,没有统一的字符编码,文件内部数据的组织格式与文件用途有关。二进制是信息按照非字符但特定格式形成的文件,一般用于可执行程序、图像、音频、视频等,如png格式的图片文件、avi格式的视频文件。二进制文件没有统一的字符编码,只能当作字节流,而不能看作字符串。