文件类型及操作

2020-06-10  本文已影响0人  glRu

文件的理解

    文件是数据的抽象和集合

    - 文件是存储在辅助存储器上的数据序列

    - 文件是数据存储的一种形式

    - 文件展现形态:文本文件和二进制文件

     文件文件和二进制文件只是文件的展示方式; 本质上,所有文件都是二进制形式存储;形式上,所有文件采用两种方式展示

文本文件

     由单一特定编码组成的文件,如UTF-8编码; 由于存在编码,也被看成是存储着的长字符串;适用于例如:.txt文件、.py文件等

二进制文件

    直接由比特0和1组成,没有统一字符编码;一般存在二进制0和1的组织结构,即文件格式;适用于例如:.png文件、.avi文件等

文本文件vs. 二进制文件

文件的打开和关闭

    文件处理的步骤: 打开-操作-关闭

1. 文件的打开

文件的打开模式

文件的关闭

文件内容的读取

文件的全文本操作

遍历全文本,法一 遍历全文本,法二

文件的逐行操作

逐行遍历文件:方法一 逐行遍历文件:方法 二

数据文件的写入

数据组织的维度

    维度:一组数据的组织形式

    一维数据:由对等关系的有序或无序数据构成,采用线性方式组织

二维数据:由多个一维数据构成,是一维数据的组合形式

多维数据:由一维或二维数据在新维度上扩展形成

高维数据:仅利用最基本的二元关系展示数据间的复杂结构

数据的操作周期

一维数据的表示

    如果数据间有序:使用列表类型

    如果数据间无序:使用集合类型

一维数据的存储

    方式一:空格分隔

    方式二:逗号分隔

    方式三:其他方式(特殊符号)

一维数据的处理

1. 1 从空格分隔的文件中读入数据

1.2  从特殊符号分隔的文件中读入数据

2.1  采用空格分隔方式将数据写入文件

2.2  采用特殊分隔方式将数据写入文件

二维数据的格式化和处理

二维数据的表示

    使用列表类型

CSV格式与二维数据存储

    CSV: Comma-Separated Values

    国际通用的一二维数据存储格式,一般.csv扩展名;每行一个一维数据,采用逗号分隔,无空行;Excel和一般编辑软件都可以读入或另存为csv文件

    如果某个元素缺失,逗号仍要保留;二维数据的表头可以作为数据存储,也可以另行存储; 逗号为英文半角逗号,逗号与数据之间无额外空格

    按行存或者按列存都可以,具体由程序决定;一般索引习惯:ls[row][column],先行后列;根据一般习惯,外层列表每个元素是一行,按行存

二维数据的读入处理

    从CSV格式的文件中读入数据

将数据写入CSV格式的文件

二维数据的逐一处理

    采用二层循环

上一篇下一篇

猜你喜欢

热点阅读