说明
数据产品经理教程 正在编写中,欢迎大家加微信 gairuo123 (备注:数据产品教程) 提供意见、建议、纠错、催更。应大家要求,作者开办数据产品和数据分析培训班,详情 数据产品经理培训 / 数据分析培训。
csv 存储的是文本,即数据本身,仅用逗号(tsv 用制表符)隔开,所以数据量越大,存储占用空间一定会增加。
而 Excel 存储同样的数据时,会根据数据类型转换,比如字符串 0.000000000 直接转为数字 0,还会对同样值的数据根据算法只存储一次。因此,Excel 占用字节的量会大大缩减,这样就压缩了存储空间
同时,Excel 也会对数据增加样式(如字体大小、颜色等)、排版(单元格合并)、公式等内容,它具有较为复杂的组织结构。
Excel 之类的文件其实采用的是一种叫做 OpenXML 的规范。如果你把 xlsx 之类的后缀改掉,变成 zip,再解压会得到同不同层级文件夹组织起来的若干个文件,这些文件大多是 xml 文件,xml 这是一种结构化数据,和 html 一样,html 也是一种 xml 文件。
这些 xml 提供了数据的基础信息、压缩形式、样式等内容。由于 xls 之类的都是有压缩的,需要专门软件打开。
csv没有最大行数限制,可以用记事本打开。
excel文件有最大行数限制,xls文件最大行数65536,xlsx文件最大行数1048576行。
excel 打开超过最大行数的csv会有提示,数据加载不全。
参考:https://www.zhihu.com/question/541988750
更新时间:2022-08-27 10:52:02 标签:csv excel