Python数据分析第一步

作者:yxglyl88 时间:2025-12-17 21:28:29

数据分析是一种具有多维性与描述性的统计方法,通过数据和图表展现变量间的关联,提取关键信息,以简洁直观的方式呈现复杂数据的核心内容,其本质在于揭示数据背后的规律与价值。

例如,上司提供历年销售数据,我们需分析其中的增长趋势、客户特征及人力成本等关键信息,从中提炼出有价值的规律与洞察。

这一过程或为人工操作,许多读者经验或更丰富。上司关注报表结果,而我们更关心如何高效准确地完成所需报表。

当数据来源复杂、分散于多个文件或数据库,且内容缺乏规范性时,需借助编程语言对数据进行清洗和整理,以确保其准确性和一致性,之后才能开展有效的数据分析工作。

本教程系列重点介绍如何运用Python及其相关组件进行数据分析,旨在帮助学习者掌握Python数据分析的基本思路与方法,熟悉常用分析工具的操作。通过系统学习,能够大幅提升工作效率,将原本耗时较长的报表分析任务在更短时间内完成,实现数据处理的自动化与高效化。

对于数据分析,每个人的理解各不相同。有人认为是打开Excel等文件查看数据,有人则认为是使用SQL语句从数据库中按需查询信息,还有人觉得是通过网络爬虫采集数据并进行深入分析。不同的人基于经验和背景,对数据分析的定义和操作方式有着不同的认知与实践方法。

总结主要是对文件进行读取,所谓数据库也只是将数据存于文件系统中,额外增加了一层结构化数据的封装。

CSV文件,即逗号分隔值文件(Comma-Separated Values),是一种以纯文本形式存储表格数据的文件格式。其特点是各数据项之间通常用逗号分隔,少数情况下也可使用其他分隔符。由于CSV文件本质上是纯文本,因此可将其视为字符序列,读取时无需采用处理二进制文件的方式,直接按文本格式解析即可,具有结构简单、通用性强的优点。

以下为一个简易的CSV文件格式示例。

Python数据分析第一步

我用文本编辑器创建了一个名为三国武将表.csv的文件。

现在可用Excel或其他电子表格软件打开该CSV文件,查看其数据呈现方式。

Python数据分析第一步

假设我们正在开发一款三国题材游戏,武将数据需直接加载至内存并在游戏中实时显示,这就要求能够随时修改并保存数据。此时,可借助Python对CSV文件的读写功能来实现数据的动态管理与持久化存储。

Python标准库内置了对CSV文件的读写功能,只需使用import csv即可导入相关模块,方便直接处理CSV文件。

完整代码及运行结果如下所示:

Python数据分析第一步

通过上述代码,我们首先导入Python内置的csv模块。

将本地文件三国武将表.csv读取并赋值给变量f。

利用csv.reader()函数将文件对象f转换为CSV格式的可读对象f_csv。

此时f_csv对象为一个可迭代对象,通过for循环即可逐行输出内容,每行数据以列表形式呈现,由该行各列数据构成,结构清晰直观。

现需随机扣除每位武将的血量,使数据呈现激战后的状态(吕布正在虎牢关与关羽、张飞展开单挑)。

重新改造代码,实现武将血量的修改功能。

Python数据分析第一步

所示,武将血量已实现随机递减。

在代码中引入了Python标准库random,主要用于生成各种随机数。

在代码第9行,我们对row中下标为2的元素进行了随机减法操作。由于CSV文件读取的数据默认均为字符串类型,若需将其作为数值使用,必须先进行类型转换。因此,不能直接使用row中的值,而应通过int(row)将其转为整型,以确保数学运算的正确执行。

已调整部分武将血量,数据暂存内存,现将其保存至CSV文件。

Python数据分析第一步

上述代码改动较少,主要新增一个rows列表变量,用于保存武将属性更新后的数据信息。

第15行的 rows.append(row) 作用是将每条修改后的数据添加到 rows 列表中。

第19行中,我们以写入模式打开新文件三国武将列表_2.csv,用于创建并写入新的CSV数据。

将文件对象传给csv.write(f),转换为CSV模块对象,再调用writerows()方法写入数据信息。

需要注意的是,该程序中使用了 try-except 语法进行异常处理,原因是第一行表头中的血量为文本信息,无法执行数学运算,需通过异常捕获避免程序出错。

当预知程序可能出现错误时,可使用 try-except 结构处理异常,在 except 中加入 pass 表示出错时忽略并跳过该错误,继续执行后续代码。具体细节可参考纸飞机编程的 Python 基础教程系列中关于异常处理的内容。

查看写入的CSV文件,可见每位武将的生命值均已更新。

Python数据分析第一步

有读者或许会疑惑,f_csv.writerows(rows) 到底写入了什么内容?我们可通过打印代码中的 rows 信息来一探究竟。

Python数据分析第一步

第18行打印了变量rows,结果显示它是一个包含多个子列表的列表,每个子列表中又包含多个列的数据。

讲完CSV文件读写后,接下来介绍Excel文件的操作。

Excel是微软于1982年推出的一款电子表格软件,凭借直观的界面、强大的计算与图表功能,加之早期市场竞争较少,多年来持续占据主导地位,使其文件格式几乎成为电子表格领域的行业标准。

应将Excel文件与Excel软件加以区分。Excel文件的格式扩展名通常为xls或xlsx,不仅可由微软Excel软件打开编辑,也能被WPS、Numbers等其他办公软件读取和修改,具有较强的兼容性,适用于多种操作系统和应用程序。

现在可将刚打开的CSV文件另存为Excel格式。由于该文件已在我的电脑上由Numbers软件打开,只需直接将其保存为.xlsx格式即可完成转换。

Python数据分析第一步

现在即可获取名为三国武将表.xlsx的文件。

如何用Python读取Excel文件?

在Python中,有众多第三方库可用于处理Excel文件,本章教程仅选用xlrd和xlwt两个库进行讲解,便于掌握基础的读写操作。

Python数据分析第一步

上述代码演示了利用xlrd库读取Excel文件的方法。

我们发现每列数据前标有text或number,用于区分该列数据是字符串类型还是数字类型。

CSV文件中的内容均为字符类型,而读取Excel文件时,若使用xlrd库,它会自动区分数字与文本,无需我们在后续处理中手动进行数据类型转换。

现对每位武将的血量进行随机调整,旨在学习如何用Python处理Excel中的数据。

Python数据分析第一步

由于首行为表头,需判断行号,从第二行起才开始修改血量数据。

为避免频繁编写 table.row(rownum) 带来的冗余,程序中引入了 row_vals 变量来统一存储每行数据,提升代码简洁性与可维护性。

row_vals 表示每行的数据,通过索引可获取对应列的元素,再访问其 value 属性,即可得到该列的具体内容,即 row_vals.value。

吕布、关羽、张飞的血量均被削减,其中张飞生命垂危,情况十分危急。

现在学习将数据写入Excel文件的方法。

Python数据分析第一步

上述代码解释如下:

为便于理解数据格式,我们打印出datas内容查看。

Python数据分析第一步

查看生成的Excel文件结果如何。

结合使用xlrd和xlwt库,可减少重复操作,提升效率,让我们有更多时间专注于更有意义的工作。

本章知识点将通过思维导图进行总结归纳。

Python数据分析第一步

本章内容到此结束,CSV与Excel文件的更多读写方式将在后续章节中陆续介绍。

小编推荐
小憩最新版
小憩最新版 生活服务丨64.3MB
进货通最新手机版
进货通最新手机版 其他软件丨40.2MB
美l免费版
美l免费版 其他软件丨48.4MB
智慧兰职手机安卓版
智慧兰职手机安卓版 其他软件丨30.4MB
万盟软件2026最新
万盟软件2026最新 其他软件丨9.0MB
微信农场上线版2026
微信农场上线版2026 其他软件丨245.0MB
涂鸦板手机版
涂鸦板手机版 其他软件丨10.0MB
麦当劳免费
麦当劳免费 生活服务丨97.0MB
中考通安卓版
中考通安卓版 其他软件丨14.0MB