Node.js 后端开发指南:搭建、优化与部署
Python读取CSV文件技巧详解
在数据处理领域,CSV文件因其简洁和通用性成为了一种非常流行的数据交换格式。Python,作为一种强大的编程语言,提供了多种读取CSV文件的方法。本文将详细介绍如何使用Python读取CSV文件,包括使用pandas库和csv库,以及如何读取特定列和行的数据。此外,我们还将探讨CSV文件的写入技巧。
CSV文件概述
CSV(Comma-Separated Values)文件是一种纯文本形式的表格数据(一种数据库),其以逗号分隔值。CSV文件中的每一行是一个数据记录,每个记录由一个或多个字段组成,字段之间用逗号分隔。CSV文件格式因其简单和易于解析而被广泛使用。Python中处理CSV文件的常用库包括csv
和pandas
。
使用pandas库读取CSV
pandas读取CSV基础
pandas
是一个强大的Python数据分析工具库,提供了read_csv
函数用于读取CSV文件。该函数将CSV文件加载为DataFrame对象,DataFrame是pandas中用于存储和操作结构化数据的一个类。
import pandas as pd
df = pd.read_csv('../data_pro/audito_whole.csv')
print(df)
pandas读取CSV高级技巧
pandas提供了多种参数来处理不同的CSV文件读取需求,例如指定列分隔符、处理缺失值等。此外,pandas还支持直接读取ZIP文件中的CSV文件,这在处理大型数据集时非常有用。
使用csv库读取CSV
csv.reader基础
Python标准库中的csv
模块提供了读取CSV文件的功能。csv.reader
是最基本的读取器,它将CSV文件的每一行读取为一个列表。
import csv
with open('../data_pro/audito_whole.csv', encoding='utf-8-sig') as f:
csv_reader = csv.reader(f)
for row in csv_reader:
print(row)
csv.DictReader和csv.DictWriter
csv.DictReader
将CSV文件的每一行读取为一个字典,其中列名作为键,字段值作为值。这对于需要通过列名访问数据的情况非常有用。
import csv
with open('../data_pro/audito_whole.csv', encoding='utf-8-sig') as f:
for row in csv.DictReader(f, skipinitialspace=True):
print(row)
读取CSV文件特定列和行
读取特定列
在处理CSV文件时,我们经常只需要读取特定的列。使用pandas时,可以直接通过列名选择需要的列,或者使用列索引。
import pandas as pd
path = 'data.csv'
data = pd.read_csv(path)
x = data'column1', 'column2'
print(x)
读取特定行
读取特定行的数据也是一个常见的需求。可以通过DataFrame的索引来实现,或者使用csv
模块的迭代器跳过不需要的行。
import csv
csv_reader = csv.reader(open(