Pandas如何迭代(遍历)一个数据集

明俊数据分析 2024-02-21 17:21:41

在Pandas中迭代一个数据集的常见方法主要包括使用 iterrows()、itertuples() 和 apply() 函数。每种方法有其特定的用途和性能特点。

1. 使用 iterrows()

iterrows() 逐行迭代DataFrame，返回每行的索引和数据。每行的数据作为一个Series返回。

import pandas as pd# 创建示例DataFramedf = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})# 使用iterrows迭代for index, row in df.iterrows(): print(index, row['A'], row['B'])2. 使用 itertuples()

itertuples() 也逐行迭代DataFrame，但它比 iterrows() 快。它返回的是具名元组。

# 使用itertuples迭代for row in df.itertuples(): print(row.Index, row.A, row.B)3. 使用 apply() 函数

apply() 函数对DataFrame中的每一行或列应用一个函数，这不是传统意义上的迭代，但它可以高效地对整个DataFrame执行操作。

# 定义一个处理函数def process(row): print(row['A'], row['B'])# 使用apply迭代df.apply(process, axis=1)注意事项iterrows() 和 itertuples() 适用于需要逐行处理数据的情况，但它们通常比向量化的方法慢。apply() 是一种更加高效的方法，尤其是当你可以使用向量化的操作时。尽量避免在大数据集上使用逐行迭代，因为这可能会导致性能问题。在可能的情况下，优先考虑使用向量化的操作。

根据你的具体需求和数据集的大小，你可以选择最合适的方法来迭代数据集。

0 阅读：0

明俊数据分析

感谢大家的关注

热门分类

教育TOP

1

校园抓拍，初中学妹

2

这是我同事写的字，是体育老师，他的字可行说在当地整个教育系统都排得上名次。写的不

3

4人宿舍怎么分？

4

看了看牢A讲的女留学生经历，实在是辣眼。牢A说，一般女留学生在国内都是乖乖女，去

5

留学生一张肛裂就诊单火遍全网，网友笑翻：这融入海外的代价也太大了！就一个简单的病

6

不同学历工资收入第一名：博士学历（工资50000）第二名：硕士学历（工资4

7

国内“三通一达”是圆通、申通、中通和韵达，可到了国外，部分留学女孩口中竟衍生出“

8

广东省教育厅今天刚刚发布：中山大学，华南师范大学，华南理工大学，北京理工大学（珠

9

厦门大学又给学生悄悄打钱了最近，厦门大学不少学生发现卡里多了一笔钱，还收到一

10

现在看这些女留学生的瓜，真是让人极度生理不适。说句实在话，老一辈留学生啃馒

教育最新文章

1

今天有个学生来学校找我办政审，办理的时候我突然问了一句，你考了435分？他点

2

广东省教育厅今天刚刚发布：中山大学，华南师范大学，华南理工大学，北京理工大学（珠

3

期末忙着赶课程总结、开家长会的小学老师，被要求熬夜排年会节目，这事儿最近在成都引

4

期末熬着夜改教案的小学老师，被拉去排年会节目了。成都某小学的老师投诉，说

5

朱珠早期外国留学的照片扯出了很多留学圈不敢说的秘密你们应该已经发现了，不

6

留学生一张肛裂就诊单火遍全网，网友笑翻：这融入海外的代价也太大了！就一个简单的病

7

2025年中国大学本科校友首富排名。

8

难怪现在留学生的含金量在国内越来越不吃香了，牢A的“三通一达”留学生不再是香饽饽

9

陪读妈妈急了？不，是“人设崩了”才慌了最近，几位加拿大陪读妈妈终于站出来“澄

10

上海一骑绝尘，以4684.4亿元稳坐头把交椅，就跟班级里的学霸似的，分数甩第二名