Python如何实现等分切分数据及规则命名-开发技术-互联网-天达云

Python如何实现等分切分数据及规则命名
更新：HHH 时间：2023-1-7

这篇文章将为大家详细讲解有关Python如何实现等分切分数据及规则命名，小编觉得挺实用的，因此分享给大家做个参考，希望大家阅读完这篇文章后可以有所收获。

将一份一亿多条数据的csv文件等分为10份，代码如下所示：

import pandas as pd
data = pd.read_csv('C:\\Users\\PycharmProjects\\SplitData\\data\\UserBehavior.csv') # 路径则根据个人存放项目文件的习惯
num = 0
for i in range(1, 11):
start = num
num = num + int(data.shape[0] / 10)
file = data.iloc[start:num,]
file.to_csv("C:\\Users\\PycharmProjects\\SplitData\\newData\\" + str(i) + "_data.csv", index=False) # index=False是不想切分后的文件出现序号

注意：如果此时文件的路径包含有中文，则必须改成以下的代码：

import pandas as pd
f = open('C:\\Users\\PycharmProjects\\数据切分\\data\\UserBehavior.csv')
data = pd.read_csv(f)
num = 0
for i in range(1, 11):
start = num
num = num + int(data.shape[0] / 10)
file = data.iloc[start:num,]
file.to_csv("C:\\Users\\PycharmProjects\\SplitData\\newData\\" + str(i) + "_data.csv", index=False)

但是使用这种方法调用文件进内存，加重了内存的负担，两次赋值相当于内存占用乘2，此方法不建议使用，还是将路径改为英文名。

关于“Python如何实现等分切分数据及规则命名”这篇文章就分享到这里了，希望以上内容可以对大家有一定的帮助，使各位可以学到更多知识，如果觉得文章不错，请把它分享出去让更多的人看到。


返回开发技术教程...

新手上路

产品管理

支付方式

关于我们