英溯IT论坛

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 962|回复: 0

pandas读取csv处理时报错:ParserError: Error tokenizing data. C error:...

[复制链接]

105

主题

113

帖子

588

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
588
发表于 2021-2-25 05:41:48 | 显示全部楼层 |阅读模式
csv文件默认的是以逗号为分隔符,但是中文中逗号的使用率很高,爬取中文数据时就容易造成混淆,所以使用pandas写入csv时可以设置参数 sep=’\t’ ,即以tab为分隔符写入。毕竟tab在中文习惯里用的很少嘛。
那这样在后面读取csv进行数据处理时,一定记得加上一个参数delimiter:

delimiter="\t"
#这样读入:
df=pd.read_csv('path',delimiter="\t")

不然你把dataframe打印出来看看就是挤在一团,没有分列的,后面对csv进行处理的时候还可能会出现标题那样的错误

ParserError: Error tokenizing data. C error: Expected 1 fields in line 29, saw 2
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|英溯IT论坛 ( 沪ICP备13022730号-6 )

GMT+8, 2024-12-22 20:28 , Processed in 0.102864 second(s), 18 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表