我正在对此csv文件进行预处理,但它没有继续 - 我收到了"TypeError: expected string or bytes-like object"
的错误:
import pandas as pd
import numpy as np
import string
import nltk
dataset =pd.read_csv('blogtext.csv')
seq=dataset.iloc[:,6]
输出将是7列的bloglog.csv文件,但我收到一个错误。
我猜你的数据集中有漂浮值。
您需要将这些浮点值转换为字符串值。
“pandas.DataFrame.iloc”是纯粹基于整数位置的索引,用于按位置选择,.iloc []主要是基于整数位置(从轴的0到长度-1),但也可以与布尔数组一起使用。
例如 ,
import pandas as pd
mydict = [{'a': 1, 'b': 2, 'c': 3, 'd': 4},
{'a': 100, 'b': 200, 'c': 300, 'd': 400},
{'a': 1000, 'b': 2000, 'c': 3000, 'd': 4000 }]
df = pd.DataFrame(mydict)
print(df.iloc[0])
'''
Output:
a 1
b 2
c 3
d 4
'''
df.iloc[[0]]
'''
Output
a b c d
0 1 2 3 4
'''
df.iloc[[0, 1]]
'''
Output
a b c d
0 1 2 3 4
1 100 200 300 400
'''
df.iloc[:3]
'''
Output
a b c d
0 1 2 3 4
1 100 200 300 400
2 1000 2000 3000 4000
'''