读取文件时字符串索引超出范围

问题描述 投票:5回答:3

我想阅读以下格式的csv

BX80684I58400;https://www.websupplies.gr/epeksergastis-intel-core-i5-8400-9mb-2-80ghz-bx80684i58400
bx80677g3930;https://www.websupplies.gr/epeksergastis-intel-celeron-g3930-2mb-2-90ghz-bx80677g3930

我使用以下内容

contents = []
with open('websupplies2.csv','r') as csvf: # Open file in read mode
urls = csvf.read()
split_urls=urls.split('\n')

for split_url in split_urls:

    contents.append(split_url[1])

但我明白了

字符串索引超出范围

我注意到我无法通过delimiter =';'在csvf.read()里面。如果我改成它

csv.reader(csvf, delimiter=';') 

我不支持拆分..

感谢您的时间

python python-3.x csv web-scraping
3个回答
3
投票

使用csv模块。

例如:

import csv

with open(filename) as infile:
    reader = csv.reader(infile, delimiter=";")
    for row in reader:
        print(row[1])

输出:

https://www.websupplies.gr/epeksergastis-intel-core-i5-8400-9mb-2-80ghz-bx80684i58400
https://www.websupplies.gr/epeksergastis-intel-celeron-g3930-2mb-2-90ghz-bx80677g3930

2
投票

只是一个解释。

问题与csv或其他问题无关。主要原因:

string比索引值短。换句话说:字符串中没有索引元素(split_url[1]

我试着用一个变量来解释:

your_string = 'abc'
print(your_string[0]) # a
print(your_string[1]) # b
print(your_string[2]) # c
# len(your_string) is 3, but you trying to get next item
print(your_string[3]) # IndexError: string index out of range

您可以使用条件(if len(split_url)...)修复它,但我认为@Rakesh解决方案更好。

希望这可以帮助。


0
投票

我认为你应该使用csv模块,这里有几个examples

import csv

csv.register_dialect('myDialect',
delimiter = ';',
skipinitialspace=True)

with open('websupplies2.csv', 'r') as csvFile:
    reader = csv.reader(csvFile, dialect='myDialect')
    for row in reader:
        print(row)

csvFile.close()
© www.soinside.com 2019 - 2024. All rights reserved.