我正在尝试编写一个函数来检查.csv文件中的所有分隔符是否为“;”。我的尝试是使用csv.Sniffer()
:
import csv
def check_data_validity(file):
sniffer=csv.Sniffer()
dialect = sniffer.sniff(file)
if dialect.delimiter != ';':
return False
无论文件如何,我总是得到“假”。我想通过读取每一行并检查分隔符是什么来做到这一点,但我觉得这对于大文件来说非常令人生畏。
原始格式的文件示例如下:
timestamp_1;timestamp_2;Value_1;Value_2;Value_3;Result
1509494402000;2017-11-01T00:00:02Z;292.05;;26.89;0.0;;;
1509494410000;2017-11-01T00:00:10Z;6.0;;4.0;1.0;;;
1509494412000;2017-11-01T00:00:12Z;29.23;;4.0;0.0
您可以使用Sniffer并检查是否抛出错误。
import csv
def check_data_validity(file):
with open(file, newline = "") as csvfile:
try:
dialect = csv.Sniffer().sniff(csvfile.read(1024), delimiters = ";")
print("Delimiter is ;")
except:
print("Wrong Delimiter")