我是Python的新手,我正试图处理一些数字。附件:Open High Low Close Sample Data
我已经测试了一些导入数据的变体但是失败了。真的很感激一些建议。谢谢!
path = 'Data/Price.numbers'
with open(path) as file:
file.readline()
for line in file:
values = map(float, line.split())
test.append(values)
主要目标:
1)以我可以轻松操作和应用计算的格式有效地存储表数据>我正在考虑Dict {}>任何评论?
2)优化快速计算,因为我需要处理多个证券的数据>我估计大约1,000,000到2,000,000个数据点。
再次,感谢任何建议更好地做到这一点。
Numpy是一个很棒的导入数据的库。
例如:
import numpy as np
import
ran = np.array([(np.loadtxt"a.txt"), delimiter =';'])
print(ran[1])
然后,您可以将数据操作为数组,如下所示:https://s3.amazonaws.com/assets.datacamp.com/blog_assets/Numpy_Python_Cheat_Sheet.pdf
您可以使用pandas库。看一下文档here
例如,如果将文件另存为csv,并使用逗号作为分隔符,则可以使用:
import pandas as pd
df = pd.read_csv('name of the file.csv', sep=',')
如果您收到编码错误,您可以尝试:
import pandas as pd
df = pd.read_csv('name of the file.csv', sep=',', encoding='latin-1')