我想将文件中的数字读取到二维数组中。
文件内容:
例如:
4 3
1 2 3 4
2 3 4 5
6 7 8 9
假设你没有多余的空格:
with open('file') as f:
w, h = [int(x) for x in next(f).split()] # read first line
array = []
for line in f: # read rest of lines
array.append([int(x) for x in line.split()])
您可以将最后一个 for 循环压缩为嵌套列表理解:
with open('file') as f:
w, h = [int(x) for x in next(f).split()]
array = [[int(x) for x in line.split()] for line in f]
对我来说,这种看似简单的问题正是 Python 的全部意义所在。特别是如果您来自 C++ 这样的语言,在这种语言中,简单的文本解析可能会很麻烦,您会非常欣赏 Python 可以为您提供的功能单元解决方案。我会使用几个内置函数和一些生成器表达式来使其非常简单。
您需要
open(name, mode)
、myfile.readlines()
、mystring.split()
、int(myval)
,然后您可能需要使用几个生成器以 Python 方式将它们全部组合在一起。
# This opens a handle to your file, in 'r' read mode
file_handle = open('mynumbers.txt', 'r')
# Read in all the lines of your file into a list of lines
lines_list = file_handle.readlines()
# Extract dimensions from first line. Cast values to integers from strings.
cols, rows = (int(val) for val in lines_list[0].split())
# Do a double-nested list comprehension to get the rest of the data into your matrix
my_data = [[int(val) for val in line.split()] for line in lines_list[1:]]
在此处查找生成器表达式。它们确实可以将您的代码简化为离散的功能单元!想象一下在 C++ 中用 4 行代码做同样的事情......这将是一个怪物。尤其是列表生成器,当我还是 C++ 人员时,我一直希望我有类似的东西,并且我经常最终构建自定义函数来构造我想要的每种数组。
不知道为什么你需要w,h。如果这些值确实是必需的并且意味着只应读取指定数量的行和列,那么您可以尝试以下操作:
output = []
with open(r'c:\file.txt', 'r') as f:
w, h = map(int, f.readline().split())
tmp = []
for i, line in enumerate(f):
if i == h:
break
tmp.append(map(int, line.split()[:w]))
output.append(tmp)
同时适用于 python2(例如 Python 2.7.10)和 python3(例如 Python 3.6.4)
with open('in.txt') as f:
rows,cols=np.fromfile(f, dtype=int, count=2, sep=" ")
data = np.fromfile(f, dtype=int, count=cols*rows, sep=" ").reshape((rows,cols))
另一种方式: 正在使用 python2(例如 Python 2.7.10)和 python3(例如 Python 3.6.4), 对于复杂矩阵,请参阅下面的示例(仅将
int
更改为 complex
)
with open('in.txt') as f:
data = []
cols,rows=list(map(int, f.readline().split()))
for i in range(0, rows):
data.append(list(map(int, f.readline().split()[:cols])))
print (data)
我更新了代码,此方法适用于初始
int
文件中的任意数量的矩阵和任何类型的矩阵(complex
,float
,in.txt
)。
该程序产生矩阵乘法作为应用程序。正在使用 python2,为了与 python3 一起使用,请进行以下更改
print to print()
和
print "%7g" %a[i,j], to print ("%7g" %a[i,j],end="")
剧本:
import numpy as np
def printMatrix(a):
print ("Matrix["+("%d" %a.shape[0])+"]["+("%d" %a.shape[1])+"]")
rows = a.shape[0]
cols = a.shape[1]
for i in range(0,rows):
for j in range(0,cols):
print "%7g" %a[i,j],
print
print
def readMatrixFile(FileName):
rows,cols=np.fromfile(FileName, dtype=int, count=2, sep=" ")
a = np.fromfile(FileName, dtype=float, count=rows*cols, sep=" ").reshape((rows,cols))
return a
def readMatrixFileComplex(FileName):
data = []
rows,cols=list(map(int, FileName.readline().split()))
for i in range(0, rows):
data.append(list(map(complex, FileName.readline().split()[:cols])))
a = np.array(data)
return a
f = open('in.txt')
a=readMatrixFile(f)
printMatrix(a)
b=readMatrixFile(f)
printMatrix(b)
a1=readMatrixFile(f)
printMatrix(a1)
b1=readMatrixFile(f)
printMatrix(b1)
f.close()
print ("matrix multiplication")
c = np.dot(a,b)
printMatrix(c)
c1 = np.dot(a1,b1)
printMatrix(c1)
with open('complex_in.txt') as fid:
a2=readMatrixFileComplex(fid)
print(a2)
b2=readMatrixFileComplex(fid)
print(b2)
print ("complex matrix multiplication")
c2 = np.dot(a2,b2)
print(c2)
print ("real part of complex matrix")
printMatrix(c2.real)
print ("imaginary part of complex matrix")
printMatrix(c2.imag)
作为输入文件,我采用
in.txt
:
4 4
1 1 1 1
2 4 8 16
3 9 27 81
4 16 64 256
4 3
4.02 -3.0 4.0
-13.0 19.0 -7.0
3.0 -2.0 7.0
-1.0 1.0 -1.0
3 4
1 2 -2 0
-3 4 7 2
6 0 3 1
4 2
-1 3
0 9
1 -11
4 -5
和
complex_in.txt
3 4
1+1j 2+2j -2-2j 0+0j
-3-3j 4+4j 7+7j 2+2j
6+6j 0+0j 3+3j 1+1j
4 2
-1-1j 3+3j
0+0j 9+9j
1+1j -11-11j
4+4j -5-5j
输出如下:
Matrix[4][4]
1 1 1 1
2 4 8 16
3 9 27 81
4 16 64 256
Matrix[4][3]
4.02 -3 4
-13 19 -7
3 -2 7
-1 1 -1
Matrix[3][4]
1 2 -2 0
-3 4 7 2
6 0 3 1
Matrix[4][2]
-1 3
0 9
1 -11
4 -5
matrix multiplication
Matrix[4][3]
-6.98 15 3
-35.96 70 20
-104.94 189 57
-255.92 420 96
Matrix[3][2]
-3 43
18 -60
1 -20
[[ 1.+1.j 2.+2.j -2.-2.j 0.+0.j]
[-3.-3.j 4.+4.j 7.+7.j 2.+2.j]
[ 6.+6.j 0.+0.j 3.+3.j 1.+1.j]]
[[ -1. -1.j 3. +3.j]
[ 0. +0.j 9. +9.j]
[ 1. +1.j -11.-11.j]
[ 4. +4.j -5. -5.j]]
complex matrix multiplication
[[ 0. -6.j 0. +86.j]
[ 0. +36.j 0.-120.j]
[ 0. +2.j 0. -40.j]]
real part of complex matrix
Matrix[3][2]
0 0
0 0
0 0
imaginary part of complex matrix
Matrix[3][2]
-6 86
36 -120
2 -40
为了让答案变得简单,这里有一个程序,它从文件中读取整数并对它们进行排序
f = open("input.txt", 'r')
nums = f.readlines()
nums = [int(i) for i in nums]
读取文件的每一行后,将每个字符串转换为数字
nums.sort()
对数字进行排序
f.close()
f = open("input.txt", 'w')
for num in nums:
f.write("%d\n" %num)
f.close()
将它们写回 就这么简单,希望这有帮助
我能想到的最短的是:
with open("file") as f:
(w, h), data = [int(x) for x in f.readline().split()], [int(x) for x in f.read().split()]
如果看起来更整洁,您可以将(w,h)和数据分开。
我发现这个问题正在寻找 Pandas 解决方案。以下是读取此文件的两种方法,均使用
pandas.read_csv
:
import pandas as pd
## Method 1:
# Ignore the header, read the rest of the file:
df = pd.read_csv('infile', header=None, sep=r'\s+', skiprows=1)
## Method 2:
# Read the header:
with open('infile') as infile:
ncols, nrows = [int(x) for x in infile.readline().split()]
# Read the rest of the file, using the info from the header:
df = pd.read_csv('infile', header=None, sep=r'\s+', skiprows=1, nrows=nrows, usecols=range(ncols))
使用这两种方法中的任何一种,你都会得到这个数据框:
print(df)
0 1 2 3
0 1 2 3 4
1 2 3 4 5
2 6 7 8 9