我有一堆图像(3D阵列),我想提高其分辨率(上采样)。我运行以下代码片段,发现有点慢...
有什么方法可以提高这段代码的速度? (不使用多重处理)
using BenchmarkTools
using Interpolations
function doInterpol(arr::Array{Int, 2}, h, w)
A = interpolate(arr, BSpline(Linear()))
return A[1:2/(h-1)/2:2, 1:2/(w-1)/2:2]
end
function applyResize!(arr3D_hd::Array, arr3D_ld::Array, t::Int, h::Int, w::Int)
for i = 1:1:t
@inbounds arr3D_hd[i, :, :] = doInterpol(arr3D_ld[i, :, :], h, w)
end
end
t, h, w = 502, 65, 47
h_target, w_target = 518, 412
arr3D_ld = reshape(collect(1:t*h*w), (t, h, w))
arr3D_hd = Array{Float32}(undef, t, h_target, w_target)
applyResize!(arr3D_hd, arr3D_ld, t, h_target, w_target)
当我进行以下基准测试时:
@btime applyResize!(arr3D_hd, arr3D_ld, t, h_target, w_target)
我知道了:
2.334 s (68774 allocations: 858.01 MiB)
我多次运行它,结果间隔为[1.8s-2.8s]。
Julia将数组存储在column-major order中。这意味着像arr[i, : ,:]
这样的切片的性能要比arr[:,:,i]
(在内存中是连续的)差很多。因此,提高速度的一种方法是使用(h,w,t)
而不是(t, w, h)
为数组建立索引。
第二个问题是像arr[i,:,:]
这样的切片会复制数据。它的影响似乎可以忽略不计,但是如果可以的话,养成using array views instead of slices的习惯可能很好。视图是一个小的包装对象,其行为与较大数组的一部分相同,但不保存数据副本:它直接访问父数组的数据(请参见下面的示例,也许可以更好地理解什么)一个视图是)。
请注意,Julia performance tips中都提到了这两个问题;阅读此页面上的其他建议可能会很有用。
将其放在一起,您的示例可以像这样重写:
function applyResize2!(arr3D_hd::Array, arr3D_ld::Array, h::Int, w::Int, t)
@inbounds for i = 1:1:t
A = interpolate(@view(arr3D_ld[:, :, i]), BSpline(Linear()))
arr3D_hd[:, :, i] .= A(1:2/(h-1)/2:2, 1:2/(w-1)/2:2)
end
end
用于数组的存储方式与您的情况有所不同:
# Note the order of indices
julia> arr3D_ld = reshape(collect(1:t*h*w), (h, w, t));
julia> arr3D_hd = Array{Float32}(undef, h_target, w_target, t);
# Don't forget to escape arguments with a $ when using btime
# (not really an issue here, but could have been one)
julia> @btime applyResize2!($arr3D_hd, $arr3D_ld, h_target, w_target, t)
506.449 ms (6024 allocations: 840.11 MiB)
这大约比您的原始代码提高了3.4倍,该代码在我的计算机上的基准测试如下:
julia> arr3D_ld = reshape(collect(1:t*h*w), (t, h, w));
julia> arr3D_hd = Array{Float32}(undef, t, h_target, w_target);
julia> @btime applyResize!($arr3D_hd, $arr3D_ld, t, h_target, w_target)
1.733 s (50200 allocations: 857.30 MiB)
NB:您的原始代码使用类似A[x, y]
的语法来获取内插值。似乎不赞成使用A(x, y)
。我可能没有与您相同的Interpolations
版本,不过...
说明视图行为的示例
julia> a = rand(3,3)
3×3 Array{Float64,2}:
0.042097 0.767261 0.0433798
0.791878 0.764044 0.605218
0.332268 0.197196 0.722173
julia> v = @view(a[:,2]) # creates a view instead of a slice
3-element view(::Array{Float64,2}, :, 2) with eltype Float64:
0.7672610491393876
0.7640443797187411
0.19719581867637093
julia> v[3] = 42 # equivalent to a[3,2] = 42
42