computer-vision 相关问题

将此标记用于与计算机视觉相关的问题 - 软件的任何方面,使计算机能够使用相机感知,理解和响应其环境。有关图像过滤和量化的问题,请使用标签[image-processing]。

如何从Deepfont论文中提到的Adobe VFR数据集中的bcf文件加载图像数据?

我正在编写我的deepfont实现(https://arxiv.org/pdf/1507.03196.pdf)。作者公开了模型训练的数据(AdobeVFR数据)。图像采用bcf格式。我怎么能够 ...

回答 1 投票 1

保存图像期间,PIL中的“SystemError:tile无法扩展到图像外部”

我有这个Image =>这里是上面黄色框的所有坐标,写在3.txt文件中。 #Y X高度宽度46 135 158 118 46 281 163 104 67 494 188 83 70 372 194 101 94 591 ...

回答 2 投票 3

为什么模型没有在keras中使用预训练的vgg16进行学习?

我正在使用Keras提供的预先训练的VGG 16模型,并将其应用于SVHN数据集,该数据集是10个数字0-10的数据集。网络没有学习并且一直停留在0 ....

回答 1 投票 0

如何在对象检测应用程序中修复ValueError?

我正在尝试使用onnxruntime和opencv为图像添加边界框以使用yolov2神经网络检测对象。相反,我在运行时收到错误。我将输入图像转换为...

回答 1 投票 1

如何计算翻译矩阵?

我有2D图像数据,具有纬度和经度的相应摄像机位置。我想将像素坐标转换为3D世界坐标。我可以访问内在的校准参数和......

回答 1 投票 0

为什么MNIST CNN的预测出错?

我在MNIST数据集上训练了CNN,训练和验证准确度为~0.99。我按照Keras文档中给出的示例中的确切步骤,使用MNIST数据集实现CNN:...

回答 2 投票 0

Tensorflow如何计算模型的准确性?

我正在按照本教程进行二进制类分类。在定义模型时,它定义如下并引用:应用tf.keras.layers.Dense层将这些功能转换为...

回答 1 投票 0

如何调整从Deeplab v3获得的分割掩码的大小?

Deeplab v3返回缩小/调整大小的图像及其相应的掩码。如何调整图像大小以及相应的蒙版以更好地符合我的规范。

回答 1 投票 0

只能将整数标量数组转换为标量索引

我正在制作一个需要从网络摄像头手指计数的项目。我尝试实现下面的代码,但我收到错误,每次它启动第一帧后停止响应和...

回答 1 投票 0

Opencv Python卡尔曼滤波器预测结果查询

我一直在使用Opencv和python,我在一个矩形上使用kalman过滤器我已经使用了背景减法和MOSSE,然后就此我将用另一个预测下一个位置......

回答 1 投票 1

是否应在调整大小之前完成YOLOv3注释?

我即将开始注释我的图像来训练YOLOv3模型。在开始之前,我想确保在原始图像上创建注释是可以的。注释会改变吗......

回答 1 投票 1

微小的YOLOv3(Darknet)训练“太快”并产生不同的输出

我对YOLO / Darknet很新,并且正在与解决方案一起走。我看过与类似问题相对应的Github和Stackexchange论坛,但似乎没有直接...

回答 1 投票 1

python中的快速图像规范化[关闭]

我正在寻找一种更快的方法来规范化Python中的图像。我想将所有像素转换为0到1之间的值.INPUT:JPEG格式的150x150 RGB图像。 OS / HARDWARE:LINUX / P40 GPU ......

回答 1 投票 -1

skimage.color.rgb2gray导入麻烦

我有导入skimage.color模块的问题。虽然我可以从python shell导入并调用skimage.color.rgb2gray,但我无法从我的应用程序中执行相同的操作。我查了一下skimage ...

回答 3 投票 1

如何将神经网络的输出转换为概率?

我目前正在研究图像识别问题,我想要识别具有最高概率的图像,这意味着期望匹配具有最大百分比...的图像。

回答 1 投票 0

检测图像中的对象和训练图像所花费的时间之间的关系是什么? [关闭]

我有一个ML模型,需要X秒来检测训练它的图像中的对象。这是否意味着在每张图像训练期间至少需要X或X + Y秒?你能提供详细的......

回答 1 投票 -1

什么是tf.nn.max_pool的ksize参数用于?

在tf.nn.max_pool的定义中,ksize用于什么? tf.nn.max_pool(value,ksize,strides,padding,data_format ='NHWC',name = None)对输入执行最大池化。 Args:价值:4-D ......

回答 1 投票 16

如何在Android增强现实中检测物理对象?

我找到了很多方法来检测不同的形状。但是当我去寻找物理对象时,运气不好。根据我的阅读,我们应该在图像周围有一个黑色边框来制作图案文件。如果我遵循这个......

回答 4 投票 33

适用于Android的计算机视觉和AR库? ARCore ML套件

我最初是一名Android开发人员,我想知道Android SDK是否有任何计算机视觉库或增强现实库,因为我打算使用这些...

回答 8 投票 19

通过计算机视觉为室内导航系统绘制大面积地图的解决方案是什么?

对于最初使用基于计算机视觉的室内导航,我们需要扫描区域并放置模型,对象和路径。保存我们以后打开应用程序时可以加载的地图。问题是......

回答 1 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.