dataset 相关问题

数据集是数据的集合,通常以表格形式表示,其中列表示不同的变量,行表示集合的不同成员。如果您正在寻找可用于任何目的的免费数据集,请考虑在https://opendata.stackexchange.com上提出您的问题。

PyTorch DeiT 模型无论如何都会预测一类

我们正在尝试在导入的 DeiT 蒸馏 patch16 384 预训练模型上微调自定义模型。 输出: 第 0 纪元的成本为 4.611058227040551 第 1 纪元的成本为 0.9889081553979353 测试装置符合...

回答 1 投票 0

使用 lfw 数据集进行数据训练时验证准确性较低

因此,我正在训练 400 个图像数据集标签,其中包含大约 900 张图像,这些图像分为 80% 的训练和 20% 的验证。我在这里遵循张量流的指南(https://www.tensorflow.org/

回答 1 投票 0

谁能帮我写一个R数据框作为SAS数据集?

在R中,我使用了foreign库中的write.foreign()函数来将数据帧写入SAS数据集。 write.foreign(df = test.df, 数据文件 = 'test.sas7bdat', 代码文件 = 'test.t...

回答 5 投票 0

如何根据id、日期和大致时间连接两个数据集?

我有两个数据集(A,B),需要根据日期、id 和最近时间合并这两个数据集(请参阅合并数据集)。两个数据集中的时间并不完全匹配,并且 ti...

回答 1 投票 0

如何合并两个大的CSV文件?

我有两个大的 .csv 文件想要加入。 file1.csv 具有以下结构: 产品代码; *许多无用的列*;开始日期;结束日期; *其他一些无用的列* file2.csv 有...

回答 2 投票 0

在 Weka 中导入 csv 时值的数量错误

我想在weka中打开一个csv文件(从openoffice calc保存)。 我不断收到错误:“值的数量错误。读取了 140 个,第 3 行预计有 139 个。” csv 已经用引号修复了...

回答 11 投票 0

努力微调 LLaMA 3.2 模型:为什么基础模型在我的用例中优于指令?

我一直在尝试在我的自定义数据集上微调 LLaMA 3.2-Instruct 模型,该数据集采用 JSON 风格的聊天格式。该数据集很小(大约 400 个条目),由于其机密性,我无法共享它......

回答 1 投票 0

自定义关键点数据集上的 Detectron2 Trainer 值错误,在训练数据之前停止

我目前正在开发一个具有自定义关键点数据集的项目。 在进一步处理数据集之前,我希望检查数据集和训练过程是否正确。 我遇到了这个e...

回答 1 投票 0

Spark 结构体到 getAs[T] 的类转换问题

我经常在 Spark 数据集行上使用映射函数来在 Scala 中对类型化对象进行转换。我通常的模式是转换从数据帧转换创建的中间结果(使用......

回答 1 投票 0

image_dataset_from_directory 返回列表而不是数据集对象

我正在编写一个转换函数,该函数利用 Keras API 中的 image_dataset_from_directory 函数。在文档中,它列出了返回值是 tf.data.Dataset 对象...

回答 1 投票 0

使行不同并显示所有列

在我的项目中有两个数据表dtFail和dtFailed(dtFailed除了列名声明之外什么都没有)。 dtFail 具有重复的“EmployeeName”列值。所以我拍了一张 dataview dv...

回答 3 投票 0

为什么 Keras Embedding 层会导致摘要中出现“未构建”模型?

在我的模型设置中,尽管指定了 Embedding 层的参数,例如输入维度 (input_dim)、输出维度 (output_dim) 和输入长度 (input_length),但摘要输出 ind...

回答 1 投票 0

如何将字符索引转换为 BERT 令牌索引

我正在使用问答数据集 UCLNLP/adversarial_qa。 从数据集导入load_dataset ds = load_dataset("UCLNLP/adversarial_qa", "adversarialQA") 如何绘制地图

回答 1 投票 0

R - 将列添加到数据集,其中包含行值重复的次数

我一直在寻找如何在 R 中执行此操作,但不幸的是没有找到简单的方法。 如果我有一个名为这样的人的数据集 一个 乙 约翰 学生 约翰 学生 约翰 学生 莎拉 学生

回答 1 投票 0

无法迭代数据集(AttributeError:模块“numpy”没有属性“complex”。)

我正在使用: 视窗 蟒蛇版本3.10.0 数据集==2.21.0 numpy==1.24.4 我尝试迭代刚刚下载的数据集: 从数据集导入load_dataset 数据集 = load_dataset("jacktol/atc-

回答 1 投票 0

用 ~1800 (R) 突出显示图表上的单个数据点

我知道我想要的数据行是第1535行。 绘图(data.exoplanets$loga,data.exoplanets$logMass,ylab =“质量对数”,xlab =“半长轴对数”) 是我以前用过的代码...

回答 1 投票 0

避免重新加载 Pytorch 数据集

我在相对稳定的数据集组合上训练 CNN,但每次开始训练作业时,训练器都会等待 5-10 分钟从磁盘加载我的数据帧。 是否可以避免...

回答 1 投票 0

警告:tensorflow:顺序模型中的层应该只有一个输入张量

我已经从tensorflow网站的自动编码器简介第一个示例中复制了过去的代码,以下代码适用于mnist时尚数据集,但不适用于我的。这给了我一个很长的警告。请告诉我...

回答 1 投票 0

从混淆矩阵计算准确率、召回率、精确率和平衡准确率

混淆矩阵显示了二元分类问题的实际标签与预测标签的比较情况。 使用混淆矩阵,计算以下内容: 准确度:什么比例...

回答 1 投票 0

Azure 机器学习工作室给出错误文件 https://aka.ms/bike-rentals/MLTable 为空

我按照这些 https://microsoftlearning.github.io/mslearn-ai-fundamentals/Instructions/Labs/01-machine-learning.html 说明在 Azure 机器学习工作室中训练模型。 我跟随...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.