dataset 相关问题

数据集是数据的集合,通常以表格形式表示,其中列表示不同的变量,行表示集合的不同成员。如果您正在寻找可用于任何目的的免费数据集,请考虑在https://opendata.stackexchange.com上提出您的问题。

在R中的knitr代码块中使用数据集名称

如何在knitr文档中使用数据集名称? 例如,在以下 knitr 代码块中,使用 deparse(substitute(x)) (通常在非 knitr R 代码中工作)不会显示 New York...

回答 1 投票 0

我应该从训练集中标记多少张图像?

我们有 10,000 张图像,我们想要实现一个深度学习模型来提取植被。如果我们想要 80% 的训练集,我们应该标记的最少图像数量是多少? 我们想用se...

回答 1 投票 0

如何从 bash 中的 awk 输出中获取数字列表

好的,所以我目前正在制作一个非常基本的 bash 脚本,用于搜索马里奥制造商级别的 jsonl 文件及其 id,然后将找到的 id 转换为游戏中实际的 id ...

回答 1 投票 0

如何仅从其中一个 DVC 存储库下载数据?

我有一个使用多个数据库的项目,为了避免在git中对大文件进行版本控制,我使用DVC在gdrive上管理它。 我在DVC上一步步遵循以下步骤 启动 DVC (dvc init) dvc 添加#

回答 1 投票 0

BigQuery 数据集 - 使用计划查询上传行

我有一个每 24 小时运行一次的计划查询,将一些数据加载到 BQ 表中(该数据是关于前一天的一些问题)。此外,我希望每当...

回答 1 投票 0

用于数据集创建的图像增强

我想创建叶子数据集的图像数据集。为此,我捕获了图像并发现了 6 个类,每个类大约有 70-60 张图像。不,在创建训练和验证集时,我知道我......

回答 1 投票 0

如何在Python中分离数据集中的项目?

我从网上抓取了评论,优点和缺点各不相同。我把它们作为一个列表,因为它看起来是最好的解决方案,不与用户、日期进行相同的评论......

回答 1 投票 0

如果数据集的UMAP聚类结果不好,是否无法分类?

我为自己的研究制作了一个数据集,大约有3万条数据。 每个数据有 20 个浮点数作为输入和 4 个类。 任何网络模型的训练都很糟糕(总是过度拟合),所以我画了一个 UMAP 并......

回答 1 投票 0

如何在 jupter 输出中显示所有结果值

我尝试查看相关值及其相应的特征,但是当运行代码时它只显示其中的一部分。下面的代码和输出 x=相关性.标签.sort_values(升序=假) 我尝试...

回答 1 投票 0

非技术用户比较 excel 中大文件集的有效方法

我有 800 万条记录,其中包含从数据库导出为 .csv 文件的订单详细信息。我将获得多个 txt 文件,每个文件的订单号至少为 800 000。我得检查一下

回答 1 投票 0

如何微调GPT-2模型?

我正在使用 Huggingface Transformers 包来加载预训练的 GPT-2 模型。我想使用 GPT-2 进行文本生成,但预训练版本还不够,所以我想用一堆

回答 3 投票 0

当我尝试使用数据集包创建数据集时,出现“无法转换,因为列名称不匹配”错误

DataFrame结构 上图显示了我的数据的结构。 从 sklearn.model_selection 导入 train_test_split 从数据集中导入特征、ClassLabel、值、数据集、DatasetDict df_t...

回答 1 投票 0

PyTorch DataLoader 和 Matplotlib 的 Imshow 之间的图像分类任务问题

我目前正在研究涉及图像数据的二元分类任务。首先,我必须检查我的数据集。但是,我遇到了 DataLoader 的问题。 在

回答 1 投票 0

将描述拆分为多行

我正在尝试在 SAS 中完成以下任务。 我的数据集如下所示: |ID |描述 |----------------|----------------- | 1 |对象 Car_bmw 已处理。颜色从红色更改为绿色 里程已更改...

回答 1 投票 0

将.csv格式的数据集添加到TFDS

我正在处理文本摘要任务,并尝试将 .csv 数据集添加到tensorflow_datasets(这是运行预先训练的变压器所必需的)。我正在关注本教程 https://www.

回答 1 投票 0

如何将各个 .npz 文件作为样本加载到 Tensorflow 数据集中

我在加载构成数据集的数据时遇到问题。我以前的(工作)方法是使用 pandas DataFrame,但对于较大的数据集,训练过程会被终止,因为......

回答 1 投票 0

Excel 图表忽略/分离 (2) 最大值

尝试绘制数据集,其中数据中的 (2) 个最大值始终远高于其余数据。当您按照正常图表 1 绘制图表时,由于 (2) max

回答 1 投票 0

文本摘要数据集

有人有包含文本和文本摘要的文本摘要数据集吗? 我找到了http://www.nist.gov/tac/data/past/2009/Summ09.html,但是为了分发它,他们需要......

回答 2 投票 0

如何使用平衡采样器进行火炬数据集/数据加载器

我的简化数据集如下所示: 类 MyDataset(数据集): def __init__(self) -> 无: 超级().__init__() self.images: torch.Tensor[n, w, h, c] # 内存中的 n 个图像 - spe...

回答 1 投票 0

是否有任何API或数据集可以提供世界旅行地点的城市、州、国家、纬度和经度?

我正在学习使用 Python Pandas 进行数据提取和数据操作,并且需要使用 Matplotlib 进行一些可视化。

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.