数据集是数据的集合,通常以表格形式表示,其中列表示不同的变量,行表示集合的不同成员。如果您正在寻找可用于任何目的的免费数据集,请考虑在https://opendata.stackexchange.com上提出您的问题。
如何在knitr文档中使用数据集名称? 例如,在以下 knitr 代码块中,使用 deparse(substitute(x)) (通常在非 knitr R 代码中工作)不会显示 New York...
我们有 10,000 张图像,我们想要实现一个深度学习模型来提取植被。如果我们想要 80% 的训练集,我们应该标记的最少图像数量是多少? 我们想用se...
好的,所以我目前正在制作一个非常基本的 bash 脚本,用于搜索马里奥制造商级别的 jsonl 文件及其 id,然后将找到的 id 转换为游戏中实际的 id ...
我有一个使用多个数据库的项目,为了避免在git中对大文件进行版本控制,我使用DVC在gdrive上管理它。 我在DVC上一步步遵循以下步骤 启动 DVC (dvc init) dvc 添加#
我有一个每 24 小时运行一次的计划查询,将一些数据加载到 BQ 表中(该数据是关于前一天的一些问题)。此外,我希望每当...
我想创建叶子数据集的图像数据集。为此,我捕获了图像并发现了 6 个类,每个类大约有 70-60 张图像。不,在创建训练和验证集时,我知道我......
我从网上抓取了评论,优点和缺点各不相同。我把它们作为一个列表,因为它看起来是最好的解决方案,不与用户、日期进行相同的评论......
我为自己的研究制作了一个数据集,大约有3万条数据。 每个数据有 20 个浮点数作为输入和 4 个类。 任何网络模型的训练都很糟糕(总是过度拟合),所以我画了一个 UMAP 并......
我尝试查看相关值及其相应的特征,但是当运行代码时它只显示其中的一部分。下面的代码和输出 x=相关性.标签.sort_values(升序=假) 我尝试...
我有 800 万条记录,其中包含从数据库导出为 .csv 文件的订单详细信息。我将获得多个 txt 文件,每个文件的订单号至少为 800 000。我得检查一下
我正在使用 Huggingface Transformers 包来加载预训练的 GPT-2 模型。我想使用 GPT-2 进行文本生成,但预训练版本还不够,所以我想用一堆
当我尝试使用数据集包创建数据集时,出现“无法转换,因为列名称不匹配”错误
DataFrame结构 上图显示了我的数据的结构。 从 sklearn.model_selection 导入 train_test_split 从数据集中导入特征、ClassLabel、值、数据集、DatasetDict df_t...
PyTorch DataLoader 和 Matplotlib 的 Imshow 之间的图像分类任务问题
我目前正在研究涉及图像数据的二元分类任务。首先,我必须检查我的数据集。但是,我遇到了 DataLoader 的问题。 在
我正在尝试在 SAS 中完成以下任务。 我的数据集如下所示: |ID |描述 |----------------|----------------- | 1 |对象 Car_bmw 已处理。颜色从红色更改为绿色 里程已更改...
我正在处理文本摘要任务,并尝试将 .csv 数据集添加到tensorflow_datasets(这是运行预先训练的变压器所必需的)。我正在关注本教程 https://www.
如何将各个 .npz 文件作为样本加载到 Tensorflow 数据集中
我在加载构成数据集的数据时遇到问题。我以前的(工作)方法是使用 pandas DataFrame,但对于较大的数据集,训练过程会被终止,因为......
尝试绘制数据集,其中数据中的 (2) 个最大值始终远高于其余数据。当您按照正常图表 1 绘制图表时,由于 (2) max
有人有包含文本和文本摘要的文本摘要数据集吗? 我找到了http://www.nist.gov/tac/data/past/2009/Summ09.html,但是为了分发它,他们需要......
我的简化数据集如下所示: 类 MyDataset(数据集): def __init__(self) -> 无: 超级().__init__() self.images: torch.Tensor[n, w, h, c] # 内存中的 n 个图像 - spe...
是否有任何API或数据集可以提供世界旅行地点的城市、州、国家、纬度和经度?
我正在学习使用 Python Pandas 进行数据提取和数据操作,并且需要使用 Matplotlib 进行一些可视化。