直接从 Kaggle Notebook 创建数据集

问题描述 投票:0回答:1

任何人都可以用外行人的话来解释这实际上是可以做到的吗? 我刚刚创建了一个工作笔记本,它将 csv 文件输出到 /kaggle/working 目录中,并且每次运行它时都会使用时间戳进行更新。

df.to_csv(f'/kaggle/working/CMC_24h_Gainers_Starting_07_10_24 updated - {timestamp}.csv',mode='a', header=False, index=False)#To append to the list

现在我想让该 csv 成为公众的数据集。

我不太明白kaggle api的使用。

这是唯一的方法还是还有其他方法? 谢谢!

jupyter-notebook dataset kaggle
1个回答
0
投票

在笔记本中,您可以使用 Kaggle API 创建数据集;请按照以下步骤操作:

### Create Kaggle Dataset

os.makedirs(SAVE_FOLDER, exist_ok=True)
os.makedirs(SAVE_FOLDER + '/folder_name_placeholder/', exist_ok=True)

with open('../input/kaggle-secrets/kaggle.json') as f:
    kaggle_creds = json.load(f)
    
os.environ['KAGGLE_USERNAME'] = kaggle_creds['username']
os.environ['KAGGLE_KEY'] = kaggle_creds['key']

!kaggle datasets init -p '{SAVE_FOLDER}'

with open(f'{SAVE_FOLDER}/dataset-metadata.json') as f:
    dataset_meta = json.load(f)
    
dataset_meta['id'] = f'username_placeholder/{DATASET_NAME}'
dataset_meta['title'] = DATASET_NAME

with open(f'{SAVE_FOLDER}/dataset-metadata.json', "w") as outfile:
    json.dump(dataset_meta, outfile)


!cp '{SAVE_FOLDER}'/dataset-metadata.json '{SAVE_FOLDER}'/meta.json
!ls '{SAVE_FOLDER}'

!kaggle datasets create -u -p '{SAVE_FOLDER}'
© www.soinside.com 2019 - 2024. All rights reserved.