Kaggle使用介绍

  • 第一步,本地
1
pip install kaggle
  • 第二步,kaggle

点击头像->Account->API->Create New API Token(如果想要删除以往使用过的Token可以点击API下的Expire API Token)

  • 第三步,本地

把下载的kaggle.json放在用户根目录的.kaggle/文件夹下

安装完成。

数据集可以用来上传本地的数据以及在本地训练好的模型文件。

  • 第一步,本地初始化 ,将data_dir换成你自己的路径名字
1
2
3
4
# 上传不含子文件夹的数据文件夹
kaggle datasets init -p 'data_dir'
# 上传含有子文件夹的数据文件夹不压缩
kaggle datasets init -p 'data_dir' -r tar
  • 第二步,数据集改名

第一步之后会在data_dir目录下生成一个dataset-metadata.json文件内容如下,把title和id中的title部分改成你想要的名字,比如我改为了best-model。

1
2
3
4
5
6
7
8
9
{
  "title": "best-model",
  "id": "oliverlionado/best-model",
  "licenses": [
    {
      "name": "CC0-1.0"
    }
  ]
}
  • 第三步,上传数据集
1
kaggle datasets create -p model_data/

然后你的数据集里就会出现一个新的数据集,以本例为例,数据集名字叫做best-model,里面的内容就是model_data/目录下的文件(不含model_data/文件夹)。

比如我想使用model_data/文件夹下的文件去更新

1
kaggle datasets version -p model_data/  -m "update"

注意——如果你想更新一个不是在当前目录下创建的数据集(目录里没有dataset-metadata.json文件)

首先你需要下载json文件

1
kaggle datasets metadata -p model_data/ oliverlionado/best-model

其中oliverlionado/best-model指的是已存在数据集的id

然后再执行上一条命令~