【有手就行无废话版】huggingface下载模型以及数据集命令

小爱同学ya

于 2025-07-02 16:47:04 发布

阅读量135

点赞数 2

CC 4.0 BY-SA版权

文章标签：人工智能

本文链接：https://blog.csdn.net/qq_51308160/article/details/149073169

镜像网站：HF-Mirror

1.导入环境变量：只需要导入一次

cd .. #这一步切换到你需要下载的目录下
export HF_ENDPOINT=https://hf-mirror.com;
wget https://hf-mirror.com/hfd/hfd.sh;
chmod a+x hfd.sh

2.搜索模型名称，点复制

3.下载

./hfd.sh +复制的模型名称

比如：

./hfd.sh OpenGVLab/InternVL3-38B
./hfd.sh wikitext --dataset #数据集的话后面加--dataset就好

关注博主即可阅读全文

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

小爱同学ya

关注关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

快速方便地下载huggingface的模型库和数据集

zik的博客

07-30

6876

使用方法：将hfd.sh拷贝过去，然后参考下面的参考命令，下载数据集或者模型。欢迎大家关注笔者，你的关注是我持续更博的最大动力。或克隆此存储库，然后授予脚本执行权限。这个代码不能保持目录结构，见下面的改进版。获取huggingface令牌，然后。中，这个命令行工具巧妙地利用。来处理 LFS 文件，并使用。为了方便起见，您可以创建一个别名。原创文章，转载告知，盗版必究。首先，下载 hfd.sh。

通过huggingface-cli下载数据集

weixin_45691429的博客

08-08

2254

huggingface-hub自带了huggingface-cli。如果下载的时候断了，再次执行命令就行，会接着之前的内容下载。此方法比git稳定好用！

参与评论您还未登录，请先登录后发表或查看评论

huggingface下载

weixin_44986037的博客

07-22

1188

huggingface

hugging face下载指令

最新发布

hithes的博客

06-30

137

本文介绍了如何使用huggingface-cli下载Hugging Face模型。首先需要安装huggingface_hub库，然后通过设置镜像地址HF_ENDPOINT来加速下载。示例展示了完整模型和单个文件的下载方法，包括处理带空格路径时需用双引号。对于特定文件下载，可使用--include参数指定文件名。

huggingface快速下载模型及其配置

vivi_cin的博客

09-05

2360

2. 出现如下图的命令。大家知道，每次进huggingface里面一个个手动下载文件然后再上传到我们的服务器是很麻烦的。

Intern大模型训练营（四）：使用Hugging Face下载模型

kjnsdg的博客

11-07

1494

通过CLI上传 Hugging Face同样是跟Git相关联，通常大模型的模型文件都比较大，因此我们需要安装git lfs，对大文件系统支持。在 intern_study_L0_4 上传之前下载好的config.json，然后新建一个README.md，粘贴以下内容。创建项目，注意这里不要在之前的intern_build仓库里面创建，本人在这里踩了坑，没注意父文件夹。运行该文件，可以看到，已经从Hugging Face上下载了相应配置文件。进行创建，在创建页面中，输入项目名为。

从Huggingface下载模型的方法小结

草亦花开的专栏

05-07

2316

根据自身需求和网络环境灵活选择，均可在 Hugging Face Hub 上安全、高效地获取所需模型。该方法会下载整个仓库快照，包括所有版本的文件，并存储于本地缓存目录，支持指定分支或提交哈希。首次运行时，所需权重文件会被下载并缓存到本地，再次加载时即从缓存读取，无需重复下载。该命令会将指定模型仓库的所有文件下载到本地缓存目录，适合快速批量下载或脚本化操作。函数会将文件缓存在本地，并返回缓存路径，有助于在自定义脚本中灵活获取模型组件。目录下，包含版本管理和权限控制信息，不建议手动修改缓存文件以免损坏。

【modelscope/huggingface 通过colab将huggingface 模型/数据集/空间转移到 modelscope并下载】

放飞自我的coder

05-21

372

modelscope/huggingface 通过colab将huggingface 模型/数据集/空间转移到 modelscope并下载

huggingface-cli下载数据（含下载指定数据教程）

l8947943的博客

12-06

7307

可以理解为配置下载对应文件时候要使用的源。如果要避免这个情况，请将上面这一行写入Linux中的。表示下载指定数据目录，以safetensors结尾的，不下载.bin结尾的文件。注意：使用wget命令并不会得到下载好的大文件内容，这点需要注意。为什么会要这么做，tmd下载一半电脑挂了，头大。上述配置环境变量代码，每次下载前均需要配置。Windows环境没测试过。wikitext文件夹中。

huggingface 中模型下载及部署演示

@bangbang的博客

04-27

4125

huggingface 可以理解为对于，提供了模型、数据集、类库（比如transformers|peft|accelerate）、教程等。官方地址:ModelsDatasetsCVNLP多模态音频60多万。

如何快速有效的从huggingface上下载模型及加载

xiaomu_347的博客

06-03

1万+

您可以点击模型卡片中的“快速使用”按钮查看如何使用Library进行模型的下载。您还可以从 repos 下载文件或将它们集成到您的库中，并且可指定下载模型的地址。默认模型会下载到~/.cache/modelscope/hub中，如果需要修改下载目录，可以手动指定环境变量：MODELSCOPE_CACHE，modelscope会将模型和数据集下载到该环境变量指定的目录中。对应的，如果需要在ModelScope平台上有感兴趣的模型并希望能下载至本地，则ModelScope提供了多种下载模型的方式。

huggingface的内容如何下载？huggingface-cli 一行代码搞定！

qq_63234089的博客

08-14

547

下载huggingface的内容

如何使用huggingface下载数据集和预训练模型

weixin_39011713的博客

09-11

1235

如果各位在下载huggingface上的模型和数据库也会出现“connect closed/failed”等错误，不妨试试下面的解决方案，思路大致是，通过设置镜像的方式来解决。

下载huggingface中数据集/模型(保存到本地指定路径)

MK422的博客

03-30

2万+

1.若需要将数据集/模型放在指定路径，需要指定"cache-dir"参数，而不是“local-dir”2.直接从huggingface中下载对应的模型和数据集，需要外网。因此可以使用国内镜像“HF-Mirror - Huggingface 镜像站。

下载hugging face上的数据集

m0_55703957的博客

02-03

3281

输入这个命令即可下载：huggingface-cli download --repo-type dataset --token 你的token uoft-复制的数据集名 --local-dir 存放位置 --resume-download。当搜索数据集之后，浏览器给出的回答中包含hugging face，如果想使用hugging face上的数据集，按照下面的步骤即可成功下载(我使用的是Linux）然后找到数据集的名字：(这里我随便找了一个)直接点旁边的复制符号。

huggingface下载的.arrow数据集读取与使用说明

阿旭的博客

04-25

1万+

huggingface下载的arrow数据集读取与使用说明

从huggingface上下载数据集具体步骤

热门推荐

David_house的博客

06-30

3万+

最近需要从huggingface上下载一个数据集，发现不能像模型那样能直接点击下载，需要通过代码来获取，很麻烦，谨以此博客作为记录

Hugging Face数据集的简单使用

IT菜鸟

07-30

2935

Hugging Face数据集的简单使用

huggingface-cli命令下载数据集

03-23

<think>好的，我现在需要回答用户关于如何使用huggingface-cli命令下载数据集的问题。首先，我得确保自己对这个命令的使用方法有正确的理解。记得Hugging Face提供了多种方式来访问数据集，比如通过Python库中的load_dataset函数。但用户特别问到的是使用huggingface-cli命令行工具，所以我需要确认这个工具是否支持直接下载数据集。可能需要查阅官方文档或者帮助信息。先回忆一下huggingface-cli的常用命令。通常，这个工具主要用于登录、管理模型和数据集，但下载数据集的主要方法可能还是通过Python库。不过，用户可能希望不写代码，直接用命令行完成下载。这时候可能需要用到huggingface-cli的某个子命令，比如huggingface-cli download，或者是否有其他参数。查阅相关资料，发现huggingface-cli的download命令可以用于下载文件，比如模型或数据集中的特定文件。例如，huggingface-cli download dataset_name path/to/file.csv --repo-type dataset。但如果是下载整个数据集，可能需要指定--repo-type dataset参数，并给出数据集名称。另外，用户可能也需要知道如何查找可用的数据集名称，比如在Hugging Face Hub上搜索，或者在命令行中使用搜索功能。但huggingface-cli是否有搜索命令呢？可能没有，所以需要引导用户去网站查找。还需要注意权限问题，如果是私有数据集，可能需要先登录，使用huggingface-cli login命令输入token。总结步骤应该是：1. 安装huggingface_hub库；2. 使用huggingface-cli download命令指定数据集名称和文件路径；3. 可能需要指定版本、缓存目录等参数。同时，提醒用户如果下载整个数据集可能需要遍历所有文件，或者推荐使用Python的load_dataset方法更方便。此外，参考用户提供的引用内容，但看起来引用中的内容是关于Docker、预测脚本、Git克隆和OpenAI CLI的，可能与当前问题无关，所以可能不需要引用这些内容。不过需要检查是否有相关引用被遗漏，但根据问题，用户可能没有提供关于huggingface-cli的直接引用，所以回答时不涉及引用标识。最后，确保回答结构清晰，分步骤说明，并提供示例命令，同时对比Python方法，指出各自的适用场景。还要生成相关问题，帮助用户进一步探索。</think>### 使用huggingface-cli下载数据集的步骤 Hugging Face提供了`huggingface-cli`命令行工具用于与模型和数据集仓库交互。以下是具体操作步骤： 1. **安装依赖** 确保已安装`huggingface_hub`库，这是使用`huggingface-cli`的前提： ```bash pip install huggingface_hub ``` 2. **下载数据集文件** 使用`huggingface-cli download`命令指定数据集名称和文件路径。例如，下载`glue`数据集中的`cola`子集文件： ```bash huggingface-cli download nyu-mll/glue --repo-type dataset --include "data/cola/*" ``` - `--repo-type dataset`: 指定仓库类型为数据集（默认为模型） - `--include`: 筛选需要下载的文件路径模式 - `--revision`: 指定数据集版本（可选） - `--cache-dir`: 自定义缓存目录（可选） 3. **登录（私有数据集）** 若需下载私有数据集，需先登录： ```bash huggingface-cli login ``` 输入账号的API Token完成认证[^4]。 4. **查看数据集结构（辅助步骤）** 建议先在[Hugging Face Hub](https://huggingface.co/datasets)查找数据集名称和文件路径。例如，`imdb`数据集的文件通常位于`data/*.parquet`。 --- ### 对比Python API方法若需直接加载数据集到代码环境，使用`datasets`库更便捷： ```python from datasets import load_dataset dataset = load_dataset("imdb", split="train") ``` --- ### 常见问题解答 **Q1: 如何批量下载整个数据集？** 需明确数据集文件结构后使用通配符匹配，例如： ```bash huggingface-cli download imdb --repo-type dataset --include "data/*" ``` **Q2: 下载后的文件存储在哪里？** 默认缓存路径为`~/.cache/huggingface/datasets`，可通过`--cache-dir`自定义。 ---