tensorflow2.0 学习笔记-get_file

本文介绍tf.keras.utils.get_file函数的使用方法,该函数可以从URL下载文件并将其缓存在本地目录。文章详细解释了函数参数,如fname、origin、untar等,以及如何验证文件完整性和提取归档文件。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

如果文件不在缓存中,则从URL下载文件。

参数:
tf.keras.utils.get_file(
fname, origin, untar=False, md5_hash=None, file_hash=None,
cache_subdir=‘datasets’, hash_algorithm=‘auto’, extract=False,
archive_format=‘auto’, cache_dir=None
)

fname:文件名(下载后保存的名字)。如果/path/to/file.txt指定了绝对路径,则文件将保存在该位置。

origin:文件的原始URL(下载地址)。

untar:不赞成使用“提取”。布尔值,是否应该解压缩文件

md5_hash:不赞成使用’file_hash’。验证文件的md5哈希

file_hash:下载后文件的预期哈希字符串。都支持sha256和md5哈希算法。

cache_subdir:Keras缓存目录下的子目录,用于保存文件。如 果/path/to/folder指定了绝对路径,则文件将保存在该位置。

hash_algorithm:选择哈希算法以验证文件。选项是“ md5”,“ sha256”和“自动”。默认的“自动”检测使用中的哈希算法。

extract:True尝试将文件提取为存档文件,例如tar或zip。

archive_format:尝试提取文件的存档格式。选项为“自动”,“ tar”,“ zip”和“无”。“ tar”包括tar,tar.gz和tar.bz文件。默认的“自动”为[‘tar’,‘zip’]。无或为空列表将不返回任何匹配项。

cache_dir:存储缓存文件的位置,如果为None,则默认为Keras目录。

说明:
默认情况下,URL中的文件origin下载到cache_dir ~/.keras,放在cache_subdir中datasets,并指定文件名fname。example.txt因此,文件的最终位置为 ~/.keras/datasets/example.txt。

也可以提取tar,tar.gz,tar.bz和zip格式的文件。传递哈希将在下载后验证文件。命令行编程shasum并sha256sum可以计算哈希值。

返回值:
下载文件的路径(绝对路径)

示例:

import numpy as np
import tensorflow as tf
import tensorflow_datasets as tfds

TRAIN_DATA_URL = "https://storage.googleapis.com/tf-datasets/titanic/train.csv"
TEST_DATA_URL = "https://storage.googleapis.com/tf-datasets/titanic/eval.csv"

train_file_path = tf.keras.utils.get_file("train.csv", TRAIN_DATA_URL)
test_file_path = tf.keras.utils.get_file("eval.csv", TEST_DATA_URL)
train_file_path
#输出结果
'C:\\Users\\14330\\.keras\\datasets\\train.csv'
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值