加载模型报错Missing key(s) in state_dict:

最新推荐文章于 2025-05-07 20:01:47 发布

Jolly-XB

最新推荐文章于 2025-05-07 20:01:47 发布

阅读量1.8w

点赞数 12

CC 4.0 BY-SA版权

分类专栏： python学习笔记

原文链接：https://blog.csdn.net/qq_45777045/article/details/109481993?utm_medium=distribute.pc_relevant_t0.none-task-blog-2~default~BlogCommendFromMachineLearnPai2~default-1.control&depth_1-utm_source=distribute.pc_relevant_t0.none-task-blog-2~default~BlogCommendFr

python学习笔记专栏收录该内容

4 篇文章

订阅专栏

本文详细介绍了在深度学习模型训练中，如何正确加载模型参数。错误情况1是尝试将checkpoint_2的参数加载到model_1，导致 Unexpectedkey(s)instate_dict 错误，因model_2有额外参数。错误情况2是使用checkpoint_1的参数加载到model_2，会出现 Missingkey(s)instate_dict 错误，因model_2比model_1多参数。解决方法是确保模型结构与加载的参数匹配，例如使用model_2加载checkpoint_2的参数。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

引用

说明：比如我们之前定义的一个模型model_1，训练之后保存了模型参数，命名为checkpoint_1；然后我们在model_1的基础上修改了模型，在内部添加了一些新的参数（或者更改了参数的名称），命名为model_2，训练之后保存了模型参数，命名为checkpoint_2。
一般而言，我们在测试时，使用的模型model，要加载相应的模型参数信息，即checkpoint。
1，如果我们使用的模型是model_1，而加载的模型参数是checkpoint_2，这时可能会出现Unexpected key(s) in state_dict: …这类错误。因为checkpoint_2内保存的模型参数是model_2的参数，而model_2是在model_1的基础上添加了一些参数，我们把模型参数checkpoint_2加载到模型model_1上，就会多出一些不能匹配的参数。
2，如果我们使用的模型是model_2，而加载的模型参数是checkpoint_1，这时可能会出现Missing key(s) in state_dict: …这类错误。因为checkpoint_1内保存的模型参数是model_1的参数，而model_1要比model_2内部少一些参数，我们把模型参数checkpoint_1加载到模型model_2上，就会出现缺少参数这类错误。
3，如果是更改了model中参数的名称，可能会同时出现上述两种错误。如上述代码中所显示错误！

我遇到的问题是：
RuntimeError: Error(s) in loading state_dict for BertModel:
Missing key(s) in state_dict: “embeddings.position_ids”.
解决方法：
self.bert.load_state_dict(ckpt[“bert-base”]， False)