toolformer，教会大语言模型使用api接口

最新推荐文章于 2025-07-16 16:38:37 发布

Yonggie

最新推荐文章于 2025-07-16 16:38:37 发布

阅读量2.1k

点赞数

CC 4.0 BY-SA版权

分类专栏： NLP 文章标签：语言模型人工智能深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Yonggie/article/details/129936163

NLP 专栏收录该内容

9 篇文章

订阅专栏

文章介绍了一种方法，通过提示（prompt）使语言模型生成带API标签的文本，然后用这些数据对模型进行微调，使其能执行API调用。该方法解决了无标签数据的问题，特别在数学计算方面显示了显著改进。模型经过自我学习和迭代，可实现能力的提升，类似技术可能已被应用到产品中，如Office的Copilot。

aim

此文章的意图在于：

To equip a language model 𝑀 with the ability to use different tools by means of API calls.

也就是是一个类似于chatGPT一样的模型能够获得调用API的能力。

方法概括

文章所使用的方法是有监督学习。
但是我们并没有类似下方带有标签的训练数据，这要怎么做呢？
在这里插入图片描述
本篇文章就采用了一个方法能够自己自足。

他直接使用Prompt的方式让语言模型自己生成带有API标签的文本数据。
在这里插入图片描述
上图的意思是直接对大语言模型（你就把他当做chatgpt就行了）输入命令，我让大语言模型做一个API的生成器，然后用他返回的结果当做带标签的数据。

然后根据这些已有的API标签，进行API调用接口并返回结果。然后根据返回的结果的好坏去筛选，最后再根据新生成的带有API标签的数据集对大语言模型进行最后的微调，就可以生成能够使用API调用接口的大语言模型了。

简单地说，就是想论文描述的那样：
在这里插入图片描述就这么几步，就可以实现标签数据的自给自足。

你甚至还可以从最后一步再次跳到第一步，再次上述步骤，自己做自己的teacher，教会自己student进行“自我升级”。

更多的

文章所调用的API一共只有五个，但是他的方法可以泛化到更多的API。
在这里插入图片描述在实验结果上可以看到。本篇文章的模型对比PPT 3。有长足的进步，尤其是在数学能力方面一直被诟病的。大约模型不能够进行数学给你算。的缺点也被大幅改进了。
像现在很多的产品估计已经早早的使用了，这样子的技术方法，比如office的copilot（可能哈，自己猜的）。
在这里插入图片描述

更具体

其实更具体的还是得看论文，我这有个自制的小视频，里面也稍微讲了些
详见：https://www.bilibili.com/video/BV1vN411A7pV/

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。