钓鱼大模型，让它输出不该输出的东西

蒸土豆的技术细节

已于 2024-08-16 23:01:33 修改

阅读量1.1k

点赞数 5

CC 4.0 BY-SA版权

文章标签：人工智能

于 2024-08-16 21:55:43 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_39006282/article/details/141264808

启发

LLM本身在指令微调的输出范式下，已经被规训地要严格对齐人类的answer标准了，你让它输出黄暴内容，它就会以极低的困惑度告诉你，打咩，我不能生成，你这样是不对的。

然而，这一切都在你按照QA模板生成的时候才会这样。最近有个小窍门，你希望大模型输出json，而有的大模型还要先废个话or直接不听你的话，你就搞个预输出，例如对于Qwen模板

<|im_start|>user
内容 ...
我要你输出json<|im_end|>
<|im_start|>assistant
{

我们会多搞一个{出来，强制输出变到json这个轨

最低0.47元/天解锁文章

200万优质内容无限畅学

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。