钓鱼大模型,让它输出不该输出的东西

启发

LLM本身在指令微调的输出范式下,已经被规训地要严格对齐人类的answer标准了,你让它输出黄暴内容,它就会以极低的困惑度告诉你,打咩,我不能生成,你这样是不对的。

然而,这一切都在你按照QA模板生成的时候才会这样。最近有个小窍门,你希望大模型输出json,而有的大模型还要先废个话or直接不听你的话,你就搞个预输出,例如对于Qwen模板

<|im_start|>user
内容 ...
我要你输出json<|im_end|>
<|im_start|>assistant
{
   
   

我们会多搞一个{出来,强制输出变到json这个轨

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值