GPT开始引起人们的注意力了

原创已于 2023-02-21 10:51:18 修改 · 606 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#自然语言处理

于 2023-02-20 11:02:47 首次发布

NLP 专栏收录该内容

3 篇文章

订阅专栏

OpenAI的GPT系列模型，从GPT1的微调阶段到GPT3的通用学习，逐步展示了其在自然语言处理领域的潜力。GPT通过调整参数如温度、topk和topp来控制多样性，而GPT3则通过zero-shot、one-shot和few-shot学习方式向通用智能迈进。随着CODEX的出现，GPT模型甚至能够进行代码编写。未来，RLHF（强化学习从人类反馈）等技术将进一步推动这一领域的发展。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

GPT

相关视频：链接

OpenAI，在美国成立的人工智能研究公司，核心宗旨在于“实现安全的通用人工智能(AGI)”，使其有益于人类。 OpenAI于2015年由一群科技领袖，包括山姆·阿尔特曼（Sam Altman）、彼得·泰尔（Peter Thiel）、里德·霍夫曼（Reid Hoffman）和埃隆·马斯克（Elon Musk）等人创办

2019年7月22日微软投资OpenAI并与其合作；

微软-Open_ai:GPT；谷歌：BERT

bert让我们看到了希望，gpt让我们看到了未来

GPT1---微调阶段

本质上是transformer的解码器，是自回归模型-生成模型，bert是自编码模型-完形填空

GPT2---基于prompt的通用阶段--1代的基础上增加数据和模型参数量

GPT2多样性控制参数:

3个参数：温度、topp、topk

温度低：准，温度高：多样性。

Topk：卡数量

Topp：卡概率和

其他值的概率置零，永远采样不到

GPT3:让模型学习人类偏好，然后给出输出—朝通用继续迈进

gpt3消耗的资源：10000个gpu

GPT3：zero-shot、one-shot、few-shot:

zero-shot：直接问答

one-shot：举一个例子

few-shot：举若干个例子

如果输入和输出费前后分别是翻译前后，那么模型就会知道你让它做翻译任务。

Fewshot：举若干个例子，然后再问他问题

不管是多少shot，都是拼接一起，自回归

网络结构：就是transformer，主要是要有海量的数据

CODEX：个性化机器人：用leetcode训练他的写代码能力

我们变成了少儿编程师

instructGpt

chatGpt

待整理的博客

关于人工智能:ChatGPT-背后的功臣RLHF-技术详解 - 乐趣区

抱抱脸：ChatGPT背后的算法——RLHF | 附12篇RLHF必刷论文

Illustrating Reinforcement Learning from Human Feedback (RLHF)

GitHub - CarperAI/trlx: A repo for distributed training of language models with Reinforcement Learning via Human Feedback (RLHF)

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。