🤖 ChatGPT是怎么工作的

从预训练到RLHF，ChatGPT的完整技术栈

ChatGPT工作原理

ChatGPT的工作分为训练和回答两部分 👇

📌 训练阶段

预训练：在大量互联网数据上训练GPT模型（decoder-only transformer），学会预测下一个词。此时能补全句子但不能回答问题

微调（3步）：

📌 回答流程

💡 ChatGPT的核心创新是RLHF（人类反馈强化学习），让模型的回答更符合人类期望。

#ChatGPT #AI #大模型 #深度学习 #程序员 #技术干货

Phaedrus