张少学习分享网什么是 ChatGPT 以及如何使用它？

OpenAI 推出了一种名为 ChatGPT 的长篇问答人工智能，可以通过对话方式回答复杂的问题。

这是一项革命性的技术，因为它经过训练可以了解人类提出问题时的意思。

许多用户对其提供人类质量响应的能力感到敬畏，并激发了这样的感觉：它最终可能有能力破坏人类与计算机的交互方式并改变信息检索的方式。

什么是 ChatGPT？

ChatGPT是OpenAI基于GPT-3.5开发的大型语言模型聊天机器人。它具有以对话形式进行交互的非凡能力，并提供令人惊讶的人性化响应。

大型语言模型执行预测一系列单词中的下一个单词的任务。

带人类反馈的强化学习 (RLHF) 是额外的一层训练，它使用人类反馈来帮助 ChatGPT 学习遵循指示并生成人类满意的响应的能力。

谁构建了 ChatGPT？

ChatGPT 由位于旧金山的人工智能公司 OpenAI 创建。OpenAI Inc. 是营利性 OpenAI LP 的非营利性母公司。

OpenAI 因其著名的 DALL·E 而闻名，这是一种深度学习模型，可以根据称为提示的文本指令生成图像。

首席执行官是 Sam Altman，他曾任 Y Combinator 总裁。

微软是价值 10 亿美元的合作伙伴和投资者。他们共同开发了Azure AI平台。

大型语言模型

ChatGPT 是一个大型语言模型（LLM）。大型语言模型 (LLM) 经过大量数据训练，可以准确预测句子中接下来出现的单词。

人们发现，增加数据量可以提高语言模型做更多事情的能力。

ChatGPT 是如何训练的？

GPT-3.5 基于来自互联网的大量代码和信息数据（包括 Reddit 讨论等来源）进行训练，以帮助 ChatGPT 学习对话并获得人类风格的响应。

ChatGPT 还使用人类反馈（一种称为人类反馈强化学习的技术）进行训练，以便人工智能了解人类在提出问题时的期望。以这种方式训练法学硕士是革命性的，因为它不仅仅是训练法学硕士来预测下一个单词。

ChatGPT 与简单聊天机器人的区别在于，它经过专门训练，可以理解问题中的人类意图，并提供有用、真实且无害的答案。

由于该训练，ChatGPT 可能会质疑某些问题并丢弃问题中没有意义的部分。

另一篇与 ChatGPT 相关的研究论文展示了他们如何训练人工智能来预测人类的偏好。

研究人员注意到，用于评估自然语言处理人工智能输出的指标导致机器在指标上得分很高，但与人类的预期不一致。

ChatGPT 有哪些限制？

毒性反应的限制

ChatGPT 经过专门编程，不会提供有毒或有害的响应。因此它将避免回答此类问题。

答案的质量取决于方向的质量

ChatGPT 的一个重要限制是输出的质量取决于输入的质量。换句话说，专家指导（提示）会产生更好的答案。

张少学习分享网