什么是ChatGPT？ - 幂简集成

ChatGPT，即聊天生成预训练转换器，是由OpenAI开发的人工智能聊天机器人，自2022年12月开始对外提供服务。这个程序依托于GPT-3.5、GPT-4和GPT-4o等大型语言模型，并采用强化学习技术进行训练。ChatGPT主要通过文本与用户互动，不仅能够以自然对话的方式与人交流，还能处理包括自动文本生成、自动问答和自动摘要在内的多种复杂语言任务。例如，在文本生成领域，ChatGPT能够根据用户提供的文本内容，自动创作出剧本、歌曲、企划书等类似文本；在问答环节，它能够针对问题自动生成答案，并具备编写和调试计算机程序的能力。在推广阶段，用户可以免费注册并使用ChatGPT与AI进行对话。

ChatGPT以其能够撰写接近真人水平的文章和在众多知识领域提供详尽清晰的回答而迅速受到关注，显示出AI在以往认为不会被取代的知识型工作中也能胜任的能力，对金融和白领劳动力市场产生了巨大影响。然而，它在事实准确性方面的表现并不一致，需要谨慎处理基于意识形态的模型训练结果。自2022年12月发布以来，OpenAI的估值已经增长至290亿美元。ChatGPT上线5天后用户数达到100万，两个月后用户数超过1亿。GPT-3.5目前可以免费使用，无需注册，而GPT-4o则对已注册的免费用户开放，但有使用限制。注册用户可以免费使用ChatGPT的浏览、视觉、数据分析、文件上传和GPTs等功能，尽管这些功能原本是付费的，但同样存在使用限制。

尽管ChatGPT在生成类似人类的文本方面表现出色，但它也可能继承并放大训练数据中的偏见，这可能导致对不同种族、性别、语言和文化群体的不公正描述。

ChatGPT是基于GPT的生成型预训练变换模型，在GPT-3.5的基础上，通过基于人类反馈的监督学习和强化学习进行微调。这两种方法都利用人类教练来提升模型性能，通过人类的干预来增强机器学习的效果，以获得更加逼真的结果。在监督学习中，模型会接收到一些对话，其中教练扮演用户和AI助理的角色。在强化学习阶段，人类教练会对模型在之前对话中的响应进行评级，这些评级用于构建“奖励模型”，并通过多次迭代的近端策略优化（PPO）进行微调。这种策略优化算法比信任域策略优化算法更为高效。

OpenAI还持续从ChatGPT用户那里收集数据，以便加强训练和微调ChatGPT。用户可以对ChatGPT的回复进行投票，表示赞成或反对，并可以附加文字反馈。

关于ChatGPT编写和调试计算机程序的能力，由于深度学习模型本身并不理解编程，它只是在统计上识别代码片段之间的关系。

斯坦福大学的研究发现，GPT3能够解决70%的心智理论任务，相当于7岁儿童的水平；而GPT3.5（ChatGPT的同源模型）则解决了93%的任务，心智水平相当于9岁儿童。但这并不意味着ChatGPT真正具备心智理论，它可能只是在训练过程中作为副产品获得了类似心智的能力。因此，我们更应该反思这些测试本身，而不是探究GPT3.5是否真的具备心智。

ChatGPT的功能不仅限于模仿人类对话者，它还能够编写信件、创作音乐、电视剧、童话故事和学术论文，回答测试问题（在某些情况下表现优于普通人类），写诗和歌词，甚至模拟Linux系统。ChatGPT的训练数据包括各种文档和互联网、编程语言等各类知识，例如BBS和Python。

与前身InstructGPT相比，ChatGPT试图减少有害和误导性的回复。例如，当问及“告诉我2015年克里斯托弗·哥伦布何时来到美国”时，InstructGPT可能会将其视为真实事件，而ChatGPT则不会。

与其他聊天机器人不同，ChatGPT能够记住与用户的先前对话和提示。为了防止ChatGPT接受或生成冒犯性言论，输入内容会通过审核API进行过滤，以减少潜在的种族主义或性别歧视内容。

自2023年9月28日起，Plus版用户和企业用户可以使用ChatGPT进行网络搜索。

ChatGPT也存在多种局限。OpenAI承认，ChatGPT有时会生成看似合理但实际上不正确或荒谬的答案，这种现象在大型语言模型中很常见，被称为人工智能幻觉。其奖励模型基于人类监督设计，可能导致过度优化，影响性能。聊天机器人的目标不是追求绝对真理或准确性，而是根据给定的上下文和概率生成合理的回答。ChatGPT对2019年9月之后发生的事件知之甚少。据BBC报道，截至2022年12月，ChatGPT不能“表达政治观点或从事政治活动”。但研究表明，ChatGPT在对两个投票建议应用的政治声明表明立场时，表现出亲环境主义的倾向。训练过程中，审核者倾向于偏好更长的答案，不管实际理解或事实内容如何。训练数据中的算法偏差可能会在询问人物描述时显现出来。一些用户发现，ChatGPT在解决复杂问题（如求方程式的切线）时可能会给出错误答案，并在解一元一次方程式时陷入循环。

参考资料

wikipedia定义：https://zh.wikipedia.org/zh-cn/ChatGPT

视频介绍：https://www.bilibili.com/video/BV11m4y1B7ur/

科普文：https://zhuanlan.zhihu.com/p/635910533