ChatGPT聊天机器人上线短短五天，用户已经突破了 100 万,ChatGPT,聊天,机器人,上线,短短,五天,用户,已经,

　　原标题：ChatGPT 会取代搜索引擎吗？

机器人（图片来源：Unsplash）

　　过去一周风靡社交网络的人工智能（AI）产品，非 ChatGPT 莫属。

　　12 月 5 日，微软投资的美国 AI 实验室 OpenAI 创始人兼 CEO Sam Altman 在社交媒体上宣布，其 11 月 30 日发布的聊天机器人模型 ChatGPT，上线短短五天，用户已经突破了 100 万。

　　所谓 ChatGPT，就是模仿人类说话风格的同时回答大量的问题，通过 OpenAI 的新模型生成一些语义答案，利用网页应用形式与用户对话互动，实现简单聊天、信息咨询、撰写诗词作文、修改代码等。

　　由于其较高质量的回答、高效获取信息的方式以及上瘾式的交互体验，ChatGPT 引起了国内外社交媒体的广泛传播与关注，而且产生取代谷歌等搜索引擎的讨论与可能性。

　　连世界首富、特斯拉 CEO 马斯克也称：" 许多人陷入了该死的疯狂 ChatGPT 循环中。" 甚至已经有国内投资人开始寻找 ChatGPT 背后的 OpenAI 公司，求购其股份。

　　尽管对其有大量赞扬的声音，但程序员聚集的问答社区 Stack Overflow 已经宣布禁止使用 ChatGPT 生成的机器回复，而且 ChatGPT 存在输出结果不稳定、没有纠错体系、商业落地难、数据安全难保护、对中国境内的实名用户不友好、关键模型不开源、AIGC（人工智能内容生产）赛道引发的创业与投资泡沫等问题，已引发业内广泛讨论。

　　接受钛媒体 App 独家采访时，京东集团副总裁、IEEE Fellow 何晓冬博士表示，中国应该要发展自己的 ChatGPT 模型产品。

　　" 坦白讲，（语音机器人）这个方向是对的，以后会有这个市场需求。" 何晓冬强调，除了在研究方面继续向前探索外，在文本生成上，ChatGPT 有独到的体验和价值，已经快要接近可商用的地步了。

　　ChatGPT 到底是怎么形成的？能否取代搜索引擎？

　　"AI 快要成精了！" 有投资人玩 ChatGPT 之后在朋友圈这样感慨。

　　那么，什么是 ChatGPT？

　　你可以理解为，ChatGPT 偏任务型的多轮对话或问答系统，定位于 " 通用型 AI 技术助理 "。相比苹果 Siri 和小爱同学的 " 订餐、订票、订宾馆 "，ChatGPT 更多执行开放域任务，即问答、阅读理解、推理、头脑风暴、写作文、改错等，可以说是 "AI 版的知乎 "。

　　今年 3 月 4 日，OpenAI 团队在预印版网站 arxiv 上提交了一篇题为 " 训练语言模型以遵循人类反馈的说明 " 的论文，详细阐述了 ChatGPT 背后基于拥有 13 亿个参数的 InstructGPT 大模型的技术能力。

　　OpenAI 在论文中指出，ChatGPT 核心在于 InstructGPT 模型输出，更深层次是基于 OpenAI 研发的 GPT-3.5 基座能力。尽管 InstructGPT 模型参数，比 NLP 预训练模型—— GPT-3 1750 亿个参数少 100 倍，但前者的数据模型有所甄选、校准和微调，训练出来的结果更精准，能够更简单的优化语言模型。

　　该团队称，ChatGPT 大部分沿用了 InstructGPT 的训练方式，在数据收集阶段招聘了人类 AI 训练师，同时扮演用户和 AI 助理角色收集数据。在此过程中，这些 AI 训练师可以根据初始模型的结果修改模型生成的回复，从而被用于有监督地精调训练模型。随后，工程师会对模型的多个生成结果进行比较，从中甄选数据中更加符合人类偏好的输出信息，甚至存在持续学习能力。OpenAI 统计发现，其 API 用户在超过 70% 的情况下更喜欢 InstructGPT。

　　目前，ChatGPT 仍处于免费测试阶段，不限量向公众开放。而基于其破百万的用户数，平台所花费的成本不算小。马斯克曾询问 " 每次聊天的平均费用是多少 "，Altman 回复：" 用户平均每次聊天所花费的可能是个位数美分。"

　　钛媒体 App 也第一时间尝试使用 ChatGPT 模型，简单问了三个关于芯片相关的问题。我们发现，ChatGPT 有些信息非常精准，有点像知乎或百科的回答，有时候像谷歌、Bing 的搜索引擎结果。但它的答案精准度依然有待商榷。

　　1、摩尔定律什么时候会终结？

　　2、英特尔未来能否超越 AMD 和英伟达？

　　3、帮我写一篇芯片的七言绝句

　　清华大学计算机科学与技术系长聘副教授、博导，聆心智能创始人黄民烈告诉钛媒体 App，ChatGPT 展示了新一代 AI 技术的能力，或许不远的未来，一定程度的 AGI（通用人工智能）可以做到。至少无缝人机交互是乐观的。他指出，InstructGPT 的数据很好，胜在数据质量高、多样性、RLHF 算法。其中，强化学习带来的增益非常之大。

　　目前来看，ChatGPT 的升级在于更多是算力与语料调教后的技术成果。

　　何晓冬则对钛媒体 App 表示，ChatGPT 模型在使用体验上确实让人感觉耳目一新。无论是流畅性，还是逻辑感都非常强，逻辑强于内容。但 " 干货 " 量偏低，缺少一些知识的准度，" 其实某种意义上，我觉得它的实用价值现在还是比不上谷歌（搜索）的。"

　　前 Google 总部科学家、出门问问创始人李志飞接受采访时表示，相对于语音助手和搜索引擎，ChatGPT 还有很多不能干或干不好的事情。ChatGPT 的 " 认知 " 建立在虚拟训练文本上，没有跟实时的数据库或信息连接，仍有些 " 空中楼阁 " 的味道，所以特别适合插科打诨。

　　有用户总结，目前 ChatGPT 不能回答的话题包括：不能预测可能会但从未发生过的事件及其后果；不能 OpenMind 或打破常规建立新规则和新模式；不能深入问题的细节去回答而是停留概要层面；无法区分是否为事实问题，一些非事实问题无法得到回答；很偏门的问题（可能从未有人这么想过的问题）不会回答；不能列出非主流观点；对话语境不能跳跃太大，领域跨度太大等。

　　但专栏作家 Parmy Olson 却认为，相比谷歌搜索抓取数十亿个网页内容编制索引，然后按照最相关的答案对其进行排名，包含链接列表来让你点击。ChatGPT 却直接基于它自己的搜索和信息综合的单一答案，回复流程更加简便。

　　针对外界认为 ChatGPT 能否取代搜索引擎的讨论，ChatGPT 自己却给出了 " 否定 " 回答：ChatGPT 并不是搜索引擎。它的目的不是提供信息搜索。相对于搜索引擎通过索引网页并匹配搜索词来提供信息，ChatGPT 则是通过对自然语言问题的回答来帮助用户解决问题。因此，它们之间没有直接的竞争关系，并不能相互颠覆。

　　早前，OpenAI 还发布了 DALL · E 2 ——可以通过文本描述中生成图像的 AI 程序。国盛证券指出，相比于此前的 AI 绘画，ChatGPT 更具有将 AI 能力与工作流程相结合的潜力，如果将 ChatGPT 与 Midjourney 等创作工具融合，有可能直接输出设计图稿等内容。而 ChatGPT 和 DALL · E 两个产品都是 AIGC 技术带来的新变革。

　　" 我认为 AI 的潜力还可以进一步放大和挖掘。回看过去这十年，AI 技术的进步确实超出想象。10 年前你可以看到图像、语音识别有突破，但肯定不会想到绘画、文章也可以通过 AI 生成逻辑性产品，这两者是不同的。这十年 AI 在不停的超越和突破很多人的预期和想象，这还是挺了不起的。" 何晓冬对钛媒体 App 表示，这次 ChatGPT 最大的创新点在新的半监督学习算法，使得它对用户的意图理解，可能快达到大规模商用的搜索引擎水平。

　　何晓冬认为，相较于之前大量使用无监督深度学习算法，ChatGPT 模型背后的算法和训练过程更加新颖。如果没有人的数据甄选，这个模型参数即便大十几倍，也很难达到这个效果。尤其 ChatGPT 把生成的文本模型更加 " 组织化 "，这是非常大的技术创新。

　　" 在某种意义上，这其实是对过去一味追求（参数）大和追求无监督学习的一个路线修正。" 何晓冬表示。

　　OpenAI 于 2021 年底已经完成了 2.5 亿美元的 A 轮融资，投资人包括微软、马斯克、谷歌风投、老虎基金、A16z 以及 Altman 前东家 Y-Combinator 等。据 The Information 报道，成立七年的 OpenAI 公司估值已经接近 200 亿美元，是其 2022 年预计收入的 500-800 倍。

　　在 2020 年 OpenAI 发布 GPT-3 之后，微软于当年 9 月 22 日取得独家授权。报道指，OpenAI 每年在微软云计算上花费约为 7000 万美元。

　　中国应该有自己的 ChatGPT

　　事实上，尽管 ChatGPT 海外爆红、服务器被挤垮，百万网友使用，但不包括中国境内的实名用户。很多拥有国内 +86 电话用户无法使用 ChatGPT。虽然有很多替代的网站或方案，或直接到非官方渠道购买 OpenAI 网站账号，但仍引发很多用户抱怨，国内用户体验大打折扣。

　　" 中国必须要有自己的基座大模型，应用大模型。很简单，OpenAI 关键模型不开源，只给 API，中国还不能随便用，已经是‘卡脖子’了，所以我们为什么不做这样的事情。" 黄民烈对钛媒体 App 表示，包括百度、聆心等国内很多团队正在（对 AIGC）做决心与相关资源投入解决相关问题。

　　告别硅谷崇拜，在中国互联网世界中，国内应该建立有中国创新特色的 ChatGPT，甚至是超越 OpenAI 能力的中国 AI 公司。这已经成为中国 AI 产业发展的必答题。

　　事实上，2022 年也因此被称为 "AIGC 元年 "，生成式 AI 发展迅速。今年 9 月一篇文章中提到，生成式 AI 可以处理的领域包括了知识工作和创造性工作，涉及数十亿的人工劳动力。生成式 AI 可以使这些人工的效率和创造力至少提高 10%，有潜力产生数万亿美元的经济价值。

　　根据中关村大数据产业联盟发布的《中国 AI 数字商业展望 2021-2025》报告预计，至 2025 年，中国 AI 数字商业核心支柱产业链规模将达到 1853 亿元，未来五年的复合增长率约为 57.7%。国泰君安则预测，未来五年，或将有最多 30％的图片内容由 AI 技术参与生成，相应有 600 亿以上的市场规模。

AIGC 产业链（来源：行业报告）

　　在国内，AIGC 概念企业正逐步成长，包括奇绩创坛、联想创投、华创资本、唯猎资本等机构都在观望或关注。今年 12 月，AI 生成 3D 内容的数字品牌 AVAR 获得天使 + 轮融资，成立一年间已连续完成三轮；另一家跨越星空也在半年内连续完成两轮共数千万元融资。未来是否存在类似 AI 绘画平台 Stable Diffusion 背后的 Stability AI 的独角兽公司，依然需要时间等待。

　　何晓冬表示，目前 GPT（AIGC）创业价值有两点：一是如果从研究角度看，国内会继续往算法技术创新上探索；二是产业价值，特别在文本生成上有独到的体验和价值，本身已经接近可商用的地步了。未来可能需要考虑具体场景应用以及准确性等，尤其是垂直的专业知识。

　　" 现在确实是 AI 应用发展的好时机，尤其是应用落地的时机。我对 AI 比较乐观，而且我认为 AI 未来肯定要走产业路线。我越来越感觉到产业界应用机会比学术界更大。" 何晓冬认为，AI 技术慢慢地会从一个 " 作坊式 " 研究探索变成 " 工业级 " 工程或系统落地。目前，何晓冬团队正在对 AI 语音交互、多模态智能、数字人等诸多技术产品展开探索与研发落地。

　　对于有行业人士称，ChatGPT 存在输出结果不稳定，商业落地并不容易，还需深耕，而且很难找到工业端应用范围，尤其它需要大量算力。

　　黄民烈向钛媒体 App 回应称，ChatGPT 定位为通用任务型助理，作为工具，容易被很多人用到。当然这里面商业成本是必须要考虑的，但他认为未来一定是成本下行的趋势，一定会产生很多商业应用。可以参考现在很多文生图的公司和应用、感知和认知领域的 AIGC 等。" 所以我绝对是积极乐观的。"

　　此外，AIGC 带来的法律版权、种族和性别偏见、伦理等问题不可忽视。据 Axios 报道，Adobe 正在考虑将 AI 生成的图片以付费形式售卖，消息一出引起广泛讨论。

　　大成律师事务所肖飒法律团队在公众号发文指出，一般情况下 AI 创作并不会发生侵权行为，但如果 AI 在创作某一幅具体的画作的过程中使用了过多某作品中的元素，或者是作为模板的作品本身属于侵权作品，那么该 AI 生成的画作就可能被认定为侵权作品，从而存在侵权的可能性。" 必须明确的是，AI 虽然能够学习，但本身并不懂法律，更不懂得侵权的概念，任凭其自由发展是完全不可取的。"

　　据财新，小冰公司 CEO 李笛表示，大家现在的热情很容易被点燃，是因为 ChatGPT 的对话质量超出预期，但真实商业化不像投资人想得那么简单，ChatGPT 的工业应用还有很长的路要走。