迅速在全球爆红的 ChatGPT 是如何诞生的?
阿尔特曼极少在公开场合热烈讨论人工智能。在谈到人工智能的时候,他可能听上去像是一位幻想思想家。
撰文:JEREMY KAHN
编译:刘进龙
来源:财富中文网
ChatGPT 的横空出世,在人工智能领域掀起了重要变革,这一智能工具因其解放人类生产力的潜力,从使用者到投资者,引起了各界的广泛关注。1 月 30 日,有消息称,百度将于 3 月在中国推出类似 ChatGPT 的人工智能聊天机器人程序。随着微软、百度等巨头加码,AIGC(人工智能自动生成内容)领域或将成为 2023 年最值得关注的、全球最热门赛道。尽管 ChatGPT 乃至整个行业距离真正成熟的商业化仍有差距,从 ChatGPT 的幕后故事中,我们仍然得以一窥它会如何影响科技、商业以及人类社会的发展进程。
在一代人的时间里,总是会出现一些产品,将从工程部门昏暗的地下室里,青少年书呆子气味难闻的卧室里,或者孤僻的有某种嗜好的人家中诞生的技术,变成人人都会用的工具。网络浏览器诞生于 1990 年,但直到 1994 年网景导航者(NetscapeNavigator)问世,大多数人才开始探索互联网。2001 年 iPod 诞生之前流行的 MP3 播放器,并未掀起数字音乐革命。同样,2007 年,苹果(Apple)iPhone 手机横空出世之前,智能手机已经问世,但却并没有针对智能手机开发的应用。
2022 年 11 月 30 日,人工智能领域可能也迎来了与网景导航者的问世同样重要的关键时刻。
旧金山人工智能公司 OpenAI 的首席执行官山姆·阿尔特曼宣告了这个时刻的来临。OpenAI 成立于 2015 年,得到了埃隆·马斯克、彼得·泰尔和其他 PayPal 帮成员以及 LinkedIn 联合创始人雷德·霍夫曼等一众硅谷大佬的投资。11 月 30 日,公司成立约 7 年后,阿尔特曼发推文称:「今天我们发布了 ChatGPT。欢迎点击这里与它聊天。」任何人可以通过推文中的链接注册一个账号,开始与 OpenAI 的新聊天机器人免费聊天。
这引起了各界人士的兴趣。人们不止与它交流天气状况。它根据软件公司 CEO 和工程师阿姆贾德·马萨德的要求,检查了程序代码的漏洞。美食博主和网红吉娜·霍摩尔卡要求它编写一份健康的巧克力片曲奇饼干食谱。Scale AI 公司的工程师赖利·古德赛德要求它撰写一集《宋飞传》(Seinfeld)的剧本。市场营销人员、一家在线人工智能美术馆的经营者盖伊·帕森斯要求它为其撰写提示语,然后输入到另外一款人工智能系统 Midjourney 后转换成图像。斯坦福大学医学院(StanfordUniversity School of Medicine)的皮肤病学家、从事人工智能医学应用研究的罗克珊娜·丹妮休向它提出了医学问题。许多学生利用它完成家庭作业。这一切都发生在该聊天机器人发布后 24 小时内。
以前也曾有其他聊天机器人,但没有一款能与 ChatGPT 相提并论。ChatGPT 能进行天马行空的长对话,可以回答问题,还能根据人们的要求撰写各种书面材料,例如商业计划书、广告宣传材料、诗歌、笑话、计算机代码和电影剧本等。当然,它并不完美:它提供的结果往往不够准确;它无法引用信息来源;而且它几乎完全不知道 2021 年以后发生的事情。虽然它提供的结果通常足够流畅,在高中甚至大学课堂上可以过关,但根本无法像人类专家们的表述那样做到字斟句酌。另一方面,通常在对用户知之甚少的情况下,ChatGPT 生成内容只要大约一秒钟时间,而且它生成的许多内容并没有想象的那么糟糕。ChatGPT 发布五天内,该聊天机器人的用户就超过了 100 万人,而 Facebook 用了 10 个月时间才达到这个里程碑。
过去十年,人工智能技术在商业领域逐步扩大应用,悄然改进了我们日常使用的许多软件,但却并没有令非技术用户感到兴奋。ChatGPT 的横空出世改变了这一点。突然之间,人人都开始谈论人工智能将会如何颠覆他们的工作、公司、学校和生活。
ChatGPT 是一股相关人工智能技术浪潮的一部分,这种技术被统称为「生成式人工智能」,还囊括了 Midjourney 和 Lensa 等热门艺术生成模型。OpenAI 位于科技行业「下一个大事件」的前沿,它具备了一家传奇初创公司的特征,包括全明星级别的团队和投资者的热捧,该公司的估值据称已经达到 290 亿美元。
该公司最近的突然蹿红引发了嫉妒、猜疑和恐慌。谷歌(Google)利润丰厚的搜索帝国可能受到影响。据媒体报道,为了应对 ChatGPT,谷歌内部已经拉响了「红色警报」。但 OpenAI 能成为超强科技公司俱乐部的成员,出乎人们的意料。几年前,它甚至还不是一家公司,而是一家致力于学术研究的小型非营利性实验室。公司至今依旧秉持着崇高的创立原则,例如保护人类文明,防范不受限制的人工智能所带来的威胁等。与此同时,OpenAI 经历了一次内部转型,导致原始团队分裂,公司也将重心从纯科研项目逐步转移到商业项目。(有批评者认为,发布 ChatGPT 本身是一种危险行为,并且表明 OpenAI 的经营模式发生了巨大转变。)
图片来源:IAN C. BATES—THE NEW YORK TIMES/REDUX
「我认为最好的情况好到令人难以想象……好到谈论它的人会令人觉得这人是个疯子。我认为最糟糕的情况是,我们所有人都死去。」
——OpenAI 联合创始人兼首席执行官山姆·阿尔特曼
OpenAI 与微软(Microsoft)扩大合作的消息于近日公布,微软将向该公司投资高达 100 亿美元,作为回报,未来几年,该软件业巨头将获得 OpenAI 的大部分利润。该笔交易可能会令外界更加确信,一份曾经理想主义的事业现在只关心谋利。尽管如此,《财富》杂志掌握的文件揭示了尚未盈利的 OpenAI 目前的经营状况。
37 岁的联合创始人兼 CEO 阿尔特曼充分体现了 OpenAI 谜一样的特性。作为一位资深科技创业者,阿尔特曼更为人们所熟知的是他出色的商业才能,而不是其工程技术成就。他是 OpenAI 估值暴涨的推手,也是给该技术泼冷水的主力。他曾公开表示 ChatGPT 距离真正可靠仍有很大差距。与此同时,他认为该技术是实现公司使命的重要一步。该公司有一个堂吉诃德式的使命,即开发一种计算机超级智能,又称通用人工智能(AGI)。阿尔特曼在 7 月份表示:「通用人工智能是人类生存必不可少的。我们面临的问题极其严峻,如果没有更好的工具将无法解决。」
对于一家营利性的企业而言,这种指导理念不同寻常,尤其是有些计算机科学家认为阿尔特曼的执念纯属幻想。加州大学伯克利分校(University of California at Berkeley)计算机科学家本·雷希特表示:「通用人工智能是一种愚蠢的设想。在我看来,它是虚无缥缈的。」
但通过发布 ChatGPT,阿尔特曼却将 OpenAI 及其宏大的人工智能使命,变得令整个科技界为之着迷。问题的关键在于,他与微软的合作能否解决 ChatGPT 的缺点,利用其先发优势改变整个科技行业。谷歌和其他科技业巨头纷纷在加大力气开发各自的人工智能平台;未来,更完善的软件可能使 ChatGPT 看起来如同儿戏。OpenAI 总有一天可能会发现,虽然它的技术突破开启了未来的大门,但这个未来却与它无关,如同网景在浏览器领域昙花一现的统治地位一样。
1 月中旬一个星期四的晚上,阿尔特曼在旧金山罕见地公开露面。他上身穿灰色针织衫,下身穿蓝色牛仔裤,脚蹬一双时髦的亮色扎染运动鞋,走进一个挤满投资者、技术人员和记者的房间。所有人都想收集与 ChatGPT 或近期融资有关的信息。当 StrictlyVC(一家专注于风险投资的媒体公司)的创始人康妮·洛伊佐斯询问他对于公司引起媒体轰动的看法时,阿尔特曼回答称:「我不看新闻,实际上我不太关注媒体的报道。」
活动在赛富时大厦(Salesforce Tower)的 46 层召开,房间内座无虚席。在采访开始前召开的金融科技专题讨论会上,一位发言嘉宾甚至对听众表示,她知道所有人「都在等待山姆·阿尔特曼」。
然而,尽管引起了各界关注,还有有关微软投资的传闻在四处传播,但阿尔特曼却似乎有意在给这种热烈的氛围降温。他表示:「这些技术有一点比较奇怪,那就是虽然它们的表现令人印象深刻,却并不可靠。所以你在使用第一版演示版的时候,会产生一种非常深刻的反应:『哇,真是不可思议,我已经迫不及待了』。但在用过一百次之后,你就会发现它的缺点。」
这种谨慎似乎代表了 OpenAI 总部的官方态度。该公司总部位于旧金山教会区的一家旧行李箱工厂。事实上,如果说 ChatGPT 是人工智能领域的「网景导航者」时刻,它差点就要提前夭折,因为 OpenAI 在几个月前几乎要叫停该项目。
ChatGPT 的聊天界面支持用户以简单的英语(和其他多种语言)与人工智能对话,OpenAI 最初的设想是将这个界面作为完善其「大语言模型」(LLM)的一种方式。大多数生成式人工智能系统核心都有一个大语言模型。大语言模型是将非常庞大的神经网络应用于大量人为创建文本所生成的。神经网络是大致基于人脑内部神经连接的一种人工智能。模型从这个数据库中学习一个复杂的统计学概率图,代表了任何一组单词在特定语境下相邻出现的统计学概率。这样一来,大语言模型就可以执行大量自然语言处理任务,例如翻译、总结或写作等。
OpenAI 已经创建了全世界最强大的大语言模型之一。该模型名为 GPT-3,由 1,750 亿个统计性联系组成,在约三分之二互联网、整个维基百科和两个大型图书数据集中进行训练。但 OpenAI 发现,GPT-3 很难准确提供用户想要的结果。一个团队提议使用「强化学习」系统完善该模型。「强化学习」是从试错中学习以取得最大化回报的人工智能系统。该团队认为,一款聊天机器人或许是不错的候选方法之一,因为以人类对话的形式持续提供反馈,使人工智能软件很容易知道其做得好的地方和需要改进的情况。因此,2022 年初,该团队开始开发这款聊天机器人,也就是后来的 ChatGPT。
开发完成后,OpenAI 邀请贝塔测试人员对其进行了测试。但据 OpenAI 联合创始人兼现任总裁格雷戈·布洛克曼表示,测试人员的反馈却令 OpenAI 失望;人们不知道该与聊天机器人交流哪些内容。OpenAI 一度改变了策略,尝试开发专业聊天机器人,希望为特定领域的专业人员提供协助。但这个项目也遇到了问题,部分原因是 OpenAI 缺少训练专业聊天机器人的合适数据。布洛克曼表示,OpenAI 决定孤注一掷,对外发布 ChatGPT,交给用户使用,任其自由发展。布洛克曼表示:「我承认,我当时的立场是,不知道它是否会成功。」
OpenAI 的高管表示,这款聊天机器人的突然爆红,令公司措手不及。其首席技术官米拉·穆拉蒂表示:「这令我们非常惊讶。」在旧金山召开的风险投资活动上,阿尔特曼表示他的「预期可能要低一个量级——它所引起的热度低一个量级。」
2022 年 10 月 25 日,OpenAI 首席技术官米拉·穆拉蒂参加《特雷弗·诺亚每日秀》。图片来源:COURTESY OF MATT WILSON/COMEDY CENTRAL’S 「THE DAILY SHOW」
ChatGPT 并不是 OpenAI 唯一一款引发热度的产品。虽然该公司仅有约 300 名员工,团队规模较小,却拓展了人工智能的应用范围,使其不只是简单的分析数据,而是可以创建数据。OpenAI 的另外一款产品 DALL-E 2 支持用户通过输入几个单词,生成他们所想象的任何物品的仿真图片。现在跟风者已经出现,包括 Midjourney 和开源软件公司 Stability AI。(这些图片生成模型都有缺点,最突出的是它们倾向于放大他们的训练数据中的偏见,可能生成存在种族歧视和性别歧视的图片。)OpenAI 通过微调其计算机代码的 GPT 大语言模型,还创建了 Codex 系统。该系统可以根据程序员以直白的语言输入的代码功能预期,为程序员编写代码。
OpenAI 还有更多创新蓄势待发。OpenAI 在贝塔测试版 GPT-4 中采用了更强大的大语言模型,预计该版本将于今年甚至很快发布。阿尔特曼也表示,公司正在研发一款可根据文本描述生成视频的系统。此外,在 1 月中旬,OpenAI 表示其计划发布 ChatGPT 的商业版。付费用户可通过一个界面使用聊天机器人,更容易将其整合到自己的产品和服务当中。
或许有冷眼旁观者认为,ChatGPT 的发布时机与 OpenAI 正在进行的一轮大规模融资有关。(OpenAI 表示该产品发布的时机纯属巧合。)可以确定的是,ChatGPT 的出现搅动了一个鲨群出没的水域。它在风投界掀起了一场狂热的追逐,风投公司希望利用 OpenAI 高管、员工和创始人非公开出售股权的机会,获得该公司的股份。
与此同时,微软将在该公司追加投资高达 100 亿美元的消息刚刚对外公布。微软在 2016 年开始与 OpenAI 合作,三年前与该公司建立了战略合作伙伴关系,并宣布投资 10 亿美元。据知情人士透露,该公司股份被大量超额认购,尽管微软通过一种不同寻常的投资结构获得了巨大的财务优势。
《财富》杂志掌握的文件显示,在新投资完成并且 OpenAI 的首批投资者收回初始资本后,微软将有权获得 OpenAI 75% 的利润,直至其收回 130 亿美元投资,其中包括直到《财富》杂志 1 月份爆料之后,OpenAI 才披露的 20 亿美元投资。之后,微软在该公司的持股比例将逐步下降到 49%,直至该软件巨头获得 920 亿美元利润为止。与此同时,其他风险投资者和 OpenAI 的员工将有权获得该公司 49% 的利润,直至利润达到 1,500 亿美元为止。在利润达到上述上限之后,微软和投资者的股份将重新归还给 OpenAI 的非营利基金。实际上,OpenAI 的做法是将公司出租给微软,租期取决于 OpenAI 的盈利速度。
但要收回投资和实现利润上限目标,可能需要一段时间。《财富》杂志掌握的文件显示,到目前为止,OpenAI 只有相对微薄的收入,依旧处在严重亏损状态。文件显示,该公司去年的收入预计不足 3,000 万美元。但计算和数据支出预计达到 4.1645 亿美元,人工支出 8,931 万美元,其他非特定营业费用为 3,875 万美元。其在 2022 年的净亏损总计为 5.445 亿美元,不含员工股票期权。而 ChatGPT 的发布可能快速增加该公司的亏损。阿尔特曼在 Twitter 上回复埃隆·马斯克的问题称,用户与 ChatGPT 的每次互动,将占用 OpenAI「个位数百分比」的计算成本,随着这款聊天机器人走红,其每月的支出可能高达数百万美元。
OpenAI 预测,随着 ChatGPT 成为吸引客户的重要工具,其收入将会快速增长。文件显示,该公司预测 2023 年收入 2 亿美元,2024 年收入预计超过 10 亿美元。但 OpenAI 并未预测其支出的增长情况以及何时能够扭亏为盈。该公司拒绝就这些数据发表评论,但它们指向了一个显而易见的事实:OpenAI 和微软都认为,曾经的非营利性实验室现在已经有可用来出售谋利的产品。
10 亿美元
根据《财富》获得的一份文件,ChatGPT 在 2024 年收入预计达到 10 亿美元,2023 年为 2 亿美元,2022 年为 3000 万美元。
微软已经开始收获双方合作协议的成果。微软在其 Azure Cloud 平台中推出了一系列 OpenAI 品牌的工具和服务,支持 Azure 客户使用 OpenAI 的技术,包括 GPT 和 DALL-E 工具。例如,汽车交易平台 CarMax 已经推出了可在这些 Azure 工具上运行的新服务。
微软人工智能平台企业副总裁埃里克·博伊德表示,满足训练和运行 OpenAI 大语言平台的需求,推动了创新,将使所有 Azure 客户受益。例如,微软为人工智能创建了其认为全球最强大的超级计算集群,并开发了多种软件创新,使在这些机器上训练和运行大型人工智能模型变得更容易。微软正在将 OpenAI 的技术整合到其许多软件当中。微软在其搜索引擎必应(Bing)中推出了一款图片创作工具以及一款新型设计师图片设计工具,这两款工具均由 DALL-E 驱动;在其 Power Apps 软件中推出了一款支持 GPT-3 的工具,并根据 OpenAI 的 Codex 模型开发了一款代码建议工具 GitHub Copilot。
晨星(Morningstar)专注于科技股研究的高级股票研究分析师丹·罗曼诺夫表示,与 OpenAI 的合作关系即使不会马上对 Azure 的收入产生影响,依旧是一次良好的品牌定位和营销。他表示:「OpenAI 备受关注。微软能够采用 OpenAI 开发的人工智能解决方案,将其应用到 Azure 并命名为 Azure AI,可以保持其竞争力。」微软云服务的竞争对手谷歌、AWS、IBM、甲骨文(Oracle)、赛富时(Salesforce)等,都有各自的「认知」服务,但能够与开发出 ChatGPT 的公司合作必然是利大于弊。
对微软而言,更大的回报可能是在搜索领域。科技媒体 The Information 最近报道称,微软计划将 ChatGPT 整合到必应,使其能够为用户反馈简洁明了的回答,并且使用户可以通过与聊天机器人对话进行深入探究,而不是逐一查看一列链接。谷歌目前在搜索市场占据主导地位,其全球市场份额超过 90%。必应虽然名列第二,却与谷歌相去甚远,市场份额仅有约 3%。在 2022 年前九个月,谷歌搜索业务的收入为 1,200 亿美元,约占谷歌总收入的 60%。ChatGPT 或许为微软动摇谷歌的霸主地位提供了唯一一次真正的机会。(微软拒绝就 The Information 的报道发表评论。)
按照微软的标准,这些积极的回报非常划算。微软在 OpenAI 的总投资额为 130 亿美元,确实是一个天文数字,但这笔投资仅占其过去 12 个月 850 亿美元税前利润的 15%,却能获得一项颠覆性技术的近期控制权,是一笔成本相对较低的交易。但 OpenAI 和阿尔特曼却可能要付出不同的代价:微软的优先任务可能对 OpenAI 自己的优先任务产生排挤效应,使 OpenAI 更宏大的使命面临风险,并且降低助力公司成功的科学家们对其的归属感。
2015 年 7 月的一个晚上,时任知名初创公司孵化器 Y Combinator 负责人的阿尔特曼,在地处门罗帕克硅谷风投业中心的牧场风格豪华酒店罗斯伍德桑德希尔酒店(Rosewood Sand Hill)举行私人晚宴。出席晚宴的包括埃隆·马斯克,还有当时 26 岁的麻省理工学院(MIT)肄业生布洛克曼。布洛克曼时任支付处理初创公司 Stripe 的首席技术官。宾客中有多位经验丰富的人工智能研究人员,也有人对机器学习几乎不甚了解。但所有人都相信通用人工智能是可行的,而且他们都非常担心。
谷歌刚刚收购了一家公司:位于伦敦的神经网络初创公司 DeepMind。在阿尔特曼、马斯克和其他科技界内部人士眼中,这是有极高胜算最先开发出通用人工智能的一家公司。如果 DeepMind 成功,谷歌可能会在这项无所不能的技术领域一家独大。罗斯伍德晚宴的目的是讨论成立一家实验室与其竞争,以避免这种情况发生。
新实验室旨在成为一家与 DeepMind 和谷歌截然不同的机构。这家实验室将是非营利性质,并明确提出以将先进人工智能的效益民主化为使命。该实验室承诺公开所有研究,将所有技术开源,并在公司名称 OpenAI 中充分体现了对透明度的承诺。该实验室有多位知名捐款人,其中不仅有马斯克,还有他在 PayPal 的同事泰尔和霍夫曼;阿尔特曼和布洛克曼;Y Combinator 联合创始人杰西卡·利文斯顿;阿尔特曼成立的 YC Research 基金;印度 IT 外包公司 Infosys;以及 Amazon Web Services。所有创始捐款人承诺在这家理想主义的新公司共同投资 10 亿美元(但税务记录显示,虽然这一承诺被媒体广泛报道,但该非营利组织仅收到了承诺捐款金额的一小部分)。
但事实很快证明,训练庞大的神经网络成本高昂,计算成本高达数千万美元。人工智能研究人员的人工成本同样昂贵:税务记录显示,出生于俄罗斯的科学家伊利亚·萨茨科尔离开谷歌后,加入 OpenAI 担任首席科学家,在前几年的年薪高达 190 万美元。几年后,阿尔特曼和 OpenAI 的其他人得出的结论是,要与谷歌、Meta 以及其他科技巨头竞争,该实验室不能继续以非营利的方式运营。阿尔特曼在 2019 年对《连线》(Wired)杂志表示:「为了成功完成我们的使命,我们需要海量资金,数额远超出我最初的设想。」
成立一家营利性分支机构,使 OpenAI 能够吸收风险资本。但 OpenAI 创建了一种非同寻常的融资结构,按照投资者的初始投资,以特定倍数规定投资者的回报上限。而由硅谷精英组成的 OpenAI 非营利性董事会,将保留 OpenAI 知识产权的控制权(见侧边栏)。有一位硅谷精英没有继续在董事会任职,他就是马斯克:2018 年,马斯克离开 OpenAI 董事会,理由是他需要经营 SpaceX,还有更重要的特斯拉(Tesla)。
当时,微软 CEO 萨蒂亚·纳德拉迫切希望证明,在人工智能领域落后于竞争对手的微软,也能在人工智能技术的尖端领域扮演一定的角色。微软曾经尝试聘请一位重量级的人工智能科学家,但未能成功。微软还建立了规模庞大、成本高昂的专用芯片集群,以推进其在语言模型开发领域的进展。这正是 OpenAI 迫切需要的超级计算力,当时该公司曾斥巨资进行收购。OpenAI 擅长的是实现各种炫酷的人工智能演示,而这正是希望证明微软人工智能实力的纳德拉所期待的。阿尔特曼主动联系到纳德拉商谈合作,他曾多次飞往西雅图展示 OpenAI 的人工智能模型。纳德拉最终签署了合作协议,并在 2019 年 7 月对外公布,使微软成为 OpenAI 技术商业化的「首选合作伙伴」,并在该人工智能初创公司初始投资 10 亿美元。
山姆·阿尔特曼与微软 CEO 萨蒂亚·纳德拉在位于华盛顿州雷德蒙德的微软总部合影。图片来源:IAN C. BATES—THE NEW YORK TIMES/REDUX
虽然阿尔特曼从最开始就参与了 OpenAI 的创立,但他直到 2019 年 5 月 OpenAI 转型为营利性企业后不久才担任该公司 CEO。但该公司从一家研究实验室变成价值数十亿美元的现象级企业的过程,充分显示出阿尔特曼独特的融资能力,以及以产品为导向的经营理念,也凸显出这些商业本能与他对实现科学驱动的宏大想法的承诺之间的矛盾。
作为 OpenAI 的领导人,从某种程度上来说,阿尔特曼就是硅谷的典型代表:年轻的白人男性;坚定专注;精通极客技术;热衷于效率和生产率最大化;致力于「改变世界」的工作狂。﹝在 2016 年《纽约客》(New Yorker)的一篇文章中,他表示自己并没有阿斯伯格综合征,但他能理解为什么人们会认为他是阿斯伯格综合征患者。﹞
阿尔特曼从斯坦福大学计算机科学专业肄业,参与创建了一家社交媒体公司 Loopt,该公司的应用可以告知用户好友所在的位置。该公司在 2005 年,成为 Y Combinator 的首批初创公司;虽然这家公司未能成功,但阿尔特曼出售该公司所得的收入,帮助他进入了风投界。他创建了一家小型风险投资公司 Hydrazine Capital,募资约 2,100 万美元,其中包括泰尔的资金。后来 Y Combinator 的联合创始人保罗·格雷厄姆和利文斯顿聘请他接替格雷厄姆,负责运营 YC。
阿尔特曼是一位创业者,而不是科学家或人工智能研究人员,他为人所津津乐道的是极其擅长进行风投融资。他坚信伟大的事业源于远大的志向和坚定不移的自信,他曾表示,希望通过开发所谓的深度科技领域,如核裂变和量子计算等,创造数万亿美元的经济价值。这些领域虽然成功的机会渺茫,但有可能带来巨大回报。阿尔特曼在 Loopt 的同事、资深科技投资者和初创公司顾问马克·雅各布斯坦表示:「山姆相信,他在自己从事的领域是最棒的。我确信,他曾认为自己是办公室里最强的乒乓球高手,直到事实证明他是错误的。」
据 OpenAI 的多位现任和前内部人士爆料,随着阿尔特曼掌管公司,公司开始转移业务重心。曾经广泛的研发议题被精简,主要专注于自然语言处理领域。萨茨科尔和阿尔特曼辩称这种转变的目的是在目前似乎最有可能实现通用人工智能的研发领域,最大程度增加投入。但有前员工表示,在公司获得微软的初始投资后,重点开展大语言模型研究的内部压力显著增加,部分原因是这些模型可以迅速投入商业应用。
有员工抱怨,OpenAI 创立的目的是不受企业影响,但它很快就变成了科技界巨头的工具。一位前员工表示:「公司所关注的重点更多地倾向于我们如何开发产品,而不是努力回答最有趣的问题。」与本文的许多受访者一样,由于保密协议的约束,并且为了避免得罪与 OpenAI 有关的大人物,这名员工要求匿名。
OpenAI 也变得不再像以前那么开放。该公司已经开始以担心其技术可能被滥用为由,收回此前做出的公开所有研究和将代码开源的承诺。但据该公司的前员工表示,商业逻辑也是这些举措背后的原因之一。OpenAI 仅通过 API 提供其先进模型,保护了自己的知识产权和收入流。OpenAI 的另外一名前员工表示:「[阿尔特曼]和[布洛克曼]对‘人工智能安全’说过不少空话,但这些言论通常都只是商业考量的遮羞布,对实际的、合理的人工智能安全问题却视而不见。」例如,这位前员工提到 OpenAI 曾因为担心被滥用而决定限制 DALL-E 2 的访问权限,但在 Midjourney 和 Stability AI 推出竞争产品后,公司快速推翻了这一决定。(OpenAI 表示,经过慎重的贝塔测试,其对安全系统充满了信心,之后才允许 DALL-E 2 的更大范围应用。)据多位前员工爆料,公司在策略和文化上的转变,是导致十多名 OpenAI 研究人员和其他员工在 2021 年决定离开公司并成立研究实验室 Anthropic 的原因之一。其中有多人曾从事人工智能安全研究。
OpenAI 表示相比其他人工智能实验室,其会继续公布更多研究成果。公司还为重心向产品转移的做法进行辩护。首席技术官穆拉蒂说道:「你不能只在实验室里开发通用人工智能。」她主张,发布产品是了解人们希望如何使用和滥用技术的唯一途径。她表示,直到发现人们使用 GPT-3 进行编程,OpenAI 才知道 GPT-3 最受欢迎的应用是编写软件代码。同样,OpenAI 最担心的问题是人们利用 GPT-3 生成虚假的政治信息,但事实证明这只是杞人忧天。她表示,相反,最常见的恶意使用 GPT-3 的行为是制作垃圾广告邮件。最后,穆拉蒂表示,OpenAI 希望通过公开其技术,「最大程度降低真正强大的技术可能对社会产生的冲击。」
她表示,如果不让人们预先了解未来可能出现的情形,先进人工智能所引发的社会混乱可能更严重。
萨茨科尔也认为 OpenAI 与微软的合作创造了一种全新的「预期,即我们需要利用我们的技术开发一种有用的产品」,但他坚持认为 OpenAI 文化的核心并未改变。
他说道,可以使用微软的数据中心,对于 OpenAI 的发展至关重要。布洛克曼也表示,与微软的合作使 OpenAI 能够创造收入,同时不必过多关注商业运营,否则公司可能不得不在商业运营方面投入更多精力。他说道:「招聘数千名销售人员,可能会改变这家公司,而与一家已经拥有销售团队的公司成为合作伙伴,实际上是非常好的策略。」
萨茨科尔直截了当地否认了 OpenAI 不再重视安全性的说法。「我想说的是,事实恰恰相反。」萨茨科尔称,在员工离职并成立 Anthropic 之前,人工智能安全「被委派给一个团队负责」,但现在它变成了所有团队的责任。「安全性标准不断提高,我们也在开展越来越多安全性方面的工作。」
「我们在开展越来越多安全性方面的工作。」
——伊利亚·萨茨科尔,OpenAI 首席科学家
然而,批评者表示,OpenAI 以产品为导向开发先进人工智能的做法是不负责任的,这相当于向人们发放上膛的枪支,理由是这是确定人们是否真的会相互射击的最佳途径。
纽约大学(New York University)认知科学专业荣誉退休教授加里·马库斯,对以深度学习为中心的人工智能开发策略持怀疑态度。他认为,生成式人工智能「将对社会结构产生切实的、迫在眉睫的威胁」。他表示,GPT-3 和 ChatGPT 等系统将生成虚假信息的成本降低到接近于零,可能会掀起虚假信息泛滥的狂潮。马库斯表示,我们甚至已经看到了第一批受害者。程序员发布和回答编程问题的网站 Stack Overflow 已经不得不禁止用户提交 ChatGPT 生成的回答,因为这种貌似合理实则错误的回答已经令该网站疲于应付。科技资讯网站 CNET 开始使用 ChatGPT 生成资讯文章,但后来发现,由于许多文章存在事实性错误,不得不对它们进行更正。
对有些人而言,真正的风险是 ChatGPT 能够编写准确的代码。网络安全公司 Check Point 的研究副总裁玛雅·霍洛维茨表示,她的团队可以用 ChatGPT 设计每一个阶段的网络攻击,包括杜撰一封令人信服的钓鱼邮件,编写恶意代码,以及逃避常见的网络安全检查等。她警告称,ChatGPT 基本可以让不懂编程的人成为网络罪犯,「我担心未来会发生越来越多网络攻击」。OpenAI 的穆拉蒂表示,公司也有同样的担忧,因此正在研究如何「调整」其人工智能模型,使它们不会编写恶意软件,但这绝非易事。
有无数批评者和教育工作者痛斥,学生很容易使用 ChatGPT 作弊。纽约、巴尔的摩和洛杉矶的校区均禁止学校管理的网络访问聊天机器人,澳大利亚的一些高校表示,将转为通过有专人监考的书面考试评估学生。(OpenAI 正在开发更便于检测人工智能生成文本的方法,包括可能在 ChatGPT 生成的文本上添加数字「水印」。)
2022 年,ChatGPT 最初的开发方式还引发了人们对道德方面的担忧。《时代》(Time)杂志调查发现,在开发过程中,OpenAI 聘请了一家数据标记公司,这家公司雇佣肯尼亚的低薪员工识别包含不良语言、色情图片和暴力内容的段落。报道称,一些员工因此出现了精神健康问题。OpenAI 在一份声明中对《时代》杂志表示,数据标记工作「是最大程度减少训练数据中的暴力和色情内容以及开发可检测有害内容的工具的必要步骤」。
免费提供 ChatGPT 使 OpenAI 能够获取大量反馈,从而帮助其完善未来的版本。但 OpenAI 未来能否维持其在语言人工智能领域的主导地位,仍是个未知数。伦敦人工智能公司 Faculty 的创始人兼 CEO 马克·华纳表示:「历史上,对于这种高度通用的算法,我们所看到的是,它们并没有达到足够可靠的程度,能够保证一家公司独占全部回报。」例如,面部识别和图像识别技术最早的开发者是谷歌和英伟达(Nvidia)等科技巨头,但现在它们已经无处不在。
法院和监管部门也可能对生成式人工智能所依赖的数据飞轮横插一脚。向加州联邦法院提起的一起金额高达 90 亿美元的集体诉讼,可能对该领域产生深远影响。该案原告指控微软和 OpenAI 使用程序员的代码训练 GitHub 的编程助手 Copilot,没有承认程序员的功劳或者对程序员予以补偿,违反了开源许可条款。微软和 OpenAI 均拒绝就该起诉讼发表意见。
人工智能专家表示,如果法院判决原告胜诉,可能会阻碍生成式人工智能的繁荣:大多数生成式人工智能模型都是使用从互联网上搜刮的材料进行训练,并没有取得许可或支付报酬。作为该案原告代理人的律师事务所,最近还提起了一起类似诉讼,指控 Stability AI 和 Midjourney 未经许可,在训练数据中使用了有版权保护的美术作品。盖蒂图片社(Getty Images)也对 Stability AI 提起了版权侵权诉讼。另外一个问题是,立法者可能通过法律,授予创作者禁止将其创作的内容用于人工智能训练的权利,例如欧盟的立法者正在考虑这样做。
与此同时,OpenAI 的竞争对手并没有坐以待毙。据《纽约时报》(New York Times)报道,失去搜索领域主导地位的可能性,已经促使谷歌高管发布了「红色警报」。报道称,谷歌 CEO 桑达尔·皮查伊已经多次召开会议,重新制定公司的人工智能策略,计划发布 20 款支持人工智能的新产品,并将在今年发布搜索聊天界面的演示版本。谷歌拥有一款强大的聊天机器人 LaMDA,但由于担心一旦该产品被滥用可能影响公司信誉,因此一直未对外发布。据《时代》杂志引用谷歌的内部报告和匿名知情人士的话称,现在,公司计划以 ChatGPT 为标杆「重新评估」其风险承受能力。该杂志报道称,谷歌还在开发一款文本转图片的生成系统,与 OpenAI 的 DALL-E 等产品竞争。
当然,目前尚不确定聊天机器人是否代表了搜索行业的未来。ChatGPT 经常会杜撰信息,这种现象被人工智能研究人员称为「幻觉」。它无法可靠地引用其信息来源,或简单地提供链接。现有版本无法访问互联网,因此无法提供最新信息。马库斯等人认为,幻觉和偏见是大语言模型存在的根本问题,需要彻底重新思考它们的设计。他表示:「这些系统可以预测句子中单词的顺序,类似于开发工具 Steroids 上的代码自动补全。但它们实际上并没有任何机制,能够跟踪其表述的内容的真实性,或者验证这些内容是否符合它们的训练数据。」
「这些系统可以预测句子中单词的顺序,类似于开发工具 Steroids 上的代码自动补全。但它们实际上并没有任何机制,能够跟踪其表述的内容的真实性,或者验证这些内容是否符合它们的训练数据。」
——纽约大学认知科学专业荣誉退休教授加里·马库斯
其他人预测,这些问题将在一年内得到解决,其中包括 OpenAI 的投资人霍夫曼和维诺德·科斯拉。穆拉蒂则更加慎重。她说道:「我们到目前为止一直遵循的研究方向,目的是解决模型的事实准确性和可靠性等问题。我们正在继续朝着这些方向努力。」
事实上,OpenAI 已经公布了对另外一个版本 GPT 的研究。该版本名为 WebGPT,可以通过查询搜索引擎和汇总查询到的信息来回答问题,包括对相关来源的注释。WebGPT 依旧不完美:它会接受用户问题假设的前提,然后查找确证信息,即使这个前提是错误的。例如,在被问到盼望某件事情发生是否能令其真实发生时,WebGPT 的回答是:「你确实可以通过思考的力量,使愿望成真。」
阿尔特曼极少在公开场合热烈讨论人工智能。在谈到人工智能的时候,他可能听上去像是一位幻想思想家。在旧金山举办的风险投资活动上,当被问到人工智能的最佳状况时,他夸张地说道:「我认为最好的情况好到令人难以想象……好到谈论它的人会令人觉得这人是个疯子。」他突然又将话题转回到 OpenAI 核心的反乌托邦主题:「我认为最糟糕的情况是,我们所有人都死去。」