7月30日上午,在美国丹佛举行的SIGGRAPH图形大会上,英伟达创始人兼首席执行官黄仁勋分别与美国《连线》杂志资深撰稿人劳伦·古德、元宇宙公司Meta创始人兼首席执行官马克·扎克伯格坐在一起,进行了两场炉边谈话,畅想生成式人工智能的发展未来。
对话上半场,黄仁勋和扎克伯格围绕生成式AI、开源技术等内容展开对话,并强调了开源大模型在推动AI发展中的重要性。对话下半场,他们围AR/VR计算平台和机器人浪潮等展开了讨论,指出下一波AI浪潮是机器人,而AR眼镜未来或替代智能手机。炉边谈话接近尾声时,黄仁勋和扎克伯格再次互送外套,一度引起热议。
生成式AI将进入应用新浪潮
在谈话开始前,黄仁勋已经在大会上展示了英伟达的一系列最新产品,并宣布“英伟达本周将开始发送Blackwell样品,这是公司今年首发的新款芯片架构”。根据英伟达介绍,Blackwell GPU在训练性能上相较前代Hopper H100 GPU提升了四倍,推理性能提升最高可达30倍,而能源效率更是提高了25倍,未来将大力推进大模型行业的迭代演进。
此外,扎克伯格一开场首先宣布推出一款名为AI Studio的新工具,基于公司最新大模型Llama 3.1构建,允许用户创建、共享和设计个性化的AI聊天机器人,同时让Instagram 创作者使用AI角色“作为自己的延伸”,以处理简单的自动回复。
在对话中,扎克伯格表示,社交媒体的信息变得越来越多,如何帮助用户筛选内容成为了一大问题,而生成式AI能够帮助改进社交媒体的推荐系统。他相信在未来,每家企业都能有一个属于自己的AI助手(AI Agent),能够独立完成所需时间较长的复杂任务。
“AI 将不仅用于内容推荐系统,还将用于即时内容生成和从现有内容中整合新内容,这将彻底改变 Instagram 和 Facebook 等平台的信息流和推荐系统。”扎克伯格称。
扎克伯格分享了Meta在生成式AI方面的进展,并指出基础模型的发展正在加速。“即便基础模型方面的进展现在停滞不前,业界也至少需要五年时间来进行产品创新,以探索如何最高效地利用迄今为止所构建的一切。但实际上,基础模型以及基础研究的进展正在加速。
在赞赏Meta在AI领域的探索同时,黄仁勋也表示,“我认为很少有人意识到,推荐系统是世界上设计出的最大计算系统之一。”然而,作为聊天机器人的AI目前还停留在“一问一答”的阶段,未来AI或许能为用户生成决策树式的思考,这让我超级兴奋。”
在生成式AI生态中,AI Studio是Meta推进AI聊天机器人迭代完善的重要一步,而其背后Llama 3.1大模型至关重要。此前,黄仁勋表示,生成式AI正在每一个领域中进行根本性转变,而Llama 3.1开源模型标志着全球企业采用生成式AI的关键时刻已经到来,Llama 3.1将掀起各个企业与行业创建先进生成式AI应用的浪潮。
开源大模型将赢得胜利
随着大模型发展进一步演进,开源大模型正在迸发出更大的潜力。
就在上周,Meta正式发布Llama 3.1系列模型,共包含8B、70B和405B三个尺寸。超大杯Llama 3.1 405B被称为全球目前最强大的开源模型,且实力与GPT等主流闭源大模型旗鼓相当。尽管这些模型的“开放性”存在争议,但它们已成为相关领域相对容易达到的AI性能标准。
黄仁勋在谈话过程中多次对扎克伯格的开源做法表示称赞,并称Llama的出现激活了每一家公司和每一个行业,正在帮助更多开发者和公司获得AI模型技术。
他还称,开源策略让更多人受益,英伟达在Llama的启发下也为用户创建了全新 NVIDIA NIM和AI Foundry服务,供开发者为生成式 AI 应用创建更小的自定义 Llama 3.1 模型。使企业能够在更多基础设施(如PC)上运行由 Llama 驱动的 AI 应用。
实际上,自Meta开发大模型以来,便一直是英伟达的重要客户。黄仁勋在对谈中透露,“Meta拥有的英伟达GPU数量可能已达到60万个”。此外,今年1月,扎克伯格宣布,Meta计划在年底前向英伟达购买35万个H100 GPU芯片。
谈及Llama大模型为何开源,扎克伯格表示,“开源是为了给开发者搭建一个更为实惠和便捷的技术平台,在便于开发者修改代码创造属于自己的应用的同时,还能节省不少开发成本。同时,开源也有利于构建更具多样性的生态系统。”
他提到,“坚持开源和闭源两种技术路线的开发者都有自己的理由,无优劣之分。但总体上,对于整个行业正在构建的计算平台而言,开源很有价值。在一个开放的操作系统中,我们能够与不同的软件及硬件公司合作,创造出更多的应用。”
扎克伯格坚信并乐观认为,在下一阶段竞争中,开源会为Meta赢得胜利。
不过,对于竞争对手苹果的封闭系统的影响,扎克伯格一度爆粗口,并称“闭源平台有些自私”。他还表示,“在创建Meta 一段时间后,我未来 10 年或 15 年要做的一件事就是,只想确保我们能够构建社交体验的基础技术。这不仅需要构建一个AI软件,还需要一个围绕它的生态系统。开源不仅使我们正在构建的东西成为最好,而且对生态系统很有帮助。”
下一波AI浪潮是机器人
至于AI技术的终端应用,在与劳伦·古德和扎克伯格的对话中,黄仁勋均强调了下一波AI浪潮将是“物理AI”,即让AI更好地理解物理世界。
黄仁勋表示,第一波AI浪潮是加速计算,不仅能降低能耗,也能为企业客户提供服务,并且有望让每个组织都有机会创建自己的AI。“下一波浪潮是物理人工智能。其需要三台电脑,一台用来创建人工智能,另一台向机器人发送指令,第三台电脑处理事务。”
换句话说,黄仁勋认为,下一波AI浪潮是人形机器人。正如物理人工智能视频演示中所说,“我们正在进入人工智能驱动的人形机器人时代。”
在大会上,英伟达详细介绍了如何加速人形机器人的开发,并公布部分新产品,包括机器人仿真和学习的NIM微服务和框架、用于运行多阶段机器人工作负载的OSMO编排服务,支持AI和仿真的远程操作工作流,以及一款AI驱动的客户服务Agent。
其中,MimicGen NIM微服务可根据苹果Vision Pro等空间计算设备记录的远程操作数据,生成合成运动数据。Robocasa NIM微服务可在OpenUSD中生成机器人任务和仿真就绪环境。而远程操作工作流允许开发者使用少量人类演示数据来训练机器人等。
此外,英伟达还宣布,将为全球领先的机器人制造商、AI模型开发者和软件制造商提供一套服务、模型以及计算平台,以开发、训练和构建下一代人形机器人。首批加入英伟达人形机器人开发者计划的有1x、波士顿动力公司、字节跳动ByteDance Research、FieldAl、Figure、傅利叶、银河通用、逐际动力等数十家企业。
黄仁勋表示,“计算机视觉是当前研究重点,英伟达正在利用视频训练人工智能模型,这样就能使其更好地理解世界模型。未来,机器人也将会更好地在物理世界中运行。”
与此同时,扎克伯格认为,虚拟世界将成为推动未来AI与机器人技术新浪潮的潜力源泉。 “其中,智能眼镜会成为下一代计算平台的移动版,混合现实头戴设备则更像是你的工作站或游戏主机。”这些设备的发展将使人们能够以更加自然和直观的方式与虚拟世界互动,从而推动AI和机器人技术的进步。
AR眼镜或替代智能手机
在AI、显示灯技术发展推动下,虚拟现实(VR)/混合现实(MR)正在迎来新兴发展阶段。
黄仁勋表示,智能能眼镜和混合现实头戴设备有巨大的市场潜力,适用于不同的应用场景。其中,不需要持续佩戴的AI设备将会受到欢迎。
当他询问智能眼镜未来的趋势时,扎克伯格坦言,自己以前一直认为全息AR眼镜会在AI时代到来之前出现,但直到现在都未能被大规模生产。不过,“智能眼镜将会是未来计算机发展的一个重要形态,下一代计算平台将是智能眼镜和虚拟现实(VR)/混合现实(MR)头显的结合。其中,智能眼镜用于移动用途,VR/MR头显用于计算密集型的工作站任务。”
他还称,“我们离拥有全息眼镜还有一段时间。不过,我认为在一副时尚的、更厚框架的眼镜中实现这一点并不遥远。”未来的一场视频对话中,显示的或许不再仅是对话者图像,两个人可以互动、打牌、面对面开会,这听起来非常疯狂,但仍是正在努力的方向。”
此前,Meta已经与雷朋合作推出两代智能眼镜,其中第二代Ray-Ban Meta取得了大超预期的销量。今年以来,据传Meta首款AR 眼镜将于 2024 年亮相。
扎克伯格表示,“我们一直在构建认为是理想全息AR眼镜所需的技术,未来将产生一系列不同价位,采用不同技术水平的智能眼镜产品,其中300美元价位的智能眼镜将成为最受欢迎款式,有望迎来数千万或数亿消费者。”同时,他也看好通过眼镜将AI与现实世界结合,并提到Meta与眼镜制造商Luxotic的合作,认为这可以用来帮助变革教育、娱乐和工作模式等。
“五年前自我曾认为AR的发展会快过AI,但现在来看,AI的快速发展已经反转了这个事实,并对虚拟现实的发展形成了重要推动作用。”扎克伯格说,未来AR眼镜或替代智能手机。
从英伟达和Meta的发展路径来看,某种程度上都未曾预见AI发展态势,但如今均凭借围绕AI的布局实现新接阶段的快速发展,尤其是英伟达已经高歌猛进至全球市值三强。
在围炉对话最后,黄仁勋感叹道,从移动时代到虚拟现实再到AI,自己和扎克伯格同为技术变革的见证者和亲历者,深知这一路走来的不易。“在技术变革过程中,我们两个被踢掉过很多次,但都坚持了下来,这就是想要成为创新先锋需要做的。”