MultiCortex创始人Cabelo:如何利用异构计算实现高性能与低能耗平衡

来源:爱集微 #集微大会# #分析师论坛#
761

5月27日至29日,2026第十届集微大会在上海张江科学会堂隆重举行,MultiCortex创始人、全球openSUSE Linux大使Alessandro (Cabelo) de Oliveira Faria受邀出席大会同期举办的“全球半导体分析师论坛”,并发表《迈向可持续AI:如何利用异构计算实现高性能与低能耗平衡》的演讲,深度解读了如何通过架构创新与软硬件协同设计,平衡AI的高性能与低能耗。他结合低成本硬件跑通大模型的实践指出,异构计算与能效优化是可持续AI的核心,为AI规模化落地提供了绿色解决方案。

图/MultiCortex创始人、全球openSUSE Linux大使Alessandro (Cabelo) de Oliveira Faria

从SIMD说起:性能原语IPP决定计算效率

Cabelo自1983年起便对科技充满热情,职业生涯中获得过不少头衔,但此刻他更愿意以一个“技术推动者”的身份发声。他首先介绍了处理器中的一种“性能原语”(IPP)——SIMD(单指令流多数据流计算机)。在经典计算中,一次只能加载一个数据“箱子”;而借助SIMD,可以同时加载多个箱子。两个向量相加时,传统方式要一个个数字累加,而优化后的方式可以同时处理所有数字。Cabelo举例说,通过这种技术,速度可以提升200倍。

“我们正在触碰软件逻辑世界与硅物理世界相遇的最大边界。”他指出,从1994年到2022年,性能原语持续演进,而最终的集大成者便是oneAPI。值得注意的是,oneAPI并非英特尔专属——AMD、Arm、IBM、华为等主流厂商均已覆盖。

在对比新旧原语的效率时,他展示了一组直观的数据:旧原语下只有两个运算符,而新原语下处理速度快得多。但他同时提醒,不要盲目否定Python,它在能耗方面有其优势,但进行循环计算时,其能耗比优化后的方案高出75~78倍。“如果要做循环计算,尽量把数据放在0级缓存中,离处理器更近,而不是放在1级缓存。通过这些优化,仅靠数据局部性就能让性能提升1500%。”

Cabelo展示的程序实例更具说服力:通过正确探索硬件和网络,性能提升30倍。处理一张猫的图像,原先需要430毫秒,优化后仅需130微秒。

异构统一平台:一套代码跑遍所有硬件

“大家不需要学完所有的东西,”Cabelo话锋一转说道,“异构计算已经大大简化了过程。”他强调了oneAPI平台的核心价值:传统编程中,每一种硬件都要单独编写软件;而借助oneAPI的DPC++编译器,可以为所有硬件开发同一套软件。

他本人有幸成为这项技术的首位认证人员,并基于其创建了一个操作系统以方便用户使用。“异构计算赋予我们超能力,我们可以在英特尔、英伟达、树莓派、Arm等任何硬件平台上运行软件,甚至可以转换任何代码。”他现场演示:只需两个命令就能生成跨硬件软件,甚至3行代码即可获得最高性能。

经典案例解读:从IBM到医疗,再到10美元的大模型

实践是检验技术的最佳标准。Cabelo分享了三个成功案例。

第一,在某个IBM项目中,原本每秒只能处理5~15个token,团队创建了巴西本地化版本后,性能提升70%。

第二,在Medical Cloud医疗云平台,原本依赖价值500万元的设备,现在采用设备成本仅10万元,同时利用上述技术为巴西避免了高达3.5亿元的欺诈损失。他透露,两个月内,MultiCortex系统将推出中文版本。

第三,用仅10美元的硬件,运行一个110亿参数的大语言模型,令人惊叹。他说:“实现‘早上好’‘下午好’‘晚上好’的问候,我们并不需要大型设备和大模型。”对比数据更具冲击力,在Jetson AGX上,一个模型每秒只能处理230个token;而经过优化的硬件上,每秒可以处理1.5万个token,甚至能达到5万个token。“我只要提问,它立刻就给出回答。”

演讲最后,Cabelo将视角从技术拉回到更宏观的命题。他说,通用计算时代已经落幕,CPU、GPU、NPU、FPGA等异构芯片协同工作正成为主流,而oneAPI、SYCL等跨平台框架正在打破算力壁垒。

最后,Cabelo以深刻的行业洞察作为结尾:“合作比竞争更好,因为合作会吸引朋友,而竞争却会招来敌人。”

Alessandro (Cabelo) deOliveira Faria的演讲视频内容,现已上传至“集微VIP频道-视频栏目”。

欢迎订阅集微VIP频道

查看完整视频内容

在技术快速迭代、全球竞争格局瞬息万变的时代,拥有系统、权威、前瞻的信息来源是做出正确决策的前提。集微VIP频道已收录超十万份深度行业报告,并以每周新增千篇的速度持续更新,全方位助力用户把握行业机遇、做出科学决策。此外,集微VIP频道还整合了Agent服务平台、资讯服务、舆情监测、企业洞察、知产交易、集微报告等一站式服务。

集微VIP坚持“信息普惠”原则,会员一次订阅即可访问全平台内容,无二次收费,无分级限制。

限时会员通道现已开启,为您的专业决策注入持续动能:

- 首月体验价仅需9.9元,以最低成本,超值体验完整服务。

- 月卡19.9元,灵活应对短期、高强度的信息需求。

- 季卡54.9元,以稳定的节奏,持续把握产业脉搏。

- 年卡199元,是长期主义者最具性价比的智囊伙伴。

责编: 爱集微
来源:爱集微 #集微大会# #分析师论坛#
THE END

*此内容为集微网原创,著作权归集微网所有,爱集微,爱原创

关闭
加载

PDF 加载中...