“算力是数字经济时代的核心生产力,正在不断催生新技术、新模式、新业态,助力各行业加快数字化智能化转型。”在青云科技举办的2024 AI算力发布会上,中关村朝阳园党工委副书记、管委会主任娄毅翔说,需要通过搭建产业的共性技术平台、打造标杆示范应用场景等方式,促成充分应用算力,进一步助力人工智能技术落地产业。
与会专家普遍认为,当前亟须实现算力供需匹配,打破算力流通壁垒,从而提升算力利用效率。
在青云科技智算产品经理苗慧看来,不同行业需要的算力具有不同特点,应为不同行业“量体裁衣”,实现算力需求与算力资源的高效匹配。
她举例说,自动驾驶系统每天面对海量图片数据,但这些数据并非全部都需要计算。根据这一特点,青云智算建设了多地区多中心的数据存储区域,并将其用于自动驾驶行业数据的内部流转。流转计算后,再将不必要的数据备份删除,以提升图形处理器(GPU)使用效率。
此外,科研单位对算力的需求存在波峰波谷。“高校院所并不是要生成一个大模型产品,更多的是用行业数据来调试其研发的算法。”苗慧认为,根据这种情况,可通过GPU切分技术,在算力需求波谷时匹配更低的算力,在算力需求波峰时重新整合GPU资源,提供足够的算力,实现降本增效。
青云科技首席执行官林源认为,从当前的产业发展趋势看,算力使用门槛亟待进一步降低。
目前,提供算力的“引擎”架构变得越来越复杂,提高了算力使用门槛。林源解释,从CPU(中央处理器)到GPU,再到不同GPU的调度和使用优化,芯片架构的变化对芯片的管理提出了新挑战,也影响着服务器的架构。此外,随着网络速度从千兆发展到数百GB,数据存储从分布式存储发展到围绕模型开发需求进行存储,人工智能落地所依托的底层基础设施变得更加复杂。只有具备高效调度能力,才能让算力“引擎”合力发动,提高算力利用效率。
如何更有效管理新的算力架构?“我们在实践中发现,打通不同底层逻辑的芯片系统,通过统一调度、智能管理,能为AI技术研发提供恰到好处的算力。”苗慧说,青云科技推出的AI智算平台,通过底层打通,能对曙光、昇腾、英伟达等提供的异构算力实现统一管理与调度。同时,通过开放的架构,平台能纵向融合多种AI技术。
林源介绍,基于不同芯片厂商、算力供应商、存储设备企业之间的协同合作,算力的底层基础设施壁垒被不断打破。当前,从青海到北京、从广东到内蒙古,都可以实现迅捷的算力调度和使用。
据介绍,包括青云科技在内的200余家行业上下游企业紧密合作,通过算力共赢、算力加速等计划,完成了百余项生态适配项目,以资源共享与优势互补推动智算产业整体发展。