2024数智科技大会:王建波探讨大模型算力基础设施的挑战与机遇
时间:2024-12-08 20:40
小编:小世评选
2023年12月6日,由每日经济新闻主办的“2024数智科技大会”在成都市圆满举行。会上,国家超级计算成都中心的常务副主任王建波发表了题为“大模型算力基础设施——技术趋势与关键挑战”的主题演讲,探讨了当前大语言模型及其背景下算力基础设施所面临的机遇与挑战。
王建波在演讲中指出,近年来大语言模型(Large Language Model)的迅猛发展,使人工智能进入了一个新的时代。模型能力的提升以及架构的不断演进,不仅促进了算力应用的新范式,还对现有基础设施提出了新的要求和挑战。以ChatGPT-4为例,其参数量高达1.8万亿;而国内的百度文心大模型4.0也实现了万亿级的突破。这种大规模的参数数量和复杂度,推动了新型算力中心的建设,尤其在中国和美国,相关企业投资建设的超级计算中心不断增多。例如,美国的X AI计划使用十万块英伟达H100 GPU,所构建的超级计算机规模至少是现有市场上最大的GPU集群的四倍,这突显了大算力的需求。
王建波强调,在这一背景下,行业的快速发展既带来了机遇,也引发了更严峻的挑战。他指出,大模型的产业化与创新商业模式是当前发展的关键挑战。他认为,中国在核心AI能力方面仍处于“跟踪”阶段,主要表现为高端人才短缺、基础算法创新不足,以及大模型训练所需的数据和算力资源的欠缺。
王建波指出,中国人工智能技术的应用主要集中在互联网行业和某些国防领域。将这些应用迁移到其他行业时,往往面临定制成本高、难度大等问题。同时,技术人才的供给与实际市场需求之间也存在显著差距,导致人工智能的应用落地减缓。
尽管面临诸多困难,王建波依然看好中国在大模型技术上的独特优势。他提到,中国拥有全球最大数量的互联网用户,为深度学习模型训练提供了丰富的数据素材,这使得中国的AI技术能够更加迅速地迭代和优化。中国的AI电商及无人驾驶等新兴产业也展现出强劲的增长潜力,代表着未来技术发展的新方向。
在王建波看来,当前美国的大模型技术多以通用技术路线为主,重点发展服务业,特别是在内容生成、人机交互和逻辑推理等领域取得显著进展。而中国的大模型技术则更侧重于整体社会生产效率的提升,着眼于成本与效率的优化。这种复合技术的应用将为传统产业、新兴产业乃至未来产业的发展带来新的机遇,并有助于全面提升全要素生产率。
王建波还提到,要想成功推动行业发展,关键在于降低行业或产品的整体成本,从而有效扩展用户群体和产业规模。在此背景下,生成式人工智能的产业链在中国已经初具规模,构成了广泛的市场机遇。他表示,未来的科技互联网公司有望通过结合用户行为数据和智能技术来提供更加精准的商品和服务,从而提升用户体验。
王建波强调,发展大模型技术的核心在于基础设施的建设。数据、算力和算法等基础设施应被视为国家战略信息资源,尤其在AI大模型的构建和运作中,算力基础设施的建设和数据的有效利用至关重要。他呼吁加强全国一体化的算力网络,推动算力的基础设施化,从而确保经济的可持续发展和国际竞争力。
王建波在2024数智科技大会上的演讲,通过深入分析大模型算力基础设施的发展趋势,展现了中国在这一领域的机遇与挑战。他的观点不仅为行业提供了方向,也激励了与会者对未来科技发展的思考与探索。随着科技的不断进步,人工智能和大模型将更加深入到各行各业,极大地推动经济的发展和社会的变革。