AIGC引爆算力需求
我国算力如何“弯道超车”?
广州人工智能公共算力中心。 资料图片 |
2022年初,国家“东数西算”工程正式启动。一年来,在全国数十个城市,一批批数据中心拔地而起。其中,广州人工智能公共算力中心自2022年6月8日正式挂牌启动,于同年9月15日建设完成。一期投资人民币5.09亿元,目前可对外提供的算力规模达到99P。
在广州,既有云从科技这样的人工智能平台型公司,又有极飞科技、安必平、虎牙直播等专注垂直行业细分领域的玩家。在数字经济高速发展的今天,数字化转型浪潮正带动企业对算力、数据、算法的需求快速增长。
随着ChatGPT、百度“文心一言”等人工智能工具的发布,AIGC(即AI生成内容的生产方式)一夜爆红,再次引爆算力需求。我国算力,究竟有多少想象空间?
AIGC拉动算力需求爆发
近期,ChatGPT的爆火引发了人们对人工智能的广泛讨论。有分析人士认为,其诞生不仅打破了摩尔定律的限制,也带动了全球范围内对AI算力需求的爆发式增长。
公开数据显示,ChatGPT背靠的生成式预训练模型GPT-3,一次训练所需的计算量最高达3640PFlop/s-day,单月运营算力7034.7 PFlop/s-day,对应成本约889万美元。而随着GPT更迭到4.0版本,参数规模朝更大体量的方向演进,单次训练的输入成本相应增加50%—200%,输出成本增加200%—500%。像这样的算力消耗几乎前所未有。
在国内,以百度、阿里巴巴、京东、腾讯为代表的大厂率先抢占技术“山头”,由百度率先推出“类ChatGPT”工具——文心一言;阿里巴巴打造的AI聊天机器人据称也将很快亮相。
然而,“如果没有政府主导建立GPU大算力基地,面对算力设施的高额投入成本,中小微企业及创业团队很难参与其中。”有企业界人士指出,没有算力支撑,我国就无法训练和验证参数规模大、语料复杂的大模型,“中国版ChatGPT”也就无从谈起。
在此背景下,“东数西算”工程的意义显得尤其重大。“东数西算”工程是我国“十四五”规划的重点工程之一。旨在将我国东部沿海区域的数据计算需求,交由西部内陆区域的数据中心处理,从而实现资源的合理化利用。据研判,如水利之于农业,电力之于工业一样,在未来数字经济时代下,算力将是核心“底座”。
去年2月17日,国家发展改革委、中央网信办、工业和信息化部、国家能源局联合印发通知,同意在京津冀、长三角、粤港澳大湾区、成渝、内蒙古、贵州等八地启动建设国家算力枢纽节点,并规划了10个国家数据中心集群,“东数西算”工程正式启动。
如今,值“东数西算”一周年之际,我国算力网络从系统布局进入全面建设阶段。在已经开工的8个国家算力枢纽中,今年新开工的数据中心项目近70个,其中,西部新增数据中心的建设规模超过60万机架,同比翻一番。
推动中小企业数字化转型
ChatGPT的发布,进一步拉动了算力需求的爆发。然而,要实现足以带动ChatGPT训练和验证的算力,以我国当下的设施发展和资源利用还有明显差距。就目前来看,我国承载算力的数据中心的更直接价值,在于为中小企业提供公共算力,助推其实现数字化转型。
在全球首个江海铁多式联运全自动化码头——广州港南沙港区四期码头,广州知行机器人科技有限公司开发的无人机图像实时AI识别技术成为无人码头的“眼、手、脑”,为码头的无人化和智能化提供了感知与决策底座。在这背后,是广州人工智能公共算力中心协助提供了空天数据自动化标注及AI训练所需的算力和平台,促进图像识别模型精准程度不断提升。
而在广州农商银行、东莞农村商业银行等金融场景,由广州广电卓识智能科技有限公司携算力中心共同训练的人脸活体检测模型,也帮助银行进一步提高了身份核验效率和准确性。
“让AI算力像水和电一样成为城市公共基础资源”,据算力中心相关人士介绍,以往企业在购买算力服务时,需要奔走咨询多家算力企业,效率低下,且也很容易造成算力资源的浪费,而在“东数西算”工程推动下,各地算力中心平台的启用,则很大程度缓解了这个问题。
投运不到半年时间,广州人工智能公共算力中心已陆续服务包括云从科技、安必平、轩辕网络、趣丸网络等在内的150多家企业、科研机构和高校,为其提供普惠算力服务。
未来随着“东数西算”的持续推进,将促进数据要素的流转和进一步价值挖掘。预计在整个“十四五”期间,工程将累计带动各方面投资超过3万亿元。
仍需突围“卡脖子”困境
随着数字经济的高速发展,“算力”这片蓝海被投以越来越多的关注。据OpenAI近日发布的数据,截至目前人们对算力的需求已增长超30万倍。在国内,据中国信通院统计,2022年,我国服务器规模约2000万台,算力规模超150 EFlops,位居世界第二,仅次于美国;预测2023年,在ChatGPT引爆算力需求的背景下,中国算力规模将超200EFlops。
然而,就在我国算力需求激增之际,“缺芯”等却掣肘了我国算力的发展。
开域集团董事长兼CEO施侃曾指出,根据ChatGPT的访问量估算,支撑其算力基础设施至少需要长期占用上万张英伟达GPU A100芯片。就训练GPT-3这样规模的大模型来看,需要同时使用上千张GPU A100芯片训练1个月以上。
GPU A100芯片是英伟达为GPT模型训练打造的芯片,能满足ChatGPT高达千亿参数规模的语言训练需求。然而,据深度科技研究院院长张孝荣介绍,随着海外进一步限制高端芯片设备及AI芯片的对华出口,我国目前只能采用“缩水版A100”,这制约了我国AI大模型的研发和生产。
在此领域,寻找“国产替代”无法一蹴而就。既有算力规模、模型搭建上的差距,也面临芯片人才的缺口。据相关数据统计,2025年我国芯片专业人才缺口将超30万人。
另据中国信通院信息化与工业融合研究所副主任王骏成指出,我国算力应用还存在标准缺失、数据共享不够、资源接口不统一等问题,导致算力供需失衡;在中文文本的数据质量、开放性上也有待加强。
但无论如何,随着“东数西算”工程的推进,我国东西部数字产业“大动脉”被逐步打通,算力基础设施加速建设,这有助于加速我国AI应用场景的落地。与此同时,我国算力供给水平大幅增长,算力创新能力也在不断提升,基础软硬件、新兴计算平台、前沿计算技术均有所突破。仅在2021年,我国计算机领域发明申请就超过3万件。
“短期内肯定要扮演‘追赶者’的角色。”容联云AI研究院院长刘杰指出,“在局部应用中开始超越,这也是业界的共识。”
南方日报记者 许隽