AI大模型热潮下算力需求爆发，上海怎么玩？

2023-06-05 发布在区块链技术144

文章转载来源：AIcore

来源：澎湃新闻

作者：贺梨萍

原标题：《特稿|AI大模型热潮下算力需求爆发：临港欲建百亿产业，商汤当“链主”》

2022年1月24日，商汤科技在上海自贸区临港新片区布局的人工智能计算中心AIDC正式启动运营。当时这家人工智能公司未必能精准预测，2022年即成为了所谓的AIGC（AI Generated Content）元年。

“今天，我们的临港AIDC已经有接近3万块的GPU（图形处理器），我们目前的算力已经达到5000 PetaFLOPS（1 PetaFLOPS等于每秒1千万亿次浮点运算），在这之上我们相信未来可以有更好的开发者效率，并且都能够支持更多千亿规模的大模型算力训练。”在6月2日的“AI引领时代，算力驱动未来”——临港新片区智算大会上，商汤科技董事长兼CEO 徐立如是表示。

据澎湃新闻（www.thepaper.cn）记者从商汤方面了解，“目前还有大量的需求在路上排着队”。而在商汤科技联合创始人、大装置事业群总裁杨帆看来，人工智能对于更大数据、更大规模、更大算力的追求并不是“始于今天”，“整个人工智能技术迭代、进步的历史，我们可以把它看成是一个对于‘暴力美学’的追求，以及算法、算力、数据三要素由量变产生质变的一个技术迭代的过程。”

聚焦前沿产业的临港新片区对这种新的热潮迅速做出了响应。6月2日当天，临港新片区党工委副书记吴晓华在上述大会上发布了《临港新片区加快构建算力产业生态行动方案》。该《方案》的蓝图之下，至2025年，临港将成为具有全国影响力的算力产业集聚区，含相关硬件、软件、应用、服务等的算力产业总体规模将突破100亿元。

图片[1] - AI大模型热潮下算力需求爆发，上海怎么玩？

临港新片区党工委副书记吴晓华发布《临港新片区加快构建算力产业生态行动方案》。

“我们看到AI大爆发的时代已经来临了，AI进入到我们生产和生活的各个领域，那么随着 AI应用的大爆发，它其实也驱动了算力需求的大爆发。”对于上述《方案》的出台，临港新片区管委会高科处处长陆瑜对澎湃新闻（www.thepaper.cn）在内的媒体表示，临港前期已具备了很好的优势，“就是我们的算力资源非常丰富。”

更为重要的是，在人工智能公司选择是否落地临港时，算力资源已经成为尤为重要的决策因素。

算力是新时代的能源，而成功又不仅仅在于“暴力美学”

何谓算力？徐立认为，算力其实是整个模型能力的表达，“算力等于算法或者说大模型的参数，去乘上它所处理的数据量。大模型时代参数越大，乘上的数据量越大，所需要的算力就越大。”算力已然成为新时代的能源，“某种程度上，算力决定了市场的竞争力。”

杨帆也谈到，从去年到今年整个人工智能领域非常火的一个概念叫内容生成，同时大家都熟悉了一个名词即大模型。简单来看，这是一种“暴力美学”，例如，GPT-3模型使用了超过1750亿个参数，需要高性能的处理器来支持训练，使用V100训练耗卡量为10000张卡训练14.8天，整体算力需求约625 PetaFLOPS。

杨帆认为，这种“暴力美学”也可以理解为量变产生质变，“其实人工智能从它诞生的第一天起到今天，一直都在追求通过规模化带来更强的智能化。”他提到，实际上就人工智能领域来说，在过去的5-6年时间里，业内最顶级的人工智能模型对算力的消耗量，“每4-6个月就要翻一番，也就是说过去的这几年时间里翻了近30万倍。”

当然，“暴力”和“智能”并不是完全成正比，“拥有更大的资源、更大的规模，它仅仅是一个必要而非充分的条件。”杨帆强调，真正在“暴力美学”背后支撑产生重大的技术创果的，恰恰又是在于对每一个环节的持续性的优化和改进。

以数据为例，“GPT-4所用的数据其实只是OpenAI收集到的所有数据的1%，因为他发现当把更多的数据去灌给的时候，有可能反而不那么聪明，应该把更加有效、更加高价值的数据提供给这个算法，然后才能去创造出一个更加聪明的大脑。”

其认为，至少在今天，数据的有效性远比数据的总量更加重要。而如何定义有效的数据，“这其实就需要数据科学家大量的努力，OpenAI其实让他们最优秀的科学家去做数据了，并非大家觉得的去搞算法了。”

这种每个环节的优化同样包括算力，在英伟达缺货的情况下，为什么没人在用国产芯片做商业化的大规模训练？为什么最新这波浪潮到来后，第一时间钱都被英伟达挣走了？这些问句背后的解释是，“并不是我们把算力量堆到一个数值就能够产生最终的价值，1000张卡100台服务器放在一起跑同一个任务，这中间还需要大量的配套软件、通信网络，它是一系列软硬件联合调优的过程，这样的工作积累我们过去没有做，我们今天就需要去补课。”

图片[2] - AI大模型热潮下算力需求爆发，上海怎么玩？

顺势而为，临港加快形成多元算力供给体系

据吴晓华介绍，临港新片区算力产业已在上游软硬件、中游的数据中心、调度平台，下游应用进行了相应布局，目前临港总算力超过3EFLOPS（FP32，1 EFLOPS等于每秒1百亿亿次浮点运算），其中智能算力占比近80%，总算力规模约占上海市近20%。

前述《方案》提出，目标到2025年，新片区将形成以智算算力为主、基础算力和超算算力协同的多元算力供给体系，总算力超过5EFLOPS（FP32），AI算力占比达到80%，算力产业总体规模（含相关硬件、软件、应用、服务等）突破100亿元，建成公共算力服务平台，规范算力交易机制，实现区域算力调度，打造具有全国影响力的算力产业集聚区，建设一批算力示范应用标杆场景。

“智能算力也就是当下最为火热的AI企业所需要的，我们也发现，AI企业落地到临港来，他们不再是仅仅关注给他他多少政策支持，给他多少补贴，他会关注落地在这边，能不能解决他的算力需求，因为现在市场上算力是非常紧缺的。”陆瑜提到了这一显著变化。

据商汤方面介绍，截至今年5月，商汤大装置已累计服务超40个核心客户。“特别是在大模型的浪潮之下，我们现在支撑了10家以上的单位机构在临港的智能计算中心中去训练他们的大模型。”杨帆也提及。

图片[3] - AI大模型热潮下算力需求爆发，上海怎么玩？

成立于2018年的深势科技是算力需求方之一。该公司核心团队由中国科学院院士鄂维南等人领衔，是“AI+Science”科学研究范式的先行者，其首创的“多尺度建模+机器学习+高性能计算”范式，突破性地实现了多尺度分子模拟中精度与效率的统一。

据澎湃新闻（www.thepaper.cn）记者此前报道，深势科技已推出Lebesgue科学计算平台、Hermite药物设计平台以及Bohrium微观计算与设计平台等。例如在医药领域，深势科技与多家客户携手，将物理建模+AI的计算范式与临床前药物研发更广泛的结合，通过Hermite Uni-FEP、Uni-Fold、RiD等模块，将自由能微扰理论、分子动力学、增强采样算法与高性能计算相结合，精准预测蛋白质结构及构象变化，并以化学精度高效评估蛋白与配体的结合自由能，为药物研发人员提供高效精准的理论指导，提升药物设计与优化效率。

去年12月29日，总部位于北京的深势科技在临港注册成立了深度势能生物科技（上海）有限公司。深势科技政企事务副总裁刘会师在接受澎湃新闻（www.thepaper.cn）记者采访时表示，公司在临港布局新一代分子模拟算法研发中心和AI辅助药物设计业务中心，主要也是因为看到临港正在大力发展算力，“我们在训练模型过程中，对算力是有需求的，另外临港尤其是要大力发展国产化算力，我们也想为这方面添砖加瓦。”

从业务层面来说，“我们在临港主要是布局我们的药物研发业务，包括我们自有管线的研发。”刘会师提到，深势科技的业务和临港甚至上海的人工智能、生物医药这样的先导产业有正相关的直接合作关系，“我们愿意把我们的研发以及产品纳入到临港的大的生态圈里来。”

上述《方案》同时提及，临港新片区也制定了一系列保障措施，包括加强人才保障、完善支持政策、推动开放合作等。据陆瑜介绍，如果AI企业到临港来，将优先提供临港的智能算力，同时通过发放算力券等形式，让企业优惠使用算力，“甚至对重点的AI企业，政府对它的算力成本直接可以给予不超过30%的补贴，这些政策我们都会出来。”

值得关注的是，在此次大会现场，临港公共智算服务平台暨国产GPU联合创新基地也正式发布。中国电信成立临港算力（上海）科技有限公司，将开展临港算力园区建设，并将分批次投放4万个适用于智算、超算的高功率机架。

上海市经济和信息化委员会副主任汤文侃当天表示，当前，以“网络为基础、数据为核心、算力为关键、安全为底线”的新一代信息基础设施已成为建设现代化产业的重要基础支撑。上海已提出构建“2+（3+6）+（4+5）”的现代化产业架构，这对以算力为代表的新型信息基础设施建设提出了更高需求。

而就在5月16日，上海市经济和信息化委员会公布了通过《上海市数据中心建设导则》符合性评估的数据中心项目名单，共支持了16个项目，其中位于临港的项目有2个。“截至目前，我委共支持新片区包括，商汤AIDC、有孚网络、信息飞鱼等8个项目，合计2.8万个6kW标准机柜，占全市已批机柜数量近1/5。”

汤文侃同时提出建议之一，即利用临港充沛算力资源构建公共算力服务。“目前，临港的商汤AIDC已经接入了公共算力服务平台。在此也希望今天参会的各单位，特别是电信运营商，结合临港的网络特点，积极在临港建设极速算力承载网，助力实现网络无所不达、算力无所不在、智能无所不及，推动算力成为与水电一样的公共服务。”

成立智算产业联盟，商汤当产业链链主

基于现有优势及未来需求，临港希望构建的是一个上中下游一体化的算力产业联盟，进行协同式、体系化发展。

陆瑜将临港的算力供给视作整条产业链的“中间一段”，一端为落地到临港的AI企业提供算力保障，另一端则涉及到对算力来说极为关键的“芯片、软件、系统”，“我们希望有了需求端，也有了这样一个平台端，那么我们把计算的芯片企业、软件企业、系统企业集聚在这里，让他们深度地参与到这样一个系统的建设过程当中。”

杨帆也强调，“今天看到的大模型所有的成绩的发展，它既是暴力出奇迹，通过人工智能三要素的持续规模上升带来的技术价值的提升，同时也是基础的研发能力和系统的工程化能力之间的深度结合，算法优化、数据的整理和选取、平台性算力的优化提供，这三者往往是互相连通的，很难把它变成割裂的环节独自去做。”

他表示，智能算力产业链的重要价值在于，“只有链上有更多的企业，大家去促进彼此的交流思考，更深度地去进行一些合作，才能够在这样新的关键性的重大技术浪潮中，去做到更好的技术进步和支持。”

图片[4] - AI大模型热潮下算力需求爆发，上海怎么玩？

大会现场，新片区智算产业联盟也正式成立，联通作为联盟首任轮值理事长单位。据悉，未来联通将在新片区成立长三角创新研究院，进一步助力新片区智算产业发展。

新片区智算产业联盟成员代表由智算算力、基础算力和超算算力中心等算力提供企业，GPU、FPGA、ASIC等算力芯片企业，以及大模型、AI for science等算力需求企业，共计25家企业，以及中国信通院华东分院、西安电子科技大学、电子科技大学共计3所高校与科研院所共同组成，后续将开展资源共享、技术交流和项目合作。商汤科技则被授予“新片区智算产业链链主”。

GPU芯片厂商沐曦当天即表示，分别满足AI推理计算、AI训练/通用计算、高性能渲染功能的三类GPU产品，应用于AI推理、AI训练、数据中心、元宇宙、云游戏等领域，将赋能各领域转型发展。

汤文侃也对临港新片区此次智算产业联盟的成立寄予厚望，“依托商汤科技这样的链主企业，结合自身优势，探索产业链上下游全要素协同，形成数字经济新的爆发点。”

图片[5] - AI大模型热潮下算力需求爆发，上海怎么玩？