华夏时报

图片[1] - 代码提速62%,5分钟真人视频素材可生成数字人!商汤加入AI大模型混战

本报(chinatimes.net.cn)记者齐萌 张智 深圳报道

ChatGpt掀起了国内通用人工智能的技术浪潮。继百度、阿里、华为、360之后,又一家大厂推出GPT大模型产品。

4月10日,商汤科技在技术交流日活动上发布了大模型体系“商汤日日新大模型”,推出自然语言处理、内容生成、自动化数据标注、自定义模型训练等多种大模型及能力。

在参数方面,商汤科技的大模型是基于千亿级参数的基础大模型,商汤人工智能计算中心能支持20个千亿参数超大模型同时训练。而这背后也体现了商汤科技在“算力”上的优势,商汤科技的AI大装置SenseCore上总共有27000块的GPU芯片卡,可以输出5.0 exaFLOPS的总算力,据商汤科技董事长兼首席执行官徐立透露,其是亚洲目前最大的智能计算平台之一。

对此,北京社会科学院研究员王鹏对《华夏时报》记者表示:“商汤科技入局大模型有其自身优势。它是国内AI四小龙之一,有相关的技术储备,在算力算法、芯片方面有深耕。”

实际上,由于ChatGPT的火爆,国内外不少大厂也开始纷纷关注大模型。过去一个月,大模型密集发布,一直是市场的焦点。

“大模型会对传统生产模式会产生颠覆式的影响,能够更好地实现降本增效,促进经济社会高质量发展。实际上,大模型密集发布的情况下反而不容易出现垄断,另外,在充分竞争下才能提升品质,才能更好地实现商业化落地应用。”王鹏表示。

基于“大装置”+“大算力”

“‘苟日新、日日新、又日新’,这句话出自《礼记·大学》中汤之《盘铭》,也是商汤‘日日新SenseNova’大模型体系的取名由来,这寓意商汤在模型的迭代速度及处理问题的能力上可以日日更新,不断解锁AGI的更多可能。”徐立在活动上如此介绍大模型名字的由来。

“日日新很像是一个超市,寓意也不错,商汤将提供一个大模型的超市。”徐立表示。

对于“日日新”大模型的特点,商汤科技方面对《华夏时报》记者表示,一是该模型具有更好的通用性,二是开放生态合作,生态合作伙伴可以在该模型上做各种微调,得到各种风格不同的模型。未来,我们也希望能依靠社区的力量把目前的模型进行调教,从而更好地往前推进。

在活动现场,商汤科技展示了“日日新”模型赋能的多款自研产品,包括千亿参数中文语言大模型“商量SenseChat”、文生图创作平台“秒画SenseMirage”、AI视频生成平台“如影SenseAvatar”、3D内容生成平台“琼宇SenseSpace”和“格物SenseThings”。

作为千亿级参数的自然语言处理模型,“商量SenseChat”在活动上展示了出色的多轮对话和超长文本的理解能力,展示了其在编程、医疗等场景的应用。

据了解,在内部实测中,AI代码助手可以让代码编写效率提升62%,HumanEval测试集一次通过率40.2%。

在医疗场景,“我们也将进一步推动在新华医院、瑞金医院、华西医院等医院的在辅助诊疗、随访、健康咨询等方面业务的上线。”徐立透露。

此外,商汤还演示了AI文生图创作、2D/3D数字人生成、大场景/小物体生成等AIGC(人工智能内容生成)大模型及应用。

“秒画SenseMirage”是商汤科技自研的文生图创作平台。在活动现场,商汤科技演示了通过关键词描述迅速生成图片的能力,同时还可根据自身需求训练生成模型。

在视频生成方面,“如影SenseAvatar”是2D数字人视频生成平台,仅需一段5分钟的真人视频素材,就可以生成出来声音及动作自然、口型准确、多语种精通的数字人分身。它可应用为智能直播、教学、短视频等多种场景。

值得注意的是,徐立在现场提到,“如影”的名字是由其“商量”自然语言处理模型提出的,“商量”表示,“如影随形”是指一个东西与另一个东西伴生,因此很符合数字人的寓意。

而“琼宇SenseSpace”和“格物SenseThings”则是3D内容生成平台,可以高效低成本生成大规模三维场景和精细化的物件,为元宇宙、虚实融合应用打开新的想象空间。在活动现场,商汤科技展示了其在空间创意中的应用。

值得注意的是,参数量、处理数据量是衡量大模型能力的主要因素,而这也对算力提出了极大的要求。

在参数方面,这些大模型是基于千亿级参数的基础大模型,其中“商量”为1800亿参数,商汤人工智能计算中心能支持20个千亿参数超大模型同时训练。

而这背后体现了商汤科技在“算力”上的优势。商汤科技的AI大装置SenseCore上总共有27000块的GPU芯片卡,可以输出5.0 exaFLOPS的总算力,据徐立透露,其是亚洲目前最大的智能计算平台之一。

在活动上,徐立也透露道,2023年商汤科技目标是训练万亿级参数大模型。

在数据方面,商汤科技发布了最大的用于真实感知、重建和生成的多模态数据集,含190个类别6000个物体,均为全视角高清图片,每个物体包括5条环绕视频,支持神经渲染、表面重建、3D生成、点云识别等。

在商业变现方面,商汤科技方面对本报记者表示:“对于人工智能大模型,商业和技术并非脱节。我们会把整套的产品体系和技术体系往大模型去做支撑和倾斜,但我们也会在原有的各类的产品里面,按照用户或客户的需求,分层地提供适应于他们的应用场景的产品和服务。”

“从最底层来说,AI原生的基础设施层会提供AI专用的算力存储网络的服务,在平台层会提供自定义的,比如大模型的训练、推理、数据管理。包括API Serving各种各样的业务,在SaaS层我们也会提供基于人工智能大模型的各类的API。”商汤科技方面表示。

AIGC产业前景广阔

据了解,如今,火爆全网的AI聊天大模型应用ChatGPT访问量已飙升至8.89亿次,它也是历史上最快达到1亿月活的应用。其浪潮很快蔓延到业内,国内外不少大厂开始关注大模型。

国内本轮大模型发布中首当其冲的是百度的“文心一言”,随后不少大厂前后入局,360发布“360智脑”大模型,阿里发布“通义千问”大模型,腾讯发布“混元”大模型、华为发布“盘古”大模型。

“实际上,各家平台各有特色和优势,无法论其谁更好。百度最大的优势是有大量的数据,淘宝最大的优势是金融类数据,商汤的优势则在语言处理、文本处理方面。”王鹏认为。

“大模型会对传统生产模式会产生颠覆式的影响,能够更好地实现降本增效,促进经济社会高质量发展。实际上,大模型密集发布的情况下反而不容易出现垄断,另外,在充分竞争下才能提升品质,才能更好地实现商业化落地应用”王鹏表示。

同时,在平安证券近期发布的研报中也提到,当前,我国大模型技术发展方兴未艾,AIGC产业未来发展前景广阔。算法方面,预计今年国内龙头AI厂商将持续推出更多大模型产品;应用场景方面,预计国内将有办公、教育、医疗、金融等越来越多的行业探索大模型产品的应用;算力是短板,由于供应链的问题,我国高端训练芯片供给可能面对较大的压力,AI算力不足的问题可能显现,相关设备研发和基础设施建设企业可能继续受益。同时,AIGC新技术也会带来新的安全挑战,国产安全厂商也将受益。

此外,4月11日,国家互联网办公室就《生成式人工智能服务管理办法(征求意见稿)》公开征求意见。这也预示着,AI产业的发展路径更清晰,有望沿着更标准化、规范化的轨道发展。

责任编辑:徐芸茜 主编:公培佳