大模型浪潮奔涌而来 数字产业走进“云”深处
本报记者 谢岚 见习记者 梁傲男
10月31日,2023云栖大会在杭州云栖小镇正式开幕,主题为“计算,为了无法计算的价值”,现场布设40000平方米科技展,涵盖算力、人工智能+、产业创新三大主题,并设有两场主论坛、500余个热点话题。
展示云计算完整产业链
在开幕式上,阿里巴巴集团董事会主席蔡崇信表示,阿里巴巴要打造AI时代最开放的云。“不开放就没有生态,没有生态就没有未来。”
童语故事创始人兼CEO张华在分享创业故事时表示:“有了大模型、云计算这些成熟的技术,才能让我们实现低成本高效创业。”
据了解,本次展区全方位展示了云计算完整产业链,系统展示了云计算领域的广泛创新。
“开放性的云生态,一方面可以吸引更多的开发者和企业加入其中;另一方面,可以让各方参与者共享资源和技术,从而加快创新的速度和效率。”中国金融智库特邀研究员、新金融专家余丰慧对《证券日报》记者表示。
记者注意到,今年暑假火爆一时的妙鸭相机于“人工智能+”展馆展出。“妙鸭相机与‘通义万相’的能力在某种程度上有相似之处,作为国内第一批云原生的AIGC应用,妙鸭相机对算力的需求较高,生成高质量的‘写真’相片之前,要对用户上传的图片进行微调训练,算法需要在短时间内完成针对性的在线推理。”阿里云负责人对记者表示。
曾推出《征途》系列、《球球大作战》等游戏的巨人网络相关负责人在现场对记者表示:“巨人网络使用阿里云人工智能平台PAI快速搭建起巨人AI绘画平台,进行绘画模型训练和推理服务,结合PAI的推理优化能力,平台出图速度显著提升50%至100%。”
阿里云首席技术官周靖人表示:“随着大模型技术与云计算本身的融合,我们希望未来的‘云’可以像车一样能够自动驾驶,大幅提升开发者使用‘云’的体验。”
多个大模型亮相
在今年的云栖大会上,“大模型”首次以主题展区亮相,围绕MaaS(模型即服务)的核心理念,以算力为基础,以模型为中心,从人工智能开发者、模型工具厂商和人工智能应用等不同主体视角,展示AI大模型领域研究成果和先进行业模型应用,体现先进智能算力和模型基础服务对我国AI大模型发展和生态建设的支撑作用。
记者注意到,“AI大模型时代新应用”展馆内人头攒动,现场有观众表示,很少见到这般热闹的行业展会。
百川大模型工作人员向《证券日报》记者介绍,百川智能是今年4月10日成立的公司,半年以来共发布了7款大模型,包括4款开源、2款闭源、1款长窗口的大模型。“我们在开源和闭源这两个领域都是有推进的,快速迭代的背后离不开云计算的支持。”
上海人工智能实验室带来其首个图文混合创作大模型“书生·浦语灵笔”,工作人员对记者表示:“我们做的是免费商用的开源模型,以及全链条的开源工具。只要向‘浦语灵笔’提出创作一篇攻略,即可‘一键生成’图文混合文章。”
10月30日,昆仑万维宣布开源百亿级大语言模型“天工”Skywork-13B系列,并配套开源了600GB、150B Tokens的超大高质量开源中文数据集。现场工作人员对记者表示:“该模型即将全面开放商用,开发者无需申请,即可商用。”
一汽集团则带来了基于阿里云大模型开发的GPT-X大模型,相关负责人表示,该模型结合了汽车行业与“红旗”品牌双重特点,基于一汽云原生技术架构及数据底座,构建大模型分层能力,重塑各领域业务模式,实现效能增长。
值得一提的是,在本届云栖大会现场,阿里云发布了千亿级参数规模的通义千问2.0。周靖人表示,大模型是本轮AI浪潮的核心技术,基础模型的质量很大程度上决定了AI产业化的前景。阿里自研大模型通义千问2.0通过阿里云全新升级的人工智能平台PAI,为AI产业化的深入提供了“智”的保证。
现阶段,国内大模型与国外一流的大模型还存在差距。北京社科院副研究员王鹏在接受《证券日报》记者采访时表示:“国内大模型与行业相结合仍然面临着诸多挑战,大模型的训练和部署需要强大的计算资源,不同行业的应用场景也呈现出不同的需求特点。因此,如何提供足够的计算资源及满足定制化需求,是大模型与行业相结合时亟须解决的问题。”
面对国内大模型遇到的挑战,阿里云给出了自己的答案。随着大规模智能算力需求爆发,阿里云已在全球30个地域建设了89个云计算数据中心,提供3000余个边缘计算节点。同时,阿里云对外提供API服务,帮助不同行业大模型的训练。除了通义大模型外,中国一半大模型公司正“跑”在阿里云上,百川智能、昆仑万维、vivo等大批头部企业及机构均在阿里云上训练大模型。
在业内人士看来,目前,人类已步入通用人工智能时代,大模型将在各个方面起到“点亮智能”的作用,大模型浪潮将超越外界的想象。