Copyright © 2021-2021 武汉洪山科创产业发展有限公司 All Rights Reserved. 备案号:鄂ICP备2022000812号-1
摘要
近期OpenAI、微软和百度竞相发布大模型产品,带给人们实实在在的震撼体验。MaaS(Model as a Service)模型即服务以其通用性、自监督学习能力和强大的智能能力助力AI产业化进程,降低AI落地应用的门槛。国内外AI领域企业竞相研发有竞争力的大模型产品,大模型领域已初步形成生态规模。未来,大模型在应用端、中间服务端以及底层服务端发展潜力巨大。

从OpenAI发布GPT-4,到百度发布文心一言,再到微软发布Office的AI生产力工具Microsoft 365 Copilot,各大厂纷纷重金布局既是前瞻性的战略举措,也是资本和技术的完美展示。据报道,GPT-3训练一次的成本约为140万美元,2022年,OpenAI公司净亏损5.45亿美元,成立七年累计净投入近40亿美元。人们不禁要问,是不是只有大厂才有资格参与人工智能这场盛宴?AI是否只掌握在少数大厂的算法人员手中,难以走向大众化?模型即服务(MaaS)作为一种新的商业模式,有望打破局限,即便是非互联网行业小公司,也可能通过MaaS模式,打造出一款专业领域的爆款应用软件。

一、何为MaaS
在云计算时代,我们已经熟悉的是IaaS(基础设施即服务)、PaaS(平台即服务)和SaaS(软件即服务),而MaaS 作为AI领域一种全新的商业模式,正如李彦宏所说,过去云服务看算力、存储等基础,未来则更多会看框架与模型,MaaS将会改变云计算的游戏规则。
大模型是“大算力+强算法”结合的产物,通常是在海量公开的无标注数据上进行训练,学习出一种特征和规则,应用开发时通过目标任务场景中的小数据集进行微调,使模型达到需要的性能,就可以完成多个应用场景的任务。在这一过程中,这种在公开数据集训练过的深层网络模型,即为“预训练模型”,预训练能够大大降低下游任务模型对标注数据规模的要求,从而可以很好的处理一些难以获得大量标注数据的新场景。
简单来说,MaaS模式下,通常是科技巨头开发出一套AI模型作为一个通用的底板,正如一个“通识型人才”,通过对外开放这些AI模型的调用接口吸引规模较小、但是深耕行业的玩家,由细分领域的公司将模型打磨成真正满足行业需求的应用,也就是培养出“专业人才”。

AI大模型的开发方式
参考资料:百度文心大模型官微
二、MaaS能给AI产业带来什么
自人工智能诞生以来的七八十年间,带给人们的惊叹比比皆是,MaaS的概念之前也被提出过,但为何在今时今日火爆出圈?
从上世纪六十年代最早的智能机器人Shakey,到八十年代深蓝战胜国际象棋冠军卡斯帕罗夫,再到2016年的AlphaGo战胜世界围棋冠军等等,AI技术从来不缺让人震撼的新闻,但真正能够产业化落地的却少之又少,过去的AI热带火的更多是概念和信心,但还没有产生颠覆某个行业的影响。但是这一轮AI技术带来的完全是不同的新体验,2022年ChatGPT的出现,让我们所有普通人都感受到切切实实的“好用”,上线仅仅2个月后注册用户数就突破了1亿,完全超出人们的预期,这是有可能颠覆“搜索引擎”行业的新技术。
目前,人工智能正处于产业化落地应用的早期阶段,努力发展 “好用”的产品,但面临着人力研发成本高、特定场景数据较少导致模型训练精度不够、模型算法产品化实际效果不满足需求、场景需求碎片化等行业痛点。而大模型通过提高模型的通用性、降低研发成本等方式能够加速AI产业化进程,降低AI落地应用的门槛。

(1)大模型的通用性提升AI 开发的效率
过去近10年间,AI开发主要是通过“深度学习+大算力”从而获得训练模型,但是在传统模式中,AI模型基本上是针对特定应用场景需求进行训练的,整个模型开发需要完成从确定场景需求、数据收集、模型设计到落地应用等阶段的整套流程,不仅耗费时间长,一个项目往往需要数月甚至数年才能完成,而且对人力素质要求很高,需要优秀的产品经理、专业的AI 研发人员等协同合作,人力成本高昂。但是,这样定制化的模型开发方式得到的模型在许多垂直行业场景任务下并不通用,模型无法复用和积累,导致了AI落地的高成本、高门槛与低效率。
而大模型通过从海量的、多类型的场景数据中学习,总结学习不同场景业务下的通用特征和规则,成为具有泛化能力的模型底座,利用大模型进行新的业务场景下的应用开发时,对大模型进行微调或者不调整,就可以完成多个应用场景的任务。过去,云计算服务商通常会将硬件资源、通用的软件能力、底层框架等来提供服务,如今,基于大模型的通用能力可以有效应对多样化、碎片化的AI应用需求,模型也上升到底层框架服务的维度,开始成为第一生产力。MaaS体现了All For everyone的概念,数据集仓库、模型仓库、算力平台通过提供零门槛模型体验、快捷的模型使用、完整链路的模型定制和云端模型部署向每个人开放,包括AI爱好者、使用者、开发者和研究者。

MaaS基本产业架构
参考资料:阿里云栖大会
(2)大模型的自监督学习能力降低AI开发及训练成本
传统的模型训练过程中,需要不少AI专业研发人员手工来完成大量的调参、调优工作,同时,模型训练需要海量的数据,但是许多行业数据收集困难、标注成本高,研发人员需要花费大量的时间精力收集整理原始数据。
相对于传统AI模型开发模式,大模型的研发流程更加标准化,通用性更强,可以泛化应用到多种行业场景中,而且,大模型的自监督学习能力可以取代传统的人工标注数据完成模型训练的模式,能够显著降低研发成本,为解决AI落地难、促进AI产业化进程这一问题提供助力。
(3)大模型带来更强大的智能能力 除了通用性和自监督学习能力以外,大模型最突出的优势在于效果,其通过给模型“填喂”大数据提高其自我学习能力,进而具有更强的智能程度,所训练的数据规模越大,生成的模型也就越智能。OpenAI的研究表明,2012至2018年,在最大规模的人工智能模型训练中所使用的计算量呈现指数级增长,其中有3.5个月的时间计算量翻倍增长,远快于摩尔定律每18个月翻一倍的速度。据有关研究者预测,下一代AI大模型,参数的数量级将于人类大脑突触水平比肩,并且不仅能处理语言模型这样的单一任务,更能够处理语言、声音、图像等多任务的多模态AI模型。
三、MaaS 的应用场景
在AI产业链中,大模型作为一种基础设施,可以搭载各式平台,将AI技术赋能千行百业。正如过去电力时代一样,电力经过生产和运输运用到各类电器,如今智能通过数据训练和计算应用到各类场景。相应地,大模型公司也将成为AI领域中的基础类公司,发挥大模型作为基础设施与底座的能力,基于“大算力+强算法+大规模预训练+微调”的方式满足AI产业链下游客户的应用需求。

大模型基础设施赋能千行百业
资料来源:智源研究院
AI大模型行业适用范围非常广泛,在医疗、金融、交通、零售、气象、新闻传播、文学艺术等领域都有广泛应用场景。大模型可以抓取所需数据,自主完成筛选和分析,在大模型中输入关键词、主题等设定属性后,即可生成满足需求条件的文本内容,并自主撰写生成报告,可以用于产品营销文案写作、电商智能客服等,也能辅助从业人员做决策。还有自动问诊、小说续写、电力检测……因为懂得人类语言,且具备各种细分行业的专业知识,AI大模型具有分饰多角的能力。 2022年11月,阿里达摩院推出AI模型社区“魔搭”ModelScope,率先向魔搭社区贡献300多个经过验证的优质AI模型,包括视觉、语音、自然语言处理、多模态等AI主要方向,践行模型即服务的新理念,提供众多预训练基础模型,只需针对具体场景再稍作调优,就能快速投入使用。 2022年12月,美国谷歌利用一个已成形的基础AI算法,叠加上专门基于医疗数据的训练流程进行微调,经过两轮打磨之后建立了Med-PaLM的模型,未来有望助力AI问诊,降低医疗服务的成本。在音乐领域,两位毕业于美国普林斯顿大学的工程师利用业余时间,在一款已经开源的AI画图算法的基础上,微调模型,将其改造成一款叫做Riffusion的AI音乐创作工具。


四、国内外大模型布局
当前,大模型领域已初步形成生态规模,国内外众多公司和研究机构在大模型领域积极布局,大模型参数规模最高已达百万亿级别,且面向多模态场景的大模型已成为未来的趋势。
国外的超大规模预训练模型起步于2018 年,并在 2021 年进入白热化阶段。2017年,Vaswani等提出Transformer架构,使深度学习模型参数达到了上亿的规模。2018年,谷歌提出了大规模预训练语言模型BERT,同年OpenAI提出了生成式预训练Transformer模型——GPT,使自然语言处理领域飞速发展。之后,OpenAI 继续推出15亿参数的GPT-2、1750 亿参数的超大规模语言训练模型 GPT-3,通过两年时间实现了模型规模从亿级到上千亿级的突破,实现作诗、聊天、生成代码等功能。2021 年,谷歌推出首个万亿级语言模型Switch Transformer。高速发展一直持续到2022年,OpenAI 推出ChatGPT、GPT-4,震撼了几乎整个世界。大型语言模型的参数数量保持着指数即的增长。
在国内,超大模型的发展也非常迅速,2021年是中国 AI大模型的爆发年。2021 年,商汤发布拥有 100 亿的参数量的书生(INTERN)大模型,截至2021年中,商汤已建成拥有超过 300 亿个参数的世界最大计算器视觉模型。同年4月,华为云联合循环智能发布参数规模达1000 亿的盘古NLP超大规模预训练语言模型。随后,浪潮信息发布约2500亿的超大规模预训练模型“源 1.0”,百度推出参数规模达2600 亿的ERNIE 3.0 Titan 模型,而阿里达摩院的M6模型参数达到10万亿,将大模型参数直接提升了一个量级。2022年,清华大学、阿里达摩院等联合研究的“脑级人工智能模型”八卦炉(BAGUALU)发布,模型参数突破了174 万亿个,完全可以与人脑中的突触数量相媲美。

信息来源:商汤科技官微,天翼智库、公开信息
五、发展机遇
李彦宏在文心一言发布会上预言大模型时代将产生三大产业机会,排在首位的是新型云计算公司,其主流商业模式从IaaS变为MaaS。大模型时代的来临催生新模式新业态,AI大模型正逐步融入到生产生活领域的每一个核心场景,最大的发展机遇就是在应用端。围绕大模型底座进行应用开发的公司,即应用服务提供商,基于文本生成、图像生成、音视频生成等场景,开发金融大模型、医疗大模型、交通大模型、能源大模型等一系列应用大模型,将技术平台与产业深度融合,完全有可能成为未来的独角兽企业,挖掘出巨大的市场潜力。
MaaS模式下的人工智能行业,也不再只是科技巨头的市场,那些多年深耕细分行业,具备行业模型精调能力的公司,可充分利用自身懂市场、懂业务、懂客户的优势作为通用大模型和企业之间的中间层,创造出更好的细分产品。而底层服务方面,新型云计算公司将迎来发展机遇,主流商业模式将从IaaS变为MaaS,以模型服务为新的业务增长点。
大模型已开启AI新时代,未来市场潜力和想象空间巨大,让我们拭目以待。

备注:本文仅作为产业科普,不提供任何投资建议。
参考资料:《人工智能行业专题报告:模型即服务》、《MaaS:Model as a Service 模型即服务》、《深度解析:为什么说MaaS是云计算的未来?》、《人工智能:模型即服务(一)》、《MaaS模型即服务:AI领域独特商业模式,降低AI使用门槛》、《阿里推出“模型即服务”,开源300+AI模型》