// 新刊推荐
// 中经传媒智库

垂直行业大模型 推动行业智能化转型的新引擎

原创 作者:赵建琳 朱耘 / 发布时间:2024-06-03/ 浏览次数:0
 
4月2日,国家互联网信息办公室(以下简称“国家网信办”)发布关于生成式人工智能服务已备案信息的公告,附件表格中的备案时间最早是2023年8月31日,从该时间起到今年3月底为止,共有117款模型通过备案,真可谓是“百模大战”!
 
 “百模”之中既有通用大模型,如百度的文心一言大模型、阿里云的通义千问大模型、科大讯飞的星火认知大模型、中国移动的九天自然语言交互大模型、昆仑万维的天工大模型,也有不少垂直行业大模型,如新华三的百业灵犀大模型、阅文的阅文妙笔大模型、唯品会的朝彻大模型等等。此外,还有尚未出现在备案公告里,但在今年2月举行的世界移动通信大会中发布的通信行业首个大模型——华为通信大模型。
 
伴随人们对通用大模型的认知加深,“让AI进入千行百业”的声音不绝于耳,围绕行业场景开发的垂直行业大模型也如雨后春笋般出现,商业模式有To B(向行业客户提供垂直模型服务),也有To C(向消费者提供AI应用,或将AI能力嵌入到原有的To C应用当中)。那么,垂直行业大模型起到的作用究竟如何?又面临哪些应用上的挑战?种种疑问有待随着企业的实践逐步解答。
 
垂直行业大模型究竟起到什么作用?
 
通用大模型像是一个多面手、“通才”,拥有广泛的知识面,适用于多种场景和任务。相比之下,垂直大模型更像是行业专家、专才,专门为特定行业或任务设计和训练,通常在专业任务的执行质量、时延和成本上更优。
 
ChatGPT的横空出世引爆了人们对于人工智能的新一轮狂热追逐,互联网公司率先发力。犹记得在2023年7月举办的全球数字经济大会上,阿里云、百度、昆仑万维等参展商就迅速展示了自身在AI大模型方面的开发实力。迅速演进的时代浪潮下,谁都不愿意掉队。
 
《大模型时代》一书作者、上海交通大学和北京探月学校特聘AI导师,曾任阿里巴巴资深产品专家兼事业部副总经理、硅谷AI创业公司联合创始人兼首席运营官龙志勇观察到,大模型火了一年多,各行各业对大模型的认知越来越清晰,提出的需求也越来越现实和精细化。除了少量的通用APP,大部分行业都需要垂直大模型来提供更为精确高效和定制化的服务。
 
这样的例子有很多,比如2023年7月19日,阅文发布了国内首个网文行业大模型“阅文妙笔”和基于这一大模型的应用产品“作家助手妙笔版”,并宣布该产品开放内测。10月底,“作家助手妙笔版”已正式向所有签约作家开放内测,目前AI功能周使用率达30%。
 
据阅文相关负责人介绍,相比一般的通用大模型,阅文妙笔在网文语言理解方面表现更为出色。由于阅文积累了二十余年的网文创作经验和表达方法,能够深入理解网文内容逻辑和语言风格,持续辅助模型生产具备网文特点的内容,所以阅文妙笔大模型更懂内容,熟悉各种网文作品的故事、角色、世界观设定;更懂创作,理解创作技巧,可以写出有“网文感”的内容;更懂“梗”,了解作家读者互动过程中形成的“网文梗”。
 
再看基于阅文妙笔大模型诞生的应用产品作家助手妙笔版,其包含世界观设定、角色设定、情景描写和打斗描写四大功能,帮作家丰富细节、辅助创作、提升效率。比如,世界观设定是网文创作前期筹备的重要内容之一,涉及武力值、地图、门派势力等多重细节,“作家助手妙笔版”的世界观设定功能可以为作家丰满世界观设定,生成大段内容补充和完善细节,不过,世界观的精神内核、演化走向仍需作家自己把握。
 
之前试用过“作家助手妙笔版”的阅文作家“咸鱼军头”表示:“从场景描述功能来看,AI词汇量更大,场景描述丰富,但它无法把控网文的节奏、读者的爽点……我认为只要找到使用方法,它是可以极大程度提升作家的写作效率。现在我就把妙笔作为一个素材、词汇量的辅助工具,让我避免在描写场景的时候因为特定的形容词而卡壳。”
 
阅文集团副总裁黄琰表示:“网文这一专业化领域的创作核心仍然是作家的灵感和构建。但在创作过程中,AI可以解决一些重复性、消耗性的‘体力活’,我们希望打造一款在网文领域具有深度理解力的产品,赋能作家。”
 
今年2月发布的华为通信大模型,华为将之称为“通信行业首个大模型”。在华为方面看来,2024年是5G-A商用元年,网络能力的跃升将激发多样化业务创新,在此背景下,行业提出了敏捷业务发放、精准用户体验保障、跨领域高效运维的高阶智能化目标。
 
华为董事、ICT产品与解决方案总裁杨超斌在今年2月世界移动通信大会上介绍,华为通信大模型支撑运营商智能化目标,面向不同角色提供智能语言交互能力,提升员工知识水平和工作效率;面向不同运营运维场景提供智能体应用,分析拆解复杂流程,编排操作方案,确保用户体验和满意度。例如在敏捷业务发放案例中,通过放号助手的多模态精准评估,实现快速的用户放号;在用户体验保障案例中,通过大模型的寻优能力,实现多目标体验保障;在辅助排障场景下,跨流程的质差分析和对话辅助处理显著改善了故障处理效率。
 
龙志勇在接受《商学院》杂志记者采访时介绍:“通用大模型和垂直大模型的主要区别在于其应用范围和专业深度。通用大模型像是一个多面手、‘通才’,拥有广泛的知识面,适用于多种场景和任务。相比之下,垂直大模型更像是行业专家、专才,专门为特定行业或任务设计和训练,通常在专业任务的执行质量、时延和成本上更优。”
 
不过,实际落地时,行业不会简单地二选一,可能是折中方案,也可能是混合方案。例如“通用大模型+垂直知识库”的“开卷考”模式,类似于给“通才”提供垂直专业的参考书,它不必预先精通专业,但碰到专业疑难问题时可以查阅参考书,这样也能达到“专才”的部分效果;再如“通用大模型+垂直小模型”的多智能体混合模式,类似于一个高薪的“通才”搭配若干个中低薪资的“专才”,将行业流程拆解分工,让“通才”和“专才”分头负责最适合自己的任务,这样往往能用合理的成本获得最佳的效果。
 
垂直行业大模型有哪些应用挑战?
 
垂直大模型的应用必然会改变行业的工作分工、方法和流程,推动AI与人类在同一个工作流程之中协作。
 
由于大模型本质上是一个概率模型,垂直行业大模型也和通用大模型一样难以避免“幻觉”(生成貌似合理但与世界知识不一致或无法验证的内容)问题的存在,但相比通用大模型,垂直行业大模型在应用中出现的“幻觉”会更少和更可控一些。
 
龙志勇认为,垂直行业大模型的应用挑战主要在于如何深入理解行业的业务流程和领域知识,合理拆分流程的各个环节,在通用大模型、垂直大模型(或小模型)和参与流程的人类之间分配任务;同时,利用对垂直业务的理解,通过编程逻辑、模型反思和人工介入等方式,精确控制模型及系统的输入输出,保证其可靠性和安全性。
 
对于医疗和汽车等直接关乎人民生命安全的行业来说,给到AI的试错空间非常小,垂直大模型表现出的可靠性、安全性尤为重要。龙志勇曾在一篇公开发表的文章中举例,一对一的大模型私人医生服务要真正落地,依赖于医疗场景下多模态图像能力的突破,还需要模型能长时间记住病人情况、治疗历史和沟通过程,而且这个系统必须准确,否则一个小错误就可能带来致命结果。
 
因此,龙志勇建议,在医疗、汽车这类行业,可以优先选择其中的低风险场景来应用大模型,例如汽车上的信息娱乐系统,而非自动驾驶。此外,可以通过前面所说的垂直智能体方案,利用编程逻辑、模型反思和人工介入,更精确控制模型及系统的输入输出,保证其可靠性和安全性,在此基础上再逐渐渗透到中高风险的场景里。
 
此外,数据隐私和数据安全也是垂直行业大模型投入应用过程中要考虑的重要话题。工业和信息化部赛迪研究院人工智能产业研究中心常务副总经理邹德宝告诉《商学院》杂志记者,在某些行业中,如医疗和金融,数据隐私和安全至关重要。垂直大模型的开发和应用需要严格遵守相关法律法规,确保用户数据的安全性和隐私性。
 
目前已经有企业进行了相关开发和应用实践。2023年6月,紫光股份旗下新华三集团发布了国内首个面向To B、To G领域的私域大模型“百业灵犀”(LinSeer),为客户提供安全、定制、独享、生长的智能化服务。据悉,私域大模型的应用场景包括政府端和垂直行业,涉及数字政府、数字教育、数字健康、数字企业等领域,比如2023年8月,新华三集团联合宁夏回族自治区人民政府发布了全国首个“数字政府”私域大模型。
 
今年4月16日,新华三集团召开“2024媒体与分析师沟通会”,新华三集团高级副总裁、新华三信息安全技术有限公司总裁孙松儿在会上介绍,对于AIGC为代表的大模型技术及其应用而言,发展和安全是一体两翼的统一整体,必须统筹规划、同步推进。基于灵犀大模型的AI能力,新华三集团打造了灵犀助手,并提出大模型安全合规与防护新思路:以灵犀卫士实现大模型安全防护,以灵犀助手实现大模型赋能安全。
 
私域意味着一个载体的数据权益私有,且具备用户规则制定权,受社会法律约束与保护,从该意义上讲,数据的隐私性要求对垂直大模型的训练会构成一定挑战。邹德宝指出,垂直大模型所需要的数据量下限取决于多个因素,包括模型复杂度、目标任务难度以及数据多样性等。一般来说,复杂的垂直大模型可能需要数百万甚至数亿级别的数据样本才能达到较好的训练效果。如果由于数据隐私的限制,无法提供足够多的数据用于大模型训练,可能导致垂直大模型的训练数据量不足,从而影响其性能和效果。
 
由此,龙志勇抛出一个问题:如果企业不敢信任模型服务商的隐私条款,目前只能通过垂直大模型的私域部署来解决。但随之而来的问题就是,私域模型的运行维护成本会远高于公域部署的模型。行业企业需要做一个权衡:是要100%确保数据隐私,还是要节约成本。
 
邹德宝建议可以考虑以下几种应对办法,一是应用数据脱敏和隐私保护技术,在保护用户隐私的同时保留足够的信息用于模型训练,此外,差分隐私、联邦学习等隐私保护技术也可以达到相同目的。二是通过数据合成和增强技术,可以在有限的数据基础上生成更多的训练样本,例如,可以通过对原始数据进行旋转、缩放、裁剪等操作,生成更多的图像数据;或者通过对文本数据进行同义词替换、句子重组等操作,生成更多的文本数据。三是在训练垂直大模型时,可以利用一些公开的、领域相关的数据集进行预训练,然后通过迁移学习的方式将预训练得到的模型参数应用到目标任务的训练中,这样可以充分利用已有的数据资源,提高模型的训练效果。四是通过与其他企业或机构合作,共享彼此的数据资源,可以在一定程度上解决数据量不足的问题,同时,也可以通过参与公共数据集的建设和共享,推动整个行业的数据积累和共享。
 
龙志勇指出,垂直大模型的应用必然会改变行业的工作分工、方法和流程,推动AI与人类在同一个工作流程之中协作。这其中最重要的人才,是理解大模型特点、愿意尝试新事物的行业专家,以及能快速理解新行业、能跟行业专家深度对话的AI产品经理。这类人才需要的数量不一定多,但非常核心,市场上真正具备这样复合型能力的人是稀缺的。
 
整体来看,目前国内的垂直模型大多数都处在训练开发和早期验证中,有待进一步观察。龙志勇认为,当任务限制在更小范围的时候,垂直大模型也有机会变“小”,从而在数量级上降低边际成本。因此,对行业理解越深刻,任务拆解越精细,就越能降低边际成本;对行业理解越深刻,垂直数据准备越充分,就越能提升应用效果。此时,垂直模型会迎来较好的应用时机。
 

除《商学院》杂志署名文章外,其他文章为作者独立观点不代表《商学院》杂志立场,未经允许不得转载。版权所有

欢迎关注平台微信公众号

 点赞 30
 收藏 20