“大模型结合仿真技术,就成为了生成式仿真技术,生成式仿真可以做一些有效的平滑处理,给我们带来非常大的机会。
比如车辆撞击,未来的仿真应该是现场的真实数据、来自于Altair这种小模型的机理的仿真数据以及工业的大模型仿真数据,三者融合在一起。有可能让工业仿真得到一个极大的推动,升级到另外一个新的高度。”
——上海数据科学重点实验室主任 肖仰华教授 在Altair “AI FOR ENGINEERS”线下研讨会的精彩演讲
为了与全球优秀工程师共同探索人工智能(AI)在工业发展中的变革力量,6月20日,Altair 将举办面向广大工程师的全球线上会议“AI for Engineers”。会议邀请全球知名设计、仿真和制造领域的专家与权威学者,共同探讨生成式人工智能(GenAI) 如何助力工业变革、产品研发,欢迎关注公众号“Altair RapidMiner”或者点击链接立即免费报名https://hubs.ly/Q02BgDjZ0,与全球工程师共享人工智能前沿技术。
现在整个世界的不确定性日益增大,导致工业系统前所未有的复杂。很多大型基层装备,涉及到成千上万个零件,每一个零件又要经过一道涉及到上万个零起元器件组成的生产线加工过程,这样的加工程序可能有几百道工序,使整个系统的复杂性达到了当年钱学森所说的复杂巨系统的状态。
基于当前的复杂情况,我们一定要把来自专家的认知能力一定程度让度给机器,未来发展成为人机协同的认知,共同应对工业中的巨大挑战。
很显然,当下大模型想要助力工业智能化发展,在工业认知系统以及能力的实践方面,都遇到了非常多挑战:
缺乏海量的应用模式
当我们把数据科学、数据智能、人工智能的很多能力和技术方案迁移到工业场景的时候,会发现以往比较成熟的应用场景大多是在消费互联网,但是这些技术一旦迁移到工业场景,就会面临着非常多的挑战。因为在工业场景,没有像消费互联网那么海量的应用模式,而且认知复杂性远远超过消费互联网。
数据复杂,治理困难
数据来源非常多样,例如Mac系统、ERP系统等等,各种各样的系统都在产生不同的数据,数据治理很困难。面对这些复杂的数据,要加工、关联、融合、清洗都非常困难。所以工业的数据治理,恐怕是所有行业里面最困难的。
知识属于隐形经验,机器难以学习
工业知识有个很大的特点,很多知识属于师傅的经验,往往自己也说不清,很难显性化的表达,所以很多知识是一种隐性经验,是一种直觉,师傅很难讲的明白,机器也无法学习。另外工业的知识体系庞杂、类型多样,涉及到几乎所有我们熟知的学科,机械的物理的化学的流程的工艺的光电的。这都会给人工智能解决工业领域的问题带来非常大的挑战。
在面对这些挑战的情况下,大模型给工业带来哪些机会呢?
在讲大模型之前,先看小模型,Altair的小模型RapidMiner在这方面做得很好,可以把传统的非常封闭场景的经验,通过数据拟合表达。在可控可编辑可理解可解释方面,小模型和智能突破仍然比大模型有优势。很多工业场景是严肃的应用场景,需要可编辑可控制可理解可解释。
其次是大模型,对于工业而言,大模型最重要的意义在于又一次有力的推动了数实融合,把数据和实体产业相结合。
对于工业来说,大模型有非常重要的价值:
1、可以对语言模型进行统一的建模和理解
工业里面的语言主要是日志,我们通过日志了解设备的运行状态,以往都是小模型,小模型换一个新任务,模型就失效了,换一个厂商的日志,模型就又失效了。现在我们已经可以用大模型技术训练日志大模型,把行业的知识注入到语言模型里,模拟实现日志统一理解处理。
工业里另外一个语言是脚本。我们经常要配置很多脚本,以前一旦是新手配置这些脚本就会容易出错,现在可以用机器统一理解,做一个生成式脚本模型,自动生成配置各种不同设备。
大模型也可以帮大家理解日志,把看不懂的日志变成自然语言表达,这样的话普通人也可以做一些运维的工作。
2、帮我们理解行业数据
现在各行各业都想激活数据要素的价值,甚至把数据变成资产去流通去交易,但是这里面很关键的问题在于数据治理。目前数据治理还是要靠行业专家写规则,然后做治理。但是代价极大,有几个行业专家能把几万张表全看一遍,所以现在要靠大模型实现数据治理的agent。如果能练就自己的工业大模型,一定程度能够识别工业数据的错误,从而帮我们做数据治理。
现在还有不少企业在使用大模型研发各种各样专业模型,比如医药研发的企业对大蛋白质的语言模型特别关注,蛋白质的语言模型可以帮新药的研发周期从2到3个月缩短到一周。很多制造业企业设备要检验,都可以借助大模型这种自动驾驶实验室的技术提效,实现将6个月的实验量缩短到5天。
3、赋能工业制造文档
所有的企业生产制造过程始终是由文档驱动的,每个环节要向下一个环节交付很多文档,目前围绕文档智能化也有很多方案,比如合同的审查检验、审图读图。这里展示的demo是用文档回答问题,帮我们做运维。
这些技术现在已经越来越成熟了,可以做多模态的、多来源的、可溯源的,而且有自知之明的理解,都是用大模型驱动和实现的。
用大模型理解自然语言的能力驱动设备的交互,不再需要写各种各样专业的脚本。还可以利用大模型检查实现更新定位,在网络系统的自动诊断里,已经有越来越多的案例,效果很不错。很多故障的排查、复杂的编排规划,最后做出诊断,就叫agent技术,也是现在大家摸索特别多的技术。目前在有些案例场景下已经能够做到不错的效果,尤其在网络以及工业质检等方向。
4、用自然语言对私有的数据库进行查询,做大数据智能分析
现代企业有很多私有数据库,把私有的知识全放到一个提示库里,利用通用大模型的自然语言转成SQL的能力,就可以实现大数据智能分析。
我们都知道,仿真技术在工业制造中非常重要,Altair的仿真技术在全球领先,现今也融入了大模型。大模型结合仿真技术,就成为了生成式仿真技术。Sora本质上就是生成式技术,结合仿真技术,可以彰显出非常大的应用潜力。
那么,生成式仿真跟基于传统的仿真根本差别在哪呢?
第一:生成仿真是在海量数据中训练的,有现实世界复杂的建模和模拟能力,是可以高度泛化的。
第二:生成仿真可以针对很多复杂的场景进行模拟
现在很多仿真把场景理想化了,比如碰撞场景不单单只是碰撞,可能还有些电子系统发生作用,所以里面实际是很多个机理融合在一起。
以前的仿真只能做某一个侧面,但是未来能不能把多学科的不同场景或者来自于不同机理的模型融合在一起仿真呢?这个都是生成仿真可能带给我们的价值
第三:生成仿真可以解决一些样本少的数据缺失的场景
生成仿真可以做一些有效的平滑处理,可能给我们带来非常大的机会。但是未来机理的仿真仍然非常重要,Altair的很多仿真模型本质上是基于机理的,是基于人类对于很多物理现象的理解建立起来的模型。
比如车辆撞击,未来的仿真应该是现场的真实数据加上来自于像Altair这种小模型的机理的仿真数据,再加上工业的大模型仿真数据,三者融合在一起。有可能让工业仿真得到一个极大的推动,升级到另外一个新的高度。
从本质上来讲,我们做的一切技术实践和努力,实际上是为了缓解专家资源稀缺的困境。工业尤其如此,老师傅一旦流失了,有经验的专家一旦离开了,很多问题就解决不了了。
所以大模型对工业最大的意义就是沉淀工业专家的经验,解决专家资源稀缺的问题。