首页>《能源评论》>《能源评论》2023年第3期

大知识量:引导电力AI向深层认知演进

发布时间:2023-03-24
  
  大知识量:引导电力AI向深层认知演进

  /周飞 

  我们正处在人工智能(AI)技术变革的进程中。ChatGPT作为一个现象级应用和AI新范式的代表,将对大幅度提升生产力发挥重要作用,其标杆意义可以与个人电脑、互联网的诞生相提并论。对能源行业而言,AI技术已经渗透源、网、荷、储各个环节,涉及数据采、传、存、用等场景。这类技术和能源电力一旦牵手,会碰撞出什么样的火花? 

  ChatGPT应用于电力要迈过几道坎  

  现在的AI技术主要有三个特征:大数据、大算力和大参数。近二十年来,深度学习技术的发展始终伴随着对训练样本量、图形处理器计算性能、模型参数规模的更高要求。调研数据显示:目前电网主设备知识服务引擎的核心组件——电力认知大模型的训练数据量约16吉字节、模型参数规模达到十亿级,而ChatGPT的训练数据量达到了45太字节、模型参数规模达到1750亿。因此,除了算法创新,样本数量、算力、参数规模方面的较大提升才催生出ChatGPT。 

  分析ChatGPT模型可以发现,与电力认知大模型和自然语言处理(Natural Language Processing,NLP)领域通用预训练大模型相比,其核心技术的特点为:通过反复利用提示学习、专家反馈强化学习,取得了高质量基础数据预处理、预训练网络结构和模型预训练微调方面的一系列创新,在预训练阶段就直接具有了模拟人的上下文理解和认知推理能力。这种训练让ChatGPT更擅长于处理智能问答、多轮对话、文本续写等工作。 

  未来,ChatGPT应用在电力行业要迈过几道坎? 

  首先,如果要应用于电力认知推理,ChatGPT需要高质量的电力知识库,突破电力专业术语环境中的逻辑推理难题。 

  其次,目前ChatGPT应用还是基于离线模型,预训练的语料样本仍是2022年11月30日之前的数据,如果要具备实时在线的处理能力,还有很大挑战。 

  最后,ChatGPT采用的是单向预测模式,需要与电力认知大模型采用的双向预测模式优势互补,提升人机对话中知识的精准提取和逻辑合理表达能力。 

  当然,这既是挑战也是机遇。比如,在专家库构建方面,ChatGPT参与人机反馈的专家数量是50人,这也意味着,人机反馈的策略是相对封闭和有限的。在我国电力行业,专业能力以及人机反馈能力在大模型的训练方面会发挥重要作用——大家都愿意把数据贡献出来,更具备建立大规模专家库的基础,由于高黏性用户群体参与的人机反馈对于模型的研发、升级很有价值,或许这能成为我们的独特优势。 

  呼唤“撒手锏”式应用 

  电力系统是一种以光速传播的能量系统,空间分布广、控制层级多、耦合关系复杂,数据的采集、传输、存储、计算对实时性和可控性的要求非常高。如此复杂的控制系统,如果没有智能手段来支持,是难以想象的。在电力行业,目前比较有代表性的AI技术已经获得了一定的应用,特别是以大数据量、大计算量和大参数量为标志的深度学习,在设备运检、营销服务等场景,以及运行控制、辅助决策等领域都有一些应用:在系统层面,可以对运行状态进行在线推演;在设备层面,可以对电网核心设备故障进行诊断;在用户层面,可以对用户侧灵活资源进行智能调控。 

  在这些场景下,AI技术的“三驾马车”——数据、算力和算法也有了新的发展态势:数据呈现多模态特征,有文本的、图像的、视频的、声音的等等;算力除了传统的GPU、CPU以及超算等资源,还需要考虑如何将云计算、边缘计算这些算力资源协调起来建立一个强大的算力网络;算法除了传统的建模解方程,还要数据驱动,用数理方程与神经网络融合方式进行求解。 

  由于电力行业专业性比较强,语料数据具有多模态属性,目前ChatGPT处理的只是单一模态的文本,暂时还没有实现跨模态应用,在跨模态的认知推理、故障诊断方面还不具备处理能力。未来要在这个方向发力,需要解决以下问题: 

  一是语料规模有限。我们现在获取的数据规模是几十吉字节,远未达到太字节的级别。二是模型研发能力有待提升。现有使用的算法和模型都是基于开源框架加入一些有电力特色的算法和模型,尚无法实现从架构设计开始电力行业就介入其中,未来期待能在架构、算法等方面取得突破创新。三是在预训练策略和分布式训练方面还有待加强,现有算力规模还不足以支撑类GPT模型的算力需要,未来需要加强对算力资源整合的工作。 

  未来ChatGPT模型的参数规模是万亿级的,将具备更高阶的深层次智慧能力,以及更加符合人类习惯的认知推理和上下文理解能力,目前认知水平正处在从量变到质变的过程中,下一步会推动人工智能技术实现从感知、理解到生产、创造这一大的跨越和跃迁。 

  电网数字化既要响应电网需求,也要符合数字化发展趋势,将两者结合起来需要站在巨人的肩膀上,期待产学研各方联手,在电力AI学习范式、电力认知大模型、电网智慧认知大脑构建等方面,能够有所突破,在核心技术上打造出“撒手锏”式应用。 

  引入“大知识量”, 向深层认知演进 

  目前AI技术的输出结果不具有可解释性,很难说清其中的逻辑关系。一旦出现不正确的结果,往往产生颠覆性的错误,引发连锁反应式的灾难性后果,尽管这还只是个概率问题,但需要引起高度重视。 

  因此,除了大数据量、大计算量和大参数量,未来还要引入大知识量的概念,强调认知的作用,包括知识发现、理解、加工、生成等环节。 

  国网智能电网研究院研发的“电网主设备知识服务引擎”,面向电网海量广域电力设备的缺陷,采用人工智能技术进行预警、故障诊断、故障溯因,并面向基层一线研发人员提供知识问答服务。日前,基于此项技术的“电网主设备知识计算关键技术及工程应用”项目成功入选“2023可信AI案例知识计算应用优秀案例”,案例首次提出电网主设备知识图谱本体规范,构建国家电网公司首个设备标准领域主题词库、首套FAQ库和首个电网设备领域大规模知识图谱,图谱规模超5500万;研发电网主设备知识服务引擎,分别为浙江、江苏等27个省级电力公司提供精细化知识检索、业务知识问答、故障溯因推理服务应用,累计提供设备知识服务6500万余次,设备缺陷、试验、故障类知识问答推理应用突破2万次,缺陷定级和故障处置的决策时间由50分钟缩短至10分钟,工作效率提升4倍;试运行期间,各单位累计开展标准检索、资料查询应用超35万人次,帮助基层解决了技术标准查找难、资料获取时间长等痛点问题,实现设备专业知识的精准化检索、智能化问答、图谱化呈现以及移动化应用等4大类11项核心功能,覆盖设备运维检修主要业务场景,设备知识智能化应用实现“0”到“1”的突破。 

  关于大知识量,学界的新思路是基于数据与机理融合驱动的方式——把物理的解析模型和人工神经网络分析方式融合起来,以物理机理为主导,加上神经网络解决不确定性的、模糊性的、随机性的参数,既能保证结果的合理性,也可以适应不同的变化,将会产生较好的效果。 

  当然,这也只是浅层的知识结合。未来能源电力领域的人工智能技术不仅是依靠数学模型、靠数据驱动,还要具有逻辑推理能力,并以专业知识作为知识图谱,像人一样具有自己的世界观、方法论和逻辑体系。只有基于电力知识图谱的大数据量、大计算量、大参数量和大知识量,才能让电力AI真正实现从浅层的感知智能向深层的认知智能演进,成为调度机器人的目标也才可以实现。