【学术沙龙】电力知识“百炼专属”,让大模型更“通义”
文/曾震宇
随着大模型技术的发展,千行百业加速拥抱智能时代。大模型技术带来的变革不仅在于自然语言交互模式的革新,还在于其对业务场景中认知协作和知识获取方式的深刻影响。
首先,大模型的自然语言交互模式,使得许多业务应用不再需要传统的UI交 互(用户界面交互),而是可以通过自然语言方式与用户进行互动。大模型的指令遵从、意图理解和逻辑推理等能力,也能够在业务场景中发挥重要作用,并通过自然语言与用户进行高效沟通。
其次,传统的知识获取方式通常依赖于专家经验和文献资料,而大模型可以通过学习大量数据,快速生成专业建议和解决方案。这种变革使得业务应用的智能化水平大幅提升,也提高了工作效率和准确性。
大模型已经从一个技术概念演变为实际业务数智化中的重要人工智能技术支撑。
应用落地,
为千行百业增添新动力
当前,越来越多的政企用户开始探索如何将大模型应用于自身的业务场景。用户考虑的问题已经不再是“我是否应该使用大模型”,而是“如何将大模型应用到业务场景中,以提升业务应用的智能化能力”。
结合在多个行业、多家企业用户联合开发及建设大模型的实践经验,支撑企业更高效地构建大模型应用,通常需要经过知识整理和接入、基础模型选型和训练、大模型智能体搭建三个阶段,这也被称为“企业级大模型落地三步骤”。
第一阶段,要明确目标和技术要求,对企业内业务需求进行详细的分析和分解,梳理清楚大模型需要解决的具体业务场景问题。通过对业务需求的深入理解,可以确定大模型在哪些环节能够发挥最大的作用,这一步骤也是确保后续大模型构建和应用能够成功的基础。
第二阶段,挑选合适的模型进行训练与微调,这一步骤也包括构建行业专属知识库和数据集。通过知识增强,生成更加精准可靠的行业专属模型,更好地适应特定的业务场景,并为后续智能体应用的开发奠定坚实基础。
第三阶段,基于企业构建的模型和知识库搭建智能体应用,并与企业原有应用进行集成,让大模型应用到各个业务场景中。这一阶段可使用直观的工作流方式呈现,这样可以让整个过程变得易于理解、解释,并且能够追踪到每一步的操作。
通过这三个步骤,不仅能够确保所开发的应用能精准满足特定的业务需求,还能有效提升企业的智能化水平与竞争力,更好地支撑企业的数智化升级。
场景融合,
技术层面面临多项挑战
当前,我国正处于能源转型关键过渡期,电力是能源清洁低碳转型的关键领域。2024年10月,国际能源署发布的《2024年可再生能源报告》预测,2030年,全球可再生能源装机容量有望超过目前各国既定可再生能源发展目标装机容量总和约25%。
在推进能源绿色转型和产业结构调整的过程中,新型电力系统“双高”(高比例可再生能源和高比例电力电子设备)特性日益凸显,电力企业不仅需要应对日益增长的电力需求、新能源消纳需求等,还要确保电力系统的稳定性、可靠性和高效性。传统的电力系统设计和管理方式已难以满足这些复杂需求,数字化转型和智能化升级成为应对未来挑战的关键路径和创新发展的必然选择。
人工智能大模型技术的引入,可以优化电网管理、预测用电需求、改善设备运维等,提高电力系统的运行效率,降低运营成本,提升服务质量。而电力行业海量设备和业务场景所带来的密集数据优势和场景优势,也成为大模型发挥“灵活智能”特点的最佳实践场。
在探索构建电力行业大模型的过程中也需要面对涉及底层技术、数据、应用落地等多个层面的挑战。
一是如何准确、快速地构建专业知识库和数据集,这是保障电力大模型有效性的基石。电力系统本身是巨型复杂系统,包含发、输、配、变、用等多个环节,每个环节都有其特定的知识、规则体系和技术要求。构建一个全面而准确的专业知识库,需要整合不同来源的数据,涵盖历史业务数据、实时运行参数、故障记录等。此外,还需要考虑如何将非结构化的信息,例如专家经验,有效地纳入模型训练中,这对提升模型的预测能力和决策支持水平至关重要。同时,还有一个不容忽视的环节,即保持知识库的更新与维护,以适应快速变化的技术环境。
百炼专属版中内置了针对电力场景的富模态文本、时序数据、图像、视频等多种知识的解析及嵌入算法模型,助力电力各专业快速而精准地构建专业知识库。同时,考虑到电力行业大部分知识都是专有的私域数据,百炼平台具有“专属”的特性,支持在用户自有的VPC(Virtual Private Cloud,基于阿里云构建的逻辑隔离的云上数据中心)内进行部署,还可以与飞天企业版一起进行线下部署,实现多租户管理和资源隔离,保证每个组织的独立,确保所构建知识的安全性和专属性。
二是深度了解行业场景,让大模型与电网内部各类专业小模型高效协同。例如,在电网运行中可能需要负荷预测、潮流计算等多个子模型的支撑,以及通过智能体灵活调用多种电力专用工具,这些都离不开大小模型的协同。
在深入理解行业需求的基础上,百炼专属版也更加“懂行”。支持行业数据的深度训练和行业知识的优化,从而提高模型在特定行业场景中的表现。同时,百炼专属版还内置智能体中心,提供了智能体开发范式和工具链,支持快速搭建、调试、评测、发布智能体,并实现应用集成对接。通过行业智能体模板和预设工具,快速生成多样化的行业应用,支持复杂的工作流程和应用场景。通过构建面向场景的智能体,实现了大模型与专业模型、专用工具的高效协同,可以更灵活地适配电力场景内的不同需求。
三是如何让大模型适配不同的算力平台,并高效运行。当前,使用国产算力芯片和服务器已经成为趋势,相关的适配工作也成为企业落地大模型过程中的重点工作之一。然而,现有的人工智能框架多基于国际标准设计,适配工作并非一蹴而就,不仅涉及软件优化,还包括硬件性能的最大化利用。克服这一障碍,需要跨领域合作,从架构设计到应用开发,都需要进行深度定制,确保大模型在国产环境中稳定运行。
为了降低企业在国产算力上落地大模型的投入,我们与各方通力合作,对国产算力进行了全面适配,形成了百炼专属版“多芯”的特性和能力。针对高性能异构算力的调度和管理也得到了优化,可以满足生产级应用的需求。此外,我们还通过定制化的混合精度量化算法,提升了模型推理的性能,降低了使用成本,让大模型可以在各类主流国产算力中进行高效训练和推理。
百炼成“型”,构建人工智能领域的电力“超级大脑”
2024年12月19日,国家电网公司在京发布了“电力知识最全、参数规模最大、专业能力最强”的千亿级多模态 行业大模型——光明电力大模型。该模型作为能源电力领域的人工智能“专家”,为电网安全稳定运行、促进新能源消纳、做好供电服务提供了“超级 大脑”。
光明电力大模型一经发布便获得了社会各界的高度关注,让众多企业看到了大模型创新技术应用到企业生产运营的最佳实践和证明。光明电力大模型是面向电力行业的千亿级多模态大模型。所谓千亿级,即模型参数可达千亿级别,提升了模型的推理能力;所谓多模态,即实现了文字、图片、视频等多形态数据的融合分析,提升了模型的分析能力;所谓“电力专家”,即模型涵盖了电力行业丰富的文本、图像、视频、语音、时序、拓扑等数据,以及广泛的标准、规程、制度、规范等经验知识,具有最全、最强的电力专业能力。该模型集成了千亿级数据参数,将在电网规划和运行、电力设备检修、供电服务等600多个应用场景发挥智能专家作用,实现电力与算力的协同赋能,助力新型电力系统和新型能源体系建设,更好保障我国能源安全。
目前,光明电力大模型已在电网规划、电网运维、电网运行、客户服务等多个领域得到应用。
在电网运维领域,传统电网运维主要依赖于人工巡检和事后维修的方式,这种方式存在响应速度慢、故障排查困难等问题。借助光明电力大模型,情况发生了改变。光明电力大模型通过学习大量历史数据,能够自动监测电网设备的状态,实时发现潜在故障,并提前发出预警信息。这种主动式维护策略大大降低了意外停电的风险,提升了电网的整体稳定性。据统计,光明电力大模型目前已学习了2000多项故障案例,具备13项常见“疾病”的诊断能力,有效保障了城市供电的安全性和可靠性。
除了在运维方面发挥作用外,光明电力大模型还深度应用于客户服务领域。在供电方案编制环节,面对用户用电需求精准确定难、多部门现场勘察耗时长、用户选择空间少等困难问题,在光明电力大模型的支撑下,图上智能作业和多套供电方案的生成得以实现,用户从申请到办电方案生成时间最快缩短至1天,带来了新的办电体验,实现了“AI心电·用心办”。
未来,光明电力大模型还将面向全行业全产业链开放共享,支持行业上下游企业和合作伙伴构建电力场景的创新和应用。
当前,国家正在加速构建新型电力系统和新型能源体系,“人工智能+电力”已是大势所趋,新型智能技术与电力系统的深度融合,也将为电力系统的“灵活智能”运行注入更多活力。
应用场景落地是人工智能技术发展的“最后一公里”,也是行业大模型发挥其作用的关键。大模型作为能源电力行业数字化转型和智能化升级的重要工具,也将在未来的电力系统管理和运营中发挥越来越重要的作用。
通过不断的技术创新和应用实践,电力行业正向更加智能、高效和可持续的方向发展,我们也希望与各方共同努力,让电力知识“百炼专属”,让大模型更“通义”。
(作者系阿里云智能集团副总裁、行业解决方案研发部总经理。编辑:王若溪)