本文摘要:摘要对电网核心业务系统的性能管理应用与部署框架进行研究,并将相关管理纳入标准化运维服务管理流程,提出了行业企业推进应用性能管理的推荐思路,在应用性能监控基础上优化整合相关的流程、人员和资源要素;并结合应用性能管理在案例中的实际应用,对电网环
摘 要对电网核心业务系统的性能管理应用与部署框架进行研究,并将相关管理纳入标准化运维服务管理流程,提出了行业企业推进应用性能管理的推荐思路,在应用性能监控基础上优化整合相关的流程、人员和资源要素;并结合应用性能管理在案例中的实际应用,对电网环境下利用性能监控和性能管理提升业务系统管理水平的方法进行详细探讨。
关键词业务系统管理 应用性能管理 应用性能监控 过程管理 数据分析 可用性管理
1引言
随着电网改革的深入推进,支撑电网核心业务的应用系统稳定性和可预测性已经受到电网企业越来越多的重视。但是对于电网来说,大批量应用和工具开发软件组建的应用架构可能会超出IT部门的应用管理能力。从电网业务应用的实践来看,无论应用软件和IT管理实践的现状是什么,都有一个基本逻辑:没有度量就没有管理。核心问题在于缺少有价值的可视化能力,这个能力能够为管理人员可视化地呈现性能问题发生的性质和原因。应用性能管理(ApplicationPerformanceManagement,APM)包括了流程和技术,让管理人员能够获得所需的度量指标。在软件生命周期的每个阶段实现性能问题可视化,是恢复管理能力和预判性的最佳方法。
2应用性能管理的技术与业务架构
2.1应用性能管理
APM具有两个含义,其中一个的核心是“应用及支持流程(维护和改进应用及相关IT资源)的生命周期管理”,这个含义即完整意义上的应用性能管理。而另一类APM其实我们应该称之为应用性能监测(ApplicationPerformanceMonitoring,APM),描述了一类软件解决方案(工具),这类工具提供了有效管理软件系统的途径,利用软件技术来呈现软件组件、资源和用户会话(交易)之间的关联关系。事实上,这两种管理逻辑都包含在应用性能管理范畴内。
(1)完整意义上的应用性能管理通过监控跨越应用生命周期阶段的应用性能情况,帮助管理者建立应用系统的管理决策。它会影响应用(或是由2个以上应用支持的服务)的总体质量或用户体验。从根本上来说,用户体验是由应用的性能和稳定性直接决定的,这是电网公司将应用性能管理视角延伸到包括应用生命周期和软件质量管理的根本原因。应用生命周期包括:委托、资金、设计、建模、开发、测试、质量保证、用户验收、生产部署、应用和用户故障的分类,以及应用生命终结等。
(2)应用性能监测包含了如下概念:软件组件——通常位于一个应用服务器内部,并基于Java或是.NET技术;资源——它们并不运行于应用服务器内部,例如:数据库、消息机制、交易处理、认证和WEB服务等。资源常常被标记为分布式(或者远程)的系统,并且通过网络能够访问到,APM能够检测到一个交易进程在这些组件间执行,被称为组件级可视化,通常被称为深度探查技术或调用栈技术;用户交易——由一个浏览器会话发起和显示的交互动作,通过一个事务处理的角度进行观察,可以将交易映射回相互作用的组件或资源,以识别性能问题的根源。
2.2业务架构
随着互联网的发展,基于中间件优化的客户-服务器计算架构开始面临额外压力,需要应对事务处理能力增长,还需要适应业务应用变化的速度。越来越多的高度分布式应用程序体系结构相对于传统的应用程序来说,在软件维护及其需要的变化速度方面提出更高的要求。面向应用生命周期的性能管理架构。应用性能管理应当覆盖应用软件的生命周期。从应用软件开发到其生产运营,应用性能管理具备了全生命周期管理能力。
3应用性能管理在案例中的应用
3.1应用目标
(1)在电网营销管理系统和资产管理系统部署应用性能监控和浏览器性能监控系统,实现对营销管理系统和资产管理系统的性能监控及分析;(2)建立最有效利用应用性能监控工具的程序化能力和相关管理文化。
3.2技术选型
3.2.1应用性能监控技术选型
今天的信息技术行业中,通过简单网络管理协议(SimpleNetworkManagementProtocol,SNMP)实现的可用性监控应用广泛。除此之外,还有很多其他技术可能出现在APM解决方案。通常来说,这些技术可以被分别使用到五类主要的度量点。
●日志处理与分析技术;●专用设备或应用(通常是自制用于特定系统);●综合事务处理系统;●实时会话处理系统,通常被称为探针(包括会话过滤或者模式匹配,协议数据捕获和分析技术);●应用软件探查技术(包括JMX/PMI或者其它度量指标框架,字节码探查技术)。这些应用性能监测技术的实用性和可视化能力的比较。根据上述方案和技术比较,基于本次管理应用的对象和目标,电网采用基于应用软件探查技术的APM系统平台,作为当前核心的应用性能监测解决方案。该系统平台部署于中间件等应用系统核心组件设备上,采用字节码拦截技术,获取业务会话的详细信息,通过指标数据分析能够对业务应用实施有效的管理,并提供最佳的指标可视化能力。
3.2.2应用性能管理技术选型
电网已具备应用性能监控并不代表所有的当前应用都将直接获得优化。APM技术探查基于WEB应用的相关特性,这对于较早的应用实现(通常采用C语言或其它非字节码语言实现)来说并不适用。
当电网将目光扩大到应用性能管理时,发现了因流程改进与协作带来的很多价值,即使没有被APM技术直接监控的应用实现也能够同样受益。遵循APM管理流程,特别是流程与运行环境评估相关联,能够帮助电网管理人员从APM计划中真正获益。传统的信息技术管理能力主要集中在可用性管理领域,该领域是以告警为中心的模式。而应用性能管理是以指标为中心的模式。这意味着,重点在于并没有所谓增强的可用性。可用性管理逻辑从来都不考虑利用额外的可见性能力实现增强管理。基于此,要实现真正的增强管理,不仅需要增添管理技术,而且需要改变使用技术的过程。这就是“可视化差距”问题。这个差距从表面来看是一堆新指标,而事实上从当前的每一个供应商获得的几乎是相同的指标。
所以,指标采样频度可能不同,但基础信息基本上是相同的。真正的“可视化差距”反而是在部署应用性能管理的信息技术管理组织身上,在于其一旦具备APM这种新型可视化能力后,组织对于所呈现的可视化管理细节的响应能力。这种响应能力恰恰与流程相关,也就是电网如何使用这种可视化工具的问题,这与管理团队的程序化能力和部门文化密切相关。APM工具本身是无法为管理团队提供如何最有效利用它的流程,这是管理团队必须自己形成的能力。基于上述比较和认知,电网的应用系统管理和运维团队,最终决定在采用基于应用软件探查技术的应用性能监测系统平台的基础上,通过优化整合核心业务系统性能管理相关流程、人员和技术资源要素,形成一套能够有效支撑应用系统全生命周期的性能管理业务流程和资源组织架构,从而构建完整的应用性能管理体系,实现对电网核心业务系统的管理能力。
3.3应用成果
通过实现应用性能监测与应用性能管理相整合的优化管理体系,电网的应用性能管理建设获得了较好的成果。(1)对核心业务系统运行状态的可视化管理可视化手段呈现业务的吞吐量、数据库的吞吐量、错误率、系统拓扑等反映业务系统运行状态数据,并依此判断业务运行状态是否异常,进而形成性能优化方向。(2)系统性能故障可快速定位根据各节点、事务的响应时间,判断该节点、事务是否属于异常(例如,EJB调用超过秒级,属于异常),再深层次逐步分析节点、事务具体情况。
(3)建立了一套可持续的业务运维体系对关键应用系统进行月度性能分析并出具性能分析报告,反馈给系统运维及开发厂商分析并整改,建立了一套问题闭环的机制,对系统性能问题持续优化提升。(4)正在形成软件生命周期管理的概念试点将应用性能管理能力前推到软件开发的质控阶段,在软件交维环节实现基于性能基线数据的交维接收规范,并将基于应用性能管理的应用审计作为软件开发质控流程的一个环节予以管理。
电网论文范例:智能电网下现代城市电网规划探讨
4结语
电网现有的IT环境大量采用虚拟化和云计算技术,基础架构和应用的对应关系被打破,通过本次应用性能管理体系建设,从可视化能力上有效重构了业务运行过程中,基础架构与应用的逻辑对应关系,帮助运维部门工作实现了从基础运维到业务运维的跨越。经过一段时间的应用性能管理体系运行,在电网核心业务系统运行管理方面,建议应用性能管理应当面向软件系统的生命周期管理,在引入应用性能管理工具基础上,有必要建立相对应的管理流程体系,将应用性能管理的相关内容嵌入开发、测试、质量保证、用户验收、生产部署、应用和用户故障处理,以及应用生命终结等软件生命周期管理环节中,形成基于应用性能的核心业务系统生命周期管理,协助系统预判和快速定位故障,提升用户体验。
作者:廖 臣 吴方权 舒 彧 李 洵 朱显峰
转载请注明来自发表学术论文网:http://www.fbxslw.com/dzlw/25674.html