某省国税系统基于客户体验的应用性能管控建设方案

网友投稿 932 2022-10-16

本站部分文章、图片属于网络上可搜索到的公开信息,均用于学习和交流用途,不能代表睿象云的观点、立场或意见。我们接受网民的监督,如发现任何违法内容或侵犯了您的权益,请第一时间联系小编邮箱jiasou666@gmail.com 处理。

某省国税系统基于客户体验的应用性能管控建设方案

背景:税务信息化建设带来的用户体验问题

金税三期工程是在全国税务信息化十多年建设的基础上,运用先进的税收管理理念和现代信息技术,通过业务重组、技术重构、功能整合,分期分批来逐步实施的信息化建设过程。金税三期工程的实施将对我国税收发展具有革命性影响,对提高纳税服务水平,规范税收执法,加强税源专业化管理,推进信息管税,提高税法遵从度和税收征收率都具有十分重大的现实意义。

今年,金税三期工程将在某省实施上线,所涉及的应用系统的客户体验至关重要,而影响客户体验的主要因素是应用性能,由于金税三期应用系统业务覆盖广、设计实现复杂,参与厂商众多、应用IT环境庞大、关联关系庞杂,给观测应用性能和诊断应用性能故障带来了很大的难度,所以,我们迫切需要利用技术手段来量化客户体验,建立通过客户体验达到对应用性能的持续监控体系,并辅助我们诊断故障,理清责任界面,最终建立一套金税三期工程的客户体验和应用性能的持续改进机制。

来源和依据

根据《国家税务总局关于进一步做好税务信息系统运行维护工作的意见》(国税函【2010】224号)文件要求:“总局将组织对各省性能数据和各系统运行情况进行分析。出具优化建议报告,提高日常运行维护水平。各地应积极使用省级系统监控管理平台,定位解决问题,提高紧急问题处理能力和效率”。

根据《国家税务总局关于印发<税务管理信息系统运行维护体系管理办法(试行)>的通知》(国税发【2005】128号)文件要求:“识别数据库性能和容量的需求,根据性能建议调整数据库容量和其他数据库性能配置。制定数据库的性能报告,评审数据库性能报告,识别趋势并提供改进建议”。

系统现状

国税系统税务网站是政府网站的重要组成部分,是税务机关与纳税人和社会公众密切联系的重要桥梁,是税务机关推行信息公开的第一平台、开展税收宣传的重要载体、服务纳税人的重要窗口与公众互动交流的重要渠道。根据国家税务总局进一步优化纳税服务工作的要求,大力依托公共网络向纳税人提供网上办税服务,网上办税服务所覆盖的业务范围快速增加,逐渐成为税务部门为纳税人办理涉税业务的一种重要方式。

网上税务局上线运行后,纳税人通过互联网就可以进行网上抄报税、申报、认证功能操作,实现了网下、网上征税方式。网上税务局的上线,不仅大大方便了纳税人办理纳税事宜,也减轻了办税网厅的压力,提升了纳税服务质量。网上税务局迅速得到了纳税人的认可,用户数量快速增长,截至2015年6月,在短短的1年时间,网上税务局的用户数量已经达到246749户,而且还在以每月1.8万户的速度在增加,峰值时,网上税务局同时在线用户达到2万多户。

2015年1月,总局推广的增值税发票系统升级版正式上线运行,纳税人开票时的身份验证和开票数据上传到税务机关的电子底账数据库等业务,均在互联网络上完成,增值税发票系统升级版用户数也已经达到12万多户,考虑到2015年营改增的推进,升级版的用户数还会大量增加。

目前,网上税务局和增值税发票系统升级版用户数已达36万户,网上业务发展十分迅速。巨大的业务访问量给税务信息系统应用的稳定性、可靠性,以及良好的用户感知和对外公众服务质量等诸多方面带来了严峻的考验,也给系统运维工作提出了更高的要求。

传统的 IT 监控通常难以从全局视野来识别和解决应用性能问题的根源。传统的IT监控和管理,着眼点往往体现在一些IT软硬件运行的技术指标上,而没有将最前端的用户的真实体验,与后端的 IT 基础架构运行结合起来,做整体的分析和诊断。在以往的运维工作中时有出现基层反映系统出现速度慢甚至无法正常使用,而中心服务器的监控指标正常的现象。随着信息化建设的发展,特别是面向纳税人网上业务的全面推广,终端用户的体验已经成为系统监控的重点,应用系统的监控重点已经从IT 基础架构测量指标变成了业务测量指标。

在中心信息系统日常运维过程中,为了更好的解决信息系统性能管理,改善客户体验,存在的困难主要有:

1、缺乏技术手段来自动收集应用和系统的运行信息。目前仍然采用人工采集的方式监控应用系统的状况,没有专业的监控工具监控系统基本运行状况、资源可用性、性能状况,无法查出系统的性能瓶颈。

2、网络状况及性能状况无法提前预警,直到业务中断之后才能发现,后知后觉,反应速度慢,业务中断时间较长。

3、不能深度的排查出应用性能瓶颈,无法辨别出问题的出处,比如:网络问题,服务器问题,应用系统问题。

4、不能实现自动化,需要耗费大量的时间和精力在性能或故障排查上。

这些困难造成了信息系统的运维仍然只能是被动运维,出现问题是排查故障难度大,时间长。

因此,建设一套基于客户体验的应用性能管控系统(APM)已经势在必行。

需求分析

传统的IT监控通常难以从全局视野来识别和解决应用性能问题的根源,着眼点往往体现在一些IT软硬件运行的技术指标上,无法将前端的使用者体验(业务应用使用的真实感知)与后端的IT基础架构运行结合起来。

近几年,在终端客户体验监测、客户体验与IT系统运行指标相关性方面的进展,让使用者能够更有效地监测和解决应用不满足服务水平协议(SLA)的问题。通过大数据比对等手段做整体性能的分析和诊断。并且,应用系统的监控重点已经从IT 基础架构测量指标变成了业务测量指标。

在给用户提供网络应用服务的过程中,我们意识到如下问题:

需要有技术手段来自动收集应用和系统的运行信息。服务提供者对自己的系统基本运行状况、资源可用性、性能状况,性能瓶颈比较关注。而如果采用人工的方式采集系统运行信息,并进行进一步的分析,将面临如下困扰:

网络状况及性能状况无法提前预警,直到业务中断之后才能发现,给业务造成较大损失。

不能深度的排查出应用性能瓶颈,无法辨别出出题的出处,比如:网络问题,服务器问题,应用系统问题。

不能实现自动化,需要耗费大量的时间和精力在排查上。

应用性能管控需要逐步从针对信息系统的服务管理过渡到面向客户体验的管理。针对应用系统而言,应用系统的客户体验一般包括如下三大类需求:

页面响应时间分析:即为用户提供服务的IT系统的页面响应时间分析,以帮助提高关健页面的响应速度,改善客户体验。

页面流程设置为分析:分析用户的行为流程,可以帮助调整页面设置或页面操作流程,以提高用户的操作体验。

服务质量分析:主要针对使用信息系统对外提供服务的工作人员,发现系统中可能影响服务质量的关健环节,或已知的、已经影响了客户体验的环节,进而分析并改善对外服务的质量。

需要有技术手段来深入应用程序内部,可以从第三方的角度,快速判断应用性能问题的故障点,快速判定责任方,以利整改。以往,缺乏这种技术手段带来很多问题:

靠人工方法判断故障点,需要相关人员有丰富的经验,对故障的诊断速度和准确度过分依赖个人能力。

缺乏明确,量化的证据判定责任方。往往会面临系统各参与IT厂商之间的责任推诿。

因为无法快速判定故障点并整改,可能会导致外部的舆情问题。

基于客户体验的应用性能管控(APM )是以业务测量指标为主,保障应用的高性能和可用性,最终目标是通过基于客户体验层面的大数据分析与研判,达到对系统应用性能的有效管控与提升。

系统方案

基于客户体验的应用性能管控是以业务测量指标为主,保障应用的性能和可用性,提升用户使用感知和用户满意度。

系统架构

Capture:探针,主要功能是抓取网络的上的包,解密(针对https)并且做初步的协议识别,然后将包发送给后续进程。

Decoder:解析器,主要功能是解析网络协议,将不可见的二进制数据转换为可见的信息。decoder实现了一个session 链表,用来存放会话信息,根据会话进行协议解析。

Analysis:数据分析器,主要功能是对信息进行分析,统计,发送告警信息,并且写数据库。

Webserver:实现一个web服务器,用来响应用户请求。具有多样化数据展示功能比如柱状,饼状图等,能够形象的展示关键信息。

整个应用系统客户体验分析架构可以分为以下三层:

采集层:包括capture,decoder,analysis。 主要功能是提供数据支撑,将数据保存在本地数据库中。

业务层:包括应用中间件服务器,以及java模块。该层的主要功能是为前端提供支持。

展示层:该层的主要功能是提供各种可视化分析图表。

系统功能

应用性能和应用质量

针对应用性能和应用质量问题,适用于如下场景:

部分用户反映系统有时很慢。但很难通过有效的手段来判断系统在哪里慢,慢到什么程度,是一个地区慢,还是只是个人慢?

系统操作员发现系统报错,投诉时无法重现错误的场景和相关的前后步骤。

系统操作员投诉系统慢时,无法快速定位问题原因。

开发人员在新版本上线后,无法确定新版本是否改善了系统性能。

系统高峰期运行缓慢,但无法确定哪个地方进行优化能最有成效。

系统维护、开发人员的辛苦工作,但无法提供系统运行满意度的量化的、图形化的报告。

定制关键页面响应时间阈值指标,当响应时间超出阈值指标时,能够提示和告警。

不同地区营业厅和访问用户的应用页面响应时间。

用户行为分析

网站调查活动的页面,用户是否真正参与了?有多少人参与?

分析一个用户在一个月内的行为:上来多少次?访问了哪些页面?

分析用户重点访问了哪些信息?希望当用户登录时,可以更直接或方便地看到自己感兴趣的信息。

分析不同地域的客户的操作和行为习惯。

应用较多,希望获得诸多应用的活跃度分析。

希望了解用户操作偏好,即用户做了哪些操作?

多维度分析

监控分析哪个时间段网络流量最大;

监控分析某个应用系统的平均延时,并且发现性能瓶颈的所在;

监控分析某个应用系统的可访问性,即访问的成功率和失败的原因;

监控分析用户使用哪个浏览器,计算机浏览器,手机浏览器,pad等;

监控分析访问来源自哪些地方;

监控分析哪个时间段系统性能明显下降;

设置应用系统KPI(用户申报响应时间等关键指标)是否达到预期;

分析用户流,即某一用户登陆系统后所做的所有操作;

关键业务精确分析,对用户所关注的业务进行全面分析;

地域分析,针对用户来源地区,进行横向对比;

终端分析,针对用户登陆系统所用终端(pc,pad,phone),进行指标对比分析;

运营商分析,对用户连接网络进行提起挖掘,将不同运营商之间的指标差异展现出来;

常用的指标统计展示功能,指标的仪表图、饼状图、柱状图等;

支持用户自定义数据,资源的指标统计;

统计和智能分析功能:包括访问成功次数、失败次数、状态返回码统计、来源统计、失败的时间分布统计,资源平均响应时间等等一系列指标;

内容审计:针对没一条http请求,能够详细展示cookie,session等信息;

告警:根据用户定义的规则,对命中该规则的事件进行告警。告警方式有:e-mail,短信;

信息的导出功能:能够将审计记录以docx,pdf,xml等方式导出。

欢迎咨询海天起点技术专家

免费热线:800-810-3650   400-810-3650

喜欢本文请长按下方的二维码订阅海天起点

上一篇:诊断路径的自动优化
下一篇:小操作有大效用-一个数据库碎片整理的优化案例
相关文章

 发表评论

暂时没有评论,来抢沙发吧~