IT运维管理到底是什么呢?
是网管?
是监控?
是工具?
是设备管理?
没有这么简单。因为今天,无论是信息架构还是IT部门的职责和定位都已经发生了转变。DT时代(数据科技时代)下,传统IT架构已然满足不了面对复杂的业务场景的每分钟数万个数据采集所需。在该形势下,兼顾应用层、网络层、感知层等横向又致力于解决IT系统纵向架构中的RIIL(Real-time Intelligence Infrastructure Library)呼之欲出。
与传统的IT运维产品相比,RIIL到底有什么不同呢?
RIIL就是统一管理信息化的人、财、物,把这些人、财、物信息收集以后,整合为基于业务、面向管理者、高度可视化的运营管理平台。该运维管理平台将IT基础架构及相关应用有效量化,并映射到它们支持的业务上,直观反映IT基础设施的动态变化对业务造成的影响和威胁,帮助管理者实现IT的精细化管理,掌控全局,准确衡量IT对业务的价值贡献,有力保障业务的健康、稳定运行
从运维到运营--抬头看用户,低头看自己,向前看趋势
RIIL帮助客户构建完整IT管理体系
平台功能价值
1. 统一资源管理,全面、动态掌握资源变化
RIIL提供多维资源管理视图,对不同品牌、类型、版本的网络设备、安全设备、无线设备、存储、主机、中间件、数据库、虚拟化、应用服务、视频监控、统一通信设备的等IT资源进行统一、全方位、多层次的综合管理,实时分析资源当前性能和运行状态,直观反映资源的动态变化对支撑业务的影响,与CMDB相结合,完整掌握资源的管理属性。通过对资源的历史事件分析,了解其稳定性及衰减趋势,为投资决策提供依据。
2. 告警管理
RIIL通过TOPN、趋势分析报表帮助IT管理者及早发现IT基础架构的缺陷和隐患;通过自动巡检功能做到主动预防,采用自动化手段针对核心业务系统及关键指标进行例行检查,可以巡检的内容包含有网络设备、服务器、中间件、数据库、动环环境等定时产生巡检报告推送给管理者加以分析;事件台能够智能感知异常,快速定位发生源,识别异常的严重程度并加以过滤,及时、准确地发出告警;结合RIIL服务请求管理中心,实现整个事件处理过程的可视化,保持良好的服务水平;RIIL还提供知识管理功能,形成事件维护记录的自然积累,IT人员可利用知识快速解决当前事件,极大提高事件的解决效率,自动巡检能帮助运维人员将日常需要人工定期巡检的例行工作交由系统自动完成。
3. 统一门户管理
支持统一WEB门户,支持自定义多种首页面;支持内置6种以上布局模板;支持自定义每个页面的展示内容和窗体标题,支持拖拽方式布局每个窗体的大小和位置。
4. 无线管理
多厂商,有线、无线一体化管理。支持对锐捷、H3C、华为、Cisco、Aruba、Juniper无线设备的的全方位管理。图形化展现无线设备及用户分布情况,用户体验好坏直观可视。
5. 分级管理
打破行政界线,贯通纵向业务
支持最多三级分级管理,可实现从总部到省,再到地市的三级统合管理。
帮助管理者打破行政界线、从业务角度理清分布在各地的IT业务资源,实现级数据统合。
6. 端到端管理
智能追踪,快速定位故障
支持查询功能,可灵活设置起始端用户和终点应用端,通过对配线、位置、设备、链路、流量、用户的智能匹配,将问题处理从繁琐的反复询问+人工梳理的方式,转变为智能化的路径追踪+远程处理,从而缩短故障问题处理的时间及效率。
7. 云基础架构管理
简化云运维,提升管理效率
虚拟化:VMware、Hyper-V、Citrix、H3C、华为、KVM等主流厂商支持,复杂结构关系清晰可视、几百种指标深度整合。存储:IBM、Brocade、EMC、NetAPP、浪潮、HP、Nexsan、华为、3PAR、Dell、宏杉等主流存储厂商支持,实现对存储 设备、光纤通道、存储池、卷、磁盘、主机的全面管理。
RIIL的架构设计
-
数据采集层
本层由各种协议适配器构成,向上层提供统一的接口访问管理协议栈(SNMP/CMIP/TL1等),获取管理信息(包括事件信息、日志信息、性能信息和拓扑信息等),并在初始发现时作为驱动模块构建信息模型。采集层通过AgentLess方式、脚本或和其他产品整合的方式来获取数据。
DCS(Data Collector server数据采集服务):负责各资源的指标采集,可配置多个DCS满足大规模采集,实现高可用性。
LOG(Log Server 日志服务):完成日志的收集采集工作。
NFA(NFA Server 流量分析服务):支持主流流量分析协议,实现流量分析的功能。
DIS(Discovery Server 发现服务):用于配置自动发现及添加服务器。可配置发现策略,用于拓扑、资源的发现与添加。
-
数据汇聚层
对底层数据采集的数据进行统一的描述,组织为管理信息库。向上提供一个统一的管理语义和调用接口。使得各个业务模块面对统一的数据模型,使得对资源的管理方式一致并处于单一的可控路径下,方便对资源进行权限管理,互斥访问等操作,使得面向事务的并发管理成为可能。
CCS(Center Controler Server 控制中心服务):将采集数据写入中心数据库,同时负责逻辑处理,生成告警、策略、处理Portal中用户输入等。
-
数据处理层
专注于管理业务的实现,不再关心底层协议的差异性。响应前台应用的请求,完成数据查询,处理等功能。
DB(DB Server 数据库服务):负责存储数据汇聚所有采集数据,并与中心控制服务器交互。
-
数据展现层
前台界面,将数据处理层得到数据加以显示,是管理员与综合业务监控系统的接口。
POS(Portal Server门户服务):数据统一展现。展现层通过Portal以完全B/S方式来展现各个管理模块;实现与用户互动,响应用户的操作与设定。
实际案例
1. 某高校应用RIIL变被动为主动,智慧运维拓展未来发展空间
通过应用RIIL系统,学校最终能够快速地对6000余台IT设备及各类IT资源进行统一的监控,快速定位故障位置和智能预警,为学校信息管理人员提供了高效、便捷的管理手段,并变被动为主动,实现资源的高度可视化管理。
规范化、标准化、高效的运维管理体制,同时也让用户能够简单便捷的获取服务请求,让管理人员能够快捷高效地受理服务事件,并积累历史运维数据,实现对IT资源、服务事件的运维与监控数据的统一分析,为学校未来信息化建设、运维管理优化提供数据支撑与决策分析。学校老师谈到:“借助RIIL运维监控系统,不仅让我们方便快速地掌握了网络实时运维状态,提升运维服务效率、降低了服务成本。更重要的是,这些运维数据为我们提供了大量的重要信息,在帮助我们快速做出适当决策的同时,也为校园网络应用的进一步发展打下了良好的基础。
2. RIIL--医院信息系统的可视化监护仪与工作站
某医院通过RIIL综合业务管理中心的部署,实现了网络设备、服务器、核心应用等IT资源的统一集中管理,并实现全院从出口到中心机房和集团各院之间的全局网络及架构的监控和管理。与此同时,结合RIIL的业务视图监控及大屏展示功能,系统将医院的业务进行了可视化呈现,在进行实时监控的同时还可以协助现场运维人员及时定位故障原因,分析网络抖动情况,从而提高日常运维效率。此外,RIIL综合业务管理中心还可以将所关注的资源及指标进行详细呈现,使医院运维人员在不登录设备时也能够实时掌控其运行情况,以保障网络及医院核心业务的正常运行。
RIIL IT运维管理服务平台就像医院信息化系统的可视化监护仪与工作站,帮助医院实现了基础资源的集中化监管,提升了IT设备的资源利用率,并通过标准化的运维服务体系,大大缩短运维人员故障响应时间,避免人工服务产生的误差,减少了由于业务系统异常给医院诊疗服务带来的损失。