网络运维管理系统优化建议

(整期优先)网络出版时间:2018-10-20
/ 2

网络运维管理系统优化建议

马鸣

(身份证号:5101051981****1274)

摘要:自TCP/IP在全世界应用以来,互联网正以史无前例的速度向前发展。目前,互联网发展规模非常之大,影响非常之深远。从研究、设计、生产、到市场、工作、管理等各方面都因互联网的不断推广,正在发生新的深刻变化。本文主要分析了网络运维管理系统的优化,希望对相关从业人员有所参考。

关键词:网络;运营;透传;维护;优化

前言:

网络运维管理系统是由一系列H3C千兆以太网路由交换机组成的,该网络结构为星型组网,其核心节点为核心交换机(H3C7506R以太网路由交换机),其它节点由14台H3C以太网交换机组成。其中各个节点的交换机只做二层透传使用,配置一个IP地址,只作为管理使用。核心交换机H3C7506R配置Vlanif,为各个节点终端提供网关,与上游核心节点启动动态路由协议OSPF。核心交换机H3C7506R采用第一类发布,将本网内所有的Vlanif对应的IP地址段发布给上游核心节点,以实现本网内IP地址段与上游核心节点IP地址段互联互通。网络建成后,网络内节点不同而Vlan相同的终端通过网络交换机二层转发直接互联互通。网络内不同节点不同Vlan的终端先通过各个节点交换机二层透传到核心交换H3C7506R,再通过核心交换机H3C7506R三层转发,以实现互联互通的。网络内部终端通过H3C7506R从上游核心节点学习到的OSPF路由,实现与上游核心节点的路由互通。

任何网络设备在入网运行后,都有可能出现故障。该网络组织结构相对单一,为保障该网络正常健康的运行,特提供以下几点建议:

1启动交换机冗余链路阻断协议

核心交换机H3C7506R与其它节点交换机运行二层协议,H3C7506R运行冗余链路阻断协议STP,而其它节点交换机没有启动该协议。STP是指SpanningTreeProtocol(生成树协议),为以太网交换机提供了冗余链路,可使一个有回路的桥接网络修剪成一个无回路的树形拓扑结构。启动该协议后,交换机能自行阻断网络中无用的冗余链路,以阻断网络中广播风暴,避免交换机宕机,网络瘫痪。建议将网络中其它节点交换机启动STP协议,整改方法:运行命令stpTC-protectionenable。

2配置交换机OSPF部分的配置

核心交换机H3C7506R的OSPF部分配置不够完善,OSPF为OpenShortestPathFirst开放式最短路径优先,它是一个内部网关协议(InteriorGatewayProtocol,简称IGP),用于在单一自治系统(autonomoussystem,AS)内决策路由。OSPF交换机在配置OSPF协议后,应该指定Loopback0为该OSPF进行的RouterID。OSPFRouterID为本网络内部唯一标识本交换机的重要参数。如果在配置OSPF的时候,没有指定OSPFRouterID,交换机会任选任何一个处于UP状态的Vlanif做为RouterID,这样配置有两个缺点:1,不方便维护,其它节点无法从OSPF邻居看到本交换机对应的正确RouterID.2,如果该Vlanif变成了Down状态,会促使该交换机H3C7560ROSPF进程重启,造成网络动荡。整改方法:运行命令:ospf1routerid172.27.*.*.,然后再重启OSPF进程:resetospfprocess。

3将OSPF发布IP地址段Silent掉

核心交换H3C7506R采用第三类发布本网络的IP地址。第三发布会产生第三类链路状态数据库在全网内进行传递,该类发布需要将对应的Vlanif的接口Silent掉,否则交换机会往这些Vlanif对应的接口上不间断发送224.0.0.5的组播报文以查找邻居,浪费交换机系统资源。

4配置交换机对应端口描述信息

核心交换机H3C7506R通过端口interfaceGigabitEthernet2/0/16,2/0/17,2/0/18,2/0/19,2/0/20与其它节点互联,H3C7506R上对应的这些端口没有配置端口描述,不方便维护。整改方法:在交换机对应的端口视图下运行命令:description。

5平台建设的总体框架

5.1监控管理平台

实现对IT基础架构,主要是网络设备、服务器、数据库以及应用的监控,并实现监控对流程的驱动。

5.2服务管理平台

服务管理具体功能包括服务台管理、服务流程管理及运维辅助功能,具体而言:

5.2.1服务台管理

职能管理功能包括服务台职能管理以及值班、巡检的管理。服务台是提供给客户提供服务的接入点,它可以从电话、邮件或者即时通之类的工具让客户快速的找到服务。同时,运维人员通过服务台可以记录客户的问题,根据服务台提供的帮助信息解决问题,也可以将用户的请求生成工单派发下去,并跟踪工单的执行。

用户也可以通过自助服务台自行提交事件问题申请,并跟踪事件处理进度。

5.2.2服务流程管理

服务流程管理包含了事件管理流程、问题管理流程、变更管理流程、发布管理流程。

服务器管理系统是对运维管理的流程进行固化的工具,它可以制定流程的总体结构、考核目标、每个节点的表单等。运维人员可以基于制定好的流程生成相应的服务流程工单,也可以接收属与自己相关的工单进行处理。同时在工单中,应该能够提供运维人员进行服务的一些关联信息,如配置信息,相关工单的信息等等。流程要能进行统计分析,生成各累报表,作为领导工作汇报和改善流程的依据。

5.2.3运维辅助功能

运维辅助功能是帮助运维人员更好,更高效的做好日常运维管理工作。功能包括运维知识库、巡检管理、运维报表等。

5.3资产配置库(CMDB)

资产配置库是要收集IT环境的各种IT资源以及IT资源的配置,建立它们之间的逻辑或者物理的关系,为IT运维人员在排除故障,解决问题的时候提供帮助。因此,除了要记录配置之间的关系外,还应该将与运维相关的一些信息资产以及其配置进行关联,例如相关的合同,维护的厂家,曾经发生过的变更,曾经维护过的知识等等。结合资产配置库,应该有专门的配置管理员来维护和保持资产配置库数据的准确性。

5.4服务展现

服务展现包括门户及管理。

5.4.1门户

门户是不同类型用户进入到防御技术研究试验中心信息化门户后,结合其角色所能够得到的与IT运维相关的信息。

5.4.2管理系统

管理系统是提供统计分析功能,按照协定的服务承诺分解到具体的KPI,从人员、流程、技术三个方面统计IT运维管理的实际情况,并与承诺的质量进行对比,从而发现不足,辅助管理者进一步分析的管理改善点,发现隐患,解决问题。

结束语:

近年来,网络设备的发展正处于日新月异的状态,网络病毒日益猖獗,网络设备也在时时刻刻面临着挑战,因此业界提出一个概念:主动维护网络。即网络设备正式运行以后,为避免设备故障,网络瘫痪,主动采取措施维护网络。第一,建议维护人员定期登录设备查看设备的日志告警,发现隐患后立即解决。第二,建议定期用网络设备巡检工具对网络设备进行巡检,发现问题后,依据网络巡检结果对问题进行相应处理。第三,定期联系厂家,对网络设备操作系统进行升级加固。第四,网络设备入网超过一定年限后,建议进行设备升级替换在网运行的设备,以避免设备故障而影响网络正常运营。

参考文献

[1]陈碧珍.浅谈IT运维服务体系的建设[J].广东科技,2001(12).

[2]王晓勤,赵刚.企业IT服务管理中心架构研究[J].信息化建设,2006(05).