极智矿山网络监控运维项目
项目背景
随着某煤矿智能化建设的不断推进,全矿网络内部署了大量网络设备、智能传感器、摄像头及环境监测器等关键设施。在此背景下,如何确保全网设备的敏捷响应与稳定运行,保障并上井下高速数据传输的畅通,以及实现全矿高效运维和安全生产,已成为该煤矿运维团队关注的核心。
客户环境:
设备类型:环网设备、交换机、视频交换机、路由器、AC、AP、PLC、硬盘录像机、摄像头、堡垒机、日志审计系统、上网行为管理等
设备品牌:迈威、赫斯曼、东土、华为、华三、信锐、闽兰之星、Windows操作系统、深信服、威努特等
网络场景:并上井下网络
项目期望
某煤矿期望通过构建智能化运维平台,实现对IT资源的全面监控和管理,可以更加精准地预测和预防潜在问题的发生。
无限极智方案
极智EIOPS平台通过跨平台、跨网络的监控运维能力,对某煤矿中的环网、视频网、办公网等井上井下网络统一管理,运维人员可以实时掌握各设备的运行状况与性能指标,迅速定位故障并采取相应措施予以解决。
设备和应用统一监控
通过构建具有可扩展性的设备监控模型,针对煤矿环网内的所有设备,包括但不限于环网设备、交换机、视频交换机、路由器、AC、AP、PLC、硬盘录像机、摄像头、堡垒机、日志审计系统、上网行为管理等,配置专属的监控模型。这些模型将涵盖设备的品牌、型号、内部资源及监控指标等关键信息,并依据煤矿的具体监管需求实施差异化管理策略。
设备自动发现
通过先进的智能自动发现技术,自动发现并记录全矿网络中的各类设备,识别设备类型和厂商型号,生成设备的面板图或搜索设备资源,如:CPU、内存、端口等,发现设备之间的连接关系,并自动匹配故障和性能监视器。在短时间内构建起全矿网络设备的详尽档案,实现对设备状态的实时监测。
环网自动识别
通过特有的工业环网识别技术,能够自动搜索并展示网络中的工业环网结构。同时,还能智能地识别和显示环网中存在的阻塞端口及冗余链路。无论是新设备的快速接入,还是网络架构的动态调整,均可通过自动识别实现迅速响应与调整,从而显著减少了人工干预的需求,大幅提升了网络的整体稳定性和安全性。
全矿网络拓扑自动生成
平台提供自动生成拓扑图及手动布局的功能,根据某煤矿的整体网络架构,采用平面展开方式清晰展现网络拓扑结构。当遇到设备故障、资源异常或链路问题时,通过不同颜色的标识来区分各类故障的严重程度,从而协助运维团队即时掌握整个网络的结构状况以及全网运行状态,并迅速准确地定位到具体的问题点。
设备性能实时监控
方案采用主动轮询与日志解析技术,对全矿设备实施实时监控。监控指标涵盖但不限于CPU使用率、内存使用率、磁盘使用率、网络接口流量及带宽、视频画面质量等。此外,除内置的常见指标外,其他资源和指标亦可通过模型库不断进行扩充。
多维度分析和处理
分析及展示全矿设备的实时性能、历史态势和性能对比分析。通过曲线图、柱状图或表格等形象化的方式展示,按天、周、月查看性能指标的变化情况。运维团队能够随时掌握设备性能的变化趋势,从而预防潜在问题的发生。
智能故障管理和告警机制
通过完备的故障管理和告警机制,灵活的告警管理策略,对全矿内的各种设备进行故障监测。利用主动轮询技术持续检测各设备的运行状态,将众多事件和状态中的零散信息主动汇总,形成当前的整体状况,并进行整合分析,出现异常情况及时告警。
在告警通知途径上,提供多种渠道,包括界面颜色变化、提示音、灯光闪烁、信息列表展示、电子邮件、短信、钉钉、企业微信以及个人微信等,确保运维团队可以第一时间获取告警信息。
远程控制与编排化运维
通过设备远程控制与自动化运维编排功能,实现对矿山网络设备的远程配置、升级及维护,从而有效降低现场维护的成本和时间。当设备发生告警时,常规告警能够通过故障自愈流程得到自动处理,解决了被动式、事后响应的故障风险监测问题。此外,大多数基于经验判断的风险和解决问题的方法可以被固化到平台上,以促进运维知识的积累与传承。
可视化统计分析报表
平台提供了丰富的可视化统计分析界面,用于对整个矿山网络中各类设备和应用的运行故障及性能进行深入分析与展示。此外,还具备自动化巡检功能,用户可根据需要自定义配置巡检策略,依据实际需求选择关注的网络区域、设备类型、资源或链路等范围,并设定特定时间自动执行巡检任务。该功能能够定期检查设备的实际运行状况,并将检测结果以报告形式发送至预设的电子邮件地址。
项目价值