当前位置:网站首页技术文章 > 浅谈数据中心机房动力环境监控系统设计与优化
产品中心products

浅谈数据中心机房动力环境监控系统设计与优化

文章更新时间:2023-10-10 点击量:182

摘要:结合银行数据中心建设项目,设计银行数据中心机房动力环境监控系统,分析银行数据中心机房监控对象、搭建系统监控架构,给出监控实现方法,*后针对运行一段时间出现的问题,提出优化措施和建议,对同类工程建设具有一定借鉴意义。


关键词:数据中心;动环监控;系统架构;网络拓扑


引言

银行数据中心机房供配电、精密空调等基础设施较多,设备维护人力资源较少,增加了基础设施运维人员的工作强度和难度。为了及时发现设备故障并进行处理,本文设计了动态环境监控系统,并对运行中的主要问题进行了优化。


1系统监控对象

银行数据中心机房动力环境监测系统(以下简称动态环境监测系统)的监测对象可分为三类:一是监测设备动力系统的实时工作状态,如供配电系统的开关状态、UPS以及柴油发电机等设备的运行参数和状态;二是监测和控制机房内的运行环境,如温度、湿度、漏水、氢气浓度和消防;三是监控人员设备的进出,如门禁、摄像头、防入侵等安全设备。但机柜内服务器、交换机、加密机等安全或网络硬件设备的运行状态不包括在内,不在本文讨论范围内。


2系统架构设计


2.1设计原则

银行机房动态监控系统的设计应遵循“集中、集成、智能"的设计模式,采用高标准的监控系统设计原则,实现主动、高效、流程的监控管理。

稳定;安全;开放;可扩展性。


2.2系统架构

动态环境监控系统采用计算机网络、现代通信技术和控制技术,实时监控机房的动力设备和环境,实现无人值守机房的现代化管理。硬件采用三层架构:底层为现场设备层,由监控设备、I/O采集模块等组成;中间层为数据采集处理层,由各串口服务器、动环服务器、交换机等组成。顶层为数据应用层,由监控平台或客户端等终端组成。软件上使用B/S结构方面,在机房内安装各种传感器和数据采集设备进行底层数据采集,在统一的用户界面下集成所有子系统,统一监控、控制和协调各子系统,从而形成统一协同工作的整体。系统结构设计如图1所示。


图1动环监控系统架构设计


3系统实现


3.1工程概况

数据中心的主机房设置在66F,根据功能细分为服务器机房一、二、三、网络机房、配电室。A、B;重要断路器或配电间的开关,电量计,UPS以及防雷,主机房新风机,精密空调及漏水检测,机柜PDU、温度、湿度、防入侵(红外检测)应纳入动环监测系统。UPS电池室设置在-2F,柴油发电机之间的设置-1F,三个电源切换室设置在1F,运营室设置为7个F,安装在消防气瓶间F。动态环境监控系统的监控对象见表1。


3.2硬件构成

2台服务器(双机热备)动环监控系统、2台客户端PC机器,监控大屏幕,核心交换机(A、B网)、视频汇集交换机、门禁接入交换机、收集箱和串口服务器等。


3.3软件平台

采用动态环境集中监控平台软件B/S结构,通过在机房内安装各种传感器和数据采集设备进行底层数据采集,外部厂商设备需要提供通信接口及其开放通信协议进行数据“翻译"处理,通过机房监控平台进行集中监控,全中文、图形化;界面结构层次清晰,数据状态实时反映。集中监控平台可以在中文运行Windows操作系统。采用模块化设计的动态环境集中监控平台软件,可以分为采集层、处理层、管理层和展示层,如图3所示。其中,个人工作平台可以提供动环监控主界面、报警事件清单、待办事项、报警等级统计,PUE可自由选择的个性化定制界面,如实时曲线、基础设施分类饼状图等。详细的数据记录报表和数据分析报表可以根据机房管理的原始报表格式生成,存储格式为Excel或PDF;数据存储时间应长于一年,并具有防篡改功能。在软件交互界面中,动态环监控模块可以直观地看到每个机房的实时运行状态。机房名称、设备图标等超链接可以直接到达每个子界面。通过温度和湿度监控、门禁、视频监控、温度场、漏水监控、红外监控、消防监控等按钮。,可以直接到达每个子屏幕,并提供基于电子地图、实时曲线、饼状图、折线图、直方图等多种形式的数据显示模式,方便运维人员分析设备的历史运行趋势。


图2动力环境集中监控平台软件架构图

系统报警采用短信、电话、现场语音三种报警方式。报警等级分为三个等级:紧急、重要和一般。不同级别的报警通过不同的报警方式发送报警信息。系统可以自动提示报警,显示报警信息,无论系统在哪个图片。当报警状态解除时,系统可以自动发送相应的恢复短信,让机房管理人员随时掌握相关动态。


4系统运行中存在的问题及优化措施


4.1常见问题

自动环监控系统运行以来,监控平台数据没有刷新,监控平台电脑“假死",数据采集不准确,系统报警漏报、误报、频繁发生(报警信号抖动),报警延迟。

不刷新监控平台数据;数据采集不准确;实时报警问题;


4.2优化措施

(1)监控平台数据不刷新问题的解决方案。运维人员需要熟悉动态环境监控系统的结构和网络拓扑,从单点设备故障到网络故障排除。必要时,他们可以优化系统结构或网络拓扑,冗余备份采集设备或设备,或通信重要监控对象。A、B双网通信。

(2)采集数据的准确性。检查智能仪表设备或第三方设备的通信协议是否准确,并与原厂商的技术支持核实设备协议文本的正确性。如果更换智能仪表时没有核对通信协议,数据将不准确或无法收集。检查通信故障,首先检查物理连接是否有问题,然后检查通信配置,检查波特率、检查位置、串口设置等是否有问题。检查采集装置或采集箱、温湿度探测器等硬件本身是否有故障,排除设备硬件故障导致数据采集不准确的问题。

(3)优化实时报警问题。第一,严格控制智能设备的串联数量,避免串联设备数量过多导致数据上传缓慢,进而导致报警延迟。合理配置FSU通过调整动环设备的扫描周期,可以缩短采集装置对各测点的询问时间,从而提高采集速度。其次,合理选择设备测点,合理选择和优化重要测点,避免过度扫描测点造成收集器负担过重,进而影响收集效率。此外,运维人员应避免扫描非重要数据占用过多资源,造成收集缓慢。此外,通过软件控制频繁报警和非合理数据引起的报警,可以增加报警回差屏蔽功能。如果数据采集值超出合理范围,可以通过设置有效的阈值上下限来屏蔽这部分数据,消除误报警。除了在软件端屏蔽有效门限外,电磁干扰在传输过程中产生的误警也可以在传输线路上安装抗干扰磁环,以减少干扰。*之后,通过人工智能等先进手段,对报警逻辑关系进行分析,对报警信息进行合理分类。如果增加报警溯源功能,划分主次报警,确定报警设备的主从关系,进而有效优化报警信息,减少报警的“信息轰炸",同时不遗漏重要的报警信息。


5安科瑞动环监控系统解决方案

通过数据中心动态环境监控系统,实现了对数据中心的门禁状态、水浸状态、烟雾状态、视频状态、环境状态、高低压配电状态、设备运行状态的实时监控,并进行了实时报警,确保数据中心的正常运行,避免了配电设备运行故障,保证了维护人员的安全,延长了设备的使用寿命,降低了配电室的粗放式管理,导致成本过高。同时实现动态环境监控,分析各种能耗和能效,帮助用户优化能效。


5.1系统功能

(1)通过仪表盘直观展示当前数据中心的总能耗、IT能耗、空调能耗等能耗,并计算出当前数据中心的实时PUE值。

(2)选择查看数据中心中低压配电系统的主接线图,并在一张图中显示配电系统目前的遥测、遥信数据和状态。实时监控各配电柜的电压、电流等电力参数,变电站的温度、湿度、烟雾、水浸、门禁等环境条件。

(3)电气接头温度实时监测,无线测温传感器监测接头温度安装在断路器触头、触臂、母排和电缆连接处,便于提前发现温度异常引起的事故。

(4)监控负载率、频率、功率因数、三相不平衡等各种变压器参数。,并显示历时曲线图和实时数据变化。帮助用户直接

(5)电能质量在线监测,可监测暂态事件记录、ITIC容忍曲线等。电流和电压谐波畸变率、电压暂升暂降暂停等。

(6)系统采集UPS输入、输出端和旁路三相电压、电流、有功功率、功率因数频率,同时监控UPS温度、电池电压、当前负载下的剩余时间等数据。

(7)显示单个电池的电压、内阻和温度,预测电池携带时的剩余时间,每个电池数据都可以设置异常报警,及时发现电池异常。

(8)展示精密配电柜内进线和馈线电路的电气参数,包括电流、电压、功率、电能和开关状态,并可设置和分级数据,数据取自精密配电柜的测量模块。

(9)展示智能小母线的始端箱和插入箱的电气参数,包括电流电压、开关状态和插入点温度,并设置和分级数据。

(10)通过平面图显示数据中心的能源分布、设备分布以及设备的能耗数据。点击平面图上的设备进入具体的设备监控界面。

(11)当前数据中心的PUE值和历史PUE曲线实时显示。并显示每个子项目的能耗和能耗排名。监控变压器的运行和负载,并给出本月变压器的输出电能排名。

(12)显示每月/年的电能消耗报表,可以显示具体电路的曲线图和饼图。对数据中心用电数据进行同比和环比分析比较,查看用电趋势。

(13)监测精密空调的回风温度和湿度,并能设定精密空调的温度和湿度,从而达到更好的控制效果。

(14)监测数据中心的温度、湿度、开关门、水浸、烟雾、噪音、气体浓度等参数。曲线图直观清晰,支持历史数据查询

(15)通过列表显示各种报警事件的数量,通过柱状图显示每天的报警数量,提供报警总数和增长趋势。

维护管理功能,可对数据中心各主要设备进行巡检、消缺、抢修等维护工作。


5.2 安科瑞动环监控系统选型方案




6结语

动环监控系统在银行数据中心基础设施设备的运行维护中发挥重要作用,在一定程度上扮演了运维人员“眼耳鼻"的角色。动环监控系统的正常运行在于7×24h不间断服务和重要告警信息能及时通知相关运维人员。而动环监控系统稳定可靠正确运行的关键在于系统架构、供电及组网的设计。在运维过程中,系统难免会出现一些问题,需不断总结经验、梳理出问题并进行优化改进。本文基于银行数据中心动环监控系统建设实际出发,对该系统进行设计并实现,同时对运行出现的问题进行合理优化,结果证明该策略的可行性。




【参考文献】 

【1】万立勇.数据中心机房动力环境监控系统设计及优化探究.[J].电工技术,2022(15):164-167.

【2】李可,王甲甲.电力企业数据中心基础设施运行管理平台设计[J].数字技术与应用,2021(39):196-197.

【3】安科瑞企业微电网设计与应用手册2022.5版