2021-09-07

武钢大数据智能数据中心项目——基于工业互联网技术的数据中心机房一体化监控系统的设计与实现

分享:

一、项目概况

1.项目背景

武钢IDC园区依托于中国宝武钢铁集团有限公司,园区内充沛的土地资源、充足的电力和水源的供应,可以为大客户提供定制化的数据中心机房和大批量的机柜空间,武钢IDC提供机柜、机房环境、网络及专业的环境运营服务、设备运行维护服务,可以帮助用户快速进行信息化的建设和运营。根据中国宝武集团的战略布局,在现有的武钢厂区内建设互联网数据中心机房,并对外提供租赁服务,外部企业可以租用数据中心资源,部署自身的业务系统,并且租用中国宝武集团的人力和技术资源进行数据中心的运行和维护。

2.项目简介

本项目采用计算机技术、网络技术、工业互联网智能控制技术、多媒体技术,数据可视化技术,对各监控子系统信息数据集中监测和管理,并能够通过客户端的管理软件,使获得授权的相关管理人员通过内部网络对机房内的监控平台运行状况进行管理。实现对于供配电监控系统、环境参数监控系统、楼宇自控系统、安防监控系统、消防报警系统以及监控中心辅助系统的监控和管理。

机房集中监控系统需满足用户的实际应用为出发点,兼顾系统的稳定性、可靠性及可扩展性,监控系统软硬件组成采用多层次结构,通过一体化的软件平台进行集成监控,以实现各子系统监控信息的共享与综合联动。

监控系统的硬件组成结构采用模块化、结构化设计,软件组成结构基于TCP/IP标准网络协议,采用分布式事务处理方式设计。实现监控网络、主机、以及各种监控功能的分布式架构,支持多种网络的接入和互连互动,进行大规模分散机房的集中监控。

各系统通过网络数据前置采集器,将前端传感器、智能设备等数据通过串行总线协议、以太网络协议等通讯方式进行数据采集,将数据上传给数据处理服务器,对数据进行分析、处理、存储,数据处理服务器将数据通过端口协议将数据传给中心管理服务器,由中心管理服务器最终统一管理、告警。

3.项目目标

基于Client/Server架构开发,整个平台的架构从下到上分为数据采集层、实时/历史数据处理层、应用展示层,具备集中配置的功能,配置信息保存在集中配置服务器中,分发至所有分布式的SCADA节点和HMI节点。

将监控客户端引申为HMI节点,即人机交互工作站节点,将监控服务器引申为SCADA节点,即数据采集和处理节点或称应用服务器。考虑实时监控领域应用规模的不同,本软件平台可根据工程需要部署一到多个HMI或SCADA节点,实现高性能、可弹性扩展的分布式系统架构,满足不同层次用户的多方面要求。

二、项目实施概况

1.项目总体架构和主要内容

(1)项目总体架构

1631693261380767.jpg

系统由中央监控大屏幕、监控服务器/客户端、智能设备/模块、各类传感器、协议转换模块、信号处理模块等组成。

(2)软件平台架构

1631693280268254.jpg

应用软件层面主要为三层架构:

数据采集层:用于数据采集,完成与外部系统之间的数据交换;

实时/历史数据处理层:用于数据管理和高级应用功能,采用实时数据库和历史数据库技术;

应用展示层:主要用于HMI 功能,数据源于本地采集或中心服务器,在操作员工作站上实现。

(3)主要内容

Ø  设备的实时/历史数据展示

实现对IDC机房内监控设备的相关设备信息进行集中展示,用户可以在画面中查看设备的重要信息数据;可在组态画面中查看设备的详细数据、历史趋势图等动态数据。

通过系统软件的数据分析和报表服务,可实现每小时、逐日、逐月、逐年设备数据的统计和分析,实现单体数据或总体情况的报表查询和打印。

Ø  系统告警

预先设置告警阈值,在监控参数在告警阈值外时,及时给出声光报警,提醒监控管理人员进行处理。

Ø  数据采集和压缩存储

设备数据采集统一采用宝信数据采集网关,将各类监控子系统的监控数据进行采集、预处理和编码上传。通过高性能实时数据库与数据采集网关的无缝对接,实现原始设备海量数据的实时采集和压缩存储。

Ø  系统数据外联

数据外联支持如下2种方式:

产品本身对外提供SDK接口,通过SDK进行二次封装,实现基于TCP协议的数据交互接口。

根据双方约定的私有协议进行定制化开发,实现远程数据上传的功能。

2.具体应用场景

本系统的监控范围包括:供配电系统(高低压供电监视、应急电源系统监视)、机房环境监测(温湿度、漏水)、暖通系统(制冷系统、精密空调系统、送排风系统)、水处理系统、安全防范监控子系统、视频监控子系统、消防报警系统以及上述子系统重要监控参数的上传。

(1)供配电系统监测

对于安装电量、智能电表等监测仪监测机房配电柜、UPS配电柜、高压配电柜的供电状况及参数,通过通讯协议将参数传输至监控主机。

一旦供配电系统工作状态不正常,系统会弹出报警画面,通过多媒体声音,告知值班人员。

本系统监视参数主要包括:

中压开关与低压开关的状态监视及故障报警(低压配电柜&电源列头柜)

中压与低压主母排的电压、电流、频率、有功功率、无功功率、视在功率及功率因数测量;

有功电度,无功电度的测量;

变压器温度监测及超温报警;

回路开关的通断状况;

备用及应急电源的手动/自动状态;

防雷器运行状态;

IT 设备的总功耗,其他用电设备的总功耗及各个能量表的功耗,每个机柜的总电流、总功耗、总电能等。

本系统报警主要包括:

市电停电报警,电压超高报警,电压超低报警,频率超高报警,频率超低报警,开关断开报警;

本系统记录数据的颗粒度:

监控系统应每小时、逐日、逐月、逐年存储电量仪、智能电表的以下电量数据(平均功率与单位时间内累计用电度数):输入数据中心的总电量、IT设备用电量、冷却系统用电量、其它耗电量、计算PUE值(时均值、日均值、月均值、年均值)。数据记录应至少存储五年,记录的粒度为每小时一次。

(2)不间断电源系统

通过集成平台,对机房UPS设备进行统一监控,保证UPS设备在运行时的各种参数可见,保证系统的正常运行。

系统主要监视UPS 及高压直流系统(电压,电流,功率因素,谐波率,有功功率、无功功率变化情况负载不平衡,输入中断, 电池放电状态,交流电源失效,逆变器状态,旁路状态,报警状态,电池端电压,电池 温度,电池内阻值等);

UPS监控系统通过网络方式对分布在底层的UPS(不间断电源)设备的关键参数(如工作状态、电压、电流等等),进行集中监测。在外部电力供应发生异常,或者UPS设备状态异常时,使用明确醒目的文字,以及特殊的声音信号提示管理人员及时进行处理,以确保电力供应的正常。

(3)ATS监控系统

ATS的运行状态,实时监视电压、电源、频率、有功功率、视在功率、无功功率等参数。

(4)发电机监控系统

实时显示并保存发电机组的各监测参数的数值,设定电压、电流的上限值与下限值,当监测的电压或电流超过设定的允许值时,系统诊断为有故障(报警)事件发生,监控主系统发出报警。

实时监测发电机组所发电的相电压、相电流、相功率、频率、功率因素、总功率、油位、启动电池组电压、油温、冷却剂温度、水套加热器,以及柴油发电机的启停状态,手自动状态、远程本地状态、故障状态、输出电压、电流、转速、频率、功率、油压、油温、燃油液位等。

(5)空调监控系统

通过精密空调厂家提供的通讯协议及通讯接口对空调运行状态及参数进行监控。一旦有故障发生,自动弹出报警画面,通过多媒体声音,告之相关人员。

以下描述的系统功能的提供,需要依赖最终子系统的具体设备能力:

监视参数主要包括:

送回风温度和湿度测量值,送回风温度和湿度设定值,偏移量、运行状态,手自动和故障状态;

压缩机状态,风机转速,水阀开度,供回水温度、过滤器情况,风机盘管机组的室内温度测量值;

监视风机、冷凝器、加湿器、去湿器、加热器的状态。

控制功能包括:

远程开机、远程关机。

报警主要包括:

送风温度、湿度超限报警。

(6)冷冻站、冷却塔监控系统

数据采集前置机与冷冻机组、冷却塔主控器做接口通讯,实现在集中监控平台上显示,主要内容如下:

压缩式制冷机系统和吸收式制冷系统的运行状态监测、监视、故障报警、启停程序配置、机组台数或群控控制状态、机组运行均衡控制及能耗累计;

蓄冰制冷系统运行状态显示、故障报警、制冰与融冰控制、冰库蓄冰量监测及能耗累计;

冷冻水供、回水温度、压力与回水流量、压力监测、冷冻泵启停状态显示、冷冻泵过载报警、冷冻水进出口温度、压力监测;

冷却水进出口温度监测、冷却水泵启停状态显示、冷却水泵故障报警、冷却塔风机状态显示、冷却塔风机故障报警。

(7)新风系统

实时监控新风机的运行状态、风机前后的风压。

(8)水处理系统

实时监控水处理器、过滤器、定压补水装置等设备的运行状态等。

(9)温度、湿度监控系统

对计算机等电子设备产生影响的各种因素中,温湿度的影响是非常重要的。本项目监测对象为所有机房及主配线区(MDA)内冷通道区域与热通道区域的温度、湿度以及露点温度。

温湿度监控主要功能如下:

监控系统以直观的画面实时显示温湿度与露点温度数据;

可以根据需要人工设定温湿度报警的阈值,包括超低值、低值、高值、超高值,一旦温湿度达到相应的阈值就会进行越限报警,自动弹出报警画面,通过多媒体声音,告之相关人员;

可查询统计历史温湿度与露点温度,方便进行统计与分析。

(10)机房漏水检测

检测空调、冷源系统等是否存在冷凝水滴漏或其他漏水情况。

采集漏水检测器的检测状态,实时监测是否存在漏水,检测感应线的状态,在界面上标示感应线漏水感应位置,便于维护人员发现漏水时及时找到漏水点,进行处理。系统同时记录断线、漏水的历史信息,供报表查询。

通过配置漏水报警,一旦发生漏水监控平台界面自动弹出报警画面(以及其他报警方式,如:短信、语音等),同时可以执行相应联动操作。

记录断线、漏水的历史信息,供报表查询。

(11)CCTV系统集成

设计监控摄像机图层,可以通过点击摄像机图标,进入该摄像机监控界面,查看视频图像。

目前视频监控系统与视频矩阵的兼容性强,保证系统的可集成和可扩展性。

视频监视的主要功能:

实时视频调看

历史视频记录

历史视频查询/调看

调节画面图像;

进行图像抓拍;

查看抓拍图片;

视频轮询;

提供联动接口。

(12)门禁监控系统集成

监控集成平台通过与门禁控制器对接,实现:

实时监控和显示系统监测门的开关状态。

记录刷卡进出的时间、门区及卡号,分类查询进出门统计资料和报警资料,为事后追溯提供依据。

(13)消防系统集成

本系统与消防系统建立通讯链路,且当报警发生时提供显示和定位,并实时联动,查看现场视频摄像头图像,对现场火灾情况进行远程核实。在视频系统与消防系统进行联动的同时,通过集成平台的综合联动功能,通知各个相关部门和人员,快速处理。

与消防系统的集成功能有:

发生火灾和设备故障时报警;

定位火灾发生地点;

显示各种预定义联动的子系统的内容;

发出联动信号;

进行跨系统联动处理;

摄像机、NVR状态监测与报警。

(14)数据上传

数据中心的使用单位,需获取本系统中各子系统的监测参数,双方约定接口通信协议,进行请求和上传;

(15)时钟同步

系统具备与时钟服务器对时的功能,并且作为系统内的标准时钟,相各子系统分发。

3.安全及可靠性

(1)高安全性

提供面向监控领域的高性能和高安全性授权系统他可对监控系统中需要授权的各类资源,如变量、联动动作、视频摄像头等进行集中配置和管理,并能在客户端和服务端实现高性能授权,满足实时监控的高安全性要求,支持集中分布式授权方式。

(2)高可靠性

系统提供了高性能、完善的冗余机制,通过将两台主控服务器组建冗余热备,在正常状况下,主备两台服务器间保持数据同步;当其中一台服务器出现异常时,另一台服务器立即接管所有数据业务和逻辑处理功能。对软件平台的异常进行自动判断并完成切换,具备优异的热冗余备份切换效果。

三、下一步实施计划

1.构建企业总控中心集中管控平台

根据规划,未来武钢大数据园区还要建设多个数据中心大楼,我们计划利用一体化监控指挥平台的分布式部署的技术,可以在同一监控中心,对数据中心园区的各栋数据中心大楼实现更加灵活的监控和管理。在管理上,可以设置唯一的监控中心,也可以采用总中心/分中心的方案,从而实现企业总控中心(ECC)集中管控。

2.数据中心运营管理平台的研发

随着数据中心行业的发展,IDC运营的标准化、体系化、平台化越来越受到大家的重视,DCOM(Data Center Operation Management),即数据中心运营管理,定位于数据中心资源与运营工作的信息管理,它的作用一方面是维护管理IDC的资源,另一方面是规范运营工作流程,使得IDC运营管理更加规范、高效执行且过程可追溯。研发数据中心运营管理平台,已提上武钢大数据的议事日程。

四、项目创新点和实施效果

1.项目先进性及创新点

(1)虚拟化技术的应用

本项目中采用了虚拟化技术,将计算机的实体资源,如服务器CPU、内存、网络、存储等资源,予以抽象、转换后呈现出来,打破实体结构间的不可切割的障碍,使用户可以比原本的组态更好的方式来应用这些资源。

采用Hyper-V虚拟化软件,结合Windows Cluster故障群集管理,实现虚机的创建、以及运行时的负载均衡和高可用性,使得服务器资源得到充分利用,系统更加安全和稳定。

(2)自有软硬件平台产品的应用

本项目使用了中国宝武旗下宝信软件自主研发的平台软件产品,包括宝信一体化监控指挥平台iCentroView,宝信高新能实时数据库软件iHyperDB,宝信工业通信网关iCentroGate,使得所实现的应用系统稳定性高,性能优越。

Ø  宝信一体化监控指挥平台iCentroView

iCentroView一体化监控指挥平台,是先进可靠、集众多功能为一体、可灵活配置、实施简便的综合指挥平台,集存储、监视、控制、报警、联动、指挥等众多功能为一体,具有“集中管理、分散控制、全面监控、安全联动”等特点。产品从技术、设计、开发、维护等各个方面保证系统的先进性,是一体化监控的有力工具。iCentroView平台提供给用户丰富的展现方式,包括统一客户端显示框架、组态、报表、统计图、趋势图等工具,并支持模块化开发方法,具有强大的脚本编辑工具可以快速应用于不同业务领域内,搭建出用户所需的监控平台。

Ø  宝信高性能实时数据库iHyperDB

iHyperDB高性能实时数据库产品采用高效的事务调度策略实现多线程并发技术,利用工业数据的时序特点进行数据压缩保证实时性;针对内存、磁盘IO和网络吞吐的特点,进行多层级数据缓冲,实现了极高的数据IO异步并发存储性能;采用了独特的数据安全保护机制,在高速存储的情况下能够保证数据安全。

产品可以实现工控数据的采集、存储、检索、展示和分析功能,通过基于Web的方式,以多种表现形态(历史趋势、柱状图、实时数据、表格与报表等)提高后台海量数据的可视性,为决策者提供最直接的决策依据。

Ø  宝信工业通信网关iCentroGate

iCentroGate工业通信网关是一款全新的工业数据采集转发设备,集通讯接口服务器、工控机、工控软件于一体的智能设备,具有以下功能:

支持多种通讯链路,如RS232/422/485、CAN、以太网、WIFI、Zigbee、GPRS/WCDMS/CDMA2000等;

支持采集工业现场的多种工业设备协议,并以多种工业设备协议向其他系统或设备提供数据分发服务。

支持众多高级的功能特性,如:脚本系统,数据存储,设备报警,触发器,远程同步更新,网管系统等。

基于互联网的应用开发,交流互动,在线调试,技术支持。

图形化的操作配置,操作较为人性化。

2.实施效果

武钢大数据响应《中国制造2025》以及十九大报告中“建设科技强国、网络强国”号召,在武钢数据中心建设中勇于创新,勇于实践,目前已经实现的武钢数据中心一体化监控平台,为现场监控管理人员以及管理者提供了监控管理、运营协调的安全稳定、简捷高效的监控软件应用系统,提高了数据中心运营水平,提升了数据中心的形象。