数据可用性的未来正成为许多工业设施关注的焦点。越来越多的公司正在利用各种智能制造工具和技术,如工业物联网(IIoT)和边缘计算,对运营进行数字化改造,并做出实时、数据驱动的决策。这些技术的增长速度比预期要快得多,我们已经看到了越来越多基于云连接的数据共享。现在可以从生产商、分销商、供应商、客户等处发送或接收数据。
如今,随着企业使用各种形式的编程语言(如Python)开发数据采集软件程序以帮助捕获关键任务数据,数据采集软件程序的数量继续增长。为了跟上这个不断增长的大数据环境的步伐,建立数据采集的最佳实践非常重要,不断升级和改进数据模型的需求也很紧迫。随着数据流的变化,有必要持续检查是否添加了新内容。这种质量控制方法,可确保设施人员识别、采集和分析正确的数据,以成功提高运营生产效率、敏捷性和灵活性。
从边缘采集数据
边缘计算技术变得越来越便宜,因此在业界越来越受关注。从边缘采集数据变得越来越重要,这使其成为关键数据采集的最佳实践。边缘数据也成为了最新的数据采集系统的一部分:
●传感器:将物理参数转换为电信号;
●信号调节电路:将传感器信号转换为“可转换为数字值”的格式;
●模数转换器:将调节后的传感器信号转换为数字值;
●边缘数据:通过Rest API或数据存储设备以消息的形式传递数据。数据以消息传递格式创建,并通过云服务或网络应用程序编程接口(API)进行传输。
一些应用需要立即获得计算能力并访问数据。边缘计算可简化来自IIoT设备的数据流,以进行实时数据分析。来自现场传感器的数据先被写入边缘设备,然后再写入边缘基础架构。来自边缘基础设施的数据,以较低的往返时速,被复制到中央数据中心(通常在云端)。
在边缘采集数据的优势是以几乎实时的速度,从企业的偏远位置将信息传送到数据采集系统的核心。拥有尽可能多的、可用于决策的数据,有助于企业保持竞争力。
除了边缘技术,更多具有嵌入式历史数据库的设备投入应用。例如,成套资产可以采集数据并将其发送给主历史数据库。历史数据库(例如OSIsoft PI和罗克韦尔自动化的Factory Talk 历史数据管理软件等)可以从自动化过程的核心——仪表和控制系统,采集和存储选定的数据。
正因如此,在诸如边缘设备之类的新技术辈出的时代,及时了解及更新这些核心仪器和控制源,是重要的数据采集最佳实践。根据设施的数据采集要求,这些数据源可以使用数据分析工具捕获、生成、组织和管理对业务有价值的数据。
接口和云服务类型
有几种不同类型的接口和云服务可用于采集和存储数据。了解各种接口节点,是另外一个数据采集最佳实践。为了确保能够从数据采集控制系统采集过程数据,并将其写入历史数据库,最常用的标准接口类型包括:
●用于过程控制的OLE(OPC):一种软件接口标准,允许Windows程序与工业硬件设备进行通信。
●OPC实时数据访问规范(OPC DA):无需自定义驱动程序/连接器,即可与各种源进行通信。
●OPC历史数据访问规范(OPC HDA):出于优化、库存控制和合规性等多个目的而对历史过程数据行检索和分析。
●通用文件和流文件加载(UFL):读取ASCII数据源,并将数据写入PI历史数据库。
除了这些标准的连接和接口,行业还使用三种不同类型的云服务模型:
●软件即服务(SaaS):一种软件销售模型,第三方供应商托管应用程序,并通过因特网将其提供给客户使用。一些示例包括Google Apps、DocuSign和Slack等。
●平台即服务(PaaS)或应用程序平台即服务(aPaaS):一种云计算产品,服务提供商提供一个平台,使客户能够开发、运行和管理业务应用程序,而无需维护软件开发过程通常需要的基础设施。PaaS的示例包括AWS Elastic Beanstalk和Google App Engine等。
●基础架构即服务(IaaS):是一种服务模型,可外包提供计算机基础架构以支持企业运营。IaaS提供硬件、存储、服务器和数据中心空间或网络组件。IaaS的示例包括亚马逊AWS和微软Azure等。
这些服务通常被称为“云计算堆栈”。IaaS位于堆栈的底部,PaaS位于中间,SaaS位于顶部。通过云服务采集的数据,可以通过云连接器安全地从一个数据源传输到另一个数据源。当多个位置需要在自己的服务器上采集数据,并在整个企业中共享时,此方法非常有用。
图1:简单的数据采集系统网络连接。本文图片来源:MAVERICK Technologies
保障数据系统安全
随着对数据安全性要求的提升,高可用性系统提供了尽可能多的冗余和数据防护。图1给出了简单数据采集系统网络连接是如何设计的。与之类似,图2说明了更复杂的高可用性数据采集系统是如何设计的。
图2:复杂的高可用性数据采集系统网络连接。
在发生故障时,高可用性系统可以通过主、辅助服务器的切换来提供保护。 如果主服务器发生故障,则切换到辅助服务器继续采集数据。利用通知提醒相关负责人系统出现问题了。问题解决后,主服务器则处于备用状态,在辅助服务器出现其它问题时接管监控服务。该装置对于很少停机的设施非常有用,可以进行例行软件更新甚至版本升级,不会影响生产。
数据缓冲、备份和扫描
缓冲、数据备份/存档和扫描类是数据采集常用的最佳实践,因此务必要审慎考虑并理解它们:
●缓冲是接口节点的功能,它可以访问和临时存储所采集的接口数据,并将其转发给适当的历史数据库。为了有效采集数据,建议在接口节点上启用数据缓冲。否则的话,如果接口节点与历史数据库的通信中断,则采集的数据就会丢失。一些行业对数据完整性有严格的指导原则。可能需要在PLC或DCS层面配置缓冲功能,以消除或最小化由于网络连接故障而导致的数据丢失。目前正在进行改进,以防止因电源故障等情况而造成的数据丢失。例如,可以实施管理控制来满足数据采集系统的限制,以确保过程数据的完整性。
●数据备份用于在数据丢失、损坏或破坏的情况下恢复数据。备份策略是保护当前/即时数据的关键。在发生意外时,协议文档对于备份和还原数据至关重要。数据档案可以保护历史信息,虽然这些信息对于日常业务运营而言并非必需,但在各种业务决策中偶尔也会需要。数据归档就是将当前不再使用的数据,转移到独立存储设备上。数据档案已建立索引,并具有搜索功能,可帮助查找和检索文件。
●历史数据库接口使用被称为“扫描类”的代码,以不同的时间间隔扫描标签并规划数据采集。扫描类以小时、分钟和秒为单位确定扫描时间间隔,规定历史数据库多久采集一次数据。了解要采集的数据,对于设置扫描类至关重要。温度、液位、压力和流量等数据需要更快的扫描速率。用于启动泵或打开阀门的数据,仅在状态更改时才需要写入。正确设置扫描类可确保系统尽可能高效地运行。
数据组织和元数据
如今,很多制造企业都在寻找合适的方法来组织数据,作为其数据采集最佳实践的一部分。例如,OSIsoft的PI服务器最常用的组件是资产框架(AF),它使组织和共享数据变得更容易。它可以集成、情境化、细化、引用和进一步分析来自多个来源甚至是外部关系数据库的数据。AF允许用户创建部件/资产及其所有属性(包括元数据)的层次结构。
现在,利用可视化工具和资产框架,最终用户可以体验来自历史数据库以外的数据。使用部件相关模板,可以大大减少相似资产所需画面的数量。例如,罐、泵、电动机、搅拌器或发电机可以使用单个图形/显示模板。与资产相关的特定数据占位符,可根据所选资产进行填充。图3是设施发电机组模板示例。请注意,数据可以直接来自历史数据库,也可以来自维护跟踪源或MES或ERP等平台的元数据。
图3:用于设施发电机组的模板示例。使用部件相关模板,可以大大减少相似资产所需画面的数量。
“元数据”是一组数据,它描述并提供有关其它数据的信息。使用软件编码的连接器,可以访问来自所有类型的数据源中的数据。将元数据链接到资产的能力,提供了一些独特的方式来采集、分析、可视化和报告过程条件。
随着技术变得越来越复杂,数据采集模型也需要随之做出改变。无论是刚开始采集数据,还是已经使用有段时间了,尝试从数据采集的最佳实践中获益都是一项挑战。
在资源带宽有限的情况下,请考虑咨询第三方自动化解决方案供应商或系统集成商,以帮助设计、建造、维持或改进下一个数据采集项目。随着制造商对数据可用性路径的了解日益深入,边缘计算和基于云的服务等新技术,可以增强数据采集的效率,从而帮助企业获得更多竞争优势。(作者:Brian E. Bolton)