Purdue模型的更新——创建适合过程行业的大数据采集和分析架构 - 从自动化的角度聚焦物联网的发展-控制工程网

社区公告

物联网与自动化一脉相承，本社区从工业控制和自动化的角度解读物联网产业的发展，向您介绍最新动态、技术和应用。欢迎您加入社区第一时间得到社区更新。

社区成员更多>>

其他行业社区

您所在的位置：首页 > 产业动态

Purdue模型的更新——创建适合过程行业的大数据采集和分析架构
发布时间：2019-10-29 来源：控制工程网
　　对数据和高级分析的讨论，需要从摩尔定律开始。 1965年，英特尔的联合创始人戈登·摩尔（Gordon Moore）注意到芯片上的晶体管数量每年都会翻倍，而价格却降低了一半。他预测这种趋势会持续下去。尽管最近每个芯片的晶体管数量已经放缓，但研究人员发现该概念仍然大致正确。
　　数据存储价格大大降低，但计算机的尺寸却只有过去的几分之一。可以在相同尺寸和价格的芯片上，执行更多的计算。
　　市场转型的结果是带来了数据爆炸；普遍的传感和连通性；具有500亿端点的物联网（IoT）；以及今天的智能手机在计算、存储和输入/输出（I/O）方面比早期的大型机甚至深蓝计算机（1997 / IBM）能力更强。
　　这种无处不在且价格低廉的计算所带来的结果，使过程行业制造商有机会通过实施在过去十分昂贵的方案，来重新设想他们的数据分析策略。在过去，由于收集、存储和分析数据的成本很高，因此需要将数据集中起来，以便进行分析。
　　模型的更新
　　新技术的涌现和普适计算的推行，意味着Purdue模型的集中式方法（图1）需要不断适应新的发展和机遇。集中式模型是全球过程工厂中最常见的架构，用户对此非常熟悉。

图1：数据收集、存储和分析带来的新架构爆炸式的增长，正在改变Purdue模型。图片来源：Seeq

　　Purdue模型的更新，充分利用了以下新技术：
　　●无线系统，将新传感器集成到工厂内或远方现有控制和监控设施中，以扩展对运营的可见性。
　　●边缘计算，这是一个包含本地数据存储、分析和运营的广义术语。
　　●云计算，它只需从供应商处租用计算、存储和分析资源。通常有两种方案可以选择：第一种是采用“直接上云”的方法，多用于传感器遥测的数据收集、存储和分析。这通常被称为工业物联网（IIoT）典型应用，其中数据直接从端点传输到云端。第二种方案是，对于已经收集的数据进行进一步汇总，使用企业历史数据库，或与其它制造和业务数据集相结合，从而可以在工厂范围内进行比较，以实现更广泛的分析，这通常被称为数据湖（Data Lake）。
　　这些方法并不是唯一的，大多数公司可以使用多种方法。例如，工厂可以从新部署的无线传感器中引入数据，以增强现有的工厂分析。可以与来自供应商的数据、来自原材料运输的数据（如温度和湿度）以及来自质量仪表的数据相结合，以获得更丰富的分析和见解。
　　借助本地云物联网方案，可以将数据从新传感器直接路由到公司的IT部门服务器机房，以确保严格的数据管理并解决安全问题。专注于边缘计算的供应商将难以解释边缘计算组件与实时单元（RTU）的区别。推动数据湖的云供应商可能很难解释为什么他们的方法与单个工厂数据的企业历史记录大不相同。
　　技术产品显然比用于解释它们的语言发展得更快。有时，整个工厂都被认为是新的边缘装置。另一个问题是创新与实施时间的不匹配。产品和营销可以在一夜之间发明，这比部署成功的证据和最佳实践要快得多。

图2：通过AWS Outposts和类似服务将供应商的云软件平台布置在客户IT部门本地运行的服务器硬件上，从而创建本地云。

　　灵活性受到更低成本和改进连接性的驱动，这些连接用于确定哪里以及如何部署传感器、数据收集、存储和分析。由于新创新技术和标准的快速发展，对可能的数据架构和权衡的全面了解将远远超出描述的范围。
　　以下是有关普适计算对数据创建、收集、存储和分析的工厂体系结构造成影响的4个注意事项。
　　1.起点是什么？
　　对于新的传感器部署，即使云是本地数据中心的硬件，收集的数据也驻留在云中。这更适合于监视/可见性，因为除了满足大量数据安全要求之外，架构还必须支持通信中断。微软、亚马逊、谷歌和100多家初创公司，包括用于工业的无线公司，提供了一整套“优势洞察”软件。这种方法可提供快速部署和新的云服务。
　　如果是对于老旧的设施或者棕地工厂，其解决方案的重心是将数据继续保留在内部。低延迟、有保证的网络和本地数据访问都是此模型的关键数据，这些解决方案已经成熟并可以保证正常运行。对棕地工厂而言，更可能的情况是通过本地无线解决方案或通过相邻的基于云的系统扩展其数据收集，并可将数据与其工厂系统集成。无论是在本地还是在云中，数据都可以灵活地使用此模型。
　　2.资产有邻居吗？
　　在边缘计算模型中，实体是可以单独分析任何资产，诊断其预测性故障，并优化运行性能的对象。如果资产独立运行，则这是有意义的，可以为高价值资产创建一个更智能的RTU模型。
　　但是，如果资产具有与过程单元或机器生产线相邻的邻居（现实应用场景通常是这种情况），则数据收集和分析应该发生的位置并不明显。可能发生的情况是相邻资产争夺资源以实现状态优化。这种情况所需要的是优化整个工艺单元或生产线。这就需要汇总来自生产线上多个资产的数据，除非它是更大装置的一部分。
　　如果不是在独立的资产场景中，还需要仔细规划收集、存储和分析数据以进行优化的位置。即使是对于在工厂车间无法获得的定价、能源和其它输入，最好的结果可能仍是采用中央数据收集和分析模型。
　　3.谁拥有这些数据？
　　对于新的计算体系结构，问题是数据应该存储在哪里以及由谁存储。资产供应商越来越多地为他们销售的资产提供远程监控服务。有关数据治理的结果需要考虑的问题包括：
　　●谁拥有生成的数据？
　　●数据是否被复制两次（发送给监控供应商和工厂所有者）？
　　●资产数据的移动方式和位置（安全性、无线、云端）？
　　●如何将这些分析提取出来并集成到客户的系统中以进行运营改进？
　　4.如何利用数据？
　　超出实时控制和监控所需的数据输入，通常被用于优化资产、生产线或工厂性能。这需要高级分析、可视化和情境化数据以创建有效的分析。生产优化减少了员工的加班以及备件的紧急订单等，也是工厂工程师和专家具有如此令人鼓舞的就业前景的原因。（作者：Michael Risse）