Direkt zum Hauptinhalt
Diese Seite wird mit automatisierter Übersetzung angezeigt. Lieber auf Englisch ansehen?
Markenentwicklung 2022
Partnerlösung

Kontextualisierte OT-Datenpipeline in Databricks

Wie können wir zuverlässig herstellerunabhängige OT-Daten aus der Werkstatt sammeln, sie mit Anlagen- und Produktionskontext am Edge anreichern und eine kontrollierte, KI-fähige Kopie in Databricks für erweiterte Analysen, Industrial AI und Unternehmensnutzung bereitstellen?

Übersicht

Architecture Hub Databricks im Überblick

Siemens Industrial Edge zu Databricks

  1. Verbinden Sie herstellerunabhängige Werkstattausrüstung über vorkonfigurierte Anschlüsse mit Industrial Edge.
  2. Stellen Sie eine sichere und zuverlässige Verbindung zwischen Siemens Industrial Edge Devices und der Databricks Data Intelligence Platform her, indem Sie FFT DataBridge für die dateibasierte Aufnahme in Cloud-Objektspeicher verwenden (S3, ADLS oder GCS)
  3. Speichern und verwalten Sie harmonisierte Industriedaten im Databricks Lakehouse für skalierbare Analysen und Industrial AI.
  4. Führen Sie fortschrittliche Analysen durch und trainieren Sie KI-Modelle auf der harmonisierten Datenebene, einschließlich OEE-Überwachung, vorausschauender Wartung, Qualitätsoptimierung und agentischer KI-Anwendungen. Stellen Sie Modelle für eine Ausführung mit niedriger Latenz wieder auf Industrial Edge bereit.

Ein hybrides Edge-to-Cloud-Setup, bei dem Industrial Edge OT-Datenströme aufnimmt und anreichert, Telemetrie und Ereignisse an der Quelle ausrichtet und kontextualisiert, bevor sie über FFT DataBridge durch Streamingaufnahme in Databricks weitergeleitet werden. In Databricks werden die Daten auf den Ebenen Landing, Kuratierung und Analytik transformiert und strukturiert. Sie bilden die Grundlage für Unternehmen wie Advanced Analytics, Industrial AI, Modellentwicklung und Lebenszyklusmanagement, betriebliche Anwendungen und ermöglichen die Integration mit MES-, ERP- und SCADA-Umgebungen. Der Gesamtansatz ist darauf ausgelegt, KI-Bereitschaft, vertrauenswürdige und konsistente Daten, robuste Sicherheit, hohe Belastbarkeit und offene, anbieterneutrale Interoperabilität sicherzustellen.

    Edge-Sammlung und Kontextualisierung (Industrial Edge)

    Industrial Edge betreibt Geräte vor Ort in der Nähe der Werkstatt und stellt über OT-Stecker (OPC UA, Modbus, Ethernet/IP usw.) eine Verbindung zu herstellerunabhängigen Automatisierungsgeräten her. Es erfasst unformatierte Telemetrie, Alarme und Ereignisse.

    Am Edge werden Daten vorverarbeitet: Filterung, Komprimierung, Zeitstempelnormalisierung, Anreicherung mit Asset-Metadaten (Asset-Hierarchien, Arbeitsauftrags-/Batch-Kontext) und lokale Aggregation, um die Cloud-Bandbreite zu reduzieren.

    Ein interner Datenbus (MQTT/Unified Namespace) oder Industrial Information Hub verbreitet harmonisierte Themenströme für nachgelagerte Komponenten und lokale Verbraucher.

    Protokoll- und Formatüberbrückung

    FFT DataBridge (Edge-App) bereitet Daten für das Streaming und die Aufnahme in Databricks nahezu in Echtzeit vor und reichert sie an. Seine kostenlose Begleit-App, FFT DataService, greift auf kontextualisierte Daten von Industrial Information Hub Essentials (Edge App) zu und stellt sie FFT DataBridge zur Verfügung, die dann abgestimmte, kontextualisierte Datenströme über Zerobus veröffentlicht und so eine kontinuierliche Bereitstellung direkt in Unity Catalog-Tabellen ermöglicht.

    Um die Robustheit zu gewährleisten, verwendet die Lösung In-Memory-Buffering und lokale Persistenz, um Verbindungsunterbrechungen und längere Ausfälle zu überbrücken. Auf der Seite von Databricks werden Daten schrittweise in Delta-Tabellen unter Unity Catalog aufgenommen, was einen kontrollierten Zugriff mit niedriger Latenz für Downstream-Analysen und KI-Workloads ermöglicht. Die sichere Konnektivität wird durch token- oder schlüsselbasierte Authentifizierungsmechanismen aufrechterhalten.

    Databricks Datenintelligenzplattform

    Die Streaming-Aufnahme über Zerobus liefert kontinuierlich Daten an Databricks, wo eingehende OT-Payloads in Bronze-Delta-Tabellen geschrieben werden, die von Unity Catalog verwaltet werden, wodurch die Rohstruktur und Metadaten für eine vollständige Rückverfolgbarkeit und Überprüfbarkeit erhalten bleiben.

    Transformationspipelines, die mit Lakeflow Declarative Pipelines, Databricks Workflows und Apache Spark erstellt wurden, verfeinern die Daten schrittweise in Silver- (kuratierte) und Gold-Ebenen (analytisch), wodurch Zeitabgleich, kontextuelle Anreicherung und Bereitschaft zur Nutzung von BI sowie KI-gestützte Anwendungsfälle unterstützt werden.

    KI-Modelle werden mithilfe von MLFlow und Mosaic AI zentral in Databricks entwickelt und trainiert und können dann wieder auf Siemens Industrial Edge für eine Ausführung mit niedriger Latenz in der Nähe der Werkstatt bereitgestellt werden, was Closed-Loop-Optimierungen und physische KI-Szenarien ermöglicht.

    Unity Catalog setzt eine durchgängige Governance durch, einschließlich detaillierter Zugriffskontrolle, Datenmaskierung und Herkunftsverfolgung, während die Lakehouse-Plattform nativ auf AWS, Microsoft Azure und Google Cloud Platform läuft und eine cloudübergreifende Bereitstellung und nahtlose Datenmobilität unterstützt.

    Werte und Vorteile

    Komponenten