Skip to main content
Cette page est générée par traduction automatique. Voulez-vous afficher la version originale en anglais ?
Évolution de la marque 2022
Solution partenaire

Pipeline de données OT contextualisé vers Databricks

Comment collecter de manière fiable des données OT indépendantes des fournisseurs dans l'atelier, les enrichir avec le contexte des actifs et de la production à la périphérie, et fournir une copie régie et prête à l'intelligence artificielle dans Databricks à des fins d'analyse avancée, d'Industrial AI et de consommation d'entreprise ?

Vue d'ensemble

Présentation des données du hub d'architecture

Siemens Industrial Edge to Databricks

  1. Connectez des équipements d'atelier indépendants des fournisseurs à Industrial Edge via des connecteurs préconfigurés.
  2. Créez une connexion sécurisée et fiable entre Siemens Industrial Edge Devices et la plateforme Databricks Data Intelligence à l'aide de FFT DataBridge pour l'ingestion de fichiers dans le stockage d'objets sur le cloud (S3, ADLS ou GCS)
  3. Stockez et gérez des données industrielles harmonisées dans le Databricks Lakehouse pour des analyses évolutives et une IA industrielle.
  4. Effectuez des analyses avancées et entraînez des modèles d'IA sur la couche de données harmonisée, y compris la surveillance de l'OEE, la maintenance prédictive, l'optimisation de la qualité et les applications d'IA agentic. Redéployez les modèles sur Industrial Edge pour une exécution à faible latence.

Une configuration hybride de la périphérie au cloud dans laquelle Industrial Edge ingère et enrichit les flux de données OT, en alignant et contextualisant la télémétrie et les événements à la source avant de les transmettre via FFT DataBridge par le biais de l'ingestion en streaming dans Databricks. Au sein de Databricks, les données sont transformées et structurées selon les niveaux de destination, de conservation et d'analyse, constituant ainsi la base de l'entreprise pour : les analyses avancées, l'Industrial AI, le développement de modèles et la gestion du cycle de vie, les applications opérationnelles et l'intégration aux environnements MES, ERP et SCADA. L'approche globale est conçue pour garantir la préparation à l'IA, des données fiables et cohérentes, une sécurité robuste, une haute résilience et une interopérabilité ouverte et indépendante des fournisseurs.

Architecture détaillée

    Collecte et contextualisation Edge (Industrial Edge)

    Industrial Edge utilise des appareils sur site à proximité de l'atelier et se connecte à des équipements d'automatisation indépendants des fournisseurs via des connecteurs OT (OPC UA, Modbus, Ethernet/IP, etc.). Il acquiert des données de télémétrie brutes, des alarmes et des événements.

    À la périphérie, les données sont prétraitées : filtrage, compression, normalisation de l'horodatage, enrichissement avec les métadonnées des actifs (hiérarchies des actifs, contexte des bons de travail/des lots) et agrégation locale pour réduire la bande passante du cloud.

    Un bus de données interne (MQTT/Unified Namespace) ou un Industrial Information Hub diffuse des flux thématiques harmonisés pour les composants en aval et les consommateurs locaux.

    Passerelle entre protocoles et formats

    FFT DataBridge (application Edge) prépare et enrichit les données pour le streaming et l'ingestion en temps quasi réel dans Databricks. Son application complémentaire gratuite, FFT DataService, accède aux données contextualisées de l'Industrial Information Hub Essentials (application Edge) et les met à la disposition de FFT DataBridge, qui publie ensuite des flux de données alignés et contextualisés via Zerobus, permettant une diffusion continue directement dans les tableaux gérés par Unity Catalog.

    Pour garantir sa robustesse, la solution utilise la mise en mémoire tampon et la persistance locale pour pallier les interruptions de connectivité et les pannes prolongées. Du côté de Databricks, les données sont ingérées de manière incrémentielle dans les tables Delta sous Unity Catalog, ce qui permet un accès régi à faible latence pour les analyses en aval et les charges de travail liées à l'IA. La connectivité sécurisée est maintenue grâce à des mécanismes d'authentification basés sur des jetons ou des clés.

    Plateforme de data intelligence Databricks

    L'ingestion en streaming via Zerobus fournit des données en continu à Databricks, où les charges utiles OT entrantes sont écrites dans des tables Bronze Delta régies par Unity Catalog, préservant ainsi la structure brute et les métadonnées pour une traçabilité et une auditabilité complètes.

    Les pipelines de transformation créés avec Lakeflow Declarative Pipelines, Databricks Workflows et Apache Spark affinent progressivement les données en couches Silver (curated) et Gold (analytique), permettant ainsi l'alignement temporel, l'enrichissement contextuel et la préparation à la consommation de BI, ainsi qu'à des cas d'utilisation pilotés par l'IA.

    Les modèles d'IA sont développés et entraînés de manière centralisée dans Databricks à l'aide de MLflow et Mosaic AI, puis peuvent être redéployés sur Siemens Industrial Edge pour une exécution à faible latence à proximité de l'atelier, ce qui permet une optimisation en boucle fermée et des scénarios d'IA physiques.

    Unity Catalog applique une gouvernance de bout en bout, y compris un contrôle d'accès précis, le masquage des données et le suivi de la généalogie, tandis que la plateforme Lakehouse fonctionne en mode natif sur AWS, Microsoft Azure et Google Cloud Platform, permettant un déploiement intercloud et une mobilité fluide des données.

    Valeurs et avantages

    Composants