Solution partenaire

Pipeline de données OT contextualisé vers Databricks

Comment collecter de manière fiable des données OT indépendantes des fournisseurs dans l'atelier, les enrichir avec le contexte des actifs et de la production à la périphérie, et fournir une copie régie et prête à l'intelligence artificielle dans Databricks à des fins d'analyse avancée, d'Industrial AI et de consommation d'entreprise ?

Vue d'ensemble

Présentation des données du hub d'architecture

Siemens Industrial Edge to Databricks

Connectez des équipements d'atelier indépendants des fournisseurs à Industrial Edge via des connecteurs préconfigurés.
Créez une connexion sécurisée et fiable entre Siemens Industrial Edge Devices et la plateforme Databricks Data Intelligence à l'aide de FFT DataBridge pour l'ingestion de fichiers dans le stockage d'objets sur le cloud (S3, ADLS ou GCS)
Stockez et gérez des données industrielles harmonisées dans le Databricks Lakehouse pour des analyses évolutives et une IA industrielle.
Effectuez des analyses avancées et entraînez des modèles d'IA sur la couche de données harmonisée, y compris la surveillance de l'OEE, la maintenance prédictive, l'optimisation de la qualité et les applications d'IA agentic. Redéployez les modèles sur Industrial Edge pour une exécution à faible latence.

Télécharger le PDF

Une configuration hybride de la périphérie au cloud dans laquelle Industrial Edge ingère et enrichit les flux de données OT, en alignant et contextualisant la télémétrie et les événements à la source avant de les transmettre via FFT DataBridge par le biais de l'ingestion en streaming dans Databricks. Au sein de Databricks, les données sont transformées et structurées selon les niveaux de destination, de conservation et d'analyse, constituant ainsi la base de l'entreprise pour : les analyses avancées, l'Industrial AI, le développement de modèles et la gestion du cycle de vie, les applications opérationnelles et l'intégration aux environnements MES, ERP et SCADA. L'approche globale est conçue pour garantir la préparation à l'IA, des données fiables et cohérentes, une sécurité robuste, une haute résilience et une interopérabilité ouverte et indépendante des fournisseurs.

Architecture détaillée

architecture-hub-databricks-detail-architecture-1280x720

Télécharger le PDF détaillé

Collecte et contextualisation Edge (Industrial Edge)

Industrial Edge utilise des appareils sur site à proximité de l'atelier et se connecte à des équipements d'automatisation indépendants des fournisseurs via des connecteurs OT (OPC UA, Modbus, Ethernet/IP, etc.). Il acquiert des données de télémétrie brutes, des alarmes et des événements.

À la périphérie, les données sont prétraitées : filtrage, compression, normalisation de l'horodatage, enrichissement avec les métadonnées des actifs (hiérarchies des actifs, contexte des bons de travail/des lots) et agrégation locale pour réduire la bande passante du cloud.

Un bus de données interne (MQTT/Unified Namespace) ou un Industrial Information Hub diffuse des flux thématiques harmonisés pour les composants en aval et les consommateurs locaux.

Passerelle entre protocoles et formats

FFT DataBridge (application Edge) prépare et enrichit les données pour le streaming et l'ingestion en temps quasi réel dans Databricks. Son application complémentaire gratuite, FFT DataService, accède aux données contextualisées de l'Industrial Information Hub Essentials (application Edge) et les met à la disposition de FFT DataBridge, qui publie ensuite des flux de données alignés et contextualisés via Zerobus, permettant une diffusion continue directement dans les tableaux gérés par Unity Catalog.

Pour garantir sa robustesse, la solution utilise la mise en mémoire tampon et la persistance locale pour pallier les interruptions de connectivité et les pannes prolongées. Du côté de Databricks, les données sont ingérées de manière incrémentielle dans les tables Delta sous Unity Catalog, ce qui permet un accès régi à faible latence pour les analyses en aval et les charges de travail liées à l'IA. La connectivité sécurisée est maintenue grâce à des mécanismes d'authentification basés sur des jetons ou des clés.

Plateforme de data intelligence Databricks

L'ingestion en streaming via Zerobus fournit des données en continu à Databricks, où les charges utiles OT entrantes sont écrites dans des tables Bronze Delta régies par Unity Catalog, préservant ainsi la structure brute et les métadonnées pour une traçabilité et une auditabilité complètes.

Les pipelines de transformation créés avec Lakeflow Declarative Pipelines, Databricks Workflows et Apache Spark affinent progressivement les données en couches Silver (curated) et Gold (analytique), permettant ainsi l'alignement temporel, l'enrichissement contextuel et la préparation à la consommation de BI, ainsi qu'à des cas d'utilisation pilotés par l'IA.

Les modèles d'IA sont développés et entraînés de manière centralisée dans Databricks à l'aide de MLflow et Mosaic AI, puis peuvent être redéployés sur Siemens Industrial Edge pour une exécution à faible latence à proximité de l'atelier, ce qui permet une optimisation en boucle fermée et des scénarios d'IA physiques.

Unity Catalog applique une gouvernance de bout en bout, y compris un contrôle d'accès précis, le masquage des données et le suivi de la généalogie, tandis que la plateforme Lakehouse fonctionne en mode natif sur AWS, Microsoft Azure et Google Cloud Platform, permettant un déploiement intercloud et une mobilité fluide des données.

Valeurs et avantages

Base de données de fabrication unifiée et prête à l'intelligence artificielle

Databricks stocke les données OT brutes et organisées dans un lac ouvert, ce qui permet des analyses cohérentes, une Industrial AI et des informations interusines à partir d'une seule plateforme gouvernée.

Réduction du coût du cloud et de la bande passante

L'agrégation périphérique, le filtrage et le traitement par lots intelligent par FFT DataBridge réduisent le volume de données et les coûts d'ingestion dans le cloud tout en préservant la fidélité là où c'est nécessaire.

IA industrielle accélérée et analyses avancées

MLflow, Mosaic AI et Databricks SQL accélèrent l'ingénierie des fonctionnalités, le training des modèles et le déploiement à des fins de maintenance prédictive, d'optimisation de la qualité et de gestion de l'énergie.

Résilience opérationnelle

La mise en mémoire tampon périphérique (mémoire en anneau, persistance des fichiers) et la logique de nouvelle tentative de FFT DataBridge garantissent la continuité des données en cas de panne de réseau sans perte de données.

Security et gouvernance

Le cryptage de bout en bout, l'authentification par jetons, l'accès basé sur les rôles et les contrôles Unity Catalog protègent les données opérationnelles sensibles grâce à un suivi complet de la lignée.

IA en boucle fermée, du cloud à la périphérie

Les modèles d'IA entraînés à Databricks peuvent être redéployés sur Industrial Edge pour prendre des décisions à faible latence, ce qui permet une IA physique et une fabrication autonome.

Composants

Industrial Edge

Héberge des connecteurs OT, des applications, un bus de données local et une mémoire tampon.

Responsable de l'acquisition, de l'enrichissement, du filtrage, de l'agrégation et de l'orchestration sécurisés.

Géré de manière centralisée via Industrial Edge Management.

Architecture Hub Industrial Information Hub

Connecteurs industriels et Industrial Information Hub

Les connecteurs industriels Siemens Industrial Edge Ecosystem débloquent les données des ateliers en connectant les actifs de différents fournisseurs.

Industrial Information Hub permet d'harmoniser, de contextualiser et de cartographier les données industrielles.

FFT DataBridge (application Edge)

Met en mémoire tampon les données pour gérer les pannes, les nouvelles tentatives, les interruptions, les lots et les emballages.

Diffuse des données industrielles via Zerobus dans les tables Databricks Delta gérées par Unity Catalog.

Aucun intergiciel d'ingestion supplémentaire n'est nécessaire.

Plateforme de data intelligence Databricks

Couche bronze : préserve les charges utiles et les métadonnées d'origine sous forme de tables delta pour des raisons d'auditabilité.

Couches argenté/doré : ensembles de données structurés et sélectionnés utilisés pour les applications de reporting et opérationnelles.

Ingestion en temps quasi réel via Zerobus.