L’usage appliqué ici est celui d’une reprise de donnée pour une mise à jour d’Alfresco cet usage est facilement adaptable pour d’autres sources ou arrivés.
Mise à jour d’Alfresco avec changement de modèle de données
Une mise à jour d’Alfresco depuis une ancienne version d’Alfresco, avec un schéma de données à conserver.
Sommaire
Contexte
Le client a un Alfresco avec un ancien modèle de données. Il souhaite l’abandonner pour réécrire les contenus d’Alfresco dans un nouveau modèle de données. Les documents doivent garder leur date de création. La mise à jour d’Alfresco est impossible parce que des changements ont été appliqués sur le schema d’Alfresco.
Compréhension du besoin
Il faut faire une migration de données d’Alfresco à Alfresco en modifiant le modèle de données.
2 applications
- Depuis le même Alfresco, c’est-à-dire qu’on injecte dans l’Alfresco, on remet dans le même Alfresco, ou
- le faire d’un ancien vers un nouveau.
Solution
- Récupérer les données du serveur Alfresco dans Airflow
- Transformer le modèle de donnée à l’aide de script Python en fonction du fichier pivot pré-établi.
- Injecter les données dans Kafka
- Kafka injecte sur le serveur les nouvelles métadonnées
Pourquoi ne pas faire une mise à jour standard ?
Le schéma d’Alfresco ayant été changer la mise à jour est très couteuse voir impossible. Il vaut mieux faire une installation propre et à jour d’Alfresco et réinjecter les données.
Une question ou un problème avec votre Alfresco Communautaire ?
Nos équipes sont à votre écoute pour répondre à vos questions et vous permettre d’utiliser tout le potentiel de votre GED !
En savoir plus
Articles connexes
- Notre service de reprise de donnée
- Technologies choisies
- Retour d’expérience : mise à jour d’Alfresco au Département du Var
- Retour d’expérience : migration d’Alfresco Entreprise vers Alfresco Communautaire
Définitions en rapport avec l'article
- ETL
- c’est le nom générique des outils pour faire de la reprise de données. Ça veut dire Extract-transform-load (extraction, transformation et chargement)
- JSON
- JSON (JavaScript Object Notation – Notation Objet issue de JavaScript) est un format léger d’échange de données.1
- Airflow2
- c’est une plate-forme de gestion de flux de travail open source 3
- Kafka4
- projet open source sous Apache License 2.0 : “logiciel de traitement de flux pour la collecte, le traitement, le stockage et l’analyse de données à grande échelle”. 5
Notes de pas de page
Source : https://www.json.org/json-fr.html ↩︎
Apache, Apache Airflow, and the Apache Airflow logo are registered trademarks or trademarks of The Apache Software Foundation in the U.S. and/or other countries. ↩︎
Apache, Apache Kafka, and the Apache Kafka logo are registered trademarks or trademarks of The Apache Software Foundation in the U.S. and/or other countries. ↩︎
Source traduite du site web d’Apache Kafka : https://kafka.apache.org/powered-by ↩︎
Contact rapide
Les informations recueillies sur ce formulaire sont enregistrées dans un fichier informatisé par la société Jeci (4, rue Bartet – 21110 FAUVERNEY, info@jeci.fr, +33 9 72 38 21 92) pour répondre à votre demande de contact Pour en savoir plus sur la gestion de vos données personnelles et pour exercer vos droits, reportez-vous à la dans la notice jointe à ce lien. Les données marquées par un astérisque dans le questionnaire doivent obligatoirement être fournies. Dans le cas contraire, nous ne pourrons pas vous contacter. En remplissant ce formulaire, vous acceptez que les informations saisies soient exploitées dans le cadre de la demande de contact.