Image de la bannière : Mise à jour Alfresco avec reprise de données

Mise à jour Alfresco avec reprise de données

project image
Projet
Reprise de données
Solution
Alfresco vers Alfresco

L’usage appliqué ici est celui d’une reprise de donnée pour une mise à jour d’Alfresco cet usage est facilement adaptable pour d’autres sources ou arrivés.

Mise à jour d’Alfresco avec changement de modèle de données

Une mise à jour d’Alfresco depuis une ancienne version d’Alfresco, avec un schéma de données à conserver.



Contexte

Le client a un Alfresco avec un ancien modèle de données. Il souhaite l’abandonner pour réécrire les contenus d’Alfresco dans un nouveau modèle de données. Les documents doivent garder leur date de création. La mise à jour d’Alfresco est impossible parce que des changements ont été appliqués sur le schema d’Alfresco.

Compréhension du besoin

Il faut faire une migration de données d’Alfresco à Alfresco en modifiant le modèle de données.

2 applications

  • Depuis le même Alfresco, c’est-à-dire qu’on injecte dans l’Alfresco, on remet dans le même Alfresco, ou
  • le faire d’un ancien vers un nouveau.

Solution

  1. Récupérer les données du serveur Alfresco dans Airflow
  2. Transformer le modèle de donnée à l’aide de script Python en fonction du fichier pivot pré-établi.
  3. Injecter les données dans Kafka
  4. Kafka injecte sur le serveur les nouvelles métadonnées

Pourquoi ne pas faire une mise à jour standard ?

Le schéma d’Alfresco ayant été changer la mise à jour est très couteuse voir impossible. Il vaut mieux faire une installation propre et à jour d’Alfresco et réinjecter les données.



Une question ou un problème avec votre Alfresco Communautaire ?

Nos équipes sont à votre écoute pour répondre à vos questions et vous permettre d’utiliser tout le potentiel de votre GED !

En savoir plus


Articles connexes




Définitions en rapport avec l'article



ETL
c’est le nom générique des outils pour faire de la reprise de données. Ça veut dire Extract-transform-load (extraction, transformation et chargement)
JSON
JSON (JavaScript Object Notation – Notation Objet issue de JavaScript) est un format léger d’échange de données.1
Airflow2
c’est une plate-forme de gestion de flux de travail open source 3
Kafka4
projet open source sous Apache License 2.0 : “logiciel de traitement de flux pour la collecte, le traitement, le stockage et l’analyse de données à grande échelle”. 5

Notes de pas de page



  1. Source : https://www.json.org/json-fr.html ↩︎

  2. Apache, Apache Airflow, and the Apache Airflow logo are registered trademarks or trademarks of The Apache Software Foundation in the U.S. and/or other countries. ↩︎

  3. Source : https://fr.wikipedia.org/wiki/Apache_Airflow ↩︎

  4. Apache, Apache Kafka, and the Apache Kafka logo are registered trademarks or trademarks of The Apache Software Foundation in the U.S. and/or other countries. ↩︎

  5. Source traduite du site web d’Apache Kafka : https://kafka.apache.org/powered-by ↩︎

Contact rapide

Protection anti-spam, écrivez le mot « libre » dans la case ci-dessous :


Les informations recueillies sur ce formulaire sont enregistrées dans un fichier informatisé par la société Jeci (4, rue Bartet – 21110 FAUVERNEY, info@jeci.fr, +33 9 72 38 21 92) pour répondre à votre demande de contact Pour en savoir plus sur la gestion de vos données personnelles et pour exercer vos droits, reportez-vous à la dans la notice jointe à ce lien. Les données marquées par un astérisque dans le questionnaire doivent obligatoirement être fournies. Dans le cas contraire, nous ne pourrons pas vous contacter. En remplissant ce formulaire, vous acceptez que les informations saisies soient exploitées dans le cadre de la demande de contact.