Un exemple de migration

Mes données, mes solutions.

septembre 2002

Mon ordinateur étant mon principal outil de travail, il renferme de très nombreuses informations exploitables et exploitées. Dès lors, la migration manuelle des données était inenvisageable.

Mon analyse à débuté par l’identification de grandes familles de données et des formats qui leur étaient associés :

- archives de courrier électronique (format mbox/unix), raccourcis d’adresse de courrier électronique (format Eudora)
- notes rédigées (formats Word)
- hypertextes (format html)
- copies numériques (format pdf)
- images numériques (formats Pict, Gif, JPeg, PNG)
- site web (base de données Frontier)
- feuilles de calcul (format Excel)
- bases de données applicatives (hyperCard)
- des documents en petit nombre (1-20) sous divers formats
- une kyrielle d’ébauches de documents sous des formats divers.

J’ai mis de côté (au moins momentannément) les deux dernières familles. Parmi les formats restants, j’ai évacué ceux qui ne soulevaient aucun problème parce qu’étant intégralement supportés par du logiciel libre sous linux (gif, pdf, html, etc.), que les formats soient eux-mêmes libres ou non.

Restaient finalement quelques formats pour lesquels la migration avait un sens (autre que la recopie bête et brutale) : mbox, eudora, word, excel,frontier et hypercard. J’ai supposé que ces formats se repartissaient à trois catégories : récupérables, transcodables et irrécupérables.

Un format "récupérable" était pour moi un format pour lequel l’un des logiciels que j’utiliserai sous Linux proposait des possibilités d’importation, plus ou moins complète.

Un format "transcodable" était un format qui nécessitait obligatoirement un transcodage avant toute réexploitation. Ce transcodage devait être le fait d’un logiciel courant, multifonction.

Un format "irrécupérables" était un format pour lequel je ne connaissais pas d’outil trivial de transcodage.

On note que la définition de la première catégorie sous-entend que l’on a déjà opéré certains choix de logiciels sous Linux. Ayant opté pour l’environnement KDE, certains logiciels étaient plus visibles, plus "évidents" que d’autres.

Kmail utilisant les fichiers de mail au format unix, je n’ai eu qu’à reconstituer les dossiers de fichiers messages. Les "boîtes de messages" ont été recopiées directement de MacOS à Linux. Le répertoire d’adresses de mail, a été importé à 80% (les plus importants) grâce à la fonction ad hoc de Kmail.Au final, une récupération assez simple, permise par le choix antérieur (sous MacOS) d’Eudora, comme client de courrier. Cette portabilité "unix" des fichiers avait d’ailleurs été l’un des critères de sélection de Eudora.

Le cas de Word était plus complexe dans la mesure où il est connu que ce format n’est jamais à 100% récupérable. Quelques test de récupération sur le traitement de texte Abiword ont montré que la simplicité de mes fichiers Word permettait une récupération intégrale.

Cela ne s’est pas vérifié sur les fichiers Excel, malgré la fonction d’import proposée par le tableur Kspread (problème de codage des dates). Un transcodage a été nécessaire.

Enfin Frontier et HyperCard entraient, a priori, dans la catégorie des irrécupérables du fait d’une forte intégration intrinsèque programme/données.

Concernant les fichiers PICT, j’ai préféré ne pas les transcoder vers un format libre, afin de conserver les informations de date. Le logiciel libre "Le GIMP" ne permet pas d’afficher les images PICT. En revanche, le logiciel gratuit (mais pas libre) ImageMagick permet de les afficher et de les transcoder vers des formats lisibles par "Le GIMP".

Pour les fichiers en petit nombre, sous formats exotiques, j’ai également procédé à leur recopie, bien qu’ils soient illisibles sous linux. En cas de besoin, je les récupérerai/transcoderai à partir de VitualMac.

Ce qui n’a pas marché

Courrier

J’ai tenté d’utiliser la fonction Kmail d’import global d’identités Outlook-Express. L’idée partait de l’existence, sur Outlook Mac, d’une excellente fonction d’importation de courrier Eudora. En fait, cette option s’est avérée être une impasse car la fonction en question ne reconnait que les formats de fichiers de "Outlook pour Windows". Or, ces derniers sont différents de ceux utilisés par "Outlook pour MacOS" !!!

Transcodages par Maclink

Le conversion via l’utilitaire Maclink n’a pas donné de meilleurs résultats que l’importation depuis les applicatif Linux. De plus, la converion procède par création de nouveaux fichiers, éliminant ainsi toutes les informations de date.