Cadre
Préparation d'un doctorat au sein du LAMSADE (Laboratoire d'Analyse et de Modélisation des Systèmes pour l'Aide à la Décision de l'Université Paris IX Dauphine, UPRESA N° 7024)
Sous la direction de Geneviève Jomier, professeur d'Informatique à l'Université Paris - Dauphine
Pré - soutenance effectuée
le 19 février 1999.
Sujet
Les applications telles que le génie logiciel, le travail coopératif, la CAO ou encore les Systèmes d'Informations Géographiques, ont besoin de conserver un historique des données qu'elles manipulent. Cet historique est notamment utile pour conserver une trace des mises à jour et étudier l'évolution de l'univers modélisé. Les versions d'entités, qui représentent plusieurs états d'une même entité, offrent une solution à ce problème. Or, ces applications qui géraient auparavant des données alphanumériques, manipulent désormais des données dites multimédias, comme le texte, l'image, la vidéo ou le son.
Les données multimédias sont généralement volumineuses. Une image, par exemple, peut occuper plusieurs kilo-octets, voire méga-octets. Or, à ce jour, lorsqu'une image est traitée (recherche des contours, modification des couleurs, élimination du bruit, etc.), l'image originale et l'image traitée sont stockées de manière indépendante. Un tel mécanisme crée de la redondance d'information, les deux images pouvant être peu différentes. Les mécanismes de versions développées dans les bases de données, dites traditionnelles, doivent en conséquence être élargis aux données multimédias, pour remédier à ce problème de recopie d'objets volumineux. Aussi, le but de notre recherche est-il d'aborder les problèmes de gestion de versions d'objets volumineux. Nous montrons, dans le cadre de ce travail de thèse, que ces problèmes se généralisent en un seul problème : Comment gérer les structures arborescentes organisant des versions d'objets volumineux? Ce travail, commencé en novembre 1996, s'appuie sur l'approche des Versions de Bases de Données de W. Cellary et G. Jomier (1990), centrée sur le problème de versions dans les bases de données orientées - objet et relationnelles.
Nous proposons, dans le cadre d'une collaboration internationale avec Marta Rukoz, professeur au Centre d'Informatique Parallèle et Distribuée de l'Université Centrale du Venezuela (accord CNRS-CONICIT 5485), une solution à la gestion d'images dans les applications de traitement ou de conception d'images. En effet, dans ces applications, les utilisateurs ont besoin de conserver, dans une base de données, différents états d'une même image, chaque état correspondant au résultat d'une opération ou d'une série d'opérations particulières sur une image. Ces états peuvent être considérés comme des versions d'images. La conservation de ces états permet notamment aux utilisateurs d'effectuer des retours en arrière lorsque, par exemple, une opération a trop modifié l'image originale. Un des problèmes est de pouvoir conserver suffisamment d'états intermédiaires pour accélérer le processus de traitement d'image, tout en optimisant l'espace de stockage des images dans la base. Pour ce faire, nous proposons de transposer les mécanismes de gestion de versions de bases de données aux structures multidimensionnelles organisant les images, comme les arbres quaternaires (ou quad-trees). Les arbres quaternaires permettent de représenter les images à deux dimensions et sont particulièrement utilisés dans les applications de traitement ou de conception d'images. Nous proposons, dans le cadre du travail de thèse, de stocker les images, à l'aide d'un Arbre Quaternaire Générique, afin d'optimiser l'espace de stockage de la base d'images, tout en offrant un gain de performances pour des opérations telles que la modification d'une image ou de plusieurs images simultanément, la comparaison etc.
Un travail est également en cours pour répondre aux problèmes de gestion de versions d'objets volumineux organisés en arbre B, comme les objets binaires ou BLOB (Binary Large Object) , les textes longs ou les collections d'objets de grande cardinalité. En définitive, nous souhaitons proposer, pour finaliser la thèse, des mécanismes généraux de gestion de versions de structures arborescentes de sorte que ces mécanismes s'appliquent à tout type de structure hiérarchique (ex. arbre B, arbre R, arbre quaternaire, etc.).
Publications dans des conférences nationales avec
comité de sélection :
02 avril 1999 | Représentation
d'Images par un Arbre Quaternaire Générique
GDR I3 - Groupe de Travail "Documents Multimédias", INSA Lyon (France) |
12 mars 1999 | Représentation
des Images
Séminaire interne du LAMSADE - Université Paris - Dauphine (France) |
23 fév. 1999 | Représentation
d'un ensemble d'images par un Quad-Tree Générique
Séminaires du GECT - Groupe d'Etude de Codage de Toulon, Université de Toulon - Var (France) |
30 oct. 1998 | Representation
of similar images : a state of the art
Séminaires du Centre d'Informatique Parallèle et Distribuée de la faculté des sciences à l'Université Centrale du Venezuela (Caracas - Venezuela) |
16 sept. 1998 | Représentation
d'images similaires
avec Marta Rukoz, professeur à l'Université Centrale du Venezuela LAMSADE - Université Paris - Dauphine (France) |
2 juin 1998 | Index
et structures d'accès aux versions : un état de l'art
LAMSADE - Université Paris- Dauphine (France) |
26 mars 1998 | Structures
d'index pour les bases de données multiversion
Centre d'Initiation a l'Enseignement Supérieur Paris VI (France) |
2 avril 1997 | Versions
de schéma
LIP6 - Université Pierre et Marie Curie Paris VI (France) |
Autres activités de recherche au sein de l'équipe Bases de Données et Génie Logiciel :
Activités d'intérêt collectif au sein du LAMSADE :
Synthèse bibliographique de plusieurs articles sur les entrepôts de données. Ce document (d'une vingtaine de pages) définit les éléments clés des entrepôts de données, et aide à comprendre les motivations et les techniques utilisées pour sa construction.
Synthèse bibliographique d'articles sur le Datamining. Ce mémoire (de 30 pages environ) énonce les grands principes du Datamining, et présente une étude plus approfondie de l'algorithme d'apprentissage ID3 de J.R. Quilan, ainsi que les spécificités de cet algorithme par rapport aux bases de données.
Techniques et outils de suivi de modification (historique) d'un projet de conception, en général, et en génie logiciel en particulier. Moyens de calcul de l'impact des modifications d'un composant sur les autres composants
Mémoire (de 50 pages environ) décrivant et analysant les outils et les techniques liés aux processus et aux versions en tant que moyens spécifiques de résolution de problème de maintenance dans les bases de données. Le génie logiciel et le contrôle de la qualité y sont particulièrement étudiés.
Stage de recherche de six mois au département Recherche et Développement de l'entreprise Accès Contrôle Télématique (mars à août 1996 à Montréal - Canada).
Membre de l'équipe chargée de la méthodologie de développement conçue par la compagnie.
Problématique de recherche
: la diffusion de connaissances précises, acquises au cours du développement
de logiciels.
La problématique du
stage était de savoir comment rendre l'expérience des développeurs
disponible à tous et comment concenter les connaissances afin de
permettre une réutilisation des composants logiciels. L'objectif
du stage était donc de répondre à la question "Comment
acquérir, structurer et rendre disponible l'information générée
par le processus de développement de logiciel ?", et ceci dans le
cadre d'une proposition de méthodologie de développement,
la Méthodologie Unifiée avec Contrôle Statistique de
la Qualité, de l'équipe Recherche et Développement
de l'entreprise. Le stage s'est concrétisé par la spécification
et la conception d'une structure d'accueil destinée à recevoir
les données et informations générées (programmes,
données utilisées par les programmes, documentation, etc.)
par le processus de développement.
Dernière mise à jour: 18 juin 1999.