Un modèle Bayésien de co-clustering de données mixtes

Résumé : Nous proposons un modèle de co-clustering de données mixtes et un critère Bayésien de sélection du meilleur modèle. Le modèle infère automati-quement les discrétisations optimales de toutes les variables et effectue un co-clustering en minimisant un critère Bayésien de sélection de modèle. Un avan-tage de cette approche est qu'elle ne nécessite aucun paramètre utilisateur. De plus, le critère proposé mesure de façon exacte la qualité d'un modèle tout en étant régularisé. L'optimisation de ce critère permet donc d'améliorer continuel-lement les modèles trouvés sans pour autant sur-apprendre les données. Les ex-périences réalisées sur des données réelles montrent l'intérêt de cette approche pour l'analyse exploratoire des grandes bases de données.
Type de document :
Communication dans un congrès
Largeron, Christine; Azzag, Hanane; Lebbah, Mustapha. Extraction et gestion des connaissances 2018, Jan 2018, Paris, France. Revue des Nouvelles Technologies de l'Information, RNTI-E-34, pp.275-280, 2018, Actes de la 18èeme Conférence Internationale Francophone sur l'Extraction et gestion des connaissances (EGC'2018)
Liste complète des métadonnées

https://hal.archives-ouvertes.fr/hal-02007805
Contributeur : Fabrice Rossi <>
Soumis le : mardi 5 février 2019 - 14:02:56
Dernière modification le : jeudi 7 février 2019 - 17:58:15

Fichiers

boucharebboulleetal2018modele-...
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-02007805, version 1
  • ARXIV : 1902.02056

Collections

Citation

Aichetou Bouchareb, Marc Boullé, Fabrice Rossi, Fabrice Clérot. Un modèle Bayésien de co-clustering de données mixtes. Largeron, Christine; Azzag, Hanane; Lebbah, Mustapha. Extraction et gestion des connaissances 2018, Jan 2018, Paris, France. Revue des Nouvelles Technologies de l'Information, RNTI-E-34, pp.275-280, 2018, Actes de la 18èeme Conférence Internationale Francophone sur l'Extraction et gestion des connaissances (EGC'2018). 〈hal-02007805〉

Partager

Métriques

Consultations de la notice

17

Téléchargements de fichiers

5