PRE-ANNONCE DU SEMINAIRE ORGANISE PAR FRANCESTAT A PARIS

« LA DATA SCIENCE PAR L’ANALYSE DE DONNEES SYMBOLIQUES »

Une nouvelle façon d’analyser les données classiques, complexes et massives à partir des classes.

La numérisation croissante de notre société alimente des bases de données de taille grandissante (Big Data). Ces données sont souvent complexes (hétérogènes et multi-tables) et peuvent être la source de création de valeur considérable à condition qu’elles soient exploitées avec des méthodes d’analyse adéquates. Un Data Scientist a justement pour objectif d’extraire des connaissances de ce type de données. Les classes constituent un pivot central de la découverte de connaissances. En Analyse des Données Symboliques (ADS), les classes sont décrites par des variables dites symboliques prenant en compte leur variabilité interne sous forme de distributions, d’intervalles, d’histogrammes, de diagrammes de fréquences, etc.

Ce séminaire débutera par la présentation et la construction des différents types de variables symboliques à partir de classes données. Des statistiques descriptives, une méthode de discrétisation automatique adaptée aux données massives (Big Data) et des indices de proximité étendus aux données symboliques y seront présentés.

Un ensemble de méthodes abordées dans le contexte de l’ADS sera ensuite illustré : nuées dynamiques (MND), décomposition de mélange par partition (issue de la MND) ou par partition floue (EM), analyse en composantes principales, algorithme Apriori, règles d’association et arbres de décision. Pour la prévision, des méthodes de régression seront présentées dont celles pénalisées ridge, lasso et elastic.

Des intervenants académiques et industriels des secteurs de la biopharmacie, de la grande distribution, de la cybersécurité et d’administrations publiques présenteront ces techniques novatrices mises en œuvre avec le logiciel SYR de la société Symbad ou avec le logiciel R.

Ce séminaire d’introduction à l’ADS s’adresse aux ingénieurs, aux universitaires et chercheurs, ainsi qu’à tous ceux qui désirent comprendre cette nouvelle façon de penser en Data Science.

Ce séminaire sera pour vous l’opportunité de rencontrer :

Edwin DIDAY, professeur émérite à l’Université Paris-Dauphine. Il est à l’origine de la méthode des nuées dynamiques (ouvrant la voie aux modèles locaux), des pyramides classifiantes (classes avec recouvrement) et de l’Analyse des Données Symboliques (passant de l’analyse des individus à celle des classes). Il est titulaire du prix Montyon décerné par l’Académie des Sciences.

Filipe AFONSO, président de la société Symbad, éditrice du logiciel SYR, spécialisée en Data Science grâce à des méthodes innovantes développées en interne ou issues de la recherche universitaire récente. Docteur en Informatique de l’Université Paris Dauphine, il conduit depuis plus de 10 ans des projets d’analyse de données pour le compte d’entreprises.

Christian CHARLES, président de la société Francestat, distributeur et éditeur de logiciels d’analyse statistique et d’aide à la décision. Docteur en Mathématiques de l’Université Paris Dauphine, il co-organise avec Edwin Diday et Filipe Afonso ce séminaire consacré à l’ADS.