Titre sous-section (conforme au menu département)

Mémoire de maîtrise - 2002

Visualisation de l'évolution d'un domaine scientifique par l'analyse des résumés de publication à l'aide de réseaux neuronaux par Jean Archambeault

Directeur : Albert Tabah

Mémoire en format pdf (1.4 Mo)

Contenu du CD-ROM d'accompagnement du mémoire - Fichier ZIP (1.3 Mo)

Résumé : Inscrite dans une problématique de prospective scientifique et technologique, cette recherche exploratoire propose l'évaluation d'outils et de méthodes parallèles à la scientométrie afin de poursuivre les recherches vers la représentation visuelle de l'univers terminologique de domaines scientifiques.

La principale caractéristique recherchée est la visualisation de la dynamique du vocabulaire de domaines scientifiques par l'analyse de données textuelles. Une expérimentation a été réalisée afin d'analyser les résumés de publication d'un domaine de spectroscopie par laser, sur une période de vingt années, de 1980 à 2000. Ce travail fait usage de Text Analyst 2.0, une application de Text Mining basée sur les réseaux neuronaux pour l'analyse automatisée des résumés et la construction de réseaux sémantiques à partir des concepts identifiés. Ensuite, les outils d'analyse de réseaux sociaux PAJEK et UCINET 5.0 ont pour fonction d'appliquer les méthodes k-Neighbours et de dénombrement Core+Degree sur les réseaux sémantiques obtenus à l'étape précédente.

Finalement, l'outil de visualisation Mage produit une représentation graphique en trois dimensions des résultats de traitements effectués. Le prototype méthodologique résultant de cette recherche a pu démontrer la pertinence générale de l'utilisation des méthodes évoquées et dégager les aspects présentant un gain significatif en comparaison aux méthodes scientométriques traditionnelles. Des axes de recherche sont préconisés afin que soit cumulées des connaissances sur l'interprétation des résultats produits grâce aux outils analytiques faisant usage de la visualisation.

Mots-clés : bibliométrie, scientométrie, visualisation de domaines scientifiques, Text Mining, prospective scientifique et technologique, dynamique du vocabulaire, réseaux neuronaux, réseaux sémantiques, analyse des réseaux sociaux


Abstract : As part of the scientific and technology forecasting problematic, this exploratory research suggests the assessment of tools and methods with relation to scientometrics, in order to carry on researches towards visual representation of terminological universe of scientific domains.

The main characteristic studied is the visualisation of vocabulary dynamics within scientific domains through textual data analysis. An experiment has been conducted to analyse the publication summaries of a laser spectroscopy domain over a period of twenty years, from 1980 to 2000. This study uses Text Analyst 2.0, a Text Mining application based on neural networks for the automated analysis of summaries and the construction of semantic networks from identified concepts. The functions of social network analysis tools PAJEK and UCINET 5.0 are then to apply the k-Neighbours methods and Core+Degree count on the semantic networks obtained during the previous stage.

Finally, the visualisation tool Mage generates a three-dimensional representation of processed results. The resulting methodological prototype made it possible for this research to demonstrate the general relevance of the said methods and isolate significantly gainful aspects in lieu of traditional scientometrics methods. Axes of research prevail to cumulate knowledge on the interpretation of results obtained through analytical tools using visualisation.

Keywords : bibliometrics, scientometrics, scientific domain visualisation, Text Mining, scientific and technology forecasting, vocabulary dynamics, neural networks, semantic networks, social network analysis

Page mise à jour le 16 août 2002