[Research] Kohonen Maps for spatial data analysis

Read in a cognitive science mailing list. It is about a project at France Telecom. They aim at using Kohonen Maps for data mining. The point is to use it in order to:- detect and visualize individuals trajectories between clusters - to see if their is a segmentation along the time

Using Kohonen Card could be a interesting technique for exploratory analysis of spatial data like in CatchBob.

France Télécom R&D propose un poste d'ingénieur de recherche et  développement en traitement statistique de l'information. Le titulaire du poste devra s'intéresser à l'extension des cartes de  Kohonen aux données spatio-temporelles. Les cartes de Kohonen sont une  des techniques très puissantes utilisées pour retrouver des groupes  homogènes d'individus dans une grande base de données. Elles sont  reconnues pour leur capacité à permettre la visualisation des  corrélations entre variables explicatives (donc des données  "d'espace"). Il est possible d'étendre les cartes de Kohonen au  traitement des données temporelles. Actuellement les données  temporelles sont traitées comme des variables d'espace sans traitement  spécifique. Cette solution est peu satisfaisante même si elle présente  l'avantage de pouvoir conserver les cartes de Kohonen telles qu'on les  connaît. Le problème est que le temps n'est pas une variable d'espace;  cette variable a un comportement spécifique qui n'est pas représenté.  On commence cependant à voir apparaître des études portant sur la  généralisation de l'algorithme de Kohonen de façon à le rendre sensible  à l'aspect spatio-temporel des données. On propose de recenser les méthodes existantes et d'étudier notamment - comment détecter et visualiser les trajectoires d'individus entre  clusters, - comment une segmentation évolue avec le temps, et plus généralement d'évaluer comment ces extensions de la carte de  Kohonen permettent d'améliorer l'analyse exploratoire des séries  temporelles multivariées. Les perspectives d'utilisation de ces résultats sont très importantes,  notamment pour la détection de rupture dans l'analyse des usages.