Manipulation de données


Les sacs de mots 1

Pour faire suite à mon article sur la gestion des chaînes de caractères, voici un premier volet qui va nous permettre d’avoir une approche progressive du traitement de ce type de données. Loin de toute approche sémantique (qui fera l’objet d’un post ultérieur) nous allons aborder ici la technique des sacs de mots


Gérer les chaînes de caractères

Si vous désirez avoir une approche analytique de vos données, vous avez bien sur été confronté à la difficulté d’exploiter des chaînes de caractères. A tel point que bien souvent vous avez certainement dû en mettre de coté certaines. Manque d’outillage, complexité de gérer des sémantiques complexes … Dans cet article (premier d’une série) nous allons aborder ces problèmes et surtout voir comment les résoudre.