Le big data est-il mort ? Vive le Machine Learning

Vous avez remarqué ? on ne parle plus ou presque de Big Data ! Pourtant ce Buzword a été le cœur de la stratégie marketing de beaucoup d'entreprises et éditeurs de logiciels autour de la données. Mais si qu'en est-il réellement ? il est difficile d'imaginer que le déluge de données n'aura pas lieu.

Le big data est-il mort ? Vive le Machine Learning

Les sacs de mots

Pour faire suite à mon article sur la gestion des chaînes de caractères, voici un premier volet qui va nous permettre d'avoir une approche progressive du traitement de ce type de données. Loin de toute approche sémantique (qui fera l'objet d'un post ultérieur) nous allons aborder ici la technique des sacs de mots

Les sacs de mots

Gérer les chaînes de caractères

Si vous désirez avoir une approche analytique de vos données, vous avez bien sur été confronté à la difficulté d'exploiter des chaînes de caractères. A tel point que bien souvent vous avez certainement dû en mettre de coté certaines. Manque d'outillage, complexité de gérer des sémantiques complexes … Dans cet article (premier d'une série) nous allons aborder ces problèmes et surtout voir comment les résoudre.

Gérer les chaînes de caractères

Bagage minimal de statistiques pour le Machine Learning

C'est bientôt la rentrée, il a fait chaud, la plage a été bonne et le sable bien chaud. Vous êtes donc bien reposé et prêt à attaquer la rentrée. C'est donc le bon moment pour remettre à plat quelques bases de statistiques qui vous permettront de mieux comprendre et utiliser les algorithmes de Machine Learning.

Bagage minimal de statistiques pour le Machine Learning