Partager cet article
Généralités sur le Machine Learning
Modélisation
Préparation de données
  • Le Big Data au service de la veille concurrentielle

    ScrapingBot rend la veille concurrentielle plus efficiente en offrant une API de scraping capable de collecter de façon fiable toutes les données pertinentes pour une entreprise.

  • Comparer des chaînes de caractères

    Découvrez dans cet article comment utiliser les algorithmes de distance et la librairie Fuzzywuzzy pour comparer des chaînes de caractères.

  • Débuter avec Tesseract

    Intéressé par les OCR ? découvrez comment utiliser Tesseract (OCR Open Source) en ligne de commande mais aussi via Python.

  • Découper ses données

    Le découpage du jeu de données dans un projet de Machine Learning est une étape très importante qu’il ne faut pas négliger faute de quoi vous risquer de sur évaluer votre modèle (over-fitting) ou tout simplement le contraire (under fitting). Dans cet article nous allons parcourir les étapes indispensables à cette opération délicate.

  • Test d’Orange (Outil de Data Science)

    Découvrez dans cet article en forme de tuto comment ce petit outil Open-Source de Data-sciences peut vous faire gagner beaucoup de temps !

  • Gérer les chaînes de caractères

    Si vous désirez avoir une approche analytique de vos données, vous avez bien sur été confronté à la difficulté d’exploiter des chaînes de caractères. A tel point que bien souvent vous avez certainement dû en mettre de coté certaines. Manque d’outillage, complexité de gérer des sémantiques complexes … Dans cet article (premier d’une série) nous allons aborder ces problèmes et surtout voir comment les résoudre.

  • Le Web Scraping

    Le Web Scrapping est une technique bien souvent indispensable pour enrichir ses données brutes. Découvrez comment écrire simplement des scripts Python pour aspirer les données d’un site web.

  • Traiter des données de localisation

    Découvrez dans cet article comment utiliser, nettoyer et visualiser simplement des données géo-localisées avec Python.

  • Bagage minimal de statistiques pour le Machine Learning

    C’est bientôt la rentrée, il a fait chaud, la plage a été bonne et le sable bien chaud. Vous êtes donc bien reposé et prêt à attaquer la rentrée. C’est donc le bon moment pour remettre à plat quelques bases de statistiques qui vous permettront de mieux comprendre et utiliser les algorithmes de Machine Learning.

  • Machine Learning : La mise à l’echelle (Feature Scaling)

    Cet article explique par la pratique pourquoi et comment mettre à l’echelle (Feature Scaling) les caractéristiques d’un modèle de Machine Learning en œuvre avec Scikit-Learn.

  • Le Profiling

    Découvrez comment les outils d’analyse de données peuvent vous aider à préparer votre modèle de Machine Learning ou tout simplement garantir le succès de vos projets data.

  • La qualité de données : carburant de l’IA !

    Comment la qualité de données peut aider les Data Scientistes dans leur quête d’une meilleure prédictivité.

  • Feature Engineering – L’encodage One-Hot

    Découvrez au travers de ce court article comment gérer vos variables catégorielles.

Cas d’usage
Visualisation de données
Outillage
  • Test d’Orange (Outil de Data Science)

    Découvrez dans cet article en forme de tuto comment ce petit outil Open-Source de Data-sciences peut vous faire gagner beaucoup de temps !

  • Google Colaboratory

    Vous adorez Jupyter mais n’avez as envie de l’installer localement. Vous avez besoin de puissance et de GPU sans frais ni contraintes ? Google Colaboratory est fait pour vous. Suivez-moi dans ce tuto pour l’utiliser rapidement.

  • Python Pandas – Tuto (Partie N°2)

    Découvrez dans cette deuxième partie de mon tutoriel Pandas comment notamment utiliser les fonctions ensemblistes (simili SQL).

  • Python Matplotlib – Tuto

    Découvrez dans ce tuto comment prendre en main rapidement et efficacement la librairie Python matplotlib

  • Python Pandas – Tuto (Partie N°1)

    Ce petit tuto a pour but de vous mettre le pied à l’étrier avec librairie Pandas qui permet de manipuler des données facilement en Python.

  • Machine Learning : s’outiller pour démarrer

    Vous vous lancez dans le machine learning ? comment s’équiper et que lire ? voici les réponses que je tente de vous apporter dans cet article.

Publication
Partager cet article