Dans cet article je vous montre comment utiliser le nouvel arrivé de l'analyse de données avec Python : datapre.eda
dataprep.eda : un nouveau venu dans l'analyse de donnéesCatégorie : Préparation
Comparaison de chaînes de caractères
Découvrez dans cet article comment utiliser les algorithmes de distance et la librairie Fuzzywuzzy pour comparer des chaînes de caractères.
Comparaison de chaînes de caractèresDébuter avec Tesseract
Intéressé par les OCR ? découvrez comment utiliser Tesseract (OCR Open Source) en ligne de commande mais aussi via Python.
Débuter avec TesseractDécouper ses données
Le découpage du jeu de données dans un projet de Machine Learning est une étape très importante qu'il ne faut pas négliger faute de quoi vous risquer de sur évaluer votre modèle (over-fitting) ou tout simplement le contraire (under fitting). Dans cet article nous allons parcourir les étapes indispensables à cette opération délicate.
Découper ses données