• Comparaison de chaînes de caractères - Découvrez dans cet article comment utiliser les algorithmes de distance et la librairie Fuzzywuzzy pour comparer des chaînes de caractères.
  • Le big data est-il mort ? Vive le Machine Learning - Vous avez remarqué ? on ne parle plus ou presque de Big Data ! Pourtant ce Buzword a été le cœur de la stratégie marketing de beaucoup d'entreprises et éditeurs de logiciels autour de la données. Mais si qu'en est-il réellement ? il est difficile d'imaginer que le déluge de données n'aura pas lieu.
  • Les expressions régulières (RegEx) - Découvrez dans cet article comment construire ses expressions régulières puis les utiliser avec Python et Java.
  • Vous avez dit Open Data … oui mais où ? - Vous cherchez des données ? mais ... vous ne savez pas où. Je vais essayer dans cet article de vous fournir un certain nombre de liens vers les sites d'Open Data les plus utiles.
  • Traiter des données de localisation - Découvrez dans cet article comment utiliser, nettoyer et visualiser simplement des données géo-localisées avec Python.
  • Accéder à Hive & HDFS via PySpark - Découvrez dans ce tuto comment récupérer via Python (PySpark) vos données dans Hadoop HDFS et Hive.
  • Le Profiling - Découvrez comment les outils d'analyse de données peuvent vous aider à préparer votre modèle de Machine Learning ou tout simplement garantir le succès de vos projets data.
  • PIM et Intelligence Artificielle - Découvrez dans cet article comment les algorithmes d'intelligence artificielle peuvent booster un PIM pour automatiser encore mieux les processus de gestion de données produit.
  • La qualité de données : carburant de l’IA ! - Comment la qualité de données peut aider les Data Scientistes dans leur quête d'une meilleure prédictivité.
  • Démo : Préréférencement de données produit alimentaires - Découvrez comment Informatica Product 360 vous permet d’accélérer et surtout de fiabiliser vos échanges de données produits avec vos fournisseurs. Lire aussi ... Master Data…

Master Data Management (MDM)

Big Data

  • Le big data est-il mort ? Vive le Machine Learning - Vous avez remarqué ? on ne parle plus ou presque de Big Data ! Pourtant ce Buzword a été le cœur de la stratégie marketing de beaucoup d'entreprises et éditeurs de logiciels autour de la données. Mais si qu'en est-il réellement ? il est difficile d'imaginer que le déluge de données n'aura pas lieu.
  • Vous avez dit Open Data … oui mais où ? - Vous cherchez des données ? mais ... vous ne savez pas où. Je vais essayer dans cet article de vous fournir un certain nombre de liens vers les sites d'Open Data les plus utiles.
  • Accéder à Hive & HDFS via PySpark - Découvrez dans ce tuto comment récupérer via Python (PySpark) vos données dans Hadoop HDFS et Hive.
  • Big data, au-delà du concept un nouvel axe de développement stratégique - Parler Big Data c’est aujourd’hui évoquer un nouveau phénomène. Marketing « poussif » ou bien réel conséquence d’une informatique qui évolue et change constamment ? Ce phénomène ne peut plus laisser indifférent. Essayons d’y voir plus clair …

Manipulation de données

Qualité de données