top of page


Data Lake ou Lakehouse : distinctions dans l'architecture de données moderne
Dans un monde axé sur les données, les organisations sont confrontées à des défis liés au volume et à la complexité considérables des données. Deux grands frameworks, les lacs de données et les lakehouses, ont émergé pour aider les entreprises à gérer et exploiter efficacement leurs données. Cet article compare clairement ces deux concepts, en soulignant leurs caractéristiques uniques et leurs applications pratiques au sein d'une architecture de données moderne.
Claude Paugh
18 mai8 min de lecture
0 vue


Apache Iceberg et Pandas Analytics : Partie 3
Les deux articles précédents portaient sur l'évaluation d'Apache Iceberg et de ses fonctionnalités, ainsi que sur l'utilisation de PyIceberg pour créer des objets et charger des données. Cet article se concentrera sur l'extraction de données et l'utilisation des dataframes Pandas pour créer des analyses.
Claude Paugh
11 mai5 min de lecture
2 vues


Stockage Apache Iceberg et Pandas Analytics : Partie 1
J'aime généralement essayer de nouvelles choses, et la technologie ne fait pas exception. J'ai donc décidé d'approfondir mes recherches sur les mécanismes d'Apache Iceberg, et plus particulièrement sur l'implémentation Python, PyIceberg.
Apache Iceberg with Industrial Piping
J'ai spécifiquement examiné certains éléments clés qui font généralement partie des pratiques de gestion des données, quelle que soit la technologie
Claude Paugh
7 mai7 min de lecture
3 vues


Exploiter la puissance de Dask pour des workflows de science des données évolutifs
C'est là qu'intervient Dask. Cette puissante bibliothèque Python est conçue pour le calcul parallèle, facilitant ainsi l'adaptation des workflows des data scientists. Dans cet article, nous allons explorer comment utiliser Dask pour des workflows de data science évolutifs, à l'aide d'exemples clairs et d'informations exploitables.
Claude Paugh
3 mai6 min de lecture
5 vues


Analyse des données sur les ETF, les fonds communs de placement et la richesse : une introduction
Il y a quelques années, j'ai commencé un travail secondaire que je pensais être amusant : collecter et classer les documents mensuels de la SEC pour les ETF et les fonds communs de placement. Je souhaite automatiser le processus de compilation des documents déposés auprès de la SEC à l'aide des dépôts d'index des entreprises et les mettre à jour lors du dépôt.
Claude Paugh
18 avr.5 min de lecture
3 vues
bottom of page