top of page
Facebook
WhatsApp
LinkedIn
Pinterest
Copier le lien
Maison
Blog
S'abonner
À propos
FAQ
Politique de Confidentialité
All Posts
Apache Spark
Apache Iceberg
Dask
lac de données
architecture de traitement
ETF
Pandas
Python
Spark
dans la modelisation
Conception de bases de données
architecture des données
ingénieur de données
lac de données
Apple Silicon
AI
science des données
matériel
qualité des données
ETL
génération initiale de code
silicone de pomme
Rust
Fournisseurs de cloud
Comprendre les distinctions entre la modélisation dimensionnelle et normalisée des données avec des exemples pratiques
Claude Paugh
9 août
5 min de lecture
Ingénierie des données évolutive pour la réussite informatique
Claude Paugh
7 août
5 min de lecture
7 techniques simples pour détecter les anomalies dans Pandas pour l'analyse des données
Pandas
Claude Paugh
24 juil.
5 min de lecture
Comprendre HDF5 : le format de données polyvalent expliqué avec des exemples
Claude Paugh
24 juil.
4 min de lecture
Optimisation des performances Scala dans Apache Spark à l'aide de Catalyst Optimizer
Apache Spark
Claude Paugh
24 juil.
7 min de lecture
Comment exploiter Python Dask pour un traitement et une analyse de données évolutifs
Dask
Claude Paugh
24 juil.
8 min de lecture
Utilisations de la conception de la modélisation du coffre-fort de données
Claude Paugh
24 juil.
10 min de lecture
ORC vs Parquet : quel format de fichier est le plus flexible dans la confrontation du stockage de données ?
lac de données
Claude Paugh
24 juil.
5 min de lecture
Datalake et Lakehouse : comparaison d'Apache Kylin et de Trino pour l'analyse de la veille stratégique
lac de données
Claude Paugh
23 juil.
7 min de lecture
Comparaison des formats de fichiers Apache Parquet, ORC et JSON pour le traitement de vos données
lac de données
Claude Paugh
10 juil.
5 min de lecture
Apache Iceberg, Hadoop et Hive : ouvrez votre Datalake (Lakehouse) -> Partie II
Apache Spark
Claude Paugh
24 juin
7 min de lecture
Apache Iceberg, Hadoop et Hive : ouvrez votre Datalake (Lakehouse) -> Partie 1
Apache Iceberg
Claude Paugh
16 juin
12 min de lecture
Apache Iceberg et Pandas Analytics : Partie 3
Apache Iceberg
Claude Paugh
11 mai
5 min de lecture
Stockage Apache Iceberg et Pandas Analytics : Partie 1
Apache Spark
Claude Paugh
7 mai
7 min de lecture
Exploiter la puissance de Dask pour des workflows de science des données évolutifs
Dask
Claude Paugh
3 mai
6 min de lecture
Maîtriser les agrégations avec Apache Spark DataFrames et Spark SQL en Scala, Python et SQL
Apache Spark
Claude Paugh
28 avr.
4 min de lecture
Exploration des cas d'utilisation d'Apache Iceberg et de HDF5 dans la gestion moderne des données
Apache Iceberg
Claude Paugh
22 avr.
5 min de lecture
Libérez le potentiel d'Apache Iceberg dans les stratégies d'ingénierie des données basées sur le cloud
Apache Iceberg
Claude Paugh
22 avr.
5 min de lecture
Analyse des données sur les ETF, les fonds communs de placement et la richesse : une introduction
ETF
Claude Paugh
18 avr.
5 min de lecture
Données sur les ETF, les fonds communs de placement et les actionnaires : Récupérer le contenu
ETF
Claude Paugh
17 avr.
2 min de lecture
bottom of page