Data Engineering | Perardua Consultinghttps://www.perarduaconsulting.com/fr/blog/tags/data-engineering-5 https://static.wixstatic.com/media/5584dc_9de4690541404b9b980acea3d27a8cba~mv2.jpg

top of page

Data Model

Data Model

Comprendre les distinctions entre la modélisation dimensionnelle et normalisée des données avec des exemples pratiques

9 août 20255 min de lecture

data center

data center

Ingénierie des données évolutive pour la réussite informatique

7 août 20255 min de lecture

pandas analyzing data

pandas analyzing data

7 techniques simples pour détecter les anomalies dans Pandas pour l'analyse des données

24 juil. 20255 min de lecture

HDF5 data storage with graph

HDF5 data storage with graph

Comprendre HDF5 : le format de données polyvalent expliqué avec des exemples

24 juil. 20254 min de lecture

spark architecture and catalyst optimizer

spark architecture and catalyst optimizer

Optimisation des performances Scala dans Apache Spark à l'aide de Catalyst Optimizer

24 juil. 20257 min de lecture

three d cube

three d cube

Comment exploiter Python Dask pour un traitement et une analyse de données évolutifs

24 juil. 20258 min de lecture

Data Vault Hubs, Satellites, and Links

Data Vault Hubs, Satellites, and Links

Utilisations de la conception de la modélisation du coffre-fort de données

24 juil. 202510 min de lecture

columnar formats

columnar formats

ORC vs Parquet : quel format de fichier est le plus flexible dans la confrontation du stockage de données ?

lac de données

24 juil. 20255 min de lecture

Users using SQL

Users using SQL

Datalake et Lakehouse : comparaison d'Apache Kylin et de Trino pour l'analyse de la veille stratégique

lac de données

23 juil. 20257 min de lecture

cloud

cloud

Comparaison des formats de fichiers Apache Parquet, ORC et JSON pour le traitement de vos données

lac de données

10 juil. 20255 min de lecture

Spark, Hive, & Hadoop

Spark, Hive, & Hadoop

Apache Iceberg, Hadoop et Hive : ouvrez votre Datalake (Lakehouse) -> Partie II

24 juin 20257 min de lecture

Apache Iceberg, Hadoop et Hive : ouvrez votre Datalake (Lakehouse) -> Partie 1

Apache Iceberg, Hadoop et Hive : ouvrez votre Datalake (Lakehouse) -> Partie 1

Apache Iceberg, Hadoop et Hive : ouvrez votre Datalake (Lakehouse) -> Partie 1

16 juin 202512 min de lecture

Apache Iceberg Industrial Form

Apache Iceberg Industrial Form

Apache Iceberg et Pandas Analytics : Partie 3

11 mai 20255 min de lecture

Apache Iceberg Industrial Scale

Apache Iceberg Industrial Scale

Stockage Apache Iceberg et Pandas Analytics : Partie 1

7 mai 20257 min de lecture

CPU with parallel computing pipelines

CPU with parallel computing pipelines

Exploiter la puissance de Dask pour des workflows de science des données évolutifs

3 mai 20256 min de lecture

Apache Spark Logon on screen

Apache Spark Logon on screen

Maîtriser les agrégations avec Apache Spark DataFrames et Spark SQL en Scala, Python et SQL

28 avr. 20254 min de lecture

Apache Iceberg and HDF5

Apache Iceberg and HDF5

Exploration des cas d'utilisation d'Apache Iceberg et de HDF5 dans la gestion moderne des données

22 avr. 20255 min de lecture

Racks of Data Center

Racks of Data Center

Libérez le potentiel d'Apache Iceberg dans les stratégies d'ingénierie des données basées sur le cloud

22 avr. 20255 min de lecture

SEC Website

SEC Website

Analyse des données sur les ETF, les fonds communs de placement et la richesse : une introduction

18 avr. 20255 min de lecture

Result Set

Result Set

Données sur les ETF, les fonds communs de placement et les actionnaires : Récupérer le contenu

17 avr. 20252 min de lecture

bottom of page