Améliorations à venir de l'IA d'Amazon Web Services (AWS) dans le paysage de l'IA

Claude Paugh
il y a 1 jour
4 min de lecture

Amazon Web Services (AWS) demeure un acteur majeur du cloud computing et de l'intelligence artificielle. Face à l'évolution rapide des technologies d'IA, nombreux sont ceux qui s'interrogent sur les nouvelles améliorations qu'AWS introduira. Ces mises à jour seront-elles axées sur les modèles d'IA génératifs ? AWS peut-il rivaliser avec des fournisseurs spécialisés en GPU comme Lambda Labs ? Qu'en est-il des frameworks de calcul distribué ? AWS étendra-t-il son offre au-delà de Ray pour inclure des services tels que DASK ? Cet article explore ces questions et éclaire l'avenir des offres d'IA d'AWS.

AWS et l'IA générative : à quoi s'attendre

L'intelligence artificielle générative (IAG) a suscité un vif intérêt grâce à sa capacité à créer du texte, des images et même du code. AWS a déjà intégré l'IAG à certains de ses services, comme Amazon Bedrock, qui donne accès à des modèles de base provenant de différents fournisseurs d'IA. La question est de savoir si AWS développera ses propres modèles d'IAG ou s'appuiera sur des partenariats.

Actuellement, AWS se concentre sur la fourniture d'infrastructures et d'outils prenant en charge les charges de travail d'IA générative plutôt que sur la création de modèles propriétaires concurrents directs d'OpenAI ou de Google. Par exemple :

Amazon Bedrock permet aux clients de créer des applications en utilisant des modèles de base fournis par des leaders de l'IA tels que AI21 Labs, Anthropic et Stability AI.
Amazon SageMaker JumpStart propose des modèles pré-entraînés et des fonctionnalités de réglage fin pour les tâches d'IA générative.

La force d'AWS réside dans l'intégration de ces modèles dans des environnements cloud évolutifs, sécurisés et économiques. Cette approche permet aux développeurs d'expérimenter l'IA générative sans avoir à gérer une infrastructure complexe.

AWS va-t-il développer ses propres modèles d'IA générative ?

AWS n'a fait aucune annonce publique concernant le lancement de modèles d'IA génératifs propriétaires concurrents à la série GPT d'OpenAI ou à Bard de Google. Au contraire, AWS semble privilégier l'accès de ses clients aux meilleurs modèles disponibles sur sa plateforme. Cette stratégie réduit les risques liés au développement et tire parti des innovations qui animent l'écosystème de l'IA.

En concurrence avec Lambda Labs et les fournisseurs de GPU

Lambda Labs est réputé pour fournir du matériel GPU spécialisé, optimisé pour l'entraînement et l'inférence en IA. AWS propose une large gamme d'instances GPU, notamment les GPU NVIDIA A100 et H100 de dernière génération, suffisamment puissants pour les charges de travail d'IA les plus exigeantes.

Comparaison des offres GPU d'AWS

Instances GPU AWS : AWS propose des instances Elastic Compute Cloud (EC2) dotées de GPU conçus pour l’IA, comme les instances P4d et P5. Celles-ci prennent en charge l’entraînement et l’inférence à grande échelle.
Lambda Labs : Spécialisé dans les stations de travail et les serveurs GPU abordables et performants, conçus pour les chercheurs et les développeurs en IA.

L'avantage d'AWS réside dans son infrastructure cloud massive, sa disponibilité mondiale et son intégration avec les autres services AWS. Les clients peuvent moduler les ressources GPU à la demande, ce qui est plus difficile avec les fournisseurs de matériel sur site ou dédié.

Si Lambda Labs peut proposer du matériel économique pour les petites équipes ou les configurations locales, les instances GPU d'AWS sont mieux adaptées aux entreprises ayant besoin d'une infrastructure d'IA flexible et évolutive.

Calcul distribué : Ray vs. DASK sur AWS

Les frameworks de calcul distribué permettent de traiter de grands ensembles de données et d'entraîner plus rapidement les modèles d'IA en répartissant les tâches sur plusieurs machines.

AWS se concentre actuellement sur Ray

AWS a adopté Ray , un framework de calcul distribué open source très prisé pour les charges de travail d'IA et d'apprentissage automatique. AWS propose Amazon SageMaker Distributed Training avec Ray, permettant aux utilisateurs de faire évoluer efficacement les tâches d'entraînement.

Ray prend en charge :

Parallélisation du code Python
Optimisation distribuée des hyperparamètres
Apprentissage par renforcement à grande échelle

Et DASK ?

DASK est un autre framework de calcul distribué, souvent utilisé pour l'analyse de données massives et l'apprentissage automatique. Il s'intègre parfaitement aux outils de science des données Python tels que Pandas et NumPy.

Actuellement, AWS ne propose pas de service DASK géré. Les utilisateurs peuvent déployer manuellement des clusters DASK sur EC2 ou Kubernetes, mais il n'existe aucun service AWS natif dédié à DASK.

AWS va-t-il ajouter un service DASK géré ?

Rien n'indique clairement qu'AWS envisage de proposer prochainement un service DASK managé. AWS semble privilégier Ray en raison de sa forte intégration à l'écosystème de l'IA et du ML. La flexibilité de Ray et sa communauté grandissante en font un choix naturel pour AWS afin de prendre en charge les charges de travail d'IA distribuées.

Exemples concrets d'améliorations de l'IA AWS en action

Chatbots IA génératifs : les entreprises utilisent Amazon Bedrock pour créer des chatbots alimentés par des modèles de base sans avoir à gérer l’infrastructure d’IA sous-jacente.
Entraînement de modèles à grande échelle : les entreprises exploitent les instances GPU AWS avec Ray pour entraîner des modèles complexes sur plusieurs nœuds, réduisant ainsi le temps d’entraînement de plusieurs jours à quelques heures.
Pipelines de traitement des données : les développeurs déploient DASK sur des clusters EC2 pour le traitement des données massives, bien que cela nécessite une configuration et une gestion manuelles.

Ces exemples montrent comment les améliorations apportées à l'IA d'AWS aident les entreprises à créer, entraîner et déployer efficacement des applications d'IA.

Ce que les utilisateurs d'AWS devraient surveiller ensuite

Extension d'Amazon Bedrock : Attendez-vous à l'ajout de nouveaux modèles et fonctionnalités, rendant l'IA générative plus accessible.
Nouveaux types d'instances GPU : AWS introduira probablement de nouveaux matériels GPU pour répondre aux besoins de calcul de l'IA.
Intégration améliorée avec Ray : outils et services améliorés pour l’entraînement et l’inférence de l’IA distribuée.
Matériel potentiel dédié à l'IA : AWS pourrait développer ou adopter des accélérateurs d'IA autres que les GPU afin d'optimiser les performances et les coûts.

AWS se positionne comme un fournisseur de plateforme d'IA flexible plutôt que comme un concurrent direct des créateurs de modèles d'IA spécialisés ou des fournisseurs de matériel. Son approche axée sur une infrastructure évolutive, l'intégration et les partenariats permet aux clients d'accéder aux dernières technologies d'IA sans investissement initial important.

Pour les développeurs et les entreprises, cela signifie qu'AWS restera un choix fiable pour la création d'applications d'IA, notamment lorsque l'évolutivité et la facilité d'utilisation sont primordiales.

Explorez dès aujourd'hui les services d'IA d'AWS pour découvrir comment commencer à développer avec les outils et infrastructures d'IA les plus récents.