L’actualité de la transformation

AWS délivre les services d’IA DeepSeek R1 depuis ses infrastructures

Le modèle d'IA DeepSeek R1 est disponible via la console SageMaker d'Amazon

Amazon Web Services (AWS) annonce la disponibilité de l’IA générative DeepSeek-R1 du chinois Deepseek sur le Cloud AWS.

Aucun modèle n’est optimisé pour tous les cas d’usage

AWS souligne qu’il élargit continuellement son offre de modèles d’IA, incluant des modèles tels que DeepSeek-R1, en se basant sur les retours des clients. La raison en est qu’aucun modèle n’est optimisé pour tous les cas d’utilisation. Les clients doivent avoir accès à une variété de modèles afin de découvrir celui qui répond le mieux à leurs besoins.  « A mesure que vous pouvez évoluer dans des applications d’IA générative, le coût du calcul compte vraiment. Les gens sont avides d’un meilleur rapport qualité-prix » retient AWS.


DeepSeek a bouleversé le marché des assistants conversationnels en annonçant des coûts de développement et des tarifs inférieurs à ceux d’OpenAI. AWS indique surveiller de près les besoins des clients et les avancées technologiques, et élargit régulièrement sa sélection de modèles pour inclure de nouveaux modèles prometteurs aux côtés des favoris établis de l’industrie. Le but est de proposer des modèles performants et différenciés et que ses clients restent à la pointe de l’innovation en matière d’IA.

Une sortie rapide de plusieurs modèles d’IA



Cela amène AWS à la startup chinoise d’IA DeepSeek. AWS rappelle que DeepSeek a lancé DeepSeek-V3 en décembre 2024, puis DeepSeek-R1, DeepSeek-R1-Zero avec 671 milliards de paramètres et les modèles DeepSeek-R1-Distill allant de 1,5 à 70 milliards de paramètres le 20 janvier 2025. Le 27 janvier 2025, ils ont ajouté leur modèle Janus-Pro-7B basé sur la vision.

Newsletter La Revue du Digital

Les modèles sont disponibles publiquement et seraient 90 à 95 % plus abordables et rentables que les modèles comparables. Selon Deepseek, leur modèle se distingue par ses capacités de raisonnement, obtenues grâce à des techniques d’entraînement innovantes telles que l’apprentissage par renforcement.

Différents modes de déploiement de DeepSeek-R1

Il est maintenant possible de déployer les modèles DeepSeek-R1 de différentes façons : Amazon Bedrock Marketplace pour le modèle DeepSeek-R1 ;  Amazon Bedrock Custom Model Import pour les modèles Llama distillés DeepSeek-R1 et  Amazon SageMaker JumpStart pour le le modèle DeepSeek-R1.
On peut utiliser des instances Amazon EC2 Trn1 alimentées par les processeurs AWS Trainium pour les modèles distillés DeepSeek-R1. 

La distillation est une technique de Machine Learning (Apprentissage automatique) qui consiste à transférer les connaissances d’un grand modèle d’IA pré-entraîné, le « modèle enseignant », à un « modèle élève » plus petit. Amazon SageMaker AI prend en charge l’exécution des modèles Llama et Qwen DeepSeek distillés. Les modèles DeepSeek peuvent être entraînés sur Amazon SageMaker AI au travers de l’intégration de Hugging Face.

Et vous, qu’en pensez-vous ?

Une idée, une réaction, une question ? Laissez-nous un mot ci-dessous.

Je réagis à cet article

Top lectures en ce moment

L’actualité de la transformation

Dossier

L'IA clé de nos besoins vitaux dans l'eau, l'électricité et le gaz

Dossier exclusif

Marchés de l’eau : l’IA générative arrive dans les réponses aux appels d’offres des collectivités

Saur, spécialiste de la distribution d’eau potable,  fait évoluer son processus de réponse aux appels d’offres des collectivités et des industriels en y injectant de l’IA géné…

Stockage de l’électricité : l’IA générative outil d’accélération clé chez Engie

Le stockage de l’électricité est un enjeu stratégique. Engie s’y attelle et mobilise pour cela l’IA générative de type RAG, c'est-à-dire basée sur le traçage des documents source. …

Nouvelle donne dans le gaz naturel : GRDF s’adapte en utilisant l’IA

GRDF, leader de la distribution du gaz naturel en France, affine sa stratégie d’IA. Il s’appuie sur des serveurs internes pour la confidentialité des données de ses clients. GRDF c…


Vous, qu’en pensez-vous ?

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Newsletter