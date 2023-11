Microsoft et Nvidia unissent leurs forces pour fournir aux développeurs les outils dont ils ont besoin pour exécuter et personnaliser des modèles d'IA sur les PC Windows. Lors de l'événement Microsoft Ignite, Microsoft a dévoilé Windows AI Studio, un hub centralisé où les développeurs peuvent accéder à une gamme de modèles d'IA et les adapter à leurs besoins spécifiques.

Windows AI Studio s'appuie sur Azure AI Studio existant et s'intègre à d'autres services comme Hugging Face, offrant aux développeurs une solution complète. Il dispose d'une interface utilisateur intuitive avec une configuration guidée de l'espace de travail, permettant aux développeurs d'affiner les petits modèles de langage (SLM) comme Phi de Microsoft, Llama 2 de Meta et Mistral.

La puissance de Windows AI Studio s'étend au-delà de la configuration. Il offre aux développeurs la possibilité de tester les performances de leurs modèles à l'aide des modèles Prompt Flow et Gradio. Microsoft prévoit de publier prochainement Windows AI Studio en tant qu'extension Visual Studio Code, le rendant ainsi facilement accessible aux développeurs.

Simultanément, Nvidia a annoncé des mises à jour de TensorRT-LLM, un outil initialement conçu pour améliorer l'efficacité de l'exécution de grands modèles de langage (LLM) sur les GPU H100. La dernière mise à jour permet à TensorRT-LLM de fonctionner de manière transparente avec les GPU GeForce RTX séries 30 et 40, équipés de 8 Go de RAM ou plus.

De plus, Nvidia travaille à rendre TensorRT-LLM compatible avec l'API Chat d'OpenAI via un nouveau wrapper. Cette compatibilité permet aux développeurs d'exécuter des LLM directement sur leurs PC, répondant ainsi aux préoccupations concernant la confidentialité des données dans le cloud. La prochaine version de TensorRT-LLM 6.0 promet une inférence et une prise en charge jusqu'à cinq fois plus rapides pour les nouveaux modèles Mistral 7B et Nemotron-3 8B.

Microsoft et Nvidia s'efforcent de créer un modèle de développement en « boucle hybride », permettant le développement de l'IA sur les appareils cloud et locaux. Les développeurs peuvent désormais tirer parti des puissants serveurs cloud de Microsoft pour alléger la charge de calcul sur leurs appareils, étendre leurs capacités et accélérer le rythme de l'innovation en matière d'IA.

