Microsoft e Nvidia stanno unendo le forze per fornire agli sviluppatori gli strumenti di cui hanno bisogno per eseguire e personalizzare i modelli di intelligenza artificiale sui PC Windows. All'evento Microsoft Ignite, Microsoft ha presentato Windows AI Studio, un hub centralizzato in cui gli sviluppatori possono accedere a una gamma di modelli di intelligenza artificiale e adattarli alle loro esigenze specifiche.

Windows AI Studio si basa su Azure AI Studio esistente e si integra con altri servizi come Hugging Face, offrendo agli sviluppatori una soluzione completa. È dotato di un'interfaccia utente intuitiva con configurazione guidata dell'area di lavoro, che consente agli sviluppatori di mettere a punto piccoli modelli linguistici (SLM) come Phi di Microsoft, Llama 2 di Meta e Mistral.

La potenza di Windows AI Studio va oltre la configurazione. Fornisce agli sviluppatori la possibilità di testare le prestazioni dei propri modelli utilizzando i modelli Prompt Flow e Gradio. Microsoft prevede di rilasciare Windows AI Studio come estensione di Visual Studio Code nel prossimo futuro, rendendolo facilmente accessibile agli sviluppatori.

Allo stesso tempo, Nvidia ha annunciato aggiornamenti a TensorRT-LLM, uno strumento inizialmente progettato per migliorare l'efficienza dell'esecuzione di modelli linguistici di grandi dimensioni (LLM) sulle GPU H100. L'ultimo aggiornamento consente a TensorRT-LLM di funzionare perfettamente con le GPU GeForce RTX serie 30 e 40, dotate di 8 GB di RAM o più.

Inoltre, Nvidia sta lavorando per rendere TensorRT-LLM compatibile con l'API Chat di OpenAI attraverso un nuovo wrapper. Questa compatibilità consente agli sviluppatori di eseguire LLM direttamente sui propri PC, affrontando le preoccupazioni sulla privacy dei dati nel cloud. La prossima versione di TensorRT-LLM 6.0 promette inferenza e supporto fino a cinque volte più veloci per i nuovi modelli Mistral 7B e Nemotron-3 8B.

Sia Microsoft che Nvidia stanno cercando di creare un modello di sviluppo a “loop ibrido”, consentendo lo sviluppo dell’intelligenza artificiale sia su cloud che su dispositivi locali. Gli sviluppatori possono ora sfruttare i potenti server cloud di Microsoft per alleviare il carico computazionale sui propri dispositivi, espandendo le proprie capacità e accelerando il ritmo dell’innovazione dell’intelligenza artificiale.

Domande frequenti (FAQ)

Cos'è Windows AI Studio?

Windows AI Studio è una piattaforma unificata sviluppata da Microsoft che consente agli sviluppatori di accedere e personalizzare i modelli di intelligenza artificiale. Offre un'interfaccia intuitiva e strumenti per mettere a punto piccoli modelli linguistici, come Phi di Microsoft, Llama 2 di Meta e Mistral.

Quali funzionalità fornisce Windows AI Studio?

Windows AI Studio consente agli sviluppatori di testare le prestazioni dei propri modelli utilizzando i modelli Prompt Flow e Gradio. Si integra inoltre con Azure AI Studio e altri servizi come Hugging Face, fornendo una soluzione completa per lo sviluppo dell'intelligenza artificiale.

In che modo gli sviluppatori possono accedere a Windows AI Studio?

Microsoft prevede di rilasciare Windows AI Studio come estensione di Visual Studio Code nel prossimo futuro, rendendolo facilmente accessibile agli sviluppatori direttamente dal loro ambiente di sviluppo.

Cos'è TensorRT-LLM?

TensorRT-LLM è uno strumento sviluppato da Nvidia che ottimizza le prestazioni dell'esecuzione di modelli linguistici di grandi dimensioni (LLM) sulle GPU. Migliora l'efficienza e la velocità di calcolo per le attività LLM.

Quali aggiornamenti sono stati annunciati per TensorRT-LLM?

Nvidia ha ampliato la compatibilità di TensorRT-LLM per includere GPU GeForce RTX serie 30 e 40 con 8 GB di RAM o più. Inoltre, Nvidia sta lavorando per rendere TensorRT-LLM compatibile con l'API Chat di OpenAI, consentendo l'esecuzione locale di LLM e risolvendo i problemi di privacy dei dati.

Qual è lo scopo del modello di sviluppo del “circuito ibrido”?

Il modello di sviluppo “circuito ibrido” mira a consentire lo sviluppo dell’intelligenza artificiale sia su cloud che su dispositivi locali. Sfrutta la potenza computazionale dei server cloud di Microsoft, alleggerendo il carico sui dispositivi degli sviluppatori e facilitando uno sviluppo IA più rapido.