Microsoft a introduit deux fonctionnalités innovantes dans le cadre de sa suite Azure AI : AI Speech Text to Speech Avatar et Personal Voice. Ces outils offrent des possibilités passionnantes en matière de création de contenu, de synthèse vocale et d'expériences numériques, mais soulèvent également d'importantes considérations éthiques.

Azure AI Speech Text to Speech Avatar permet aux utilisateurs de créer des avatars photoréalistes capables de parler en fournissant simplement des images et un script. L'outil de Microsoft utilise des modèles avancés d'apprentissage automatique pour animer l'avatar et générer un discours authentique. Cette fonctionnalité ouvre la possibilité de générer des vidéos de formation, des témoignages de clients et des assistants virtuels.

Un aspect remarquable est que ces avatars peuvent converser dans plusieurs langues et même répondre à des questions hors script en utilisant des modèles d'IA comme le GPT-3.5 d'OpenAI. Cette polyvalence étend les applications potentielles de l'outil, le rendant utile pour les chatbots et les scénarios de support client interactifs.

Bien que Microsoft reconnaisse le potentiel d'utilisation abusive associé aux technologies de génération d'avatars, ils ont mis en place des mesures de protection. Dans un premier temps, seuls les avatars prédéfinis seront accessibles à la plupart des abonnés Azure. Les avatars personnalisés sont actuellement limités à des cas d'utilisation spécifiques et nécessitent une inscription. Cette approche prudente vise à éviter une exploitation contraire à l’éthique de la technologie.

Cependant, l’introduction de ces capacités d’animation d’avatars a suscité des discussions sur des préoccupations éthiques. À l’instar de la récente grève SAG-AFTRA, où les acteurs se sont battus pour obtenir une compensation pour les ressemblances générées par l’IA, la question se pose de savoir si les entreprises devraient compenser les individus pour l’utilisation de leurs personnages virtuels. La position de Microsoft et de ses clients sur cette question reste floue.

Un autre ajout novateur à Azure AI est Personal Voice, une amélioration du service vocal neuronal personnalisé. Personal Voice permet aux utilisateurs de reproduire leur propre voix à diverses fins, telles que les assistants vocaux, le doublage linguistique et les narrations personnalisées. Microsoft prend des précautions pour éviter les complications juridiques en exigeant un consentement explicite sous la forme d'une déclaration enregistrée. Les utilisateurs doivent également accepter des directives d'utilisation spécifiques, garantissant que les modèles vocaux respectent certaines limitations.

Bien que Microsoft n'ait pas fourni de détails sur la rémunération des acteurs pour l'exploitation de leurs contributions vocales personnelles, cela témoigne d'une approche plus mesurée avec cette fonctionnalité. L'entreprise donne la priorité au consentement explicite des utilisateurs et à l'accès sécurisé pour maintenir le contrôle et prévenir les utilisations abusives.

Alors que ces puissants outils d’IA continuent d’évoluer, il reste à voir comment l’industrie dans son ensemble abordera les considérations juridiques et éthiques associées à l’utilisation du contenu généré par l’IA. La transparence et les lignes directrices en matière de rémunération peuvent devenir des facteurs essentiels au maintien des normes éthiques et à la protection des droits des individus.

QFP

Qu’est-ce que l’avatar de synthèse vocale Azure AI ?

Azure AI Speech Text to Speech Avatar est un outil qui génère des avatars photoréalistes capables de parler. L'outil utilise des modèles d'apprentissage automatique pour animer les avatars et générer un discours basé sur un script fourni.

Quel est l’objectif de Personal Voice dans Azure AI ?

Personal Voice est une amélioration du service vocal neuronal personnalisé de Microsoft. Il permet aux utilisateurs de reproduire leur propre voix à diverses fins, telles que la création d'assistants vocaux personnalisés, le doublage de contenu dans différentes langues et la génération de narrations pour des histoires, des livres audio et des podcasts.

Comment Microsoft répond-il aux préoccupations éthiques avec ces outils d’IA ?

Microsoft reconnaît le potentiel d'utilisation abusive et a mis en œuvre des mesures pour atténuer les problèmes éthiques. Par exemple, l’accès aux avatars personnalisés est actuellement limité, nécessitant des cas d’utilisation et une inscription spécifiques. De plus, les utilisateurs de Personal Voice doivent fournir un consentement explicite et adhérer aux directives qui limitent l'application des voix à certains types de contenu.