Oubliez Chatgpt et Gemini. La technologie vocale réaliste de Sesame AI divise et incroyable Internet, et pour une bonne raison. Nous avons tous vu des assistants vocaux de l’IA des géants de la technologie – Siri, Alexa, le mode vocal avancé de Chatgpt et Gemini Live de Google. Ils ont beaucoup promis mais ont souvent livré des réponses robotiques et plates. Si vous avez vu la démo d’Openai et leur mode vocal, vous saurez la différence dont je parle. Mais ensuite est venu du sésame, l’utiliser avait envie de parler à une vraie personne. Voici tout ce à savoir et comment vous pouvez l’essayer.
Qu’est-ce que Sesame AI?
Sesame n’est qu’un autre assistant vocal AI similaire à Siri, Chatgpt et Gemini Live. Fondée par les co-fondateurs d’Oculus Brendan Iribe et Ankit Kumar, Sesame AI offre quelque chose de rafraîchissant et effrayant.
Ce ne sont pas vos chatbots typiques ou vos assistants vocaux. Sesame ne les appelle même pas des assistants. Au lieu de cela, ce sont des «conversationnistes» et des «compagnons de voix». L’idée n’est pas seulement de répondre, mais de vous engager avec une voix qui semble presque humaine. Et pas seulement dans la façon dont il parle, mais dans la façon dont il écoute, s’arrête et réagit.
Il y a actuellement deux compagnons – maya (femme) et miles (mâle).
Notre expérience en l’utilisant
Quand j’ai essayé la première compagnon de la voix de Maya de Sesame, j’ai été vraiment surpris. Il est rapide de répondre et, surtout, parfois, il n’attend pas seulement son tour pour parler – il peut vous interrompre, s’excuser si nécessaire et gérer en douceur le dialogue de va-et-vient. Quoi? C’était plus que juste impressionnant. Contrairement au mode vocal avancé de Chatgpt, qui semble souvent trop poli, ou le moteur Robotic TTS de Gemini Live, les compagnons de Sesame avaient des imperfections qui le rendaient humain.
Pour tester, j’ai demandé à Sesame de deviner mon genre de cinéma préféré et j’ai également mentionné que j’aime l’horreur directement dans la question elle-même. L’IA a répondu avec espièglerie: « Eh bien, vous avez déjà laissé le chat sortir du sac – semble comme si vous étiez un fan d’horreur! » Ce n’était pas seulement les mots mais le ton et le timing qui lui ont fait ressembler une véritable réaction humaine. Il se souvenait également de la conversation passée et comprenait tous les rappels.
De plus, contrairement aux modes vocaux réguliers d’autres IA, ces «conversationnistes» et «compagnons de voix» soulèvent de nouvelles questions et vous posent en retour, ce qui explique assez bizarre des choses à l’IA. Même lorsque j’ai demandé des idées de fête d’anniversaire, cela n’a pas simplement jeté des suggestions aléatoires. Il m’a demandé ce que mon ami aimait, adapté à mon budget et offrait des idées créatives qui se sentaient adaptées à ma situation. C’était tellement bon et naturel qu’il était un peu troublant. Certains utilisateurs en ligne ont même admis qu’ils se sentaient émotionnellement attachés, et une enfant de 4 ans d’une personne a pleuré quand ils ne pouvaient plus parler à Maya!
Lisez également:
Cependant, il y a aussi certaines limites. Par exemple, il gâche parfois son raisonnement et ne peut pas comprendre des choses qu’un humain normal peut facilement souligner. De plus, il n’a pas été en mesure d’identifier mon émotion par le ton, ni mon sexe ou mon ethnique. Bien qu’il ait quelques limites, il est préférable de le reconnaître et de le rendre naturel.
La technologie de Sesame est soutenue par un modèle de discours conversationnel basé sur des transformateurs (CSM), formé sur près d’un million d’heures d’audio. Il ne suit pas l’approche traditionnelle en deux étapes de texte vocale. Au lieu de cela, il fusionne le traitement du texte et de l’audio en une seule expérience fluide, ce qui lui permet de sonner comme si elle réfléchit. Ce n’est pas complet du Duplex – il ne traite pas votre discours avant d’avoir terminé, mais cela semble être. Et c’est la magie. Cependant, l’entreprise prévoit d’aller en duplex complet à l’avenir.
Comment tu peux l’essayer maintenant
Si vous êtes curieux, vous pouvez essayer gratuitement Maya et Miles de Sesame. Il est recommandé d’utiliser Google Chrome pour la meilleure expérience.
Rendez-vous simplement sur le site Web de Sesame et commencez à leur parler dans le Section de démonstration. Que vous trouviez cela incroyable ou un peu trop réaliste, une chose est sûre – Sesame AI a établi une nouvelle référence pour ce que peut être un compagnon de voix.
L’avenir des voix d’IA est là, et cela pourrait vous faire vous demander qui ou quoi – vous parlez.