Le startup audio KRISP a déclaré mercredi qu’il lançait une nouvelle fonctionnalité qui utilise l’IA pour modifier l’accent d’un utilisateur lors des appels. L’entreprise déploie initialement un soutien pour changer les accents anglais indiens en anglais américain.
La startup indique que le processus de conversion d’accent préserve la voix de l’orateur et change uniquement de phonèmes pour correspondre aux accents américains. La fonctionnalité a apparemment été testée dans des environnements d’entreprise, et une model bêta arrive maintenant sur l’utility KRISP Desktop. Les utilisateurs peuvent allumer la fonctionnalité à tout second pendant ou avant les appels.
Arto Minasyan, le co-fondateur de la société, a déclaré que l’idée de la fonctionnalité provenait d’un problème auquel il était confronté dans ses conversations. « Beaucoup de gens ne comprennent pas mon accent même si je parle bien l’anglais. Nous pensions que changer les accents pourrait aider les gens à se comprendre beaucoup mieux. Nous avons commencé à travailler sur ce problème il y a deux ans et maintenant nous le publions en bêta », a déclaré Minasyan.
Cependant, lorsque ce journaliste a testé la fonctionnalité, la voix transformée ne semblait pas naturelle et a même raté quelques mots parfois. L’entreprise a attribué ces défauts à la model bêta, affirmant que le modèle s’améliorerait avec le temps.
Krisp affirme que lorsqu’il a testé la fonctionnalité avec les entreprises, les taux de conversion des ventes ont augmenté de 26,1% et les revenus par livre ont bondi de 14,8%.
La société a déclaré qu’elle avait décidé de travailler d’abord sur les accents indiens, automotive les gens du pays représentent une grande partie de la main-d’œuvre mondiale dans les domaines STEM. Il est prévu d’ajouter une prise en cost de plus d’accents, y compris des Philippins.
D’autres startups comme Sanas soutenues par GV ont déployé une technologie similaire dans les centres d’appels à grande échelle.
La société affirme avoir formé le modèle sur des milliers d’échantillons de parole qui couvraient différents accents et dialectes, et utilisé des données de son assistant de réunion après avoir obtenu le consentement des utilisateurs.
Minasyan a déclaré qu’un autre avantage de la fonctionnalité est qu’il n’a pas besoin de pré-formation sur la voix d’un utilisateur automotive il crée un profil pour le haut-parleur en temps réel.
Krisp, qui a levé les capitaux pour la dernière fois en 2021, prévoit de publier cette année les functions iOS et Android pour soutenir les réunions en personne. Il existe également une nouvelle extension Chrome pour une meilleure intégration avec Google Meet within the Works.