Le décalage de Google Assistant et dans l’ère Gemini est presque à ses derniers étapes. On peut se sentir nostalgique à propos de l’assistant virtuel éponyme, mais il est indéniable que l’arrivée des Gémeaux a vraiment changé ce qu’un agent d’IA peut faire pour nous.
Les côtelettes de compréhension du langage sont bien meilleures avec les Gémeaux. Les conversations sont naturelles, les interactions d’purposes sont fluides, l’intégration avec d’autres produits Google est enrichissante, et même dans son état libre, Gemini emmène Siri aux nettoyeurs même sur un iPhone.
Il y a cependant quelques astuces qui mettent les Gémeaux dans une ligue complètement différente. La recherche approfondie est l’une de ces caractéristiques agentiques que j’utilise quotidiennement et que je proceed à être étonnées. En mars, Google a ajouté une autre fonctionnalité enrichissante au Gemini Arsenal: Présentation audio.
Tourner tout cela, en podcast
Imaginez transformer vos paperwork ternes, votre doc de recherche ouvertement complexe ou votre matériel de lecture académique en un chat de podcast bidirectionnel vivant. C’est essentiellement le sujet des aperçus audio. La fonctionnalité est arrivée pour la première fois sur le Notebooklm profondément sous-estimé de Google et a finalement été porté sur l’expérience de base des Gémeaux sur le cellular et le Internet.
Vous n’avez pas à passer par des cerceaux strategies ou à écrire une invite de texte hyper spécifique pour obtenir ces relookings audio. Téléchargez simplement un fichier à partir du sélecteur de pièce jointe, et vous verrez une puce «générer une vue d’ensemble audio» apparaître juste au-dessus de la boîte de chat. Appuyez dessus et la génération de podcast commencera.
Cela peut prendre quelques minutes pour terminer, mais en attendant, vous pouvez passer en toute sécurité à une autre utility (ou fenêtre). Une fois le processus terminé, vous obtiendrez une notification sur le fait que le podcast soit prêt pour votre plaisir d’écoute ou partage avec d’autres personnes.
L’aperçu de l’audio est généralement un chat à deux personnes et fluide sur un ton étrangement naturel. J’ai presque l’impression que vous discutez avec Gemini Reside, qui se despatched lui-même dramatiquement plus naturel que n’importe quel chatbot IA que j’ai utilisé jusqu’à présent en mode dialog vocale.
Ces podcasts générés par l’IA sont généralement assez bien faits, je dirais. Mais je gravite vers eux pour deux raisons. Tout d’abord, je regarde un écran, je lis des articles pour la recherche et j’écris mes propres affaires, à peu près toute la journée.

Cela laisse peu de place pour s’engager avec tout autre matériel textuel, que ce soit académique, lié au travail ou même récréatif. Cependant, si je pouvais simplement changer le mode sensoriel pour m’engager avec ce matériau, ma fatigue de lecture prend un siège arrière.
Les podcasts audio offrent une toute nouvelle façon de s’engager avec du matériel textuel de manière plus immersive. Cela nous amène au deuxième avantage, qui est une stimulation sensorielle ou une variance. Cette formule a été bien documentée et expérimentée, dans le domaine du monde universitaire et du teaching professionnel.
Remark ça m’a aidé?
La fatigue du texte fait des ravages. Cela fait que un travail excitant apparaît même comme une corvée que vous devez passer, simplement parce que vous ne pouvez pas vous permettre de le manquer. Cependant, s’engager avec le même travail ou son essence, à travers un média sensoriel différent supprime que la peur de surcharger sur un matériau plus basé sur le texte. Cela aide en fait de quelques autres manières.
«L’engagement de plusieurs sens renforce la mémoire. Lorsque nous écoutons et interagissons – que ce soit en lecture, en écrivant ou en faisant – le cerveau établit des connexions plus fortes, ce qui facilite le rappel plus tard», explique Yasir Naseem, un professional en linguistique dont le travail de recherche s’est concentré sur la modernisation et la gamification des méthodologies d’enseignement.
Naseem, qui est actuellement un professional du programme d’études dans une entreprise de technologie ED-Tech, me dit que vous ne pouvez pas vous fier uniquement à un seul assist pour l’apprentissage. Au lieu de cela, me dit-il, vous devez combiner différentes méthodes pour un avantage maximal, allant de l’effet sentimental à la rétention de la mémoire.

Recherche publiée dans Ordinateurs et éducation Journal a également souligné remark les étudiants ont trouvé que les fichiers audio étaient le matériel d’apprentissage et de révision supérieur. La flexibilité et la polyvalence sensorielle ont joué un rôle majeur dans leur préférence pour les podcasts sur d’autres médias.
«La véritable compréhension et la rétention à lengthy terme se produisent lorsque l’écoute est associée à des visuels, des discussions ou des activités pratiques», ajoute Naseem. Mes propres expériences avec les aperçus audio de Gemini font écho à ses conseils. J’ai un memento plus fort des connaissances que j’ai absorbées by way of les podcasts audio par rapport à la lecture du même matériau.
Vous voyez, ces podcasts audio ne sont pas une easy conversion text-to audio. Au lieu de cela, ils décomposent un mur de texte autrement ennuyeux en une dialog à deux personnes à laquelle vous êtes essentiellement le seul public. C’est une aubaine pour tout matériau textuel qui ne déclenche pas instantanément votre curiosité et vous interact dans une lecture instantanée.
Dans ma dernière expérience, le podcast audio de Gemini m’a aidé à comprendre la signification d’un article discutant «d’un cadre pour l’apprentissage neuronal interprétable basé sur les fonctions locales de l’information-théorique». En termes plus simples, la recherche a expliqué remark les cellules nerveuses s’organisent.
Vous obtenez le level que j’essaie de faire faire ici, non?
Commodité, surtout

La commodité joue un rôle necessary lorsqu’il s’agit d’absorber des informations. Et il en va de même pour l’enthousiasme et l’excitation pour tout le processus. Selon un article publié dans le Ordinateurs dans le comportement humain Journal, podcasts «Améliorez la commodité, la flexibilité et l’accessibilité aux informations et aux connaissances». Il ne m’a pas fallu longtemps pour le réaliser.
Vivre dans la capitale nationale, passer entre 2 et 3 heures coincé dans un trafic ou un trajet public est une réalité quotidienne pour moi. Mais plus que l’inconfort de tout cela, c’est le temps perdu qui fait le plus mal. Le matériel d’apprentissage audio offre le moyen le plus pratique d’utiliser cette période de manière productive.
Avec les Gémeaux, vous avez un autre avantage essential. Vous n’avez pas à compter sur la disponibilité audio d’un sure livre, article de presse ou matériel académique. Vous pouvez simplement télécharger tout le matériel à votre disposition, et Gemini le transformera en une dialog de type podcast.
Il existe de nombreuses recherches multidisciplinaires qui soutiennent les avantages d’une approche audio de l’apprentissage. Et il ne s’agit pas uniquement de l’écoute, mais plutôt de décomposer les choses et de les présenter de manière plus accessible.
« Quelques gens ont dit … ils aiment le fait que nous leur donnons des trucs qu’ils ne lisent pas dans le journal. Ils aiment le fait … nous essayons de nous présenter d’une manière différente », explique un doc de recherche citant un rédacteur en chef. Le doc, gracieuseté de l’Université de Syracuse, a été publié en 2006 au tout début de la tendance du podcast.

En 2025, les podcasts sont devenus un véritable phénomène pour consommer des informations, du matériel éducatif aux trucs de divertissement. Selon le Pew Research Centerprès de la moitié des Américains se sont engagés avec des podcasts. Plus de la moitié du public interrogé a écouté des podcasts pour l’apprentissage, pour le divertissement ou pour avoir du matériel audio tout en faisant autre selected.
Près d’un troisième voulait entendre les opinions des autres, et un autre section tout aussi necessary était connecté afin qu’ils puissent garder un œil sur les nouvelles et les événements actuels. Mon engagement n’est pas tombé trop loin du schéma susmentionné. Pour les histoires de journalisme lengthy ou les travaux d’investigation, j’ai souvent trouvé leur model de podcast plus agréable.
Plus efficace aussi
Fait intéressant, les podcasts semblaient également conduire des changements pratiques. Environ les deux tiers des auditeurs se sont engagés dans un livre ou un movie après avoir entendu un podcast, plus de la moitié du public a commencé à suivre une personne sur les réseaux sociaux, et un tiers d’entre eux ont fait des changements de type de vie tels que la prise de l’exercice ou le changement de régime.
Recherche publiée dans le Journal of Social Media Marketing Des ideas ont mis en évidence des ideas tels que la substitution des médias et la similitude fonctionnelle dans le contexte de l’écoute des médias et de la volonté du public. L’idée globale est que les utilisateurs évaluent le médium et choisissent celui qui leur convient le plus.
«Pour le caractère distinctive des contenus de podcast, l’affect sur la volonté d’écoute et la substitution des médias est optimistic, ce qui suggère que le contenu distinctive, la grande qualité et la diversité de grande envergure donnent envie aux podcasts d’écouter», explique le journal. Je peux également attester personnellement de cette constatation.
– nadeémne (@nsnadeemsarwar) 30 mars 2025
Au cours des derniers jours, j’ai «« irifié »de nombreux paperwork de recherche discutant de l’impression des fibres, de la viande et de la consommation alimentaire emballée sur les habitudes de sommeil, la santé cognitive et la santé intestinale. Comparé au ton ouvertement approach des articles scientifiques, deux hôtes décomposent les résultats avec un ton «sentimental» et «persuasif» a eu un effet de manière discernable sur moi.
Considérez-le comme un apprentissage sur les étiquettes sociales ou les sensibilités culturelles dans un livre. Et des années plus tard, les voir en motion de vos propres yeux. Ou, pensez à apprendre une langue étrangère à partir d’un livre, le tout par vous-même, et la différence que cela fait lorsque vous l’apprenez d’une personne remplissant toutes ces connaissances dans vos oreilles.
Cette dernière approche récolte de meilleurs résultats. Et c’est principalement parce que l’effet composé de l’engagement multisensoriel accélère le processus d’apprentissage, ou le rend plus efficace. Les aperçus audio de Gemini ont créé un effet similaire, et ils m’ont beaucoup aidé.
Quelques accrocs
Aussi productif que tout cela puisse paraître, les aperçus audio de Gemini ne le sont pas. Ils peuvent vider la véritable essence d’une histoire écrite avec goût dans ses efforts de «podcasti-fication», ou manquer quelques petits détails. Il y a aussi quelques bizarreries fonctionnelles. La longueur de la vue d’ensemble audio, qui correspond directement à la profondeur du matériau supply, peut être assez aléatoire.

Par exemple, lorsque je lui ai nourri un livre de 260 pages sur le sujet des conjugaisons et de la morphologie des verbes dans la langue perse, l’aperçu de l’audio généré par les Gémeaux était un peu plus de sept minutes. Qualitativement, il a couvert les pièces les plus cruciales, mais a raté les détails les plus fins.
Dans un autre cas, j’ai transformé un doc de recherche en profondeur d’une valeur de quatre pages en podcast audio. La durée de celle-ci était d’environ 13 minutes. Malheureusement, la puce de tâche automatique de Gemini ne vous permettra pas d’ajuster la longueur ou la profondeur conversationnelle de la vue d’ensemble audio.
Si vous utilisez Google NoteBookLM, où la fonctionnalité de vue d’ensemble de l’audio est apparue pour la première fois, vous pouvez écrire une invite qui peut dicter la profondeur de la dialog du podcast. J’ai généré un podcast audio avec un fonctionnement de 59 sur Notebooklm il y a quelques semaines.
Gemini ne vous laissera pas faire ça. Pas encore.

Ensuite, nous avons la barrière linguistique, automotive Google est actuellement en practice de régler l’ensemble du pipeline au-delà de l’anglais. Un autre problème était la prononciation anglicisée. Par exemple, l’hôte du podcast AI a mal prononcé le monde persan «RAF-mince» comme «RAAF-Tin».
À une oreille non formée qui ne connaît pas les nuances bilingues de la traduction anglaise-personne, ou remark les accents changent la notion auditive des mots dans une langue différente, les hôtes du podcast IA pourraient très bien cracher du charabia whole.
La somme totale de mes expériences est que les aperçus audio Gemini ne sont pas une révolution. Ils offrent simplement un assist différent et plus captivant, pour s’engager avec le contenu. Cela ne fonctionne pas tout le temps, mais cela prend certainement l’ennui de lire des pages de texte qui vous endormiraient autrement.