L’application de prise de notes Granola, basée sur l’IA, évaluée à 250 millions de dollars, est devenue un outil populaire parmi les fondateurs de l’industrie technologique et les sociétés de capital-risque. Mais un développeur estime qu’il existe une demande pour une alternative plus privée, uniquement locale, disponible moyennant des frais uniques et sans abonnement. Cela a conduit à la création d’une nouvelle application Mac appelée Talat.
Nick Payne, développeur basé dans le Yorkshire, en Angleterre et se décrivant lui-même comme un passionné d’informatique, affirme que l’idée de créer un preneur de notes local basé sur l’IA est née principalement à cause d’une série d’heureux accidents.
« Je pense que Granola est génial ; c’est un brillant exemple de ce que vous pouvez faire avec une application Electron (un cadre pour créer des applications de bureau) avec suffisamment d’amour et de soin », a-t-il déclaré à TechCrunch. « Lorsque je l’ai essayé pour la première fois, j’étais fasciné par le fait qu’il parvenait à enregistrer l’audio du système sur mon Mac sans enregistrer de vidéo, ce qui était la solution de contournement standard à l’époque. Cela a conduit à une tonne de recherches, découvrant une API Apple relativement nouvelle et mal documentée. «
Pour faciliter le travail avec cette API (Core Audio Taps, qui permet aux développeurs d’accéder aux flux audio d’un Mac), Payne a décidé de créer une bibliothèque audio open source, AudioTee.
« Pendant ce temps, j’étais lentement en train de reconstituer une boîte à outils, mais je n’ai jamais trouvé quoi que ce soit qui semblait pouvoir être autonome en tant que produit plutôt qu’une simple démo technologique sympa », a déclaré Payne. « Les modèles de transcription hébergés de pointe – les mêmes fournisseurs que Granola utilisent – sont incroyables, et c’est viscéralement cool de voir votre discours se dérouler à l’écran en temps quasi réel. Mais cela m’a toujours harcelé que le compromis nécessitait de fournir non seulement mes données, mais mes données audio ; ma voix réelle », a-t-il ajouté.
Il est ensuite tombé sur une boîte à outils logicielle appelée FluidAudio, un framework Swift qui permet une IA audio entièrement locale et à faible latence sur les appareils Apple. Il vous permet d’exécuter de petits modèles de transcription rapides directement sur le moteur neuronal du Mac, le matériel dédié d’Apple au traitement de l’IA.
C’est grâce à cela que Payne a réalisé qu’il pouvait transformer ses recherches en un véritable produit, dans lequel votre audio ne quitte jamais votre Mac et vos transcriptions ne sont pas stockées sur les serveurs d’une autre entreprise.
Talat, qui a été construit aux côtés de l’ami de longue date et ancien collègue de Payne, Mike Franklin, est le résultat de l’intérêt de Payne pour l’espace audio. Le résultat est un achat unique de 20 Mo qui ne nécessite pas de création de compte ni même de partage de données analytiques avec les développeurs. Il n’y a pas non plus de frais courants.
Alors que certains preneurs de notes IA peuvent avoir plus de fonctionnalités, Talat propose un ensemble simplifié de fonctionnalités. Il capture l’audio du microphone de votre ordinateur lorsque vous êtes dans des applications de réunion comme Zoom, Teams, Meet et autres, et le transcrit en temps réel. L’application essaie d’attribuer les haut-parleurs en temps réel, mais vous pouvez les réaffecter si nécessaire. Vous pouvez également prendre des notes et modifier, supprimer ou diviser des segments de transcription. Une fois la réunion terminée, un LLM local génère un résumé avec les points clés, les décisions et les actions à entreprendre.
Les notes, transcriptions et résumés sont également consultables dans Talat.
En plus de l’aspect confidentialité, Payne a déclaré que l’objectif est de donner aux utilisateurs plus d’options.
« Nous nous appuyons sur la configurabilité et laissons les utilisateurs contrôler où vont leurs données : choisissez votre propre LLM, exportez automatiquement vers (l’application de prise de notes) Obsidian, des webhooks qui envoient les données à la fin d’une réunion, un serveur MCP », qui est un moyen standardisé pour les outils d’IA de se connecter à des sources de données externes, « pour les extraire à la demande », a-t-il expliqué.
Sous le capot, l’IA est un mélange – « principalement assemblé et abstrait derrière FluidAudio », a noté Payne, à qui il attribue le gros du travail. Pour le résumé, l’application utilise par défaut un modèle Al appelé Qwen3-4B-4bit, qui peut fonctionner même sur du matériel assez modeste.
Cependant, les utilisateurs peuvent choisir de basculer cela vers n’importe quel fournisseur cloud LLM de leur choix, ou ils peuvent choisir entre deux variantes de Parakeet – des modèles de reconnaissance vocale développés par Nvidia – ou le pointer vers Ollama (un outil pour exécuter des modèles d’IA localement), leur donnant plus de contrôle sur l’expérience. Avec le temps, Talat ajoutera la prise en charge d’un plus grand nombre de choix intégrés et intégrera d’autres applications, comme Google Calendar et Notion.
Au lancement, les utilisateurs d’ordinateurs Mac de la série M (ceux équipés des processeurs Apple, à commencer par le M1) peuvent télécharger l’application et l’essayer gratuitement avec 10 heures d’enregistrement avant de décider de l’acheter.
Talat est disponible au prix de 49 $ dans cette version préliminaire, qui est toujours en développement actif.
Lorsque l’application sortira en version 1.0, le prix passera à 99 $.
Payne et Franklin démarrent Talat et prévoient de conserver le produit de base sous forme d’achat unique à l’avenir.

