App - Voice Transcription IA
Application macOS de dictee vocale 100% offline, construite sur MLX Whisper. Transcription FR/EN en 2 secondes, Dynamic Island animee, commandes vocales.

Les applications de dictee vocale populaires comme Wispr Flow et Superwhisper sont soit payantes (abonnement mensuel), soit dependantes du cloud (donnees envoyees a OpenAI ou Deepgram). Pour un usage professionnel quotidien avec des informations confidentielles, c'etait inacceptable.
Le defi : construire une alternative 100% locale, gratuite, ultra-rapide et bilingue FR/EN, avec une interface aussi soignee que celles des produits commerciaux. Le tout sur un MacBook Pro M4 sans sacrifier ni la qualite de transcription ni l'experience utilisateur.
VoiceInk est une app macOS native (Python + PyObjC) qui utilise le modele Whisper large-v3-turbo via MLX, le framework de machine learning d'Apple optimise pour le Neural Engine des puces Apple Silicon.
Un simple appui long sur Control (1 seconde) declenche l'enregistrement. La Dynamic Island apparait en bas de l'ecran avec une waveform orange animee style Rivian. A la fin, le texte est automatiquement colle dans l'application active, avec gestion des commandes vocales (ponctuation, paragraphes, annulation).
Architecture modulaire : le moteur de transcription peut etre remplace par Parakeet TDT pour encore plus de vitesse, et un LLM local optionnel (Qwen 2.5) permet de nettoyer automatiquement les hesitations.
Fonctionnalités clés
- ▸Transcription MLX Whisper large-v3-turbo - 100% offline, precision quasi-humaine en FR et EN
- ▸Dynamic Island flottante avec waveform audio temps reel style Rivian (Python + PyObjC + Core Animation)
- ▸Hotkey push-to-talk : maintenir Control pendant 1 seconde pour eviter les activations accidentelles
- ▸Detection automatique de la langue (FR/EN) avec basculement a chaque enregistrement
- ▸Commandes vocales : nouveau paragraphe, point d'interrogation, efface ca, annule, etc.
- ▸Paste automatique via CGEvent Cmd+V dans l'app active + fallback osascript
- ▸Reformulation optionnelle via LLM local (Qwen2.5-3B quantifie 4-bit) pour nettoyer les hesitations
- ▸App bundle macOS avec permissions Accessibility, Input Monitoring et Microphone configurees
- ▸Escape pour annuler l'enregistrement en cours ou undo (Cmd+Z) le dernier paste dans les 5 secondes
- ▸Re-initialisation automatique du micro apres sortie de veille (NSWorkspaceDidWakeNotification)
Galerie


