On Sun, 2025-06-29 at 23:43 +0200, Pierre Estrem wrote: > Bonjour, > > Je continue à explorer la reteranscription textuelle depuis une dictée > vocale et autant que possible sans retardement... > > Le lien dessous recommande un "GPU NVIDIA with CUDA..." : > https://www.tecmint.com/whisper-ai-audio-transcription-on-linux/ > > Une recherche sur ce qu'est un "GPU Nvidia with CUDa" m'amène à des > cartes graphiques AMD dotées de "ZLUDA" compatibles avec des > applications "CUDA". > C'est hors de prix (> 1000€).
J'ignore si un co-processeur vectoriel spécialisé est véritablement nécessaire pour un tel logiciel de transcription automatique vocale. Puisque un signal sonore (perceptible par un humain) c'est 44KHz d'échantillonnage (sur un CD Audio) avec 16 bits par échantillon. Avec l'âge on entend moins bien mais un humain même âgé comprend la parole. J'imagine que des techniques dites de réseaux de neurones artificiels sont pertinents. Une bibliothèque libre en C++ comme https://www.mlpack.org/ ou comme https://gudhi.inria.fr/index.html (cette dernière étant française) sont alors utiles, et ne requierent pas de matériel spécialisé. Mon point de vue est que techniquement c'est accessible par n'importe quel processeur x86-64 actuel. J'attire l'attention de tous sur cette liste que CUDA est défini et propre à la société NVIDIA Une alternative un peu plus portable est la norme OpenCL (qui peut être compilée sur materiel NVIDIA ou ATI/AMD et même sur un processeur Intel ou AMD sans coprocesseur graphique). https://fr.wikipedia.org/wiki/OpenCL De plus tout code écrit en CUDA ou en OpenCL dépend fortement du matériel précis, et ce code doit être modifié à chaque changement de matériel. Enfin, les supercalculateurs comme https://www.genci.fr/ existent, ils sont sous Linux et avec de nombreux coprocesseurs. Cf https://top500.org/ pour une liste. Il existe des procédures documentées pour y louer du temps calcul. Voir aussi https://www.teratec.eu/ Librement -- Basile STARYNKEVITCH <[email protected]> 8 rue de la Faïencerie http://starynkevitch.net/Basile/ 92340 Bourg-la-Reine https://github.com/bstarynk France https://github.com/RefPerSys/RefPerSys

