Différences
Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentes Révision précédente Prochaine révision | Révision précédente | ||
ressource:logiciel:vosk:start [2022/01/26 08:58] gweltaz |
ressource:logiciel:vosk:start [2022/03/06 23:06] (Version actuelle) gweltaz |
||
---|---|---|---|
Ligne 169: | Ligne 169: | ||
Les instruction pour l'installation sont dans le fichier ''tools/INSTALL'' | Les instruction pour l'installation sont dans le fichier ''tools/INSTALL'' | ||
- | Cloner le répo de Kaldi : | + | Cloner le répo de Kaldi : https://github.com/kaldi-asr/kaldi |
- | https://github.com/kaldi-asr/kaldi | + | $ git clone https://github.com/kaldi-asr/kaldi |
Vérifier les dépendances : | Vérifier les dépendances : | ||
Ligne 181: | Ligne 181: | ||
Installation de Intel Math Kernel Library (optimisation des opération d'algèbre linéaire) : | Installation de Intel Math Kernel Library (optimisation des opération d'algèbre linéaire) : | ||
$ sudo ./tools/extra/install_mkl.sh | $ sudo ./tools/extra/install_mkl.sh | ||
+ | |||
+ | Installation de SRILM (outil pour la création de modèles de langages) | ||
+ | $ ./tools/install_srilm.sh | ||
Installation de kaldi : | Installation de kaldi : | ||
Ligne 203: | Ligne 206: | ||
==== Traitement des fichiers son ==== | ==== Traitement des fichiers son ==== | ||
+ | |||
+ | Conversion en wav mono 16 bits et avec une fréquence d’échantillonnage de 16000 Hz | ||
+ | |||
+ | $ ffmpeg -i in.mp3 -acodec pcm_s16le -ac 1 -ar 16000 out.wav | ||
+ | |||
Détection des silences et des non silences avec Python | Détection des silences et des non silences avec Python |