Reconocimiento de voz

import IPython.display as ipd # Para reproducir audio y videos en Jupyter Notebook
ipd.display( ipd.VimeoVideo("112133045"))

Si tiene android y ha utilizado el servicio **Google now** y quiere verificar los audios que tiene google grabados de su voz puede verificarlo en:

https://myactivity.google.com/myactivity?restrict=vaa&hl=en&utm_source=udc&utm_medium=r&utm_campaign=

Librerias para Speech Recognition

Instalacion de la Libreria SpeechRecognition

Se utilizara la Libreria SpeechRecognition que se puede instalar asi:

conda install -c conda-forge portaudio

conda install -c anaconda pyaudio

conda install -c conda-forge speechrecognition

# Importar libreria
import speech_recognition as sr
print( f'La version de speech recognition es: {sr.__version__}')
La version de speech recognition es: 3.6.3
# la clase que permite el uso de los sitemas de traduccion son Recognizer class.
r = sr.Recognizer()

Con esta libreria se pueden usar diferentes sistemas de reconocimiento de voz

Reconocer archivos de Audio

El sistema actualmente solo reconoce los siguientes formatos de audio sin perdidas:

  • WAV: must be in PCM/LPCM format
  • AIFF
  • AIFF-C
  • FLAC
# se utiliza el metodo record para cargar el archivo de audio
harvard = sr.AudioFile('speech_harvard.wav') # cargar el archivo de audio
with harvard as source:
    audio1 = r.record(source,duration=8) #Tomar los primeros 8 segundos
    #audio1 = r.record(source) #Leer todo el archivo de audio
    
ipd.Audio('speech_harvard.wav') # escuchar archivo de audio