Reconocimiento de voz

Invítame a un Café

import IPython.display as ipd # Para reproducir audio y videos en Jupyter Notebook
ipd.display( ipd.VimeoVideo("188095475"))

Si tiene android y ha utilizado el servicio **Google now** y quiere verificar los audios que tiene google grabados de su voz puede verificarlo en:

https://myactivity.google.com/myactivity?restrict=vaa&hl=en&utm_source=udc&utm_medium=r&utm_campaign=

Librerias para Speech Recognition

Instalacion de la Libreria SpeechRecognition

Se utilizara la Libreria SpeechRecognition que se puede instalar asi:

pip install portaudio

pip install pyaudio

pip install speechrecognition

# Importar libreria
import speech_recognition as sr
print( f'La version de speech recognition es: {sr.__version__}')

La version de speech recognition es: 3.10.4

# la clase que permite el uso de los sitemas de traduccion son Recognizer class.
r = sr.Recognizer()

Con esta libreria se pueden usar diferentes sistemas de reconocimiento de voz

Reconocer archivos de Audio

El sistema actualmente solo reconoce los siguientes formatos de audio sin perdidas:

  • WAV: must be in PCM/LPCM format
  • AIFF
  • AIFF-C
  • FLAC
# se utiliza el método record para cargar el archivo de audio
harvard = sr.AudioFile('speech_harvard.wav') # cargar el archivo de audio
with harvard as source:
    audio1 = r.record(source,duration=8) #Tomar los primeros 8 segundos
    #audio1 = r.record(source) #Leer todo el archivo de audio

ipd.Audio('speech_harvard.wav') # escuchar archivo de audio