import IPython.display as ipd # Para reproducir audio y videos en Jupyter Notebook
ipd.display( ipd.VimeoVideo("188095475"))
Si tiene android y ha utilizado el servicio **Google now** y quiere verificar los audios que tiene google grabados de su voz puede verificarlo en:
Librerias para Speech Recognition
Instalacion de la Libreria SpeechRecognition
Se utilizara la Libreria SpeechRecognition que se puede instalar asi:
pip install portaudio
pip install pyaudio
pip install speechrecognition
# Importar libreria
import speech_recognition as sr
print( f'La version de speech recognition es: {sr.__version__}')
La version de speech recognition es: 3.10.4
# la clase que permite el uso de los sitemas de traduccion son Recognizer class.
r = sr.Recognizer()
Con esta libreria se pueden usar diferentes sistemas de reconocimiento de voz
- recognize_bing(): Microsoft Bing Speech
- recognize_google_cloud(): Google Cloud Speech - requiere instalar de google-cloud-speech package
- recognize_houndify(): Houndify by SoundHound
- recognize_ibm(): IBM Speech to Text
- recognize_sphinx(): CMU Sphinx - requiere instalar PocketSphinx
- recognize_wit(): Wit.ai
Reconocer archivos de Audio
El sistema actualmente solo reconoce los siguientes formatos de audio sin perdidas:
- WAV: must be in PCM/LPCM format
- AIFF
- AIFF-C
- FLAC
# se utiliza el método record para cargar el archivo de audio
harvard = sr.AudioFile('speech_harvard.wav') # cargar el archivo de audio
with harvard as source:
audio1 = r.record(source,duration=8) #Tomar los primeros 8 segundos
#audio1 = r.record(source) #Leer todo el archivo de audio
ipd.Audio('speech_harvard.wav') # escuchar archivo de audio