0% encontró este documento útil (0 votos)

51 vistas17 páginas

Presentacion Síntesis de Voz

La síntesis de habla, conocida como text-to-speech (TTS), es la producción artificial de voz humana mediante sintetizadores. A lo largo de la historia, se han desarrollado diversas tecnologías y métodos, desde máquinas del siglo XVIII hasta sistemas computarizados modernos, que enfrentan desafíos como la naturalidad y la inteligibilidad del habla. Los sintetizadores actuales utilizan diferentes enfoques, como la síntesis concatenativa y la síntesis de formantes, aunque muchos todavía presentan un sonido robótico.

Cargado por

Manix_Nava

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

51 vistas17 páginas

Presentacion Síntesis de Voz

Cargado por

Manix_Nava

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

Manuel Bizuet Nava Aguilera

La sntesis de habla es la produccin artificial de habla humana. La sntesis de voz se llama a menudo en ingls text-to-speech (TTS). Un sistema que usa la sntesis de habla recibe el nombre de sintetizador de habla.

Su inteligibilidad: Con qu facilidad/dificultad es entendida?.

Su naturalidad: En qu medida se asemeja a la voz real de un humano?

En 1779, Christian Gottlieb Kratzenstein construy modelos del tracto vocal que podra producir las cinco vocales largas.

Wolfgang von Kempelen describi una mquina accionada con un fuelle. Esta mquina tena, adems, modelos de la lengua y los labios, para producir consonantes, as como vocales.

En 1837 Charles Wheatstone produjo una 'mquina parlante' basada en el diseo de von Kempelen En 1857 M. Faber construy la mquina 'Euphonia En los aos 30, los laboratorios Bell Labs desarrollaron el VOCODER, un analizador y sintetizador del habla operado por teclado que era claramente inteligible. Homer Dudley refin este dispositivo y creo VODER

Los primeros sintetizadores de voz sonaban muy robticos y eran a menudo inteligibles a duras penas.

El primer sistema de sntesis computarizado fue creado a final de la dcada de 1950 El primer sistema completo texto a voz se finaliz en 1968.

Sntesis concatenativa
Sntesis de formantes Sntesis articulatoria

Sntesis por seleccin de unidades

Sntesis de difonos

Sntesis especfica para un dominio

Sntesis por seleccin de unidades

Utiliza una base de datos de voz grabada Durante la creacin de la base de datos, el habla se segmenta en algunas o todas de las siguientes unidades: fonemas, slabas, palabras, frases y oraciones.

Normalmente, la divisin en segmentos se realiza usando un reconocedor de voz modificado para forzar su alineamiento con un texto conocido.

Sntesis de difonos

Usa una base de datos mnima conteniendo todos los difonos que pueden aparecer en un lenguaje dado. El nmero de difonos depende de la fonotctica del lenguaje: el espaol tiene unos 800 difonos, el alemn unos 2500. La calidad del habla resultante es generalmente peor que la obtenida mediante seleccin de unidades pero ms natural que la obtenida mediante sintetizacin de formantes

Sntesis especfica para un dominio

Concatena palabras y frases grabadas para crear salidas completas. Se usa en aplicaciones donde la variedad de textos que el sistema puede producir est limitada a un particular dominio, como anuncios de salidas de trenes o informacin meteorolgica.

No usa muestras de habla humana en tiempo de ejecucin. En lugar de eso, la salida se crea usando un modelo acstico. Parmetros como la frecuencia fundamental y los niveles de ruido se varan durante el tiempo para crear una forma de onda o habla artificial.

Muchos sistemas basados en sntesis de formantes generan habla robtica y de apariencia artificial

Se basa en modelos computacionales del tracto vocal y el proceso de articulacin. Pocos de los modelos son suficientemente avanzados o eficientes computacionalmente para ser usados en sistemas comerciales de sntesis de voz. El sistema, que fue comercializado por primera vez en 1994, proporciona una conversin texto a voz articulatoria completa mediante una analoga de gua de onda o lnea de transmisin de los tractos vocal y nasal humanos.

Desafos de la normalizacin de texto

Desafos de los sistemas Texto a fonema

Desafos de la normalizacin de texto

Los textos estn llenos de homgrafos, nmeros y abreviaturas que tienen que ser transformados en una representacin fontica. Muchos sistemas de texto a voz no generan representaciones semnticas de los textos de entrada. Decidir cmo convertir nmeros en palabras es otro problema. De esta misma forma podemos tener las abreviaturas.

Desafos de los sistemas Texto a fonema

Los sintetizadores de voz usan dos aproximaciones bsicas al problema de determinar la conversin texto a fonema. La aproximacin ms simple es la basada en diccionario, donde se almacena en el programa un gran diccionario que contiene todas las palabras de la lengua y su correcta pronunciacin. La otra aproximacin es la basada en reglas, donde dichas reglas se aplican a palabras para extraer sus pronunciaciones basadas en su forma escrita.

El rechazo por parte de los usuarios que no le perdonan su falta de naturalidad y su timbre robtico. Los Conversores de Texto-Voz producen generalmente voz de hombre.

Las personas que trabajaban en los laboratorios eran hombres y stos empleaban su propia voz durante los experimentos. La voz masculina ofrece mejor calidad sonora que la femenina.

En los ltimos tiempos han aparecido sintetizadores que utilizan voz de mujer de calidad aceptable.

También podría gustarte

Trabajo Escrito Sintesis de Voz Metodo Cientifico - Final
Aún no hay calificaciones
Trabajo Escrito Sintesis de Voz Metodo Cientifico - Final
10 páginas
Capitulo 1
Aún no hay calificaciones
Capitulo 1
10 páginas
Síntesis de Habla: Tecnología y Usos
Aún no hay calificaciones
Síntesis de Habla: Tecnología y Usos
1 página
Métodos de Síntesis de Voz en TTS
Aún no hay calificaciones
Métodos de Síntesis de Voz en TTS
10 páginas
Revisión de La Tecnología de Síntesis de Voz y Recursos Lingüísticos Existentes para El Idioma Español
Aún no hay calificaciones
Revisión de La Tecnología de Síntesis de Voz y Recursos Lingüísticos Existentes para El Idioma Español
14 páginas
Revisión de La Tecnología de Síntesis de Voz y Recursos Lingüísticos Existentes para El Idioma Español
Aún no hay calificaciones
Revisión de La Tecnología de Síntesis de Voz y Recursos Lingüísticos Existentes para El Idioma Español
14 páginas
Procesamiento Del Habla
Aún no hay calificaciones
Procesamiento Del Habla
48 páginas
Sintesis de Voz en Español PDF
Aún no hay calificaciones
Sintesis de Voz en Español PDF
76 páginas
144288-Text de L'article-257339-1-10-20100615
Aún no hay calificaciones
144288-Text de L'article-257339-1-10-20100615
19 páginas
Producción de Habla 2
Aún no hay calificaciones
Producción de Habla 2
84 páginas
Fonética y Reconocimiento de Voz
Aún no hay calificaciones
Fonética y Reconocimiento de Voz
5 páginas
TTS y La Inteligencia Artificial
Aún no hay calificaciones
TTS y La Inteligencia Artificial
2 páginas
Mbrola
Aún no hay calificaciones
Mbrola
116 páginas
Tecnologías Del Habla
Aún no hay calificaciones
Tecnologías Del Habla
1 página
1 - Estado Del Arte - Síntesis de Voz
Aún no hay calificaciones
1 - Estado Del Arte - Síntesis de Voz
9 páginas
Conversor Texto a Voz en Ubuntu
100% (1)
Conversor Texto a Voz en Ubuntu
159 páginas
Ciencia, Docencia y Tecnología 0327-5566: Issn: Cdyt@uner - Edu.ar
Aún no hay calificaciones
Ciencia, Docencia y Tecnología 0327-5566: Issn: Cdyt@uner - Edu.ar
28 páginas
Traducción Robots Con Mal Acento, Convivir Con El Habla Sintética (2008) - Marc Bohlen, Colectivo Pliegue
Aún no hay calificaciones
Traducción Robots Con Mal Acento, Convivir Con El Habla Sintética (2008) - Marc Bohlen, Colectivo Pliegue
12 páginas
Codificador de Voz y Seguridad
100% (1)
Codificador de Voz y Seguridad
9 páginas
Reconocimiento Voz a Texto con NLP
Aún no hay calificaciones
Reconocimiento Voz a Texto con NLP
27 páginas
Paper - Computación Blanda - Agosto 19 de 2020
Aún no hay calificaciones
Paper - Computación Blanda - Agosto 19 de 2020
4 páginas
Cecilia Gestora,+6.rufino
Aún no hay calificaciones
Cecilia Gestora,+6.rufino
21 páginas
Llisterri 03 Tecnologias Habla Ingenieria Linguistica PDF
Aún no hay calificaciones
Llisterri 03 Tecnologias Habla Ingenieria Linguistica PDF
15 páginas
Introducción al Voice AI y su Impacto
Aún no hay calificaciones
Introducción al Voice AI y su Impacto
29 páginas
Trabajo Dps (Reparado)
Aún no hay calificaciones
Trabajo Dps (Reparado)
30 páginas
Reconocimiento de voz en radiología
Aún no hay calificaciones
Reconocimiento de voz en radiología
5 páginas
Historia y Sistemas de Reconocimiento de Voz
Aún no hay calificaciones
Historia y Sistemas de Reconocimiento de Voz
11 páginas
Reporte 2#
Aún no hay calificaciones
Reporte 2#
2 páginas
PFC Emilia Mendez Barrios
Aún no hay calificaciones
PFC Emilia Mendez Barrios
91 páginas
Articulos Sistemas Embebidos
Aún no hay calificaciones
Articulos Sistemas Embebidos
3 páginas
Reconocimientos Vocales
Aún no hay calificaciones
Reconocimientos Vocales
10 páginas
Guía de Conversores Texto-Voz TTS
Aún no hay calificaciones
Guía de Conversores Texto-Voz TTS
3 páginas
Reconocimiento de Voz
Aún no hay calificaciones
Reconocimiento de Voz
90 páginas
Presentación Proyecto RHVoice EC
Aún no hay calificaciones
Presentación Proyecto RHVoice EC
7 páginas
Sistema Reconocimiento de Voz
Aún no hay calificaciones
Sistema Reconocimiento de Voz
26 páginas
03 Hernandopericas Capitol 2
Aún no hay calificaciones
03 Hernandopericas Capitol 2
48 páginas
Rpic 2013
Aún no hay calificaciones
Rpic 2013
6 páginas
Informe Final
Aún no hay calificaciones
Informe Final
8 páginas
Reconocimiento de Voz
Aún no hay calificaciones
Reconocimiento de Voz
18 páginas
Informe Mana
Aún no hay calificaciones
Informe Mana
2 páginas
Reglas Fonéticas para Textos en Español
0% (1)
Reglas Fonéticas para Textos en Español
19 páginas
Balotario de Preguntas - Rec - Voz
Aún no hay calificaciones
Balotario de Preguntas - Rec - Voz
3 páginas
Tipos de Reconocimiento de Voz
100% (1)
Tipos de Reconocimiento de Voz
8 páginas
Reconocimiento de Voz Offline para Robótica
0% (1)
Reconocimiento de Voz Offline para Robótica
14 páginas
Proyecto RAL PDF
Aún no hay calificaciones
Proyecto RAL PDF
12 páginas
Aplicaciones de La Fonética
Aún no hay calificaciones
Aplicaciones de La Fonética
2 páginas
Instructions For ACL Proceedings 1
Aún no hay calificaciones
Instructions For ACL Proceedings 1
4 páginas
Cacic 2012
Aún no hay calificaciones
Cacic 2012
10 páginas
Trabajo de Exposicion
Aún no hay calificaciones
Trabajo de Exposicion
5 páginas
Historia y Función del Vocoder
Aún no hay calificaciones
Historia y Función del Vocoder
5 páginas
Curso de Reconocimiento de Voz - Galindo
Aún no hay calificaciones
Curso de Reconocimiento de Voz - Galindo
57 páginas
Proyecto. Sistema de Reconocimiento de Voz
Aún no hay calificaciones
Proyecto. Sistema de Reconocimiento de Voz
19 páginas
Reconocimiento de Voz en MATLAB
Aún no hay calificaciones
Reconocimiento de Voz en MATLAB
29 páginas
Reconocimiento de Habla en Ruido
Aún no hay calificaciones
Reconocimiento de Habla en Ruido
115 páginas
Teoria Speech de Text
Aún no hay calificaciones
Teoria Speech de Text
15 páginas
Vocoders
Aún no hay calificaciones
Vocoders
3 páginas
Linguistica Computacional (I Parte)
Aún no hay calificaciones
Linguistica Computacional (I Parte)
18 páginas
Reconocimiento de Voz Resumen
Aún no hay calificaciones
Reconocimiento de Voz Resumen
4 páginas
IA Generativa Audio y Video
Aún no hay calificaciones
IA Generativa Audio y Video
58 páginas
Proyectos de Futuro Constitucional
Aún no hay calificaciones
Proyectos de Futuro Constitucional
40 páginas
Dulce Camino SUSANA
38% (8)
Dulce Camino SUSANA
555 páginas
005 Plantilla - Presentac - TG - Proyecto - Invest
Aún no hay calificaciones
005 Plantilla - Presentac - TG - Proyecto - Invest
12 páginas
Alegato Civil
Aún no hay calificaciones
Alegato Civil
36 páginas
Examen Parcial Algebra Lineal PDF
Aún no hay calificaciones
Examen Parcial Algebra Lineal PDF
1 página
Present Simple Affirmative Negative Sentences
Aún no hay calificaciones
Present Simple Affirmative Negative Sentences
7 páginas
Tarea - Ensayo y Poster
Aún no hay calificaciones
Tarea - Ensayo y Poster
5 páginas
Curso - 222 Educación Ambiental Integral: Orientaciones para El Aula
100% (1)
Curso - 222 Educación Ambiental Integral: Orientaciones para El Aula
62 páginas
Dia Del Logro CHD 2024
Aún no hay calificaciones
Dia Del Logro CHD 2024
11 páginas
Diagnóstico Socioeducativo
Aún no hay calificaciones
Diagnóstico Socioeducativo
1 página
Reglamento de Uniformes Adventistas
Aún no hay calificaciones
Reglamento de Uniformes Adventistas
56 páginas
El Mal Burgués
100% (1)
El Mal Burgués
286 páginas
Estrategia de Segmentación Maxi Despensa
Aún no hay calificaciones
Estrategia de Segmentación Maxi Despensa
4 páginas
Sílabo Metafísica
Aún no hay calificaciones
Sílabo Metafísica
7 páginas
Conducta Sexual Atípica
Aún no hay calificaciones
Conducta Sexual Atípica
15 páginas
Onomatopeyas y Determinantes en Lengua
Aún no hay calificaciones
Onomatopeyas y Determinantes en Lengua
3 páginas
Demanda de Deasohucio
Aún no hay calificaciones
Demanda de Deasohucio
4 páginas
Mapa Mental Diarrea
Aún no hay calificaciones
Mapa Mental Diarrea
2 páginas
Novena sobre Sinodalidad y Comunión
Aún no hay calificaciones
Novena sobre Sinodalidad y Comunión
5 páginas
Avances en Proyecto de Desarrollo Organizacional
100% (1)
Avances en Proyecto de Desarrollo Organizacional
9 páginas
Semana Lactancia Materna 2022
Aún no hay calificaciones
Semana Lactancia Materna 2022
8 páginas
Horario de Estudio y Su Importancia
Aún no hay calificaciones
Horario de Estudio y Su Importancia
2 páginas
Ejercicios UdeA Resueltos y Propuestos Por Escolaria Preuniversitario
Aún no hay calificaciones
Ejercicios UdeA Resueltos y Propuestos Por Escolaria Preuniversitario
8 páginas
Cuestionario de Lenguaje y Comunicación
Aún no hay calificaciones
Cuestionario de Lenguaje y Comunicación
2 páginas
Welp - Democracias
Aún no hay calificaciones
Welp - Democracias
3 páginas
Medidas de Tendencia Central y Dispersión
Aún no hay calificaciones
Medidas de Tendencia Central y Dispersión
7 páginas
Hijos de Padres del Mismo Sexo: Estudios
Aún no hay calificaciones
Hijos de Padres del Mismo Sexo: Estudios
5 páginas
Asamblea en La Carpintería Mamerto Menapace
Aún no hay calificaciones
Asamblea en La Carpintería Mamerto Menapace
1 página
Antropología
Aún no hay calificaciones
Antropología
10 páginas
Conclusiones en Caso de Robo Agravado
Aún no hay calificaciones
Conclusiones en Caso de Robo Agravado
3 páginas