DSpeech (by Dimio)
~~~~~~~~~~~~~~~~~~
La versi�n m�s reciente se encuentra en el siguiente enlace:
P�gina de inicio: "[Link]
DESCRIPCI�N:
~~~~~~~~~~~~
DSpeech es un programa de texto a voz, (TTS) con funcionalidad de ASR, (sistema
autom�tico de reconocimiento de voz) integrada. Est� dise�ado para leer el texto
escrito y para elegir las oraciones que debe pronunciar, de acuerdo con las
respuestas mediante comandos de voz, interacci�n con la interfaz o atajos r�pidos
de teclado del consumidor. Proyectado espec�ficamente para dar rapidez, direcci�n
completa de sus funciones y mayor utilidad requerida para este tipo de programas,
aparte de mantener el menor tiempo de reacci�n posible, la invasividad y el consumo
de recursos, y no se instala. No se integra en el sistema, es ligero, se abre casi
de manera instant�nea y no escribe nada en el registro de tu sistema operativo.
Las caracter�sticas principales de DSpeech son:
1. Te permite guardar el texto editado en un archivo wav, mp3, ogg, aac y dem�s
formatos.
2. Te permite seleccionar voces r�pidamente mediante su men� contextual para
combinarlas de todas las maneras posibles y crear di�logos entre ellas.
3. Incluye un sistema de reconocimiento de voz que, mediante un sencillo lenguaje
de scripting, hace posible la creaci�n de di�logos interactivos entre tus voces
sint�ticas instaladas y t�.
4. Permite configurar cada voz independientemente.
5. A trav�s de etiquetas especiales propias de DSpeech, te permite variar de forma
din�mica las caracter�sticas de las voces durante la reproducci�n, (Velocidad, Tono
y Frecuencia), hacer pausas, enfatizar t�rminos o incluso deletrear.
6. Te permite capturar y reproducir autom�ticamente con la voz predeterminada en el
programa el contenido del portapapeles.
7. Ofrece soporte completo para los motores de voz SAPI 4 y SAPI5.
Aparte de una serie de caracter�sticas secundarias, entre las que est�n:
1. La capacidad de cargar autom�ticamente los �ltimos archivos abiertos, con su
propia posici�n de lectura o marcador, �til si deseas leer libros o hacer
audiolibros con ellos.
2. El soporte de la l�nea de comandos, para usar el programa sin interfaz gr�fica
para crear audiolibros.
3. La capacidad de escoger el formato del audio a exportar. Esto es muy �til en
situaciones particulares en las que necesites operar con determinados archivos wav
que tengan ciertas caracter�sticas.
4. La capacidad de insertar en plena lectura, a trav�s de una palabra clave
precedida por el mayor que (>), una tos, una risa, o incluso un efecto musical.
5. La posibilidad de, una vez guardados los audios, especificar la calidad de los
mismos en post de conservar m�s calidad, tama�o, u optimizar ambos.
6. La posibilidad de dividir el archivo de texto antes de que se convierta en audio
en 5, 10, 15 minutos, �Y hasta m�s!
7. La capacidad de personalizar las etiquetas del propio programa, editando el
archivo [Link]. Este archivo es una tabla de etiquetas que te permitir�
insertarlas a futuro en el texto.
TEXTO A VOZ:
~~~~~~~~~~~~~~~
En el men� contextual (click derecho o tecla de aplicaciones en el cuadro de
edici�n principal) se pueden elegir qu� voces insertar en el texto clasificadas por
idioma. Una vez seleccionada la voz, aparecer� la etiqueta de uso de la misma, y
debajo, la posibilidad de crear di�logos interactivos entre voces.
Tambi�n, es posible insertar etiquetas especiales propias de DSpeech para modificar
las caracter�sticas de una voz. Y si deseas, puedes utilizar el micr�fono desde
DSpeech para crear di�logos interactivos contigo como el consumidor mientras
cambias valores de cada voz en tiempo real como la velocidad, el volumen, la
frecuencia, etc.
OPCIONES DE AUDIO:
~~~~~~~~~~~~~~
Tambi�n es posible especificar la tarjeta de sonido a la que DSpeech deber�
redirigir el audio, y sobre todo, la calidad de las voces que se deber�n usar. Este
ajuste deber� ser lo m�s exacto posible a la calidad de la voz en s� misma. De lo
contrario, se escuchar�n p�rdidas masivas de calidad, como si la voz estuviera
habl�ndonos desde una lata.
En general, la calidad de la mayor�a de voces sint�ticas disponibles en el mercado
es: "16 Khzes 16 Mono Bit", mientras las voces de Microsoft utilizan "22 Khzes 16
Mono Bit."
Estas etiquetas de calidad son importantes en la conversi�n a un archivo wav o mp3.
Sin embargo, puedes experimentar y encontrar lo que m�s se adapte a tus gustos.
Conversi�n a un archivo wav o mp3:
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Tambi�n es posible utilizar DSpeech para convertir los di�logos interactivos que
has creado en archivos wav o mp3. Una vez has obtenido el resultado deseado,
puedes escoger las caracter�sticas de la conversi�n. De hecho, puedes determinar si
tu archivo debe estar optimizado para calidad, para tama�o o valanceado.
EDITANDO EL TEXTO.
~~~~~~~~~~~~~~~~~~~~
Aparte de las funciones est�ndar de cualquier editor de textos (buscar, reemplazar,
cortar ETC), una funci�n particular ha sido integrada en DSpeech, la remoci�n de
retornos de carro innecesarios. Se utiliza para eliminar las l�neas en blanco que
eventualmente pueden aparecer, para que no limiten la fluidez con que leer�n el
resultado las voces sint�ticas que hayas elegido. De hecho, por razones de
paginaci�n correcta y m�s que nada de est�tica es el motivo de la inserci�n de
estos retornos de carro o l�neas innecesarias que pueden afectar de manera negativa
la lectura del texto.
CREACI�N DE AUDIOLIBROS.
~~~~~~~~~~~~~~~~~~~~~~~
Una variedad de opciones para crear audiolibros han sido incorporadas en DSpeech.
De manera particular, est� la posibilidad de dividir el texto en distintos archivos
de audio de un minuto cada uno, o m�s, dependiendo del gusto del consumidor.
Tambi�n es posible utilizar la subdivisi�n manual, donde t� eliges d�nde
subdividir. En este caso, deber�s escribir el keyword ">BREAK" donde quieras para
crear otro archivo de audio.
La opci�n agregar permite insertar un archivo de texto despu�s del otro.
En este caso, el >BREAK ser� insertado autom�ticamente entre archivo y archivo, a�n
d�ndote la capacidad de subdividir manualmente donde t� quieras.
Tambi�n es posible insertar un >BREAK al inicio del texto para mantener la
compativilidad con los lectores de CD o viejos archivos mp3.
RECONOCIMIENTO DE VOZ.
~~~~~~~~~~~~~~~~~~
DSpeech soporta un sistema de reconocimiento de voz que, unido a un simple sistema
de scripting, te permite crear di�logos interactivos contigo como el consumidor del
tipo:
Consumidor: "�Ordenador?"
PC: "Ordenador listo. �Qui�n es?"
Consumidor: "Dimio"
PC: "Bienvenido entonces"
Etc.
El sistema de scripting es muy similar al b�sico. De momento estos Keywords est�n
soportados:
>VOICE NombreDeLaVoz
>I DA
>EXIT Sale
>LOOP
>RECOGNIZE Parola1, [Parola2], [OtrasPalabras...]
>RECOGNIZE_WITH_TIMEOUT Secondi, Parola1, [Parola2], [OTRAS_PALABRAS...]
>IF RECOGNIZED Parola1, [Parola2], [OTRAS_PALABRAS]...
>IF TIMEOUT
>END IF
>CALL NomeSub
>Sub NomeSub
>END SUB
>RANDOM
>HOUSES
>END RANDOM
>EXECUTE PathFileOProgramma
>OPEN [Link]
>STOP
>BREAK
>PLAY [Link]
>WAIT nSegundos
>CLOSE
En el men� contextual del cuadro de edici�n principal, (Click derecho o tecla
aplicaciones) puedes encontrar todos estos keywords con ejemplos relativos.
De momento no explicar� la sintaxis del lenguaje de scripting, considerando que t�
mismo/a puedes deducirlo de manera m�s intuitiva desde los ejemplos en s� mismos.
En cualquier caso, un ejemplo de scripting para el reconocimiento de voz de DSpeech
puede ser el siguiente:
>VOICE Marco
Soy angelus el ordenador de dimitry. �Qui�n eres t�?
>DO
>RECOGNIZE Dimitri, Gloria, OTHER_WORDS
>IF RECOGNIZED Dimitri
Angelus Esperando instrucciones
>EXIT DO
>END IF
>IF RECOGNIZED Gloria
Te has equibocado de ordenador, el tuyo es el de m�s a la derecha.
>EXIT DO
>END IF
>IF RECOGNIZED OTHER_WORDS
>RANDOM
>CASE
�Puedes repetir, por favor? No he entendido correctamente tu nombre
>CASE
�Qu� has dicho? �Puedes repetir?
>CASE
No he entendido nada de lo que has dicho, muy probablemente tu nombre no est�
alojado en mi base de datos.
>END RANDOM
>END IF
>LOOP
El sistema de reconocimiento de voz est� formado de momento y enteramente en
ingl�s, por lo que para que te reconozca lo que quieres decir, necesitar�s
adaptarte a la pronunciaci�n en ingl�s de esas palabras. Por ejemplo, para que
reconozca la palabra Rusia, deber�s escribir o decir "Rassya."
ATAJOS R�PIDOS:
~~~~~~~~~~
Aparte de las funciones visuales de la interfaz del programa en s�, hay atajos de
teclado para hacer m�s f�cil la interacci�n. Los atajos de teclado soportados son
los siguientes:
F1 = Ir al cuadro de edici�n principal
F4 = Pausar/Reanudar
F5 = Leer/Detener la lectura
F6 o ALT + FLECHA ARRIBA = Leer la l�nea anterior
F7 o ALT + FLECHA IZQUIERDA = Leer la l�nea actual
F8 o ALT + FLECHA ABAJO = Leer la siguiente l�nea
F9 o ALT + FLECHA DERECHA = Leer desde el cursor
F11 = Pasar a la voz anterior de las instaladas en el sistema
F12 = Pasar a la siguiente voz de las instaladas en el sistema
ESC = Detener
ALT+1 = Subir volumen
ALT+2 = Bajar volumen
ALT+3 = Incrementa la velocidad
ALT+4 = Decrementa la velocidad
ALT+5 = Incrementa el tono
ALT+6 = Decrementa el tono
L�NEA DE COMANDOS:
~~~~~~~~~~~~~
Es posible especificar el nombre de un archivo desde la l�nea de comandos para que
DSpeech lo abra y reproduzca autom�ticamente. Esto es �til si necesitas crear un
script de manera autom�tica.
SYNTAXIS:
[Link] [/Play] [/Speak] [/Wav] [/Mp3] [/Ogg] [/Hidden|/HiddenFix]
[[Link]]
Ejemplos:
- Para abrir un archivo:
[Link] [Link]
- Para iniciar la reproducci�n de un archivo:
[Link] /Play [Link]
- Para verbalizar en voz alta una frase:
[Link] /Speak Hola!
- Para convertir un audio a mp3:
[Link] /mp3 [Link] [destino.mp3]
- Para convertir un archivo de texto a ogg:
[Link] /ogg [Link] [[Link]]
- Para convertir un archivo de texto a wav:
[Link] /wav [Link] [[Link]]
CONFIGURACI�N DEL SISTEMA:
~~~~~~~~~~~~~~~~~~~~
Para sistemas Windows nt /2000, es necesario instalar el paquete MS Sapi5 desde el
sitio web de microsoft o desde uno de estos enlaces:
[Link]
[Link]
Con windows NT o 2000, si se desea utilizar el sistema de reconocimiento de voz,
tambi�n se deber� descargar e instalar dicho paquete de complementos para el
sistema operativo desde la p�gina de Microsoft. Se puede descargar de manera
opcional el paquete universal de 30 MB desde el siguiente link:
[Link]
Windows XP/2003/VISTA No necesitan instalaciones de complementos, puesto que ya los
tienen incluidos.
DSpeech Requiere una resoluci�n de pantalla de por lo menos 1024x768.
LAS VOCES:
~~~~~~~~~~~
DSpeech usa las voces instaladas en el sistema. Tambi�n cuentan las voces
preinstaladas por defecto. Por ejemplo, en Windows XP solo estar� Microsoft Sam.
Sin embargo, si has instalado el paquete MS Sapi5.1 en Windows NT/2000, tendr�s
disponibles tambi�n a Microsoft Mike y Mary (solo en ingl�s)
Los usuarios de Windows XP podr�n descargar su paquete correspondiente desde aqu�:
[Link]
Estos �ltimos muy probablemente son mejores que sam, pero la calidad es
avismalmente superior a algunas voces por defecto en Windows. Cabe resaltar, sin
embargo, que Windows 10 ha mejorado sus voces sapi y eliminado las anteriores, pero
diferencia s� que hay. Se recomienda descargar voces de terceros si quieres otra
calidad. Desafortunadamente, a menudo estas voces requieren licencias, y casi
siempre son muy costosas. En cualquier caso, dejamos una particular forma de
describir las voces seg�n su calidad y con su fabricante al inicio:
Acapela (Son voces claras e inteligentes, pero no son las mejores en t�rminos de
naturalidad).
Cepstral (La calidad no se acerca mucho a las de las voces m�s caras, pero de todos
modos son usables aplic�ndoles ciertos efectos de audio si la edici�n es lo tuyo).
Loquendo (Muy buenas, especialmente en t�rminos de naturalidad y expresividad,
aunque son un poco costosas. Cabe mencionar tambi�n que hoy en d�a es dif�cil
encontrarlas en su �ltima versi�n, que ya no est�n en venta por la compa��a que las
ten�a y que Nuance las compr� y las hizo parte de Vocalizer Expressive, su popular
paquete de voces).
RealSpeak (Realmente buenas. Algunas de estas voces las compr� loquendo, otras
vienen con autoinstalables y a menudo suelen romper los sintetizadores Sapi5 en
sistemas operativos modernos, pero sirven igual).
VoiceWare (No est�n para nada mal, aunque no existen voces en italiano).
Ivona (Probablemente las mejores del mercado. Hay que resaltar que estas voces
tambi�n fueron compradas, en este caso por Amazon, y creemos que est�n siendo
utilizadas para el Amazon Echo y el Polly, distintas plataformas que usan voces
sint�ticas).
NOTAS:
~~~~~~
Cuando insertas un archivo mp3 en el texto, especialmente de tama�o considerable,
un peque�o espacio puede aparecer antes y despu�s de la reproducci�n del audio.
Esto es normal y no se denomina como bug. Sin embargo, en el resultado final, el
espacio desaparece por completo.
Para la compresi�n en mp3 el c�dec utilizado es Blades ([Link]), Y
corresponde al archivo [Link] incluido en el paquete.
PROGRAMADORES Y BETA TESTERS:
~~~~~~~
Dimitrios Coutsoumbas (Dimio)
SKYPE : katafratto
ICQ : 145633952
E-MAIL : cyberdimio@[Link]
P�GINA DE INICIO : [Link]
BETA-TESTERS:
~~~~~~~~~~~~~
Talksina (talksina@[Link])