SATI EEE SATI EEE

Síntesi de veu en català


Introducció

Molts programes d'ordinador incorporen música, sons i veu per millorar la interacció amb l'usuari. En la major part dels casos es tracta de sons digitalitzats en uns fitxers que l'ordinador reprodueix com si fos un casset. Aquest sistema, a més de consumir molts recursos és poc flexible, ja que només es poden escoltar els missatges enregistrats.
Els sistemes de síntesi de veu són programes d'ordinador que converteixen el codi escrit en un missatge oral de forma que l'ordinador pot llegir qualsevol text que s'escolta a través de la targeta de so i l'altaveu de l'ordinador sense que calgui l'enregistrament previ.


UpcTV

UpcTV és un sistema de síntesi de veu en català i castellà desenvolupat pel Grup de Tractament de la Parla UPC que funciona exclusivament en sistemes Windows de 32 Bits, Windows 95, Windows 98 o Windows NT, utilitzant qualsevol targeta de so. El sistema utilitza el llenguatge de control SABLE. Incorpora dos locutors, un de masculí i un de femení, que es poden alternar per comandaments interns. També hi ha comandaments per controlar la velocitat del locutor, seleccionar la llengua, així com de pausa i aturada. Incorpora la capacitat de llegir nombres i dates i disposa de fitxers diccionaris i d'abreviatures per resoldre les expressions més complexes.
Inclou:
  • UPCTV.DOT, una plantilla per al Microsoft Word 97 que afegeix una barra d'eines amb les icones per controlar el sistema. La plantilla s'instal·la en el directori de l'aplicació, per defecte el directori C:\UPCTV, i cal copiar-la amb la resta de les plantilles del Word, generalment C:\OFFICE97\PLANTILLES.



  • Fitxers ABR_*.txt amb abreviatures i fitxers DIC_*.txt amb diccionaris. Aquests fitxers són diferents per a cada idioma i els trobareu en el directori DAT de l'aplicació. Aquests fitxers es poden editar i personalitzar.
  • El fitxer TV.EXE és una demo i un test del funcionament del programa. El programa admet com a paràmetres noms de diferents fitxers. S'obre una sessió MS-DOS que respon a comandaments de tecles. Entre d'altres:
    • P comença a llegir
    • S atura la lectura
    • Q surt del programa



  • el programa SV.EXE que llegeix paraules i fitxers de text. La seva sintàxi és
    • SV.EXE [/I:i] [/L:l] [ /V:v] [ [/F:fitxer] [paraula] ]
    • /I: llengua C català E castellà
    • /L: locutor 1 masculí 2 femení
    • /V: velocitat, essent la normal 100
    • /F:fitxer nom de fitxer
    Per exemple SV.EXE /I:C /L:2 /V:100 HOLA

  • Informació tècnica sobre les funcions del sistema de síntesi de veu i exemples de programació en llenguatge C.
En el Sinera 99 podeu trobar alguns exemples i aplicacions que ja utilitzen l'UpcTV, que ha d'estar prèviament instal·lat a l'ordinador.
  • Infograf incorpora una opció que permet escoltar automàticament tots els missatges escrits. Cal instal·lar el programa i les col·leccions d'històries a l'ordinador.
  • El Clic 3.0 suporta el sistema de síntesi de veu. Cal posar en una casella les ordres perquè executi el programa SV.EXE
  • El plafó Cares del Tpwin és un exemple de com utilitzar el programa SV.EXE i la síntesi de veu



El Parlador

En el Sinera 99 també trobareu el Parlador, un processador de text dissenyat per funcionar amb la síntesi de veu UPCTV. El Parlador va llegint el text a mesura que es va confegint el que pot tenir una triple finalitat:
  • Reforç auditiu en el procés d'escriptura
  • Com a sistema de comunicació alternativa
  • Recurs educatiu en l'aprenentatge de la lecto-escriptura
Per al seu correcte funcionament primer cal instal·lar la síntesi de veu i en segon lloc el Parlador. L'instal·lador crea una icona a la carpeta de programes del Windows que engega el programa. Com a processador de text el Parlador suporta les funcions bàsiques com escriure, rectificar, desar i recuperar, tallar, copiar, enganxar, canvi de font i mida de la lletra, etc. Admet fitxers de text en format TXT i RTF, el que permet intercanviar informació amb l'Ami Pro i el Word, però no admet les taules ni cap tipus de gràfic.
La lectura del text pot funcionar segons tres modalitats:
  • Lletreig, el programa va dient les lletres a mesura que s'escriuen
  • Paraula, el programa llegeix el text quan es prem la tecla d'espai
  • Frase, que es llegeix quan s'escriu el punt de final de frase
Els tres sistemes són compatibles entre si i s'activen a través del menú Veu que conté les diferents opcions per configurar el sistema de síntesi: l'idioma, el locutor i la velocitat. La tecla F2 llegeix el text seleccionat i situat al principi llegeix la frase. Les tecles de funció de F5 a F12 reprodueixen frases pre-enregistrades en fitxers anomenats FRASE0.WAV, FRASE1.WAV, ..., FRASE8.WAV, que es troben en el directori del programa. El programa inclou altres opcions com canviar el color de fons del document (que no canvia el color de la lletra), inserir la data o desar automàticament…