0% encontró este documento útil (0 votos)
340 vistas8 páginas

La Formacion de Palabras Compuestas en Español

Reglas de formación de palabras compuestas en español para la automatización de su reconocimiento Formation rules of compound words in Spanish to automate recognition Octavio Santana Suárez, José Pérez Aguiar Virginia Gutiérrez Rodríguez, Isabel Sánchez Berriel

Cargado por

stephanie_canet
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
340 vistas8 páginas

La Formacion de Palabras Compuestas en Español

Reglas de formación de palabras compuestas en español para la automatización de su reconocimiento Formation rules of compound words in Spanish to automate recognition Octavio Santana Suárez, José Pérez Aguiar Virginia Gutiérrez Rodríguez, Isabel Sánchez Berriel

Cargado por

stephanie_canet
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Procesamiento del Lenguaje Natural, Revista n 51, septiembre de 2013, pp 75-82 recibido 30-04-2013 revisado 16-06-2013 aceptado 21-06-2013

Reglas de formacin de palabras compuestas en espaol para la


automatizacin de su reconocimiento
Formation rules of compound words in Spanish to automate recognition
Octavio Santana Surez, Jos Prez Aguiar Virginia Gutirrez Rodrguez, Isabel
Universidad de Las Palmas de Gran Canaria Snchez Berriel
Edificio Departamental de Informtica y Universidad de La Laguna
Matemticas Edificio de Fsica y Matemticas
Campus Universitario de Tafira Campus Universitario Anchieta
35017 Las Palmas de Gran Canaria C/Astrofsico Francisco Snchez s/n
{osantana, jperez}@dis.ulpgc.es 38271 La Laguna
{vgutier, isanchez}@ull.es

Resumen: En el presente trabajo se recogen las reglas de formacin y los criterios de


aplicacin que se deberan llevar a cabo en cada situacin para permitir la identificacin
automatizada de uno de los procesos de formacin de palabras que tiene el espaol: la
composicin, se estudian slo aquellos casos en los que se ha producido dicho fenmeno
mediante la unin grfica de los elementos que participan, con miras a su automatizacin.
A tal fin, se extraen de diferentes diccionarios los distintos compuestos con el propsito
de garantizar un conocimiento suficiente de los diferentes casos que se pueden prever de
la materia y se estudian los mecanismos de unin aplicados segn la categora gramatical
del compuesto y las de sus elementos componentes.
Palabras clave: Composicin, reglas de formacin, neologismos, procesamiento del
lenguaje natural, lingstica computacional

Abstract: The following work presents the formation rules and application criteria that
should be carried out in each situation in order to obtain the automated identification of
one of the words formation processes in Spanish. In the composition are studied only
those cases in which this phenomenon has been produced through the graphic link of the
elements involved, aimed to automation. At this aim, different compounds are extracted
from dictionaries with the only purpose of guarantee a basic knowledge of the cases that
are provided by the materia. The linking mechanisms are also studied depending on the
grammatical category of the compounds and the elements which form part of it.
Keywords: Composition, formation rules, neologisms, natural language processing,
computational linguistic

En estos mecanismos morfolgicos se parte


1 Introduccin de elementos ya presentes en el lenguaje o de
otros tomados de fuera para crear nuevos
Uno de los medios con los que cuenta la lengua
vocablos; en la composicin mediante la unin
espaola para ampliar el conjunto de voces del
de dos o ms de estos elementos, en
idioma es utilizar mecanismos de tipo
contraposicin a la derivacin donde existe un
morfolgico tambin llamados neologismos
elemento gramatical que no est libre, es decir,
morfosintcticos para formar nuevas palabras
consiste en la creacin de elementos lxicos
como son la composicin, la derivacin o la
nuevos mediante la adicin o supresin a
parasntesis, entre otros. Sin duda, la
palabras ya existentes de elementos
composicin es uno de los procesos de
inseparables afijos. Por ltimo, en la
formacin de palabras con mayor importancia
parasntesis se combinan los mecanismos
que dispone la lengua para la renovacin y
anteriores, bien por afijacin que simultanea
enriquecimiento de su lxico.

ISSN 1135-5948 2013 Sociedad Espaola Para el Procesamiento del Lenguaje Natural
Octavio Santana Surez, Virginia Gutirrez Rodrguez, Jos Prez Aguiar y Isabel Snchez Berriel

dos procedimientos derivativos sufijacin y tanto sean prefijos como sufijos3. La Tabla 1
prefijacin o por combinacin de elementos muestra ejemplos de palabras compuestas
de la composicin y de la derivacin como trata formadas por las combinaciones posibles de
Serrano Dolader (1995). En el presente trabajo estos dos tipos de unidades lxicas.
se estudian aquellos casos de compuestos que
se han consolidado como la unin grfica de los Elemento
Composicin Palabra
elementos que intervienen1, adems se tratan compositivo
los pseudoprefijoides o pseudosufijoides como Palabra
hojalata germanfilo
elementos compositivos no como morfemas malgastar ualbo timbrologa
derivativos, y se incluye la parasntesis por Elemento ecosistema logopeda
composicin, desde un punto de vista compositivo cardioprotector filntropo
morfolgico. Se trata, en suma, de
procedimientos que pueden crear neologismos,
lo que constituye una alternativa moderna para Tabla 1. Combinaciones de distintas unidades
el enriquecimiento de la lengua. lxicas para formar palabras compuestas
La utilizacin de races cultas greco-latinas
2 La composicin en espaol es frecuente en los procesos de formacin de
En los estudios realizados sobre composicin nuevas palabras, especialmente en los campos
en espaol, no se ha llegado a dar una cientficos y tcnicos. Las voces en cuya
definicin de forma unnime, sobre todo a la formacin intervienen estos elementos podran
hora de establecer la frontera entre composicin no considerarse propiamente compuestas, pues
y derivacin. Para M. Lang (1997) la la mayora de estas races no pueden aparecer
composicin consiste en la unin de palabras ya de forma aislada, pero tampoco pueden
se trate de formas libres o morfemas lxicos; en considerarse derivadas puesto que tienen un
la misma lnea puede resultar la definicin de comportamiento peculiar que los aleja de los
M. Alvar (2002) donde en la composicin autnticos afijos; es ms, tienen un significado
participan dos o ms unidades lxicas que lxico ms prximo al de las races que al de los
pueden aparecer libres en la lengua; pero la ms afijos. A este tipo de races se les da el nombre
prxima a nuestro estudio es la definida por el de elementos prefijales o sufijales elementos
Diccionario de la Real Academia de Lengua compositivos, en funcin de si se anteponen o
Espaol DRAE procedimiento por el cual se posponen a otra raz.
se forman vocablos agregando a uno simple Hay que tener en cuenta que aunque, por
una o ms preposiciones o partculas u otro norma general incluido en muchas
vocablo ntegro o modificado por eufona definiciones de composicin el nmero de
coyotomate, quitaipn, cagalaolla, paraguas. constituyentes que forma una palabra
Se considera que los elementos componentes compuesta es de dos, existen casos de tres
que forman una palabra compuesta pueden ser tiraiafloja, bienteveo, cenaaoscuras, o incluso
de dos tipos: palabras2 castellanas enteras (P) cuatro componentes correveidile, ahimelollevas,
tentenelaire, aunque, en la mayora de ellas,
y temas cultos de origen grecolatino llamados
elementos compositivos prefijales o sufijales suelen insertarse elementos monosilbicos
(EC). Al fijar que los elementos compositivos tonos como preposiciones, conjunciones
son temas cultos se establece la diferencia copulativas, pronombres, artculos, entre otros.
con lo que se entiende por verdaderos afijos, Las palabras compuestas han sufrido un
proceso de aglutinacin sin prdida de dicho
elemento del sintagma nominal u oracin
original del que proviene.
En cuanto a las combinaciones de palabras
1
Hay que tener en cuenta que la composicin puede (P+P), estas pueden crearse a partir de
dividirse en composicin de tipo ortogrficamente unidos
y composicin de tipo sintagmtico, donde los
3
componentes han alcanzado una coherencia semntica sin Un reconocimiento automatizado de compuestos
fusin ortogrfica. El presente trabajo slo se centrar en formados por elementos compositivos tiene que considerar
el primer tipo de composicin. la distincin entre elementos compositivos y afijos: un
2
Entendindose como palabras aquellas que tienen un elemento prefijal no equivale a la derivacin por
solo lexema o un lexema unido a morfemas flexivos o las prefijacin de una palabra (bienvenir es una palabra
que estn formadas por un morfema libre o unido a compuesta, no derivada del verbo venir con los prefijos bi-
morfemas flexivos. en- sino proviene del elemento compositivo bien-).

76
Reglas de formacin de palabras compuestas en espaol para la automatizacin de su reconocimiento

conceptos que estn relacionados, o mejor tradicin lingstica o de realidad de los hechos
dicho, categoras gramaticales como del lenguaje. Se dejan al margen la mayora de
sustantivos, adjetivos y verbos; por tanto, la los compuestos de tipo sintagmtico, ya que los
estructura de los compuestos puede presentar componentes han alcanzado una coherencia
mltiples formas, segn la categora gramatical semntica pero sin fusin grfica y por lo tanto
de los componentes y la categora del resultado no se van a considerar en el presente estudio.
final. Con la variedad de formantes y de
resultados que presentan, las relaciones entre
Adverbio+Adjetivo
los elementos participantes son de muy diversa Composicin
Adjetivo+Adjetivo
ndole. La composicin ms comn es aquella Adjetiva Sustantivo+Adjetivo
que sirve para denominar objetos como la Composicin
Sustantivo+Sustantivo
composicin nominal, seguida de la Verbo+Verbo
Propia Verbo+Complemento
composicin adjetiva y, en menor medida, la Composicin
Sustantivo+Adjetivo o
composicin verbal. En funcin de la clase -ominal
Composicin Adjetivo+Sustantivo
funcional de los elementos componentes se Sintagmtica Sustantivo+Preposicin
obtienen los siguientes esquemas de +Sustantivo
combinacin ms tpicos:
Sustantivo+Sustantivo
Verbo+Complemento Tabla 2. Clasificacin de la composicin segn
Sustantivo+Adjetivo E. Bustos Gisbert
Adjetivo+Sustantivo Segn la frecuencia de aparicin de la
Sustantivo+Preposicin+Sustantivo categora gramatical del compuesto, se pueden
donde E. Bustos (1986) plantea una detallar las siguientes combinaciones:
clasificacin segn las categoras gramaticales
de los elementos componentes, as como la  Uno de los compuestos ms productivos
categora del compuesto como se indica en la son los que dan como resultado un
Tabla 2. sustantivo. Dentro de este tipo, los ms
Se entiende por composicin sintagmtica caudalosos son los de Verbo+Complemento
aquel tipo de composicin que tiene como debido a la constitucin interna que
resultado unos compuestos que se aproximan presentan as como a la comodidad que le
bastante a los sintagmas nominales produce a un hablante esta estructura por la
correspondientes, pero que no pueden ser semntica que sus compuestos implican, ya
considerados como sintagmas nominales4, sino que caracterizan al referente a travs de su
como unidades lxicas pues el compuesto se actividad, como indica E. Bustos (1986). En
utiliza como una nica palabra en la que han la Tabla 3 se aprecian diferentes
quedado cohesionados todos sus componentes; formaciones de compuestos nominales.
donde la composicin adjetiva y la propia Existen compuestos que representan
sustantiva tambin conocida como sistemas marginales o bien resulta escaso el
composicin lxica est formada por dos o nmero de casos que producen o son casos
ms palabras o bases con alguna modificacin particulares de los anteriores:
fnica, generalmente con unin grfica de los
elementos que la componen. Desde un punto de PREPOSICIN+CONJUNCIN CONDICIONAL +ADVERBIO
DE MODO: porsiacaso.
vista histrico, no existe una separacin tajante NUMERAL+PREPOSICIN+SUSTANTIVO: cientoemboca,
entre los compuestos sintagmticos y milenrama.
determinados ejemplos de compuestos propios, VERBO+CONJUNCIN: creique, penseque.
por cuanto que estos, en ciertos casos, pueden Los compuestos que constan de ms de
ser el resultado de un proceso de aglutinacin dos piezas lxicas dan como resultado un
hoja de lata hojalata, hidalgo o aguanafa. sustantivo formado por las combinaciones,
Desde un punto de vista sincrnico, el no entre otras:
reconocimiento de grupos sintcticos en alguno VERBO+Y+VERBO: tiraiafloja, quitaipn.
VERBO+VERBO+Y+VERBO: correveidile.
de estos tipos de compuestos es un problema de ADVERBIO+PRON.PERSONAL+VERBO: bienmesabe.
VERBO+PRONOMBRE PERSONAL+ PRON. IMPERSONAL:
4
No pueden adquirir la categora de compuesto sabelotodo.
aunque semnticamente estn unidos como farola de VERBO+PRON.PERSONAL+VERBO: hazmerrer.
jardn o casa hospital frente a palabras que s lo son como VERBO+PRON.PERSONAL+PREPOSICIN+
libro de cocina o restaurante espectculo. PRON.IMPERSONAL: metomentodo.

77
Octavio Santana Surez, Virginia Gutirrez Rodrguez, Jos Prez Aguiar y Isabel Snchez Berriel

Categora Sustantivo Adjetivo ADJETIVO+ADVERBIO DE MODO: otrosi.


aguardiente Raros: ADVERBIO+VERBO: dondequiera.
casatienda bocamanga
Sustantivo carricoche telaraa
hierbabuena  Que dan lugar a pronombres:
artimaa pelirrojo PRONOMBRE RELATIVO+VERBO: cualquiera,
ciempis malasangre
Adjetivo medioda malpas quienquiera.
hincapi matamoscas PRON.PERSONAL+ADJETIVO: nosotros.
Verbo
quemasangres  Que dan lugar a conjunciones:
saltarrostro quitapenas ADVERBIO DE TIEMPO O DE MODO + PRONOMBRE
trotamundos RELATIVO: aunque.
bienandanza
PREFIJO+SUSTANTIVO U.T.C. CONJUNCIN
Adverbio menoscuenta
ADVERSATIVA: sin embargo.
bienquerencia
CONJUNCIN+ADVERBIO DE MODO: sino.
Verbo Adverbio
compraventa  Que dan lugar a numerales:
bogavante atalejo
Verbo duermevela veinticincoveinte+cinco, diecisisdiez+seis
mandams
ganapierde

Adverbio bienmesabe
Categora Adjetivo (o Participio)
Tabla 3. Compuestos nominales segn la alicado, cejijunto,
Sustantivo pelirrojo, teticiega, patidifuso
categora gramatical de sus elementos tonticiego, grandilocuente,
componentes Adjetivo agridulce, hispanohablante
 El segundo caso en productividad son los bienintencionado,
Adverbio
compuestos adjetivos. Los ms caudalosos malaconsejado
son los de Sustantivo+ Adjetivo donde
Tabla 4.- Compuestos adjetivales segn la
existe una marcada relacin entre los
categora gramatical de sus elementos
elementos del compuesto ya que el segundo
componentes
miembro predica una cualidad del primero,
sustantivo5 que generalmente designa partes Se tiene en cuenta no tratar la formacin del
exteriores del cuerpo humano o animal. tipo: ADJETIVO + -MENTE  ADVERBIO
 Componentes que parecen admitir dos rpidamente, compulsivamente debido a que,
interpretaciones diferentes adjetivos y aunque algunos autores (Prez, 2002) la
sustantivos, y no se posee informacin reconocen como un proceso de composicin,
suficiente para decidir cual resulta ms est consolidada como una formacin
correcta cardocuco cardo silvestre no derivativa; as lo recoge el Diccionario General
est claro si cuco es adjetivo o sustantivo. de la Lengua Espaola (VOX, 2003) ya que
considera -mente como un sufijo, no elemento
Por regla general, el resultado de fusionar
sufijal, que entra en la formacin de adverbios
dos palabras para formar un compuesto es un
de modo pospuesto a los adjetivos en su forma
sustantivo o un adjetivo. Pero existen, aunque
femenina6 buenamente.
en menor medida, diversas categoras
Por otro lado, segn se recoge en el trabajo
gramaticales adicionales:
de M. Alvar (2003), la composicin se sirve de
Cuando dan lugar a verbo. No se ha procedimientos para la creacin de palabras
detectado que esta categora gramatical nuevas, como son: sinapsia, disyuncin,
combine dos constituyentes de su misma contraposicin, yuxtaposicin, prefijos vulgares
categora gramatical, es decir, y acortamiento. El ms caudaloso de los
Verbo+Verbo, constatndose esta misma procesos de composicin es la yuxtaposicin o
restriccin en otras lenguas. lexas compuestas, aqu la fusin grfica de los
SUSTANTIVO+VERBO: maniatar,aliquebrar. elementos participantes en el compuesto es
ADVERBIO+VERBO: maldecir, malcomer, bienpensar. total, as como su lexicalizacin y su
 Que dan lugar a adverbio gramaticalizacin carnicol, malqueda, cochitril,
CONJUNCIN+VERBO: siquiera (adverbio o
conjuncin). hincapi. Sin embargo, la unin de los miembros
ADVERBIO DE CANTIDAD+ADJETIVO O ADVERBIO: en la sinapsia es de naturaleza sintctica, no
tampoco. morfolgica, por lo que es difcil determinar si
ELEMENTO COMPOSITIVO+ADVERBIO DE TIEMPO: se ha producido lexicalizacin o no. Suele
anteayer.
6
El adjetivo adopta siempre la forma femenina, si la
5
Existe una marcada tendencia a colocar en el primer tiene, pues -mente es femenino en latn y conserva el
miembro sustantivos bislabos acento.

78
Reglas de formacin de palabras compuestas en espaol para la automatizacin de su reconocimiento

existir un nexo de unin entre las dos palabras siguiendo la estructura A+B+Sufijacin,
que dan lugar al nuevo trmino, generalmente pero no existe la combinacin A+B ni
con las preposiciones de y a pan de azcar, paso B+Sufijacin se consideraran derivacin de
a nivel, cuerda sin fin, correspondiendo este palabras compuestas o derivados por sufijacin,
compuesto con la clasificacin sintagmtica que respectivamente, y en caso de existir no son
hace E. Bustos Gisbert (1986) de Sustantivo + el origen de la palabra final. A este tipo especial
Preposicin + Sustantivo. Por otro lado, la de palabras se le conoce con el nombre de
disyuncin da origen a un tipo de lexas en la parasintticos en composicin.
que los dos elementos participantes no se han misacantano no existe misacanta ni cantano,
soldado grficamente, por ms que la ropavejero no existe vejero, doceaista no existe
aista, aguamanil no existe mano+il
lexicalizacin sea un hecho alta mar, peso
Es, por todo lo anterior, que en el presente
pluma, pjaro mosca correspondindose con
artculo se procede a estudiar los compuestos
diversos compuestos Sustantivo+Sustantivo o
yuxtapuestos o lexas compuestas en
Sustantivo+Adjetivo o viceversa de E. Bustos.
composicin nominal y adjetiva, segn la
Se puede incluso llegar, en las dos
clasificacin de E. Bustos (1986), al igual que
composiciones anteriores, a la unin grfica de
algunos casos especiales de acortamiento,
los elementos tela de araatelaraa, agua
elementos compositivos y parasintticos por
nieveaguanieve, ave fraavefra.
composicin, desde un punto de vista
En un grado ms alto de unin grfica que
morfolgico, ya que en los restantes tipos se
los dos anteriores, est la contraposicin donde
han de tener en cuenta factores sintcticos y
los elementos que participan en ella se escriben
semnticos para poder justificar que es un
unidos por un guin, aunque generalmente el
verdadero compuesto en espaol y esto se
resultado aparecer sin l debido a las
escapa actualmente del dominio informtico.
restricciones del uso del guin que tiene el
espaol falda pantaln falda-pantaln,
3 Reglas de formacin de palabras
considerndola como uno de los compuestos
anteriores. compuestas
Se hace una mencin especial a la Las reglas de formacin de compuestos que se
combinacin de una preposicin con otra estudian son de carcter lxico y no sintctico,
categora gramatical, como por ejemplo: semntico o fonolgico, lo que no excluye que,
PREPOSICIN + SUSTANTIVO sobredosis, en ocasiones, sea necesario hacer referencia a
entreacto, contradanza, PREPOSICIN + VERBO dichos aspectos dado que son caractersticas
sobredimensionar, contradecir, entresacar, inseparables de este proceso de formacin de
PREPOSICIN + ADJETIVO sobreabundante, palabras.
contrachapado, entremedio, pues generalmente se Las primitivas, a las cuales se le aplican las
suelen confundir estos casos con composicin reglas de formacin de palabras compuestas que
cuando en realidad se trata de un proceso se buscan, deben ser palabras consolidadas en
derivativo como indica S. Varela (1990) en su nuestra lengua o neologismos, pero nunca
libro Fundamentos de Morfologa, aunque M. palabras incorrectas ortografa irregular o
Alvar (2002) considera la formacin de palabras bloqueadas como *grabamiento por
palabras mediante prefijos vulgares como parte grabacin. La existencia en el lexicn7 de
de la composicin cuando estos prefijos innumerables particularidades no debera
coinciden con las preposiciones, esto es, se suponer una barrera para la automatizacin de
unen dos elementos independientes de la este proceso, tanto en el reconocimiento como
lengua. en la generacin, dado que algunas de las
Muchos autores consideran el acortamiento palabras que presentan irregularidades admiten
como un procedimiento de formacin de nuevas un reglado y el resto pueden llevar un
palabras o neologismos que, por su naturaleza, tratamiento especial.
escaparan, en principio, a una teora Para la deduccin de las reglas de formacin
morfolgica, no como parte de la composicin, que permiten la identificacin automatizada de
pero la frontera entre ellos no est todava muy palabras compuestas yuxtapuestas, se extraen
clara sobre todo en el caso de abreviamiento.
Existen palabras que se forman a partir de
7
una combinacin de dos palabras ms una Los ejemplos utilizados pueden ser formaciones
neologsticas, no necesariamente documentadas en la base
sufijacin, segn D. Serrano (1995) de referencia.

79
Octavio Santana Surez, Virginia Gutirrez Rodrguez, Jos Prez Aguiar y Isabel Snchez Berriel

de diferentes diccionarios los distintos Hay que tener en cuenta que en un estudio
compuestos y se estudian los cambios grficos cuyo objetivo sea la automatizacin de la
que han sufrido las diferentes palabras que los morfologa con medios informticos, los
forman as como las categoras gramaticales de aspectos formales o tericos no tienen por qu
stas. Se obtiene un conjunto de reglas que, coincidir con los estrictamente lingsticos. As,
junto a las excepciones encontradas, permitan el *altobajo falsa composicin pues lo correcto
reconocimiento y posterior generacin sera altibajo no tendra por qu tratarse de
automtica de palabras compuestas. una mala formacin al no contravenir ninguna
regla fonotctica del lenguaje, ni siquiera la
3.1 Obtencin de la base de estudio norma de la estructura silbica del espaol.
Se parte de un conjunto de tamao En la Figura 1 muestra el funcionamiento
suficientemente significativo de compuestos, del procedimiento de reconocimiento de
alrededor de 11000, y se clasifican en grupos compuestos, donde una vez superada las
segn la categora gramatical de sus condiciones de partida, como no contener
constituyentes. Para ello, se toma como base ningn error ortogrfico, se lematiza la palabra
documental de partida los compuestos identificando sus diversas formas cannicas,
recogidos en los principales repertorios categoras gramaticales y las flexiones o
lexicogrficos de la lengua espaola derivaciones que las produce. Por lo general, si
(Bibliograf, 2003; RAE, 2001; Larousse, 1996; se tratara de una palabra compuesta, las
Clave, 1997; Moliner, 1996) y del glosario de diversas formas cannicas se reduciran a una,
compuestos del libro La composicin nominal coincidiendo con la palabra en si. Adems, la
en espaol de E. Bustos (Bustos, 1986), donde categora gramatical suele ser simple:
para su elaboracin se utilizaron obras de sustantivo en la mayora de los casos,
carcter general DRAE y obras de carcter adjetivo o verbo. Se analiza si la palabra es
regional o dialectal hablas leonesas, compuesta pura, derivada en cuyo caso se
aragonesas, meridionales, espaol de Amrica. estara hablando de derivacin por
composicin, pasndose a reconocer la forma
3.2 Obtencin de las reglas de cannica de la misma, o pudiera ser
formacin parasinttica por composicin (Serrano, 1995).
A partir de los conjuntos obtenidos se buscan A continuacin, se aplican las reglas de
las reglas de formacin de los mismos. Se parte formacin de compuestos si no pertenece a la
de la palabra y se prueba que cumpla unas base de estudio, se comprueba cules son
ciertas condiciones tamao de la palabra, por buenas, ordenados por criterios de idoneidad, en
norma general, mayor a cinco caracteres, o caso contrario, no existe solucin en el
8 reconocimiento. Por todo lo anterior, se buscan
formado por al menos tres slabas ualbo. El
proceso de reconocimiento empieza haciendo las reglas de formacin a partir del estudio del
cortes a la palabra hasta que se encuentra algn comportamiento de los vocablos constituyentes
vocablo ntegro o bien ambos, a los cuales se del compuesto, algunas coinciden con las
les aplica la regla correspondiente o bien se tratadas por lingistas, aunque con una
trata como excepcin, utilizando para ello el adaptacin informtica justificada por el
Flexionador y Lematizador de palabras del comportamiento mayoritario observado.
espaol del Grupo de Estructura de Datos y Adems, se debe tener en cuenta que cuando se
Lingstica Computacional (Santana et al., aplican las reglas hay que considerar los
1997, 1999, 2006). Al ir generando cortes se cambios grficos que se pueden producir como
pueden obtener mltiples soluciones entre las consecuencia de aplicarla, siendo esto necesario
que se pueden encontrar varias que no lo sean, para un correcto tratamiento informtico.
pero esta primera aproximacin permite aadir
9
otro tipo de condicionantes . 3.3 Reglas de formacin
Los procedimientos por los que se forman
8
palabras compuestas pueden dividirse en dos
Generalmente los vocablos en espaol son grandes grupos atendiendo al grado de
bisilbicos o trisilbicos, por lo que se puede decir que los
compuestos nominales contienen de cinco a seis slabas.
modificacin que sufran los elementos
9
Las palabras que forman el compuesto no son
derivadas sino forman una nica unidad lxica, es decir, compuesto, o bien no se admite la flexin de diminutivo
no tienen prefijos, en especial el primer constituyen del en la segunda palabra del compuesto, entre otras.

80
Reglas de formacin de palabras compuestas en espaol para la automatizacin de su reconocimiento

originales: o bien por la mera adicin de dos o produce es de la vocal a, pues normalmente
ms trminos sin que ninguno de ellos se el elemento verbal aparece en forma
modifique rompeolas, abrelatas, medioda o por imperativa y la flexin de los verbos de la
la unin que conlleve algn tipo de primera conjugacin acaba en a los ms
modificacin grfica en alguno de los utilizados en esta reglaclaroscuro, ualbo,
elementos que intervienen en la composicin caridelantado, ajolio, ceracate, aguardiente.
generalmente ocurre en el primero de los Caso adicional (ha, ho): Se elimina la h
componentes o de adicin al resultado final del punto de unin si se encuentra entre dos
agridulce, rojiblanco, coliflor, balompi. vocales iguales, como resultado de la unin
de los constituyentes.
matambremata+ambremata+hambre
 Sustitucin de las vocales tonas finales a,
e y o correspondientes al primer
constituyente por el infijo compositivo i, o
en el caso de Verbo+Complemento sustituir
la terminacin verbal, acabada en a para los
verbos de la 1 conjugacin y en e para los
de la 2 y 3, por el infijo compositivo i, y
llevar a cabo la unin sin prdida.
Generalmente, en la composicin
Adjetivo+Adjetivo se utiliza con adjetivos
de color. Por la construccin del tiempo
verbal en los compuestos Verbo+Verbo, la
mayora de los casos son con la vocal tona
e. Sin embargo, son ms los que hay que
sustituir el morfema o en los compuestos de
tipo Sustantivo+Adjetivo o Adjetivo+
Sustantivo. Debido a la estructura peculiar
del compuesto [Sustantivo+Adjetivo]Adjetivo
hay que tener en cuenta que existen
Figura 1.-Diagrama para el reconocimiento de palabras que aplicaran la regla anterior si
palabras compuestas no es porque previamente han incorporado
el infijo compositivo i altibajo, cortiancho,
rojinegro, dulciagrio, ardiviejas, batiaguas.
Se presentan las reglas de formacin de  Si el primer elemento acaba en consonante
palabras compuestas detectadas en la base de y el segundo empieza en consonante,
estudio. introducir la i en medio y llevar a cabo la
 Unin sin prdida ni adicin ni cambio. unin. No se aprecia que se produzca en
Esta regla se aplica de forma general a todos los tipos de composicin, sino en
todas las categoras gramaticales. aquellos casos en los que ambos
Generalmente, en la composicin adjetiva componentes tienen igual categora, a
de Adjetivo+Adjetivo se utiliza con excepcin de la combinacin Verbo +
adjetivos de nacionalidad y en la Verbo azuliblanco, calicanto, paniqueso.
composicin nominal de Verbo+Verbo se El papel que parece desempear el
duplica el lexema verbal. La ms morfema compositivo i es de funcin
productiva de la lengua espaola es la conjuntiva que, aunque parece probable
composicin nominal de Verbo + desde la perspectiva semntica carricoche,
Complemento, coincide en que sta es, coliflor, no se justifica en otros casos,
precisamente, la regla que ms se utiliza especialmente, en algunos compuestos
para este tipo de compuesto dedodedama, adjetivales, porque en ellos no se atisba
bienintencionado, iberoamericano, tragaavemaras. claramente ninguna razn de tipo semntico
 Cuando las palabras a unir terminan y o fonolgico.
empiezan con la misma vocal a, e u o, se  Se elimina la ltima vocal fuerte del primer
elimina una de ellas sinalefas o constituyente, si acaba en vocal, o bien
reducciones de los hiatos. En cuando es final voclico el primer
Verbo+Complemento la prdida que se

81
Octavio Santana Surez, Virginia Gutirrez Rodrguez, Jos Prez Aguiar y Isabel Snchez Berriel

componente y principio voclico el segundo desde un punto de vista morfolgico como


y tienen la posibilidad de formacin de un semntico.
diptongo o de una contraccin, se procede a
la unin con prdida de la vocal del primer Bibliografa
elemento eurasitico, papalbo, liquidmbar..
Alvar Ezquerra, M. 2002. La formacin de las
Existen casos en que parece que ms
palabras en espaol. Cuadernos de lengua
que aplicar esta regla, se podra haber
espaola, Ed. Arco/Libros, Madrid.
utilizado la de sustituir el morfema por el
infijo compositivo i, como puede verse en: Bibliograf, S.A. 2003. Diccionario General de
agridulceagrio+dulce ( agro+dulce) la Lengua Espaola VOX Barcelona.
En otros casos, se dice que ha sufrido un
proceso de prdida del infijo compositivo i: Bustos Gisbert, E. 1986. La composicin
manvacomanivacomano+vaco nominal en espaol, Universidad de
 Los elementos compositivos pueden estar Salamanca.
formados por la agregacin de races cultas Clave SM. 1997. Diccionario de Uso del
greco-latinas a una palabra espaola, Espaol Actual. Clave SM, Madrid.
antepuesta o pospuesta a la misma
cornialto, denticonejudo, petrolfero, carnvoro Lang, M. 1992. Formacin de palabras en
o por la combinacin de races cultas: raz espaol. Morfologa derivativa productiva
prefija y sufija griegas o latinas telfono, en lxico moderno. Ctedra, Madrid.
filiforme, raz prefija griega y sufija latina Larousse Planeta, S.A. 1996. Gran Diccionario
automvil o raz prefija latina y sufija de la Lengua Espaola. Larousse Planeta,
griega hispanofilia, o por otro tipo de S.A., Barcelona
races arisblanco, euroasitico, galicursi.
Mara Moliner. 1996. Diccionario de Uso del
4 Conclusiones Espaol,Ed. Gredos, Madrid.

A pesar de ser la composicin, sin duda, uno de Prez Cino, W. 2002. Manual Prctico de
los procesos de formacin de palabras de mayor formacin de palabras en espaol I, Ed.
importancia pese al escaso tratamiento Verbum.
recibido por parte de la bibliografa se ha Real Academia Espaola y Espasa-Calpe. 2001.
contribuido a llenar en parte el vaco Diccionario de la Lengua Espaola,
informtico existente en su tratamiento, ya que edicin electrnica. 22 edn. Madrid.
han resultado infructuosas las bsquedas de
referencias sobre procesamiento automtico de Santana, O.; Carreras, F.; Prez, J.; Gutirrez,
la composicin en espaol. V. 2006. El reconocimiento automtico de
Uno de los procesos de formacin de la composicin en espaol. Conference
palabras compuestas ms productivos, con Abstracts of the First International
respecto a los dems tipos compositivos, son las Conference of the Alliance of Digital
formaciones de Verbo+Sustantivo debido a la Humanities Organizations.
gran expresividad, simplicidad el grado de Santana, O.; Prez, J.; Carreras, F.; Duque, J.;
modificacin que sufren los elementos Hernndez, Z.; Rodrguez, G. 1999.
originales, en la mayora de los casos, es nulo FLANOM: Flexionador y lematizador
y al frecuente uso que se hace en el lenguaje automtico de formas nominales.
publicitario de este sistema compositivo. El Lingstica Espaola Actual XXI, 2, Ed.
auge en el uso de nuevos medios de Arco/Libros, S.L.
comunicacin social, el lenguaje periodstico,
Santana, O.; Prez, J.; Hernndez, Z.; Carreras,
entre otros factores, han hecho que se creen
neologismos compositivos debido a la rpida F.; Rodrguez, G. 1997. FLAVER:
evolucin de los acontecimientos y a su Flexionador y lematizador automtico de
formas verbales. Lingstica Espaola
inmediata incorporacin al mundo de las
Tecnologas de la Informacin. Por ello, son Actual XIX, 2, Ed. Arco/Libros, S.L.
imprescindibles procesos automticos que sean Serrano Dolader, D. 1995. Las formaciones
capaces de identificar estas palabras situndolas parasintticas en espaol, Ed. Arco/Libros.
en un contexto lingstico adecuado, tanto

82

También podría gustarte