DWORKIN S Et Al - Lingüistica Historica Del Español
DWORKIN S Et Al - Lingüistica Historica Del Español
Lingüística histórica del español/The Routledge Handbook of Spanish Historical Linguistics ofrece una
síntesis actualizada de los diversos campos que componen la lingüística histórica del español.
Este volumen, pionero en su género, estudia la historia interna y externa de la lengua española
con atención a los desarrollos teóricos y conocimientos contemporáneos sobre la naturaleza del
cambio lingüístico y sobre el papel de los factores no lingüísticos en tales procesos. El volumen,
escrito íntegramente en español, reúne contribuciones de un nutrido grupo de expertos
internacionales. Con capítulos tanto de destacados filólogos como de lingüistas de orientación
más teórica, el volumen ofrece a los lectores una panorámica equilibrada y completa del objeto
de estudio desde muy diversas perspectivas de investigación.
Esta obra aspira a servir de referencia en el campo de la lingüística histórica española y
resultará de interés para estudiosos y profesores interesados en dicho ámbito, así como para los
estudiantes de lingüística hispánica.
Editado por
Steven N. Dworkin,
Gloria Clavería Nadal y
Álvaro S. Octavio de
Toledo y Huerta
DIRECTORES DE LA COLECCIÓN:
JAVIER MUÑOZ-BASOLS
Designed cover image: Nikada/Getty Images
First published 2024
by Routledge
4 Park Square, Milton Park, Abingdon, Oxon OX14 4RN
and by Routledge
605 Third Avenue, New York, NY 10158
Routledge is an imprint of the Taylor & Francis Group, an informa business
© 2024 selection and editorial matter, Steven N. Dworkin, Gloria Clavería Nadal and
Álvaro S. Octavio de Toledo y Huerta; individual chapters, the contributors
The right of Steven N. Dworkin, Gloria Clavería Nadal and Álvaro S. Octavio de
Toledo y Huerta to be identified as the authors of the editorial material, and of the
authors for their individual chapters, has been asserted in accordance with sections 77
and 78 of the Copyright, Designs and Patents Act 1988.
All rights reserved. No part of this book may be reprinted or reproduced or utilised in
any form or by any electronic, mechanical, or other means, now known or hereafter
invented, including photocopying and recording, or in any information storage or
retrieval system, without permission in writing from the publishers.
Trademark notice: Product or corporate names may be trademarks or registered
trademarks, and are used only for identification and explanation without intent to
infringe.
British Library Cataloguing-in-Publication Data
A catalogue record for this book is available from the British Library
ISBN: 978-0-367-47433-1 (hbk)
ISBN: 978-1-032-54979-8 (pbk)
ISBN: 978-1-003-03556-5 (ebk)
DOI: 10.4324/9781003035565
Typeset in Bembo
by Apex CoVantage, LLC
Índice
Lista de tablas x
Lista de figuras xi
Biografías de los autores xii
PARTE I
Perspectivas metodológicas y horizontes de investigación 5
8 Oralidad y escrituralidad 86
Silvia Iglesias Recuero y Eugenio Bustos Gisbert
v
Índice
PARTE II
Grandes procesos evolutivos 145
vi
Índice
PARTE III
Historia lingüística desde la época prerromana al
español europeo actual 315
38 Latín y romance como lenguas de cultura desde 1450 hasta 1700 438
Christopher J. Pountain
PARTE IV
Historia de las variedades no europeas del español 509
ix
Tablas
x
Figuras
7.1 Los niveles universal, histórico y actual del lenguaje y los saberes elocucional,
idiomático y expresivo de acuerdo con la propuesta de Coseriu 76
7.2 Niveles y dominios de lo lingüístico 76
9.1a Expresión del pronombre de sujeto de 3.ª sg. según el rol sintáctico de
la mención previa y el género del referente en textos premodernos 105
9.1b Número y distribución de sujetos de 3.ª sg. según el rol sintáctico de
la mención previa: referentes femeninos versus masculinos 105
29.1 Remodelación del esquema del espacio variacional entre inmediatez
y distancia comunicativas de Koch y Oesterreicher (1990, 39)
propuesta en Del Rey Quesada (2021) 347
29.2 Ejemplos de variantes marcadas y no marcadas en el espacio variacional del latín 348
xi
Biografías de los autores
xii
Biografías de los autores
Del Barrio de la Rosa, Florencio. Doctor en filología hispánica por la Universidad de Valladolid,
es Catedrático de Lengua Española en la Università Ca’ Foscari de Venecia (Italia). Ha
xiii
Biografías de los autores
Del Rey Quesada, Santiago. Licenciado en Filología Hispánica y Filología Clásica por la
Universidad de Sevilla, en la que es Catedrático de Lengua Española. Alumnus de la Fundación
Alexander von Humboldt, ha sido profesor en las universidades de Tubinga y Múnich. Sus
principales líneas de investigación giran en torno a la elaboración lingüística de las lenguas
romances desde la época medieval hasta la moderna, el análisis histórico del discurso, la lingüística
de variedades, el contacto de lenguas y la teoría y la historia de la traducción. El capítulo del
que es autor se enmarca en los proyectos PGC2018-097823-B-I00 y PID2021-123763NA-I00.
Diez del Corral Areta, Elena. Profesora titular de Lingüística Hispánica en la Universidad
de Lausana. Sus líneas de investigación se centran en la historia del español de América,
principalmente en el nivel de la sintaxis, y en la edición y estudio de textos antiguos manuscritos
no literarios. Es miembro de la Red CHARTA ([Link] desde 2008 y actualmente
dirige el proyecto CorColombia (Corpus histórico del español de Colombia). Para más información
sobre sus proyectos y publicaciones puede consultarse su página web institucional: <[Link]
ch/esp/elenadiezdelcorralareta>.
xiv
Biografías de los autores
xv
Biografías de los autores
Gutiérrez, César. Assistant professor de español en Wake Forest University (EE. UU.), donde
imparte clases de lengua, lingüística y cultura españolas. Sus áreas de investigación son la fonética
y fonología históricas, la etimología y la dialectología de las lenguas iberorromances.
Gutiérrez Maté, Miguel. Profesor en la Universidad de Augsburgo. Su tesis doctoral (2013) fue sobre
sintaxis histórica del español de Colombia y de Santo Domingo. Actualmente prepara, a partir de
su tesis de habilitación, el libro ROMANIA BANTU. Restructuring with and without Transfer in Two
Ibero-Romance/Kikongo (De Gruyter) Varieties: Palenquero Creole and Cabindan Portuguese (De Gruyter)
y está coeditando los volúmenes Contact Varieties of Spanish and Spanish-Lexified Contact Varieties (De
Gruyter, HSK). Es miembro de la Red BayMis dedicada al Sprachbund de Misiones, Argentina.
Iglesias Recuero, Silvia. Profesora del Departamento de Lengua Española y Teoría de la Lite-
ratura de la Universidad Complutense de Madrid. Sus principales líneas de investigación se
centran en la pragmática histórica y el análisis histórico del discurso, especialmente en la historia
de la formulación lingüística y discursiva de los actos de habla en español.
xvi
Biografías de los autores
xvii
Biografías de los autores
Actualmente está elaborando una gramática histórica del español y del portugués que publicará
en dos volúmenes en la editorial Oxford University Press.
Pons Rodríguez, Lola. Catedrática en la Universidad de Sevilla. Ha sido directora de los cuatro
proyectos de investigación Historia15, dedicados al castellano de la Baja Edad Media, época a
la que ha dedicado principalmente sus intereses investigadores. Recientemente ha publicado
una edición del Diálogo de la lengua (1535) de Juan de Valdés en la Biblioteca Clásica de la
Real Academia Española. Su capítulo forma parte del proyecto de investigación “La escritura
elaborada en el español de la Baja Edad Media al siglo XVII: lengua epistolar y cambio lingüístico”
(PID2020-113146GB-I00, Ministerio de Ciencia e Innovación), que codirige.
xviii
Biografías de los autores
Torrens Álvarez, María Jesús. Científica titular del Consejo Superior de Investigaciones
Científicas (Instituto de Lengua, Literatura y Antropología). Sus investigaciones se centran en
la edición y el estudio de textos castellanos medievales. Su capítulo en este volumen se enmarca
en el proyecto de investigación El castellano norteño en la Edad Media (PID2020–119308GB-I00),
financiado por MCIN/AEI/10.13039/501100011033.
xix
Biografías de los autores
Tuten, Donald N. Profesor de Español y Lingüística en la Universidad de Emory (Atlanta, EE. UU.).
Su investigación y sus publicaciones se centran en la sociolingüística histórica y la actuación de
los cambios lingüísticos.
xx
Introducción y visión panorámica
de la “Lingüística histórica
del español”
(Introduction and overview to
“The Routledge Handbook of
Spanish Historical Linguistics”)
Steven N. Dworkin, Gloria Clavería Nadal y Álvaro
S. Octavio de Toledo y Huerta
DOI: 10.4324/9781003035565-1 1
Steven N. Dworkin et al.
tanto en sombra en las dos últimas décadas con respecto al estudio del léxico y la sintaxis, muy
favorecidos estos por el empleo, desde comienzos de siglo, de corpus electrónicos; es de notar, en
todo caso, la escasez en los últimos 15 años de visiones de conjunto sólidamente fundadas acerca
de la evolución fónica y morfológica del idioma.
La obra que presentamos, Lingüística histórica del español/The Routledge Handbook of Spanish
Historical Linguistics, entraña novedades sustanciales con respecto a las obras existentes hasta este
momento. No pretende ser una historia de la lengua en sentido convencional y tradicional,
sino que intenta proporcionar una síntesis de vanguardia de las cuestiones más candentes de
los últimos treinta años desde la perspectiva, original y amplia, de las investigaciones que se
están desarrollando modernamente y de los avances que se están consiguiendo. Persigue este
manual combinar la historia interna o gramática histórica —es decir, el estudio de los cambios
lingüísticos— con la historia externa o historia de la lengua —esto es, el estudio de la evolución
del castellano/español dentro de sus sucesivos entornos históricos, culturales, sociopolíticos,
etc.—. Se atiende a la metodología y a las fuentes de la disciplina desde la mirada compleja
y esperanzadora de principios de siglo XXI, y se combinan enfoques globales con otros más
restringidos pero igualmente iluminadores, siempre trazando puentes entre esa historia interna,
que toma como base el cambio lingüístico como hecho de lengua, y la historia externa, que
atiende al peso de los factores no lingüísticos en los procesos de cambio. Por primera vez, se
intenta cubrir la descripción histórica del español en toda su geografía y de forma equilibrada,
con igual atención al desarrollo del español europeo y también, desde sus orígenes, al americano,
así como, con mirada más amplia, al resto de territorios y comunidades de hablantes entre los
que el español llegó a encontrar cierto arraigo.
La Lingüística histórica del español/The Routledge Handbook of Spanish Historical Linguistics es,
pues, una obra que proporciona un examen amplio de la historia de la lengua española con
una síntesis del estado de la cuestión de los conocimientos que se integran en los varios campos
(fónico, gramatical, léxico) que comprende siguiendo el hilo cronológico, desde las lenguas
prerromanas hasta el español del siglo XXI; con un alcance amplio e innovador, en el que se
conjugan las cuestiones de carácter metodológico con la atención a la evolución propiamente
lingüística y a la historia externa. Este manual muestra, además, como esta disciplina puede
contribuir y se puede beneficiar de las investigaciones tanto de la lingüística sincrónica como de
la lingüística histórica.
Los capítulos que conforman la obra se organizan en cuatro grandes secciones que represen-
tan cuatro grandes perspectivas (con frecuencia íntimamente relacionadas) en los estudios de
lingüística histórica del español: la que toma por objeto los fundamentos metodológicos de la
disciplina y los modelos de análisis más destacados, la que trata de describir las principales trans-
formaciones lingüísticas experimentadas por el idioma, la que procura la caracterización de los
tramos cronológicos más claramente perceptibles en su evolución y, finalmente, la que explora
las raíces y los efectos de la muy considerable variación interna que hoy presenta. La primera y la
última de estas perspectivas, en particular, encuentran en este volumen un desarrollo notable en
relación con otras obras semejantes, como corresponde a los intereses de la lingüística histórica
hispánica más reciente.
Así, en la parte primera se ofrecen las “Perspectivas metodológicas y horizontes de investi-
gación” y en ella se exponen las principales cuestiones teóricas y metodológicas de la lingüística
histórica actual y su aplicación al estudio del español, como, por ejemplo, las consideraciones
filológicas relativas a los textos en el estudio de la historia de la lengua, el uso crítico de los cor-
pus y las bases de datos, la dialectología y la sociolingüística históricas, las tradiciones discursivas,
la función de la oralidad y la escrituralidad, los procesos de gramaticalización y pragmatización,
de koineización y estandarización en el español.
2
Introducción de la “Lingüística histórica del español”
En la parte segunda, y tomando como base la naturaleza sistémica del cambio lingüístico,
se atiende a los “Grandes procesos evolutivos” que configuran la formación y evolución de la
lengua, desde la fonética y la fonología a la arquitectura discursiva y los cambios léxicos, con
una perspectiva amplia en la que se considera también la formación de palabras, las unidades
fraseológicas o la investigación de los cambios en el orden de constituyentes y la estructura
informativa.
La parte tercera tiene como hilo conductor la “Historia externa del latín al español europeo
actual”; toma como punto de partida la consideración de las distintas propuestas de periodización,
y el punto de arranque del recorrido histórico se encuentra en las posibles influencias ejercidas
por las lenguas prerromanas para extenderse a la caracterización de la época latina, el castellano
plenamente medieval, el cuatrocentista, el español clásico y el de los siglos XVIII y XIX, para
acabar con el español actual y sus cambios en marcha, así como con la historia de los contactos
entre el español y otras lenguas de España (vasco, gallego y catalán). Se trata, pues, del apartado
más cercano a la histoire de la langue tradicional, pero renovado no solo con la consideración de
las principales aportaciones de las últimas décadas acerca de cada periodo, sino también con
una visión de conjunto (y, en los capítulos individuales, de detalle) sobre la periodización del
español y con la atención específica a algunas de las épocas del idioma menos estudiadas hasta el
momento, sobre todo desde el punto de vista gramatical (por ejemplo, el siglo XIV o los siglos
XVIII–XIX).
La parte cuarta, atendiendo a la variación interna de la lengua pluricéntrica que es hoy el
español, dirige su mirada a la conformación y evolución de la “Historia de las variedades no
europeas” y considera la historia del español de América en toda su amplitud, la formación y
evolución del judeoespañol y la historia de la presencia del español en otras partes del mundo,
fundamentalmente África y Filipinas.
En suma, la obra consta de 52 contribuciones distribuidas en 48 capítulos que van desgra-
nando las múltiples y complejas facetas que han ido constituyendo la historia de la variedad que
hoy denominamos “español” a lo largo de más de veinte siglos. Aunque cada capítulo tiene un
contenido que lo hace único, en casi todos ellos se encontrará una misma estructura organizativa
—introducción, conceptos fundamentales, aproximaciones teóricas, perspectivas actuales y futuras y
conclusiones, además de tres lecturas recomendadas para profundizar en el tema del capítulo y las
referencias citadas en el mismo— que persigue un fácil manejo por parte del lector, especialmente
el alumno universitario, principal destinatario de esta obra, en atención al cual todos los autores
han hecho lo posible por lograr una exposición sucinta, concisa y clara en forma y contenidos. Las
abundantes remisiones entre unos capítulos y otros permitirán al lector una lectura comprensiva
y abarcadora que superará los límites que impone la fragmentación de la obra en microcapítulos.
Las referencias bibliográficas al final de cada capítulo persiguen proporcionar al lector, ante todo,
una visión panorámica de los estudios más relevantes y recientes sobre cada tema.
Han intervenido en esta obra 60 especialistas destacados de más de cuarenta universidades de
Europa y América. La calidad de los contribuyentes y el esfuerzo de síntesis que han realizado
hacen del estado de la cuestión que ofrece este manual, por la pluralidad de asuntos y la actua-
lidad de los planteamientos, una guía apta para iniciarse en el amplio campo de la lingüística
histórica del español.
Agradecimientos
La elaboración de este volumen ha sido posible gracias a la participación de muchas personas y
queremos expresar nuestra gratitud a todas ellas. En primer lugar, agradecemos a cada uno de
los autores que participan en este volumen el entusiasmo con el que aceptaron la propuesta, su
3
Steven N. Dworkin et al.
Referencias citadas
Cano Aguilar, R., coord. 2005. Historia de la lengua española. 2.ª ed. Barcelona: Ariel.
DCECH = Corominas, J. y J. A. Pascual.1980–1991. Diccionario crítico etimológico castellano e hispánico.
Madrid: Gredos.
DHLE = Real Academia Española. 2013–. Diccionario histórico de la lengua española (DHLE). [Link]
dhle.
Dworkin, S. N. 2012. A History of the Spanish Lexicon: A Linguistic Perspective. Oxford: Oxford University
Press.
Lapesa, R. 1981. Historia de la lengua española. 9.ª ed. Madrid: Gredos.
SHLE = Company, C., dir., 2006–. Sintaxis histórica de la lengua española. Ciudad de México: Fondo de
Cultura Económica / Universidad Nacional Autónoma de México.
Várvaro, A. 1972–1973. “Storia della lingua. Passato e prospettive di una categoria controversa (I), (II)”.
Romance Philology 26 (1): 16–51; 26 (3): 509–531.
4
Parte I
Perspectivas metodológicas y
horizontes de investigación
1
Lingüística histórica y filología
(Historical linguistics
and philology)
Pedro Sánchez-Prieto Borja
1. Introducción
En este capítulo inicial se examinan las relaciones entre lingüística histórica y filología o, pro-
piamente, crítica textual, puesto que esta última se ocupa de establecer ediciones fiables, tras
reconstruir la historia del texto a partir de su tradición manuscrita e impresa.
Palabras clave: filología, crítica textual, historia de la lengua, edición crítica, estudio lingüístico
de textos
This opening chapter examines the relationships between historical linguistics and philology or,
strictly speaking, textual criticism since the latter is concerned with establishing reliable editions,
after reconstructing the history of the text from its manuscript and printed tradition.
Language history, a discipline that combines descriptive and reconstructive methods, needs to
start from reliable textual materials. One of the tasks of the transcription and editing methods is
to provide the historians of the language with quotable sources, but at the same time, the latter
must know the history of the texts in order to contextualize and adequately assess the linguis-
tic data that the texts offer. The debate is between different editing methods; none of them is
definitive, since the study of the different levels, from the spelling to the lexicon and speech,
surely requires different editions. In the digital age, the editing of texts opens itself up to new
possibilities as a mandatory source of data for the language historian, but, for this very reason,
also to new demands for rigor and reliability.
Keywords: philology, textual criticism, history of the language, critical edition, linguistic study
of texts
La historia de la lengua, disciplina que combina los métodos descriptivo y reconstructivo, nece-
sita partir de materiales textuales fiables. Uno de los cometidos, pues, de los métodos de trans-
cripción y edición consiste en proporcionar fuentes citables al historiador de la lengua, pero, al
mismo tiempo, este último debe conocer la historia de los textos para poder contextualizar y
valorar adecuadamente los datos lingüísticos que los textos ofrecen. El debate se presenta entre
diferentes métodos de edición; ninguno de ellos es definitivo, pues el estudio de los diferentes
DOI: 10.4324/9781003035565-3 7
Pedro Sánchez-Prieto Borja
2. Conceptos fundamentales
El punto de partida de la investigación en historia lingüística e historia de la lengua es el texto;
sin embargo, este no se presenta como una realidad objetiva per se, sino que se concreta dentro
de su historia, es decir, en el marco de una hipótesis sobre cómo surgió. La historia se puede
desglosar en génesis y transmisión (difusión del texto a través de copias), pero se ha de añadir otro
plano conceptual, el de la recepción, que no depende solo del texto recibido, sino de cómo este
es leído, glosado, comentado, interpretado y aun esperado. En un plano ontológico, el texto se
define por su tenor, es decir, por su expresión lingüística lineal y literal; por ello, una traducción
es otro texto; sin embargo, modernamente, se ha visto el texto como abierto (Shillingsburg
1996), de manera que bajo el mismo se incluyen todas sus manifestaciones o concreciones, por
la vía de la versión, resumen, amplificación y aplicaciones secundarias (citas y otros usos trans-
textuales). Con todo, dentro de la filología, el concepto de texto se liga al de original, al texto
prístino o autorial. Cabe distinguir un doble plano, el del texto ideal, libre de errores [Ω], y el
original como testimonio concreto, manuscrito o impreso (0), y que, con seguridad, no estará
libre de errores; los códices de la cámara regia alfonsí aspiran a este rótulo, pero no dejan de ser
una puesta en limpio, autorizada por el rey y con no pocas modificaciones respecto de los borra-
dores previos o cuadernos de trabajo (Catalán 1997). Si este original es de mano del autor, se
llamará autógrafo; si de otra mano, alógrafo. Auténtico puede ser el mismo original o el ejemplar
autorizado por el autor. Más difuso y controvertido es el concepto de arquetipo (Blecua 1987,
59), estado textual más antiguo al que es posible remontarse con la tradición manuscrita. Antí-
grafo es el modelo del que se copia.
Se habla corrientemente de modernización en las copias. Esta no es uniforme, por lo que da
lugar a un estado lingüístico mixto. Un problema conceptual es qué se entiende por variante de
lengua; su naturaleza depende de la tradición textual (cf. §§ 3 y 6). Suele distinguirse entre variantes
gráficas (las que no tienen transcendencia fonética) y de lengua (de la fonética al léxico). Las copias
pueden introducir formas marcadas geográficamente, aunque, en general, todo texto (y toda copia)
lo está. Con “dialectismo”, los editores suelen referirse a los usos no castellanos, con excepciones
(López Gutiérrez y Godino López 1997).
En cuanto al método de edición, no pertenecen a la misma categoría intelectual la transcrip-
ción de un manuscrito y el intento de elucidar el proceso por el que una obra nació, operación
imprescindible para establecer el texto crítico. En la perspectiva de la edición, la garantía
de autenticidad y rigor se liga a la consulta del facsímil, especialmente recomendable para
lecciones controvertidas. La transcripción paleográfica, que refleja en todo pormenor los usos
del manuscrito o impreso, conviene al estudio gráfico-fonético, mientras que la edición crítica (o
presentación crítica) es adecuada al examen morfosintáctico, léxico y discursivo. Se ha llamado
la atención acerca de la interpretación que toda edición implica, por lo que puede condicionar
al estudioso, p. ej., al proponer este una puntuación que tal vez no refleja la conformación
sintáctica del texto genuino. En El caballero de Olmedo de Lope de Vega (ed. de Rico 1981 y
2009; reseña de Morreale 1983, 3), Don Alonso, al oír el cantar “Que de noche le mataron/al
caballero,/la gala de Medina,/la flor de Olmedo” exclama “¡Cielos! ¿Qué estoy escuchando?/
Si es que avisos vuestros son,/ya que estoy en la ocasión,/¿de qué me estáis informando?”
(vv. 565–568), donde ha de leerse “ya que estoy en la ocasión de que (‘de la cual’) me estáis
informando”.
8
Lingüística histórica y filología
3. Aproximaciones teóricas
La crítica textual se ha aplicado sobre todo a las obras de la literatura y, desde sus orígenes
científicos en el siglo xix (Baker y Greub 2018, 61–62), ha centrado su atención en los pro-
blemas propiamente textuales (o de sustancia) y no en los lingüísticos ni en los de la forma
verbal del texto editado, aunque no faltan excepciones, desde el mismo Cantar de mio Cid
(Menéndez Pidal 1976). El modelo lachmanniano parte de la exigencia de reconstruir el
arquetipo a partir del acopio y cotejo de testimonios manuscritos e impresos (collatio), aplicado
al Nuevo Testamento en griego, según un método reformado por Dom Quentim para la
edición benedictina de la Vulgata, que compara los testimonios de tres en tres, y ensayado
parcialmente en la edición de la General estoria de Solalinde (1930). La reconstrucción del
original ha sido criticada por historiadores de la lengua, que han preferido partir de un solo
manuscrito, y se han orientado hacia al bédierismo (Bédier 1928), aunque con evidente
simplificación de las ideas del sabio parisino. Según Faulhaber (2011, 2), “para Bédier,
entonces, la mejor solución es editar el mejor manuscrito, enmendándolo sólo para corregir
los errores evidentes. Así tendremos un texto verdaderamente medieval, sin injertar en él la
subjetividad de los editores. Y esto es precisamente lo que hizo el equipo de Solalinde, cuyas
intervenciones se redujeron al mínimo”. Pero el concepto de “evidente” está lejos de ser
objetivo, y las correcciones ocasionales dan lugar a un texto fallido que ni es una transcripción
ni una edición propiamente dicha. Solo una filología que se plantee la génesis y transmisión
del texto en su integridad y sitúe a este en la historia lingüística está en situación de formular
la propuesta de lectura que implica toda edición que merezca este nombre: “la solución
positivista de Bédier, escamotea, bajo el pretexto de la objetividad del manuscrito base, el
carácter inexorablemente problemático del texto” (Orduna 2000, 171).
La rica discusión inicial entre ambas corrientes, lachmanniana y bedierista, ha conocido una
simplificación polemizante en autores que defienden la variación como modelo único de acceso
plural al texto, sin establecer una jerarquía entre los testimonios, de manera que las variantes se
presenten en pie de igualdad; surge así el lema, en apariencia aceptable, de éloge de la variante
(Cerquiglini 1989); antecedente notable en el ámbito hispánico es la edición sinóptica experimental
de Los siete tiempos de las leyes, de Jacobo de Junta (Roudil 1986); propiamente, es una transcrip-
ción paleográfica interlineada.
La desconfianza en la estemática o clasificación genealógica de los testimonios llevó a posturas
más ponderadas que ponen el foco en la historia del texto. Así nació hace un siglo en Italia la
filología neolachmanniana de Barbi, reformulada recientemente (Orlandi 1995), y que se fun-
damenta en el juicio crítico sobre cada paso del texto. De este modo, todas las enmiendas han
de ser justificadas. El aparato se convierte así en una fuente de información sobre las elecciones
lingüísticas del autor, pues estas son modificadas, o alteradas, en las copias por incomprendidas
(en el Calila e Dimna, “E fallé las leyes mucho alongadas e las setas [‘sectas’] muchas” de A es en
B e las letras muchas; Döhla 2009, 134). Progresivamente, la variación que recogen los aparatos
críticos va siendo utilizada en los estudios lingüísticos. Los conceptos de lectio facilior y difficilior
son señalados con frecuencia y en ellos el plano lingüístico tiene importancia. Cuentan a este
propósito pasajes raros, difíciles y hápax o formas no documentadas, fuente valiosa esta para la
historia del idioma (cf. el caso de la repetición del numeral, con valor distributivo, en “mas val
con sendos ojos salvar vuestro pecados/que con dos dos veerbos [‘veros’] en infierno dañados”,
en la Vida de San Millán, de Berceo (Horcajada Diezma y Sánchez-Prieto Borja 1999), o el
empleo de la conjunción disyuntiva do en documentación burgalesa como euskerismo (Torrens
Álvarez 2014). La regla que podría guiarnos es que una lección no documentada o rara puede
ser errónea en un pasaje, dudosa en dos, y segura si se repite en tres lugares del texto.
9
Pedro Sánchez-Prieto Borja
4. Perspectivas actuales
Una cuestión que se dirime casi más en el plano práctico que en el teórico es la de qué texto
estudiar. La respuesta está condicionada por diversos imperativos; muchas veces, lo primario es
10
Lingüística histórica y filología
11
Pedro Sánchez-Prieto Borja
12
Lingüística histórica y filología
13
Pedro Sánchez-Prieto Borja
En definitiva, las ediciones no solo se diferencian por ser críticas o paleográficas, sino por
su rigor. Así, para el Calila e Dimna, Döhla (2009) no intenta una reconstrucción del texto
genuino, tarea no del todo hacedera ante lo innovador de las dos ramas, sino que presenta en
columnas paralelas los testimonios A y B, con amplia anotación explicativa, y se convierte en
una fuente importante para el estudio lingüístico, con el inconveniente, eso sí, de la distancia
de casi dos siglos con el original del xiii. El historiador de la lengua ha de ser consciente de
que recuperar el texto del siglo xiii y, más aún su lengua, es tarea imposible para obras como
esta. Situación infinitamente mejor es la de contar con el original, aunque tampoco es garantía
de autenticidad autorial absoluta. La historia de la lengua, en tanto basada en fuentes escri-
tas problemáticas por su propia naturaleza, no puede consistir en otra cosa que en formular
hipótesis; eso sí, cuanto mejor se comprenda la trayectoria textual de las mismas más sólidas
serán estas hipótesis.
Lecturas recomendadas
El Manual de crítica textual de Blecua (1987) sigue siendo lectura obligatoria para quienes se quieran
adentrar en la edición de textos, o pretendan valorarlos en cuanto testimonio lingüístico. Blecua
se adhiere a una postura neolachmannina, y, por tanto, no es excéptico acerca de la capacidad
enmendatoria del editor ante errores de la transmisión, a condición de que este sea capaz de expli-
car cómo se ha producido el error. Aunque no es muy explícito este manual acerca de las variantes
lingüísticas, sí propone darles cabida en un segundo aparato de variantes adiáforas (frente al que
recoge las variantes propiamente textuales o elegibles).
Fernández-Ordóñez (2002) se encuentra entre los pocos estudiosos que se han planteado los pro-
blemas lingüísticos de la edición y, en particular, el límite entre variantes textuales y de lengua.
Señala qué variantes de la tradición manuscrita de un texto medieval, la Segunda Parte de la
General estoria y la versión Vulgata de la Estoria de España, han de considerarse lingüísticas y, por
tanto, no elegibles per se en la tradición textual. Entre ellas, señala no solo las fonéticas y morfo-
sintácticas, sino ciertas diferencias discursivas, como la presencia o ausencia de los constituyentes
oracionales: “E Ruth fizo cómo (le) mandó Boos”.
La tesis doctoral de Torrens Álvarez, publicada (2002), se propone como modelo integrado de
edición y estudio de un texto medieval, el Fuero de Alcalá (ca. 1235). Cabe destacar la cuidada
edición con triple acceso: facsímil en blanco y negro, de notable calidad, la detallada transcrip-
ción paleográfica, en la que se marcan las linetas abreviativas, y la edición crítica, que facilita el
acceso al texto y el estudio de aspectos que van de la morfosintaxis al léxico y al discurso; véanse
p. ej., sus observaciones sobre las estructuras quiásticas: “el ochavo de la leche tome e del queso”
(Torrens Álvarez 2021).
Referencias citadas
Almeida Cabrejas, B. 2013. “Fenómenos sintácticos raros y edición de textos: el caso de la segunda parte
de la General estoria”. Revista de Historia de la Lengua Española 8: 3–28.
Almeida Cabrejas, B., R. Díaz Moreno y M. C. Fernández López, eds. 2017. “Cansada tendré a Vuestra
Excelencia con tan larga carta”. Estudios sobre aprendizaje y práctica de la escritura por mujeres en el ámbito his-
pánico (1500–1900). Lugo: Axac.
Arias Álvarez, B. (dir. y ed.), M. R. Delgado García, M. A. Mendoza Posadas y I. Mora Peralta. 2014.
Documentos públicos y privados del siglo xvi. Textos para la historia del español colonial mexicano I. México:
Universidad Nacional Autónoma de México.
Baker, C. y Y. Greub. 2018. “Sous le signe de Lachmann: la domination de la méthode critique
d’édition entre 1872 et 1913”. En L’Ombre de Joseph Bédier. Théorie et pratique éditoriales au xxe siècle,
eds. C. Baker, M. Barbato, M. Cavagna et Y. Greub, 61–89. Estrasburgo: Éditions de Linguistique
et Philologie.
Barbato, M., ed. 2020. Historia troyana. Versos. Alessandria: Edizioni dell’Orso.
14
Lingüística histórica y filología
Bayo Julve, J. C. 2002. “La datación del Cantar de mio Cid y el problema de su tradición manuscrita”. En
Mio Cid Studies: ‘Some Problems of Diplomatic’ Fifty Years On, eds. A. Deyermond, D. G. Pattison and
E. Southworth, 15–35. Londres: University of London.
Bédier, J. 1928. “La tradition manuscrite du Lai de l’Ombre”. Romania 54: 161–198 y 321–356 (tirada aparte
París: Champion, 1929, reimpr. 1970).
Blecua, A. 1987. Manual de crítica textual. 2.ª ed. Madrid: Castalia.
Blecua, A., ed. 1992. Juan Ruiz, Arcipreste de Hita, Libro de buen amor. Madrid: Cátedra.
Buezo, C., P. Corrales, P. Fanconi, L. Guerra, C. Moral, M. M. Paúl and J. Satter, eds. 2000. José de la Vega,
Confusión de confusiones. Madrid: Universidad Europea y CES Ediciones.
Castillo Martínez, C. 2009. “La edición moderna de textos del Siglo de Oro: el caso de El pastor de Fílida”.
En Lecturas y textos en el siglo xxi. Nuevos caminos en la edición textual, coords. C. Castillo Martínez y J. L.
Ramírez Luengo, 95–102. Lugo: Axac.
Catalán, D. 1997. De la silva textual al taller historiográfico alfonsí. Códices, crónicas, versiones y cuadernos de trabajo.
Madrid: Fundación Ramón Menéndez Pidal y Universidad Autónoma de Madrid.
Cerquiglini, B. 1989. Éloge de la variante. Histoire critique de la philologie. París: Seuil.
CHARTA 2013 = Red CHARTA. Criterios de edición. [Link]/criterios-de-edicion [22/11/2020].
Company Company, C. 1994. Documentos lingüísticos de la Nueva España. Altiplano Central. Universi-
dad Nacional Autónoma de México: Instituto de Investigaciones Filológicas, Centro de Lingüística
Hispánica.
CORDE = Real Academia Española. Corpus diacrónico del español. [Link]
[21/11/2020].
Döhla, H.-J. 2009. El libro de Calila e Dimna (1251): nueva edición y estudio de los dos manuscritos castellanos.
Zaragoza: Instituto de Estudios Islámicos y del Oriente Próximo.
Faulhaber, C. B. 2011. “Reseña de Alfonso X el Sabio, General estoria. Madrid: Biblioteca Castro/
Fundación José Antonio de Castro”, Infoling, 18 marzo de 2011. [Link]
[Link].
Fernández Catón, J. M., M. Díaz y Díaz, J. A. Pascual Rodríguez, J. M. Ruiz Asencio, J. R. Morala
Rodríguez, J. A. Fernández Flórez y J. M. Díaz Bustamante. 2003. Documentos selectos para el estudio de
los orígenes del romance en el Reino de León. Siglos X-XII. León: Centro de Estudios e Investigación “San
Isidoro”. [Link]/web/biblioteca/libros/documentos-selectos-estudio-origenes-romance-reino-
leon-siglos-x-xii/html/[Link]?idLibro=155 [22/11/2020].
Fernández López, M. C. 1996. “Una distinción fonética inadvertida en el sistema gráfico medieval”. En
Actas del III Congreso Internacional de Historia de la Lengua Española, eds. A. Alonso González, L. Castro
Ramos, B. Gutiérrez Rodilla and J. A. Pascual Rodríguez, 113–123. Madrid: Arco Libros.
Fernández-Ordóñez, I. 2002. “Tras la collatio o cómo establecer correctamente el error textual”. La Corónica
30 (2): 105–180.
Fernández-Ordóñez, I. 2006. “La historiografía medieval como fuente de datos lingüísticos. Tradiciones
consolidadas y rupturas necesarias”. En Actas del VI Congreso Internacional de Historia de la Lengua española,
eds. J. L. Girón Alconchel y J. J. de Bustos Tovar, vol. 2, 1779–1808. Madrid: Arco/Libros.
García Andreva, F. (2010). El Becerro Galicano de San Millán de la Cogolla. Edición y estudio. Logroño: Cilen-
gua (incluye CD-ROM).
García Godoy, M. T., ed. 2012. El español en el siglo xviii. Cambios diacrónicos en el primer español moderno.
Berna: Peter Lang.
Greg, W. W. 1950–1951. “The Rationale of Copy-Text”. Studies in Bibliography 3: 19–36 (Reimpresión
con cambios menores en Greg, W. W. 1966. Collected Papers, ed. J. C. Maxwell, 374–391. Oxford:
Clarendon-Oxford University Press).
Herrera, T. y M. N. Sánchez González de Herrero, eds. 1997. Tratado de patología. Madrid: Arco
Libros.
Hilty, G. 1986. “El Auto de los Reyes Magos (prolegómenos para una edición crítica)”. En Philologica Hispa-
niensia in Honorem Manuel Alvar, vol. 3, 221–232. Madrid: Gredos.
Horcajada Diezma, B. y P. Sánchez-Prieto Borja. 1999. “La reduplicación distributiva del numeral y el
arabismo morfosintáctico en el romance hispánico medieval”. Zeitschrift für romanische Philologie 115 (2):
280–299.
Isasi Martínez, C., L. Martín Aizpuru, S. Pérez Isasi, E. Pierazzo y P. Spence. 2020. Edición digital de docu-
mentos antiguos: marcación XML-TEI basada en los criterios CHARTA. Sevilla: Editorial Universidad de
Sevilla.
Lapesa, Rafael. 1981. Historia de la lengua española. 9.ª ed. Madrid: Gredos.
15
Pedro Sánchez-Prieto Borja
LHP = Léxico Hispánico Primitivo (siglos viii al xii). Versión primera del Glosario del primitivo léxico ibero-
rrománico, proyectado y dirigido inicialmente por Ramón Menéndez Pidal, redactado por Rafael Lapesa
con la colaboración de Constantino García. Edición al cuidado de Manuel Seco. Madrid: Fundación
Menéndez Pidal y Real Academia Española, 2003.
López Gutiérrez, L. y A. Godino López. 1997. “Algunos dialectalismos espigados en la obra de Delibes”.
Revista de Dialectología y Tradiciones Populares 52 (2): 261–268.
Martín Aizpuru, L. 2020. La escritura cancilleresca de Fernando III, Alfonso X, Sancho IV y Fernando IV. Berna:
Peter Lang.
Menéndez Pidal, R. 1976 (1908–1911). Cantar de mío Cid. Texto, gramática y vocabulario. 3 vols. 5.ª ed.
Madrid: Espasa Calpe.
Morreale, M. 1983. “Apostillas a una reciente reedición de El caballero de Olmedo de Lope de Vega (F. Rico,
a cura di, Madrid, 1981)”. Rassegna Iberistica 18: 3–14.
Octavio de Toledo, Á. S. y L. Pons Rodríguez. 2016. Textos para la historia del españo, vol. X. Queja política
y escritura epistolar durante la Guerra de Independencia: documentación de la Junta Suprema Central en el AHN.
Selección, edición y estudio lingüístico. Alcalá de Henares: Universidad de Alcalá.
Orduna, G. 2000. Ecdótica. Problemática de la edición de textos. Kassel: Edition Reicherberger.
Orlandi, G. 1995. “Perché non possiamo non dirci lachmanniani”. Filología Mediolatina. Rivista della Fon-
dazione Ezio Franceschini 2: 1–42.
Ramírez Luengo, J. L. 2017. Textos para la historia del español, vol. XI: Honduras y El Salvador. Alcalá de
Henares: Universidad de Alcalá.
Riaño Rodríguez, T. y M. C. Gutiérrez Aja, eds. 2003. El Cantar de mío Cid. Reproducción digitalizada del
manuscrito de la Biblioteca Nacional, transcripción paleográfica y texto modernizado. Alicante: Biblioteca Virtual
Miguel de Cervantes. [Link]/bib_obra/Cid/ [22/11/2020].
Rico, F., ed. 2009. Lope de Vega, El caballero de Olmedo. En Cervantes Virtual. [Link]/
obra/el-caballero-de-olmedo-0/ [21/11/2020].
Rivarola Rubio, J. L. 2000. Español andino. Textos de bilingües de los siglos xvi y xvii. Madrid: Vervuert.
Romero Cambrón, Á. 2006. “Sintaxis histórica y crítica textual: camino de ida y vuelta”. En Actas del VI
Congreso Internacional de Historia de la Lengua Española, eds. J. L. Girón Alconchel y J. J. de Bustos Tovar,
vol. 2, 2051–2062. Madrid: Arco Libros.
Roudil, J., ed. 1986. Jacobo de Junta, el de las Leyes, Œuvres, I. Summa de los nueve tiempos de los pleitos, édition
et étude d’une variation sur un théme. París: Annexes des Cahiers de Linguistique Hispanique Médiévale.
Sánchez-Prieto Borja, P. 1998. Cómo editar los textos medievales: criterios para su presentación gráfica. Madrid:
Arco Libros.
Sánchez-Prieto Borja, P. 2011. La edición de textos españoles medievales y clásicos. Criterios de presentación gráfica.
San Millán de La Cogolla: Cilengua.
Segre, C. 1979. “Les transcriptions en tant que diasystèmes”. En La pratique des ordinateurs dans la critique des
textes, 45–49. París: Éditons du CNRS.
Shillingsburg, P. 1996. Scholarly Editing in the Computer Age. Theory and Practice. 3.ª ed. Ann Arbor: Univer-
sity of Michigan Press.
Solalinde, A. G., ed. 1930. Alfonso el Sabio, General estoria. Primera parte. Madrid: Centro de Estudios
Históricos.
Tanselle, G. T. 1989. A Rationale of Textual Criticism. Filadelfia: University of Pennsylvania.
Torrens Álvarez, M. J. 2002. Edición y estudio lingüístico del Fuero de Alcalá (Fuero viejo). Alcalá de Henares:
Fundación Colegio del Rey.
Torrens Álvarez, M. J. 2014. “Los coordinadores disyuntivos latín et aut > castellano (e)do> vasco edo: una
historia inadvertida”. Zeitschrift für romanische Philologie 130 (3): 671–697.
Torrens Álvarez, M. J. 2021. “La lengua de Madrid en la Edad Media: los fueros”. En La lengua de Madrid a
lo largo del tiempo, coords. P. Sánchez-Prieto Borja, M. J. Torrens Álvarez y D. Vázquez Balonga, 41–86.
Sevilla: Editorial Universidad de Sevilla.
Ward, A. (2018). “The Estoria de Espanna Digital. Collating Medieval Prose – Challenges... and More
Challenges”. Digital Philology: A Journal of Medieval Cultures 7 (1): 65–92. [Link]
article/700509.
16
2
Manejo de las fuentes: los corpus
(Use and analysis of sources:
linguistic corpora)
Andrés Enrique-Arias
1. Introducción
El análisis comparativo de textos de diferentes épocas, géneros y dialectos es una herramienta
fundamental en las investigaciones lingüísticas de orientación diacrónica, pues los textos son la
principal fuente de datos para estudiar los estados de lengua del pasado. En las últimas décadas
el método ha adquirido una nueva dimensión con la creación de una amplia variedad de corpus
diacrónicos en formato electrónico y la aplicación de herramientas informáticas que permiten
analizar un gran volumen de datos a una escala que era inalcanzable con los procedimientos
manuales tradicionales. En este capítulo se repasan las bases metodológicas de la lingüística de cor-
pus aplicada al estudio diacrónico del español; para ello se establece el valor empírico relativo de
los principales planteamientos vigentes, se evalúan algunos de los recursos que están disponibles
de modo libre en Internet y se presentan las principales vías de investigación de la diacronía del
español que están siendo impulsadas por la lingüística de corpus. Asimismo, se exponen para cada
técnica o recurso los problemas, cautelas y limitaciones metodológicas que conlleva su empleo.
Palabras clave: corpus informatizados; lingüística de corpus; lingüística histórica; español;
metodología
The comparative analysis of texts from different historical periods, genres and dialects is a funda-
mental tool in diachronic linguistic research, as written texts are the main data source for studying
the language of the past. In recent decades, this method has acquired a new dimension with
the creation of a wide variety of diachronic corpora in electronic format and the application of
computer tools that allow the analysis of a large volume of data on a scale that was unattainable with
traditional manual methods. This chapter includes a review of the methodological foundations of
corpus linguistics applied to the diachronic study of Spanish; to this end, the relative empirical value
of the main current approaches is established, along with an evaluation of some of the resources
that are freely available on the internet as well as a survey of the main lines of corpus-based research
in Spanish historical linguistics. Finally, there is a discussion of the potential problems, precautions
and methodological limitations entailed by the use of these resources.
Keywords: electronic corpora; corpus linguistics; historical linguistics; Spanish; methodology
DOI: 10.4324/9781003035565-4 17
Andrés Enrique-Arias
2. Conceptos fundamentales
La lingüística de corpus, entendida como el estudio del lenguaje a través del análisis de textos,
es sin duda la metodología más utilizada en el estudio diacrónico del español desde el mismo
momento en que la lingüística románica se constituyó como disciplina científica hace ya más
de un siglo. El motivo es que los textos son la principal fuente de datos para estudiar los estados
de lengua del pasado; en consecuencia, la investigación en lingüística histórica exige el dominio
de las herramientas metodológicas adecuadas para interpretar, analizar y comparar datos proce-
dentes de testimonios escritos de diferentes periodos, géneros, y dialectos. Aunque en sentido
estricto un corpus es una colección de textos en cualquier formato (libro, audio, CD, microfilm,
etc.), hoy en día esa denominación se aplica básicamente a colecciones de textos almacenados en
soporte informático, organizados y clasificados de acuerdo con parámetros como registro, pro-
cedencia geográfica o fecha de producción, y dotados de algún tipo de herramienta de búsqueda
que permita extraer la información mediante procesos automáticos. La lingüística de corpus es
en sí misma una subdisciplina consolidada con aplicaciones a prácticamente todas las áreas de la
investigación lingüística (Lüdeling y Kytö 2008).
Los estudios sobre la diacronía del español se han beneficiado de la explotación de los datos
procedentes de los corpus, especialmente para la compilación de diccionarios y el estudio de
fenómenos morfosintácticos. La razón es que, como los corpus informatizados permiten hacer
búsquedas a través de cientos de millones de palabras en una fracción de segundo, son de gran
ayuda a la hora de localizar un alto número de ocurrencias y superar el problema que supone la
baja frecuencia de determinadas estructuras en el lenguaje natural. Por este motivo los corpus
son la base empírica fundamental para aplicar métodos de análisis cuantitativo en la investigación
de problemas de variación y cambio lingüísticos en perspectiva diacrónica.
En el análisis de los corpus diacrónicos que se presenta en las páginas que siguen no se
pretende proporcionar un repertorio exhaustivo de recursos digitales (los interesados en un
listado actualizado de estos recursos pueden consultar el Portal de Corpus Históricos Iberorrománicos
CORHIBER), sino más bien plantear una serie de reflexiones metodológicas generales que
servirán de guía para evaluar el mérito relativo de las diferentes tipologías de recursos disponibles.
Además de considerar la cantidad y calidad de los datos, que sin duda son aspectos esenciales a la
hora de evaluar un corpus diacrónico, se tendrán en cuenta otros componentes metodológicos
no menos importantes relacionados con la extracción y análisis de datos, como son la interfaz de
consulta de los corpus, el formato en que se presentan los resultados y las metodologías para su
análisis. Se consideran, por tanto, no solo las aplicaciones de búsqueda y visualización de resulta-
dos que forman parte de los corpus, sino también las herramientas computacionales usadas por
los lingüistas para el procesamiento y análisis externo de los datos, ya sean módulos de descarga
de resultados, hojas de cálculo para la anotación manual de las concordancias o lenguajes de
programación para el análisis cuantitativo.
Finalmente, no se incluye el estudio de recursos electrónicos que no son propiamente corpus
textuales, como los diccionarios históricos (cap. 4) o los atlas dialectales (cap. 5). Tampoco se
consideran los corpus que no están en formato accesible de manera libre en Internet, es decir,
las colecciones en formato impreso, CD, microfichas o similar.
18
Manejo de las fuentes: los corpus
diafásicas de la lengua a lo largo de las diversas fases de su evolución. Los recursos disponibles son
muy diferentes en lo que respecta a tamaño, tipologías textuales, rango cronológico o herramien-
tas de extracción de datos. En esta sección se proponen algunas pautas metodológicas generales
que conviene tener en cuenta para evaluar la adecuación de un corpus para una investigación
científica. Para ello se toman como punto de partida los parámetros de representatividad, diver-
sidad, comparabilidad, análisis, perspectiva y calidad (cf. Silva-Corvalán y Enrique-Arias 2017,
65). Conviene advertir que no es necesario que un solo recurso satisfaga todos estos requisitos,
pues es también posible combinar datos de varios corpus especializados en un género, periodo
o variedad geográfica particular.
3.1 Representatividad
La representatividad es uno de los problemas esenciales de la lingüística de corpus (Kabatek
2013). Es bien conocido que Labov (1994, 11) definió la lingüística histórica como “the art
of making the best of bad data”. En efecto, los textos históricos solo permiten una visión
artificiosa y fragmentaria de los sistemas lingüísticos del pasado, por múltiples razones. Para
empezar, los textos disponibles en los corpus no son necesariamente los más representativos,
sino simplemente los que han sobrevivido a las vicisitudes de la historia y, entre ellos, los que
han despertado el suficiente interés como para llegar a ser seleccionados y publicados. En el
caso del español, es bien sabido que hay épocas, como el siglo xiv o el periodo de la segunda
mitad del xvii y primera del xviii, que están relativamente peor representadas en los corpus
disponibles (cap. 36, cap. 40). Por otro lado, los textos escritos tampoco son un reflejo directo
de las interacciones orales de los hablantes del pasado, pues las convenciones de la escritura
filtran muchas características de la lengua viva (cap. 8). Dado que, además, durante gran
parte de la historia la escritura ha sido una actividad restringida a un grupo muy minoritario
de la población (hasta finales del siglo xix la inmensa mayoría de los hispanohablantes era
analfabeta), los testimonios escritos en gran medida dejan fuera la lengua de la gente común,
y más aún si cabe en el caso de las mujeres, minorías raciales y grupos desfavorecidos en
general (cap. 6).
Por otro lado, la realidad indiscutible es que los corpus diacrónicos son el mejor método a
nuestra disposición para reconstruir los estados de lengua del pasado. Si bien no existen infor-
mantes que nos puedan confirmar directamente que un enunciado x es posible, la aparición
reiterada del enunciado en cuestión en los corpus textuales permite concluir con seguridad
razonable que tal enunciado era compatible con las reglas del sistema lingüístico en vigor en
la época en que aparece representado en los textos pues, a no ser que se trate de una situación
de diglosia extrema, el registro escrito será coherente con los usos orales. En cualquier caso,
el diseño de una investigación basada en corpus diacrónicos debe tratar de aproximarse al ideal
de representatividad mediante la inclusión de una variedad de registros y evitando un número
desproporcionado de textos marcados estilísticamente (poéticos, litúrgicos, técnicos, traduccio-
nes serviles) que puedan introducir sesgos en los resultados.
19
Andrés Enrique-Arias
cubrir un arco cronológico lo suficientemente amplio como para registrar las fases evolutivas de
la lengua, y los datos deben incluir una pluralidad de tipologías textuales en lo que se refiere a
registros, procedencia geográfica o tipologías textuales. Al mismo tiempo, el corpus debe estar
equilibrado, y las diferentes dimensiones de la variación representadas en el corpus (registros,
dialectos, tipos de textos) deben constituir a su vez subcorpus equilibrados, de tal modo que
sea posible establecer comparaciones entre los diferentes cortes diacrónicos representados en la
muestra.
Una alternativa pensada precisamente para controlar mejor la comparabilidad de los textos en
un corpus diacrónico es la metodología de los corpus paralelos. Se trata de contrastar versiones
alineadas en paralelo de textos con el mismo contenido pero compuestos en diferentes épocas
o variedades, como puedan ser traducciones de un mismo original o las colecciones de los dis-
tintos testimonios o copias de una misma obra (Enrique-Arias 2018). La utilidad de los corpus
paralelos en lingüística histórica es evidente, pues en ellos se aprecia con particular claridad la
evolución diacrónica de las estructuras de la lengua.
3.3 Análisis
El diseño de un corpus debe permitir analizar de manera óptima los elementos relevantes para el
tipo de fenómeno que se quiere estudiar. Por ejemplo, para el estudio de los usos escriptológicos
de los textos es preciso contar con un corpus en transcripción paleográfica que incluya imágenes
facsimilares de los originales; los corpus formados a partir de ediciones críticas no nos servirán,
pues, en estos materiales, los editores tienden a normalizar el texto descartando variantes de
interés lingüístico. Por otro lado, si se trata de investigar fenómenos de tipo léxico, el ideal es
un corpus que permita hacer búsquedas por lemas (el lema es la forma básica por la que una
palabra aparece en el diccionario, como el infinitivo en los verbos o el masculino singular en los
adjetivos), de modo que, por ejemplo, una búsqueda de [cantar] permita obtener todas las formas
flexionadas (canté, cantaría, he cantado, etc). Por último, las investigaciones de tipo morfosintáctico
son mucho más fáciles en corpus que ofrecen la opción de rastrear palabras gramaticales y en los
que la anotación posibilita hacer búsquedas introduciendo rasgos morfológicos o constituyentes
sintácticos.
El problema a la hora de editar los textos para un corpus es que mantener la variación gráfica
del manuscrito tiene como contrapartida una pérdida de claridad, así como dificultades añadidas
para la lematización del texto y su etiquetado gramatical; este problema es más evidente en los
escritos más alejados de la norma general, como los procedentes de escribientes semicultos o los
que incluyen variantes dialectales (Enrique-Arias 2015, 402–403). La solución para cumplir las
expectativas de los que se acercan al texto desde diferentes perspectivas pasa por ofrecer al lector
varios niveles de acceso al texto (facsímil, transcripción paleográfica y presentación crítica), ya
sea como versiones paralelas o a través de la anotación de diferentes capas. Como se verá más
adelante, estos sistemas de múltiple presentación han sido aplicados con fortuna en las ediciones
de varios corpus en línea.
De modo semejante, las investigaciones sobre el foco geográfico original de los fenómenos
de variación requieren textos con datación cronogeográfica precisa. Este tipo de corpus nor-
malmente está formado por colecciones documentales con textos del ámbito jurídico (cap. 5).
3.4 Perspectiva
Bajo la noción de perspectiva se analiza el medio de acceso a los datos, un parámetro que condi-
ciona crucialmente el planteamiento y alcance de las investigaciones. En la mayoría de los corpus
20
Manejo de las fuentes: los corpus
los datos se obtienen a través de un buscador: los usuarios necesitan introducir una palabra o frase
en un cuestionario de consulta y la aplicación de búsqueda crea una concordancia que muestra
todos los ejemplos del texto buscado en el corpus junto a su contexto de aparición, con infor-
mación básica sobre el texto de origen. Esto significa que es necesario conocer de antemano por
medio de gramáticas, diccionarios o estudios previos las formas que son relevantes para rastrear
el fenómeno que se desea investigar, pues el investigador no accede al texto completo de donde
proceden los datos. Este método puede funcionar bien cuando se conoce la lista exhaustiva de las
formas relacionadas con aquello que se pretende estudiar, pero no es lo idóneo cuando se trata de
investigar estructuras que se pueden expresar con elementos de clase abierta o para los que no es
posible saber de antemano todas las formas posibles de expresión (Enrique-Arias 2016). Cons-
cientes de estas limitaciones, algunos corpus ofrecen medios alternativos de acceso a los datos,
como concordancias del texto completo, posibilidad de descarga de los textos o disposición en
paralelo de varias versiones.
3.5 Calidad
Los textos deben estar libres de errores de transcripción y la herramienta de búsqueda y con-
sulta debe funcionar sin dar fallos. Otro aspecto que se podría adscribir al parámetro de calidad
(aunque también podría verse bajo el subapartado del análisis) es la correcta datación cronológica
de los textos. A este respecto, una distinción crucial es la que se da entre copias tardías y copias
contemporáneas o cercanas al original del autor, pues es bien sabido que durante la transmisión
manuscrita la intervención de los copistas puede llegar a alterar de manera sustancial la lengua
del original. Si, por ejemplo, analizamos un texto de una época dada en testimonios copiados
tardíamente, corremos el riesgo de caracterizar la lengua de los copistas de siglos posteriores y
no la del autor que se quiere analizar. Los corpus informatizados hechos a partir de obras litera-
rias tienden a datar los textos a partir de la fecha conocida o supuesta de composición y no de
acuerdo con la de la copia que se ha utilizado como base en la edición volcada en el corpus, lo
cual tiene consecuencias para la correcta situación cronológica de los procesos de cambio que
se reflejan en los textos.
21
Andrés Enrique-Arias
estructuras con una frecuencia muy baja sino porque permiten apreciar correlaciones entre cam-
bios sin relación aparente, o porque al reunir un mayor número de ejemplos posibilitan estudiar
coocurrencias con más factores.
Por otro lado, estos corpus tienen el inconveniente de la pérdida de contacto con las fuentes
primarias: los resultados, que se obtienen en forma de concordancias a través de un formulario
de búsqueda, no dan acceso a los textos completos ni al facsímil del original de donde proceden
los ejemplos. Esta configuración no permite comprobar la exactitud de las ocurrencias concretas
en los resultados de búsqueda y, así, descartar que se hayan producido errores en las diversas fases
de preparación de los textos para la base de datos. Asimismo, estos recursos presentan los incon-
venientes ya señalados de los corpus creados a partir de ediciones, en particular el hecho de no
poder distinguir las lecturas genuinas del original de las que son resultado de las intervenciones
de los editores. Finalmente, como los textos se clasifican de acuerdo con la fecha conocida o
supuesta de producción, y no la de la copia del testimonio, hay riesgo de atribuir a la lengua
de los autores fenómenos que son en realidad característicos de copistas de épocas posteriores.
Para poder utilizar con propiedad los corpus creados a partir de ediciones de textos medie-
vales existe un excelente recurso: Rodríguez Molina y Octavio de Toledo (2017) han creado
un índice de las ediciones de los textos medievales presentes en el CORDE. Se trata de un
repertorio en que se evalúan aspectos como la fiabilidad y representatividad del testimonio que
se ha seleccionado para incluir la obra en el corpus, la existencia de problemas de datación o la
calidad de la edición utilizada. Dado que muchos de los textos reseñados se emplean también en
el CDH, el CE y otros corpus, el recurso tiene un gran valor para los interesados en la fiabilidad
filológica de las ediciones reunidas en estos corpus.
Otro complemento interesante a los corpus creados a partir de ediciones de textos literarios
son los portales de Internet que dan acceso a todo un complejo de elementos útiles para la cons-
titución del texto, como imágenes de los manuscritos y transcripciones paleográficas de varios
testimonios de una tradición. Este es el caso, por ejemplo, del proyecto acerca de la poesía can-
cioneril del siglo XV dirigido por Dorothy Severin An Electronic Corpus of 15th Century Castilian
Cancionero Manuscripts o del portal Biblia Medieval. Asimismo, cada vez es mayor la disponibilidad
de acceso a las fuentes primarias a través de colecciones digitales de manuscritos publicadas en
línea por un número creciente de bibliotecas y archivos, como la Biblioteca Nacional de España
o la Biblioteca de la Real Academia de la Historia, entre otras.
Frente a las limitaciones de acceso a los datos en los corpus que solo permiten resultados en
forma de concordancias, algunos recursos ofrecen alternativas con una perspectiva más abierta.
Es el caso de la Biblioteca Digital de Textos del Español Antiguo (BiDTEA), que reúne el texto com-
pleto de un buen número de manuscritos medievales hispánicos en transcripción paleográfica.
Los textos se pueden descargar de manera libre y van acompañados de unas muy útiles con-
cordancias de los textos completos organizadas de acuerdo con parámetros diversos (alfabético,
frecuencia, alfabético inverso).
Otra alternativa para el acceso a los resultados es la metodología de los corpus paralelos, es
decir, la posibilidad de comparar textos con el mismo contenido, pero compuestos en diferentes
épocas. Para el estudio diacrónico del español existe el portal Biblia Medieval, que reúne trans-
cripciones paleográficas descargables, versiones normalizadas, imágenes facsimilares y concor-
dancias completas de la totalidad de los testimonios que han transmitido traducciones bíblicas en
castellano durante la Edad Media y el Renacimiento. Cuando el usuario introduce una consulta,
las diferentes versiones aparecen dispuestas en paralelo junto a sus fuentes, hebrea o latina. Este
tipo de búsqueda tiene un valor heurístico particular, pues los resultados permiten descubrir
en las versiones paralelas equivalentes de la estructura buscada que en muchos casos no estaban
previstos en el rastreo inicial (Enrique-Arias 2012, 2016).
22
Manejo de las fuentes: los corpus
Un tipo de recurso informatizado de especial relevancia para los estudios diacrónicos son las
colecciones documentales en línea. Los documentos del ámbito jurídico tienen la característica
de ser la única manifestación escrita que tiende a llevar sistemáticamente indicación de fecha
y lugar; por ello, los corpus documentales son los recursos más adecuados para poder adscribir
fenómenos lingüísticos a unas coordenadas cronogeográficas concretas. En lo que respecta a
la publicación de corpus documentales del castellano y romances vecinos (asturleonés y nava-
rro-aragonés), se han hecho progresos sustanciales gracias a los esfuerzos concertados de los gru-
pos de la red internacional CHARTA (Corpus Hispánico y Americano en la Red. Textos Antiguos),
que trabajan en la edición de fondos documentales del mundo hispánico. Fruto de esta iniciativa
se ha creado el sistema de triple presentación (facsímil, transcripción paleográfica y presentación
crítica) adoptado ya en numerosos proyectos de corpus (Sánchez-Prieto Borja 2011). Destaca
el Corpus de Documentos Anteriores a 1900 (CODEA), que contiene 4000 documentos antiguos
(más de dos millones de registros) procedentes de distintos archivos españoles. El corpus, que
además incorpora una función que permite cartografiar los resultados, ya ha sido empleado con
éxito para determinar el origen geográfico de algunas variables lingüísticas (cap. 5, cap. 39). Con
un planteamiento semejante, pero centrado en el español de América, está el Corpus Diacrónico y
Diatópico del Español de América (CORDIAM), que reúne documentos, textos literarios y textos
periodísticos producidos en América entre 1494 y 1905 y permite descargar las concordancias
con los resultados de búsqueda (cap. 44).
Por último, cabe mencionar los corpus que tratan de aproximarse a la lengua de la vida coti-
diana o de las clases populares a través de los textos más próximos a la inmediatez comunicativa.
Se trata de recursos especialmente apropiados para el cultivo de una disciplina de reciente crea-
ción: la sociolingüística histórica, que estudia la relación entre lengua y sociedad a lo largo de
la historia (cap. 6). Por ejemplo, el proyecto Post Scriptum reúne un corpus de cartas privadas
escritas en España y Portugal durante la Edad Moderna con varios formatos de presentación
(paleográfico, normalizado, facsímil) (cap. 5). Un enfoque similar es el del Corpus Mallorca, que
contiene más de un millar de cartas privadas, declaraciones de testigos e inventarios de bienes en
castellano producidos en el contexto catalanohablante de Mallorca. El corpus sigue el sistema de
triple presentación de la red CHARTA y permite la descarga de resultados en formato de hoja
de cálculo.
Una distinción crucial es la que se da entre los corpus con texto plano sin anotar (la mayoría
de los que se han ido presentando en las páginas precedentes) y los que tienen texto lematizado
y etiquetado gramaticalmente, como los ya mencionados CDH, CE y Biblia Medieval o, para
el periodo medieval, el Old Spanish Textual Archive (OSTA) En estos últimos se pueden hacer
búsquedas más sofisticadas: es posible obtener, por ejemplo, ocurrencias de uso de los lemas (es
decir, de todas las formas flexionadas de una palabra), así como comprobar las agrupaciones más
frecuentes de una palabra (coapariciones) o hacer búsquedas de acuerdo con categorías grama-
ticales (por ejemplo, qué adjetivos acompañan a una determinada palabra, o qué combinaciones
hay de artículo y nombre propio). Como complemento a la gran oferta de recursos que existen
y sus funcionalidades, muchos investigadores optan por crear sus propios materiales mediante la
descarga de los textos o los resultados de búsquedas y la utilización de programas diversos para
etiquetar los fenómenos, introducir anotación gramatical, crear concordancias o usar expresiones
regulares para hacer búsquedas especialmente complejas.
En suma, existe una gran variedad de recursos para aplicar la metodología de la lingüística de
corpus al estudio diacrónico del español. Dado que cada uno de ellos presenta al mismo tiempo
ventajas y limitaciones, en muchos casos el proceder más efectivo será combinar el empleo de
más de un recurso: así, los corpus más grandes son el medio ideal para hacer búsquedas prelimi-
nares que permiten hacerse una idea general de la documentación de una estructura a lo largo de
23
Andrés Enrique-Arias
la historia del español; al mismo tiempo, otros corpus más pequeños especializados en una época,
área geográfica o tipología textual concreta pueden servir para afinar los resultados y centrarse
con más detalle en algún aspecto del fenómeno que se pretende investigar. Al mismo tiempo, el
aprovechamiento de los corpus se puede ampliar mediante el uso de herramientas externas para
la descarga, marcación y análisis de los resultados.
5. Perspectivas futuras
Uno de los procedimientos más eficientes para entender los mecanismos que rigen los cambios
lingüísticos es el examen de los textos que muestran los momentos de transición en que convi-
ven el sistema original anterior al cambio y el sistema innovador. La distribución y la frecuencia
relativa de las estructuras asociadas con el sistema antiguo y con el nuevo proporcionan informa-
ción valiosa sobre los factores que motivan el cambio, los contextos en los que se ha originado
y los canales por los que se ha extendido. Los corpus diacrónicos informatizados facilitan enor-
memente esta labor, pues permiten obtener en un instante listados de ocurrencias que en otro
tiempo hubieran supuesto meses de laboriosa búsqueda.
El otro gran desarrollo metodológico reciente de la lingüística histórica es la adaptación de
los métodos de estudio de la variación desarrollados por la sociolingüística para el estudio de los
datos históricos obtenidos de los corpus (Silva-Corvalán y Enrique-Arias 2017, 295–296) (cap.
6). Sin embargo, las investigaciones de la diacronía del español no han explotado esta posibilidad
en toda su dimensión, lo que contrasta con la atención dispensada a otras cuestiones metodo-
lógicas, como los problemas filológicos de selección y presentación de textos en los corpus
o la efectividad de las herramientas de búsqueda. En efecto, en muchos trabajos de variación
diacrónica del español el análisis de los datos se limita a hacer conteo de ocurrencias y cálculo
de porcentajes sin ni siquiera incluir un test estadístico de significatividad; más infrecuente aún
es el empleo de técnicas que son de uso común en sociolingüística cuantitativa y lingüística de
corpus, como el análisis multivariable mediante programas de regresión logística. La aparición de
nuevas herramientas para el análisis cuantitativo, como el modelado estadístico de efectos mix-
tos (mixed-effects modeling), así como la posibilidad de presentar resultados en un amplio elenco
de formatos gráficos, ensanchan considerablemente los métodos para el estudio de los datos
de los corpus. Una muestra del potencial de los nuevos recursos es el trabajo de Rosemeyer y
Enrique-Arias (2016) sobre la expresión de la posesión en castellano medieval. Frente al pro-
ceder tradicional de identificar el contexto variable y reducirlo a una oposición binaria de dos
estructuras en competición, un análisis estadístico de regresión logística multinomial calcula la
probabilidad del empleo del esquema más frecuente (su casa) frente a cualquiera de sus compe-
tidores (la su casa, la casa de él, la casa): el análisis multinomial refleja mejor que el binario cómo
opera en realidad el fenómeno variable, puesto que el hablante dispone de más de dos opciones
a la hora de expresar la posesión.
Otra de las tareas pendientes de la lingüística histórica hispánica es constituir el “mapa varia-
cional” del español, es decir, establecer una tipología de cuáles son los principales fenómenos
sujetos a variación en cada época y área geográfica en la evolución de la lengua. La creación
de corpus documentales con textos datados y situados en su espacio geográfico de producción
proporciona, finalmente, el material base para poder llevar a cabo este objetivo mediante la con-
fección de un listado filológicamente fiable de rasgos lingüísticos situados en sus coordenadas
cronogeográficas. La compilación y análisis de estos datos, además de servir para delimitar el foco
geográfico donde se originan los cambios, permitirá establecer mediante cálculos matemáticos
la data cronogeográfica de textos comparables para los que no disponemos de esa información
(Kawasaki 2014).
24
Manejo de las fuentes: los corpus
Las posibilidades de uso de los corpus se van ensanchando gracias a la creación de nuevos
recursos; normalmente se trata de corpus de pequeño ámbito asociados a un proyecto par-
ticular, pero que contribuyen a incorporar variedades poco representadas, como dialectos,
variedades de contacto, habla de mujeres o de minorías. En esta línea está el corpus Programes,
concebido para complementar a otros corpus mediante la compilación de testimonios de una
época insuficientemente representada, como es el caso del primer español moderno (cap. 40):
el corpus da acceso a textos descargables de los siglos xvii al xix, con particular atención al
periodo 1640–1725. En la misma línea, el Corpus Histórico del Español Norteño (CORHEN)
reúne documentos particulares de las variedades castellanas del centro-norte peninsular, con
especial atención a una época umbría como es la del periodo de orígenes (siglos X–XIII)
(cap. 34). El ámbito limitado de estos nuevos recursos normalmente se corresponde con un
alto grado de especialización por parte de sus creadores, quienes, al ser especialistas en la
tipología textual asociada, aportan un alto grado de calidad en la selección y edición de los
textos.
Uno de los aspectos de los corpus que seguramente tendrá mayor relevancia en el futuro es la
participación de los investigadores mediante la habilitación de herramientas colaborativas. Cabe
imaginar que las nuevas aplicaciones facilitarán cada vez más que el trabajo realizado por un pro-
gramador, o la codificación de datos hecha por el usuario lingüista, sean aprovechables para otros
usuarios. Un avance en este sentido es el que los creadores de corpus pongan a la disposición
de los usuarios los textos completos y provistos de las diferentes capas de anotación disponibles,
como se hace por ejemplo en Biblia Medieval o en BiDTEA. Los formatos digitales facilitan ade-
más el poner a la disposición de los usuarios un amplio elenco de recursos para el estudio y com-
prensión de los textos: facsímiles digitales de los manuscritos, transcripciones paleográficas así
como las herramientas analíticas necesarias para manipular los textos (herramientas de búsquedas
con posibilidad de filtrado por diferentes parámetros, concordancias, glosarios, enlaces externos,
estudios monográficos, etc.). Otra iniciativa destacable es el planteamiento de la plataforma Tei-
Tok, un programa creado originalmente para el corpus del proyecto Post Scriptum pero que se ha
hecho de acceso libre; el programa permite que filólogos con conocimientos informáticos de
nivel usuario puedan gestionar todo el proceso de creación de un corpus diacrónico: edición,
anotación y visualización de los textos.
Por otro lado, la metodología de los corpus informatizados está fuertemente ligada a los
cambios tecnológicos y es, por tanto, una disciplina en continuo movimiento. Es previsible,
por ejemplo, que el desarrollo de macrobuscadores permita extraer datos de manera masiva
rastreando varios corpus simultáneamente. Otra innovación será la posibilidad de interacción de
imagen y texto con el desarrollo de documentos legibles por máquina, de modo que sea posi-
ble analizar y recuperar información grafémica y textual de los facsímiles digitalizados. Otros
avances tecnológicos que son aplicables a la lingüística de corpus son el empleo de programas de
inteligencia artificial para el análisis de la variación o la geolocalización para el cartografiado de
resultados. Asimismo, el rastreo de la web como corpus tiene un gran potencial: entre los billo-
nes de páginas existentes hay recursos como las colecciones de Google Libros, alimentadas por
un gran número de bibliotecas y cuya herramienta de búsqueda OCR mejora constantemente,
que pueden proporcionar datos complementarios a los corpus convencionales. Por ejemplo,
Enrique-Arias (2019, 355–358) localiza a partir de búsquedas en Google la distribución diatópica
en el sur de Aragón y norte de Valencia de la forma jublar, variante antigua y dialectal de ‘juglar’
no documentada en los corpus diacrónicos. La limitación actual de este método es que requiere
visitar uno a uno cada enlace de los resultados de búsqueda y cerciorarse de que los ejemplos
son legítimos; posiblemente en el futuro habrá posibilidades de mejorar el proceso de búsqueda
y filtrado para poder usar procesos automáticos en las búsquedas en la red.
25
Andrés Enrique-Arias
6. Conclusiones
El desarrollo y amplia accesibilidad de los recursos informáticos ha abierto grandes posibilidades
para avanzar en el estudio diacrónico del español. La disponibilidad creciente de nuevos datos
y herramientas de análisis, las iniciativas de colaboración e intercambio entre equipos creadores
de recursos y el mayor rigor y exigencia por parte de los investigadores en lo que respecta a la
calidad filológica de los textos abren un panorama prometedor para el futuro de la disciplina. No
obstante, a pesar de la abundante oferta de recursos electrónicos no existe un corpus en línea que
sea capaz de satisfacer todas las necesidades de la investigación de la diacronía del español. Cada
uno de los recursos disponibles, ya sean los grandes corpus, las colecciones documentales o la
explotación de datos de Internet, tiene sus ventajas metodológicas y sus debilidades. En términos
generales es posible concluir que los grandes corpus que permiten compilar un mayor número
de datos y cubren un arco cronológico más amplio implican un menor control de la calidad
filológica, datación y origen geográfico de los textos y, por tanto, un nivel más alto de posibles
resultados mal clasificados. Al mismo tiempo, los recursos que permiten un mejor control del
origen de los datos tienden a ser corpus más pequeños y reúnen tipologías textuales concretas
que pueden introducir sesgos en los resultados. Por todo ello, la capacidad del investigador a la
hora de evaluar el mérito relativo de los diferentes recursos y la habilidad para valorar la validez
empírica de los datos son cualidades esenciales para poder aprovechar en todo su potencial las
ventajas metodológicas del empleo de los corpus en investigaciones de orientación diacrónica.
Lecturas recomendadas
Torruella (2017) ofrece, en un tono accesible, una panorámica amplia sobre los corpus diacrónicos y
una síntesis práctica de las bases teóricas y metodológicas de la investigación con corpus diacró-
nicos, los diferentes elementos que intervienen en la creación de los recursos informatizados o los
procedimientos para el análisis de los datos extraídos de los corpus.
Kabatek (2016) contiene una muestra de las investigaciones recientes que se llevan a cabo con corpus
diacrónicos del español e incluye, además, aportaciones acerca de otras lenguas iberorromances.
Los lingüistas a menudo optan por no limitarse a emplear las herramientas que ofrecen los corpus
y procesan los resultados de manera externa con otros programas. Anthony (2013) presenta una
revisión crítica de los programas informáticos que se pueden emplear para codificar y analizar
estadísticamente los datos lingüísticos extraídos de corpus.
Bibliografía citada
A Recursos
BiDTEA = Gago Jover, F., ed. Biblioteca Digital de Textos del Español Antiguo. [Link]/
[Link].
CDH = Real Academia Española. Corpus del Diccionario Histórico de la Lengua Española. [Link]
CNDHE.
CE = Davies, M., dir. Corpus del Español. [Link]
CODEA = Sánchez-Prieto Borja, P., coord. Corpus de Documentos Anteriores a 1900. [Link]
es.
CORDE = Real Academia Española. Corpus Diacrónico del Español. [Link]
CORDIAM = Company, C. y V. Bertolotti, dirs. Corpus Diacrónico y Diatópico del Español de América. www.
[Link].
CORHEN = Torrens Álvarez, M.J., dir. Corpus Histórico del Español Norteño. [Link]
CORHIBER = Torruella, J. y J. Kabatek, coords. Portal de Corpus Históricos Iberorrománicos. [Link]
[Link]/portal-corhiber.
26
Manejo de las fuentes: los corpus
B Estudios
Anthony, L. 2013. “A Critical Look at Software Tools in Corpus Linguistics”. Linguistic Research 30 (2):
141–161.
Enrique-Arias, A. 2012. “Dos problemas en el uso de corpus diacrónicos del español: perspectiva y com-
parabilidad”. Scriptum Digital 1: 85–106.
Enrique-Arias, A. 2015. “Edición digital y corpus diacrónicos: problemas en la edición de textos históricos
producidos en un entorno bilingüe”. En Temas, problemas y métodos para la edición y el estudio de documentos
hispánicos antiguos, eds. J. P. Sánchez Méndez, M. de la Torre y V. Codita, 395–406. Valencia: Tirant lo
Blanch.
Enrique-Arias, A. 2016. “Sobre la noción de perspectiva en lingüística de corpus: algunas ventajas de los
corpus paralelos”. En Lingüística de corpus y lingüística histórica iberorrománica, ed. J. Kabatek, 21–39.
Berlín: De Gruyter.
Enrique-Arias, A. 2018. “Some Methodological Issues in the Corpus-Based Study of Morphosyntactic
Variation. The Case of Old Spanish Possessives”. En Diachronic Corpora, Genre and Language Change, ed.
R. J. Whitt, 261–279. Ámsterdam: John Benjamins.
Enrique-Arias, A. 2019. “Los corpus informatizados aplicados al estudio del libro antiguo. Técnicas, recur-
sos, problemas”. En La producción del libro en la Edad Media: una mirada interdisciplinar, eds. G. Avenoza,
L. Fernández y M. Lourdes Soriano, 335–363. Madrid: Sílex.
Kabatek, J. 2013. “¿Es posible una lingüística histórica basada en un corpus representativo?”. Iberoromania
77: 8–28.
Kabatek, J., ed. 2016. Lingüistica de corpus y lingüistica histórica iberorrománica. Berlín: De Gruyter.
Kawasaki, Y. 2014. “Datación crono-geográfica de documentos medievales españoles”. Scriptum Digital 3:
29–63.
Labov, W. 1994. Principles of Linguistic Change: Internal Factors. Oxford: Blackwell.
Lüdeling, A. y M. Kytö, eds. 2008. Corpus Linguistics: An International Handbook. Berlín: De Gruyter.
Octavio de Toledo, Á. 2019. “Large Corpora and Historical Syntax: Consequences for the Study of Mor-
phosyntactic Diffusion in the History of Spanish”. Frontiers in Psychology 10 (780): 1–15 [en línea].
[Link]
Rodríguez Molina, J. y Á. Octavio de Toledo. 2017. “La imprescindible distinción entre texto y testimo-
nio: el CORDE y los criterios de fiabilidad lingüística”. Scriptum Digital 6: 5–68.
Sánchez-Prieto Borja, P. 2011. La edición de textos españoles medievales y clásicos. Criterios de presentación gráfica.
San Millán de la Cogolla: Cilengua.
Silva-Corvalán, C. y A. Enrique-Arias. 2017. Sociolingüística y pragmática del español. Washington, DC:
Georgetown University Press.
Torruella Casañas, J. 2017. Lingüística de corpus: génesis y bases metodológicas de los corpus (históricos) para la
investigación científica. Nueva York: Peter Lang.
27
3
Las gramáticas del español como
fuentes de datos lingüísticos
(Spanish grammars as sources
of linguistic data)
Daniel M. Sáez Rivera
1. Introducción
En el presente capítulo se aborda el empleo de las antiguas gramáticas del castellano (hasta el
siglo XIX), como fuente de datos lingüísticos para la historia del español. Tras un breve estado
de la cuestión, se señalan la utilidad, pertinencia y cautela necesarias al utilizar las gramáticas del
pasado como fuentes histórico-lingüísticas. Se distinguirá entre gramática interna y gramática
externa, siendo la última un género historiográfico que permite atisbar la gramática interna de
hablantes del español del pasado. Sigue una breve historia de la gramática del español según sus
tipos textuales al hilo de la cual se proporcionan herramientas teóricas adecuadas para el análisis
de gramáticas: la distinción entre usos descritos, prescritos y escritos, de un lado, y la diferencia
entre gramatización y gramaticalización, de otro. Todo lo anterior se ejemplifica en gramáticas
concretas con atención a distintos niveles lingüísticos.
Palabras clave: gramáticas antiguas, fuentes, historia del español, historiografía lingüística,
gramatización
This chapter explains how linguists can use older grammars of Spanish (understood as those
published through the 19th century), as sources of linguistic data for the history of the Spanish
language. After a brief state of the art survey, this chapter will describe the usefulness, necessity,
relevance and appropriate cautions on the use of grammars from the past as historical-linguistical
sources. It will next distinguish between inner grammar and outer grammar, the latter being a
historiographic genre which allows us to glimpse the inner grammar of speakers of Spanish in
the past. The chapter then offers a brief history of Spanish grammars according to their main
text types. Several useful theoretical tools are provided at this point: the distinction between des-
criptive, prescriptive, and written uses, and the difference between grammatisation and gram-
maticalization. Several examples from concrete grammars are supplied with attention paid to
different levels of linguistic analysis.
Keywords: old grammars, sources, history of Spanish language, linguistic historiography,
grammatisation
28 DOI: 10.4324/9781003035565-5
Las gramáticas del español como fuentes de datos lingüísticos
29
Daniel M. Sáez Rivera
30
Las gramáticas del español como fuentes de datos lingüísticos
todo a extranjeros (Sáez Rivera 2011, 559). En tal comunidad discursiva, la gramática sería un
género más junto a diálogos escolares, nomenclaturas o vocabularios temáticos, diccionarios alfa-
béticos, narraciones breves, colecciones de refranes, cartas o notas histórico-lingüísticas, entre
otros.
Una parte destacada del género historiográfico gramática es el prólogo inicial en el que se
indica su propósito, objetivo y público. A continuación, las gramáticas antiguas suelen incluir
una sección de pronunciación (normalmente denominada “pronunciación de las letras”, pos-
teriormente —en particular a partir del siglo XVIII— desglosada en ortografía y prosodia)
y desarrollan a continuación especialmente la morfología (denominada habitualmente “ana-
logía”) y la exposición de las categorías gramaticales o partes del discurso (usualmente en
torno a nueve, a saber: artículo, nombre, adjetivo, pronombre, verbo, adverbio, preposición,
conjunción e interjección). Sigue la sintaxis, inicialmente de poca entidad y extensión (pues
se desgranaba más bien en los tratados retóricos), y al final algunas notas léxicas y fraseológicas
además de observaciones varias (relación del vernáculo con el latín, por ejemplo). Son apéndi-
ces frecuentes (sobre todo en gramáticas para extranjeros) nomenclaturas, breves diccionarios,
diálogos escolares, cartas e incluso textos literarios, con lo que se crean verdaderos manuales
completos. La gramática puede ser también texto liminar de un diccionario (por ejemplo, el
inglés-español de Minsheu 1599, que incluye además una serie de diálogos de mucha fortuna
posterior) o una colección de diálogos (como la serie multilingüe bajo el nombre de Noël de
Berlaimont que arranca en el siglo XVI y llega incluso al XIX, y que incluye el español por
primera vez en 1551).
Se puede dividir la gramática en subtipos o subgéneros según el público al que se dirige, esto
es, la comunidad discursiva en la que se insertan (Sáez Rivera 2011), lo cual produce diferencias
en sus contenidos y metodología que pasamos a abordar.
31
Daniel M. Sáez Rivera
1) Flandes.—Es el primero que surge, por la presencia española en la zona, dado que los
Países Bajos (esto es, Flandes) formaron parte de la Corona española desde Carlos I hasta
el Tratado de Utrecht (1713), por el cual se enajenaron (Sáez Rivera 2008, 169, n. 2). Por
ello no extraña que aparecieran en Lovaina, en el taller de Gravio, dos gramáticas, ambas
anónimas (1555 y 1559), y en Amberes la Gramática castellana (1558), de Cristóbal de Villa-
lón. A finales del siglo XVII se imprime en Bruselas la Nouvelle grammaire espagnole (1697)
de Francisco Sobrino, copia incremental de la exitosa Grammaire espagnole de César Oudin
(cf. inf. nº 3) con numerosas reediciones hasta incluso principios del siglo XX.
2) Italia.—Es el segundo foco, también debido a la influencia política española en el área,
especialmente en el Sur (Nápoles) y en las islas (Cerdeña y Sicilia): cf. Sáez Rivera (2008,
111–113). Así, las Osservationi della lingua castigliana (1556) de Juan de Miranda inician
la gramática basada en el contraste lingüístico (en este caso, con el italiano), modelo
que influirá poderosamente en la gramática de Oudin. Sobresale igualmente Lorenzo
Franciosini, cuya Grammatica spagnuola e italiana (1624) debe mucho a Oudin y algo a
Miranda. Franciosini es el primer traductor del Quijote al italiano, igual que Oudin lo fue
al francés, abriendo ambos una tradición aún viva de empleo de la obra magna cervantina
para la enseñanza del español.
3) Francia.—El país vecino de España, en el siglo XVI enemigo, tarda un poco más en tener su
primera gramática para enseñar español: La parfaicte méthode pour apprendre l’Espagnol (1596)
de Nicolas Charpentier. Al año siguiente publicó César Oudin, secretario e intérprete del
rey francés, su ya mencionada Grammaire espagnole (1597), muy reeditada en el siglo XVII y
que siguió retocando su hijo Antoine, también secretario e intérprete regio al que sucedió
32
Las gramáticas del español como fuentes de datos lingüísticos
Claude Dupuis, autor de La grammaire espagnole de Des Roziers (1659). A Juan de Luna,
protestante refugiado en Francia y luego Inglaterra, se debe un Arte breve y compendiosa para
aprender la lengua española (1616). Resulta asimismo señero Claude Lancelot, coautor de la
famosa Grammaire générale et raisonnée (1660) que, con el seudónimo de De Trigny firma
en el mismo año una Nouvelle méthode pour apprendre la langue espagnole (1660). En el siglo
XVIII destaca por su calidad la gramática de Jean de Vayrac, autor en 1708 de una volumi-
nosa Nouvelle grammaire espagnole, muy ampliada en la segunda edición de 1714.
4) Inglaterra (y Estados Unidos).—Uno de los primeros profesores de español en Inglaterra
fue Antonio del Corro, también protestante refugiado, que publicó en Oxford sus Reglas
gramaticales para aprender la lengua española y francesa (1586). No mucho después, Richard Per-
cyvall hace publicar su Bibliotheca hispanica, containing a grammar, with a dictionarie in Spanish,
English and Latine. El relevo en la producción de materiales para enseñar español lo toma el
ya mencionado Minsheu con su diccionario bilingüe (1599). Ya en el siglo XVII, Juan de
Luna publica en Londres una edición de su Arte breve (1623). El siglo XVIII se inicia con
A new Spanish and English Dictionary (1706) del capitán John Stevens, con una gramática y
unos diálogos muy inspirados en Minsheu. En 1725 sale una edición muy aumentada de
esa gramática (A new Spanish Grammar, more perfect than any hitherto publish’d) que constituye
el arranque de toda una cadena editorial posterior (Sebastián Puchol 1739; Giral Del Pino
1766; Raimundo del Pueyo 1792; Felipe Fernández 1797). Esta tradición desembarca en
Estados Unidos a través del catalán-cubano Mariano Cubí y Soler, que publicó en Balti-
more en 1822 A new Spanish Grammar, adapted to every class of learners, con gran repercusión
en su momento.
5) Países germanófonos.—Las primeras gramáticas de español se publican aquí en latín, así las
Institutiones in linguam hispanicam (1614) de Doergank, obra derivada de Oudin con influen-
cia también de Miranda. El cántabro Juan Ángel Sumarán da a la luz en Viena una destacada
Grammática y pronunciación alemana y española (1634). En torno a la corte vienesa se publican
varias gramáticas y manuales más en los siglos XVII y XVIII, como la muy apreciable Gram-
matica et syntaxis linguae Hispanicae (1711) de Matías Cramer. A partir del último cuarto del
siglo XVIII, con la Kurzgefasste Spanische Grammatik (1778) de Barth como bisagra, pro-
liferan las gramáticas del español: a comienzos del siglo XIX destaca Theoretisch-Praktische
Lehre der Spanischen Sprache (1806) de Manuel Pérez Ramajo.
6) Otros focos.—En el arranque de la gramática de español en Holanda se sitúa Linguæ hispan-
icæ compendiosa institutio (1630) firmada por Carolus Mulerius (Karl van Muller). Con un
título similar se publicó en Dinamarca la pionera en ese país, Linguae Hispanicae Compendium
(1662) de Carolus Rodriguez Matritense, esto es, Carlos Rodríguez de Madrid. La primera
gramática para enseñar español en Portugal es muy tardía, la Grammatica hespanhola para uso
dos portuguezes (1848) de Nicolau António Peixoto.
33
Daniel M. Sáez Rivera
y diferentes marcas diatópicas (geográficas o dialectales), diastráticas (de grupos sociales, inclui-
dos lenguajes de especialidad) y diafásicas (o de situación: distinciones de estilo o de registro) e
incluso diacrónicas (señalamiento de arcaísmos), pudiendo adjudicarse formas o construcciones
a tradiciones discursivas específicas (Sáez Rivera 2007). Estas marcas suelen estar además entre-
veradas o entrelazadas.
Valga un ejemplo: el gramático castellano Villalón incorpora informaciones diatópicas simi-
lares o asimilables a las marcas lexicográficas en su Gramática castellana (1558), sobre todo en la
sección dedicada al género de los sustantivos. Así, señala que “[t]odo nombre de árbol es del
género masculino. [...] Aunque en algunas partes de Castilla dizen esta peral, esta moral, esta nogal”
(Villalón 1558, 22). El uso descrito puede mutar rápidamente en prescrito (o proscrito, esto es,
condenado como incorrecto): en la misma sección del género, al indicar que todo nombre aca-
bado en -ar es masculino (mar, par, azúcar, aljófar, azahar), se añade: “en algunas partes de Castilla
dizen esta mar, del género femenino: pero mal dicho” (Villalón 1558, 28). Un caso de combina-
ción de marcas es el siguiente: en su gramática, Stevens (1706, 48) señala que la paragoge o aña-
dido de una letra o sílaba al final de una palabra es rara en el presente pero usada antiguamente
(un arcaísmo), conforme se encuentra en antiguas canciones y baladas, de modo que la asigna a
una tradición discursiva concreta, un género poético popular. Se añade, además, que voy y soy
muestran paragoge de -y respecto a vo y só, siendo estas últimas las formas antiguas.
Los usos escritos pueden encontrarse en la lengua de metalenguaje si la gramática está escrita
en español, como suele ser el caso de las gramáticas para nativos, mientras que las gramáticas para
extranjeros suelen adoptar como lengua de metalenguaje la del foco o público al que se dirige.
Podemos clasificar también dentro de los usos escritos los ejemplos de las reglas y las muestras
de lengua (diálogos, cartas, narraciones breves, etc.) que suelen acompañar a las gramáticas. Sin
embargo, es necesario considerar que los ejemplos son parte de la teoría (Auroux 1994, 110)
y los usos lingüísticos que muestran pueden estar al servicio de esta, aparte de que suelen ser
con frecuencia copiados; las muestras de lengua, por otro lado, están pregramaticalizadas (Besse
2001; Sáez Rivera 2005) o preparadas para enseñar ciertas estructuras, y las lecturas incluidas
en las gramáticas poseen un valor de modelo de lengua, sobre todo cuando están firmadas por
autoridades literarias.
Otra noción teórica útil para el análisis es la de gramatización (término de Auroux 1994),
entendido como la codificación de una forma o estructura lingüística en una gramática, noción
que, siguiendo a Girón Alconchel (2018), podemos poner en paralelo con la de gramaticaliza-
ción (cf. cap. 9), proceso de cambio lingüístico que puede seguirse mediante datos extraídos de
gramáticas. Por ejemplo, Bello (1847, § 923), al tratar la duplicación de los pronombres de acu-
sativo y dativo simplemente señala (gramatización por uso descrito) que “[e]s usual el acusativo a
usted después del caso complementario: Le han sorprendido a usted; Los aguardábamos a ustedes”,
dando a entender que no es aún obligatoria (no está, por tanto, enteramente gramaticalizada) tal
duplicación con usted, forma que además no considera aún pronombre, sino “nombre indecli-
nable” (Bello 1847, § 920).
34
Las gramáticas del español como fuentes de datos lingüísticos
(1975, 96) aduce como prueba de que las grafías <g, j + e, i> correspondían a la velar sorda
[x], si bien Menéndez Pidal (2005, 1006), con análisis más fino, considera que Dupuis revela un
paso intermedio entre la palatal fricativa /∫/ y la velar /x/, la palatoalveolar /ç/ (el ich-Laut del
alemán).
si bien hai quien dice siempre lo para el acusativo sin la menor distinción, y le para el dativo,
lo general es obrar con incertidumbre, pues los escritores más correctos que dicen adorarle,
refiriéndose a dios, ponen publicarlo, hablando de un libro. Pudiera conciliarse esta especie
de contradicción, estableciendo por regla invariable usar de le para el acusativo si se refiere a
los espíritus u objetos incorpóreos y a los individuos del género animal; y del lo, cuando se
trata de cosas que carecen de sexo, y de las que lo tienen, pero pertenecen al reino vegetal.
Así diré examinarle, si se trata de un espíritu, un hombre o un animal masculino, y exami-
narlo, si de un hecho.
( Salvá 1847, 152–153)
La construción destos verbos actiuos es mediante preposición y sin ella. En cosas anima-
das, por la mayor parte, se pone la preposición, como siruo a Pedro, fauorezco a Ioan, amo a
Francisco. En cosa sin alma, están sin ella, como amo la verdad, leo los libros, oyo el Euangelio.
( Jiménez Patón 1614, 102)
35
Daniel M. Sáez Rivera
constituyen una mina por explorar, sobre todo para el nivel pragmático y la cortesía en particular.
Por ejemplo, Delgado Marín (1790, 94) condena el empleo de tú en el ambiente respetuoso de la
escuela: “En las Escuelas no se permita tratarse de tú, ni menos por apodos, ó nombres ridículos”;
los escolares han de emplear “vmd.”[=usted], según se deduce de los ejemplos: “Nunca llamará la
atencion quando habla diciendo, ¿me entiende Vmd.? ¿está Vmd.?” (Delgado Marín 1790, 90). Es
tal la importancia que se confiere en la escuela de primeras letras del siglo XVIII a la cortesía que
se supone obligación del maestro enseñarla, como recoge Balbuena Pérez (1791, 195): “Otra de
las obligaciones del Maestro, y no la menos importante, es el enseñar a los Niños cortesia, politica,
ò buena crianza, que consiste en el distinto modo de tratar con los superiores, con los iguales, é
inferiores, el aséo, y limpieza de su persona”. Delgado Marín (1790, 108–109), por otra parte, no
recoge los tratamientos especiales debidos a ciertas personas, “como V. S.ª Exc.ª Magd., &c. pues
nadie va á hablar á algun personage de estos sin enterarse ántes del tratamiento que se les da por
su casa, ó empleo”; en cambio, Balbuena sí los presenta y explica a colación de la enseñanza de la
escritura de cartas (una tradición discursiva), e incluso señala pragmáticas vigentes de tratamientos
como la Nueva recopilación de leyes (Balbuena Pérez 1791, 246–256).
Lecturas recomendadas
En un artículo aparecido un año antes de su muerte, Alonso (1951) ofreció el que sigue siendo el
trabajo más accesible para iniciarse en su labor con las gramáticas del Siglo de Oro como fuente
para la historia de la pronunciación del español (Alonso 1955/1967).
Siguiendo la estela de Amado Alonso, Girón Alconchel (1996) sondea las principales gramáticas del
Siglo de Oro explorando fenómenos morfosintácticos como la evolución de las segundas personas
de plural en el verbo español y del complemento directo preposicional.
Gómez Asencio (1989) es un artículo ya clásico de este llorado profesor que rastrea en gramáticas de
los siglos XVIII–XIX las diferentes opciones de leísmo, laísmo y loísmo (siendo “loístas” en esa
época los gramáticos que propugnaban lo como pronombre acusativo masculino singular).
Bibliografía citada
A Repertorios bibliográficos
Alvar Ezquerra, M. y Mª Á. García Aranda, dirs., 2023. Biblioteca Virtual de la Filología Española (BVFE):
directorio bibliográfico de gramáticas, diccionarios, obras de ortografía, ortología, prosodia, métrica, diálogos e historia
de la lengua. [Link].
36
Las gramáticas del español como fuentes de datos lingüísticos
Esparza Torres, M. Á., E. Battaner Moro, G. B. Garrido Vílchez, H.-J. Niederehe y A. Álvarez Fernández.
2012. Bibliografía cronológica de la lingüística, la gramática y la lexicografía del español (BICRES V): desde el año
1861 hasta al año 1899. Ámsterdam y Filadelfia: John Benjamins.
Esparza Torres, M. Á. y H.-J. Niederehe. 1999. Bibliografía Nebrisense: las obras completas del humanista Anto-
nio de Nebrija desde 1481 hasta nuestros días. Ámsterdam y Filadelfia: John Benjamins.
Esparza Torres, M. Á. y H.-J. Niederehe. 2012. Bibliografía cronológica de la lingüística, la gramática y la
lexicografía del español (BICRES IV): desde el año 1801 hasta el año 1860. Ámsterdam y Filadelfia: John
Benjamins.
Niederehe, H.-J. 1995–2005. Bibliografía cronológica de la lingüística, la gramática y la lexicografía del español
(BICRES I-III): desde el año 1501 hasta el año 1800, 3 vols. Ámsterdam y Filadelfia: John Benjamins.
37
Daniel M. Sáez Rivera
Gómez Asencio, J. J., dir. 2006–2011. El castellano y su codificación gramatical, 3 vols. Burgos: Instituto Cas-
tellano y Leonés de la Lengua.
Kiddle, L. B. 1975. “The Chronology of the Spanish Sound Change š > x”. En Studies in Honor of Lloyd A.
Kasten, 73–100. Madison: Hispanic Seminary of Medieval Studies.
Martínez Alcalde, M.ª J. 2019. “La(s) norma(s) del castellano en los primeros tratados para su codificación:
testimonios y cautelas”. En La configuración histórica de las normas del castellano, eds. V. Codita, E. Bustos
Gisbert y J. P. Sánchez Méndez, 135–160. Valencia: Tirant lo Blanch.
Menéndez Pidal, R. 2005. Historia de la lengua española. Madrid: Fundación Ramón Menéndez Pidal y
Real Academia Española.
Merrill, J. S. 1962. “The Presentation of Case and Declension in Early Spanish Grammars”. Zeitschrift für
Romanische Philologie 78: 162–171.
Quijada van den Berghe, C. 2011. “Autoridades y canon en gramáticas del español del siglo XVIII”. En
El castellano y su codificación gramatical, Vol. 3, El siglo XVIII: de 1700 a 1835, dir. J. J. Gómez Asencio,
805–831. Burgos: Instituto Castellano y Leonés de la Lengua.
Ramajo Caño, A. 1993. “La norma lingüística y las autoridades de la lengua: de Nebrija a Correas”. Anua-
rio de Letras 31: 333–377.
Sáez Rivera, D. M. 2005. “La explotación pedagógica del diálogo escolar en la didáctica del español (ss.
XVI–XIX)”. En Las gramáticas y los diccionarios en la enseñanza del español como segunda lengua: deseo y
realidad, eds. M.ª A. Castillo Carballo et al., 792–798. Sevilla: Universidad de Sevilla.
Sáez Rivera, D. M. 2006. “Crítica textual, historiografía lingüística e historia de la lengua: propr(r)io-mismo
a partir de la Nouvelle grammaire espagnole de Francisco Sobrino”. En Historia de la lengua y crítica textual,
ed. L. Pons Rodríguez, 267–302. Madrid y Fráncfort: Iberoamericana y Vervuert.
Sáez Rivera, D. M. 2007. “Tradiciones discursivas, historiografía lingüística e historia de la lengua”. En
Cuatrocientos años de la lengua del Quijote: estudios de historiografía e historia de la lengua española, eds. M.
Fernández Alcaide y A. López Serena, 89–111. Sevilla: Universidad de Sevilla.
Sáez Rivera, D. M. 2008. La lengua de las gramáticas y métodos de español como lengua extranjera en Europa
(1640–1726). Tesis doctoral. Madrid: Universidad Complutense de Madrid. [Link]/BUCM/
tesis/fll/[Link].
Sáez Rivera, D. M. 2009. “La explosión pedagógica de la enseñanza del español en Europa a raíz de la
Guerra de Sucesión española”. Dicenda 27: 131–156.
Sáez Rivera, D. M. 2011. “Los libros de gramática del español en el siglo XVIII: estructura y tipología
textual”. En El castellano y su codificación gramatical, vol. 3, El siglo XVIII: de 1700 a 1835, dir. J. J. Gómez
Asencio, 549–570. Burgos: Instituto Castellano y Leonés de la Lengua.
Sáez Rivera, D. M. 2014. “Notas sobre la gramática para la enseñanza del español en el ámbito germánico
en el siglo XIX”. En Métodos y resultados actuales en historiografía de la lingüística, eds. M.ª L. Calero et al.,
vol. 2, 653–663. Münster: Nodus.
Sáez Rivera, D. M. 2016. “Un francés de Chartres en la Sevilla del siglo XVII: la interlengua asevillanada
de François Huillery en su Vocabvlario para facilmentey brieuemente deprender a ler, escrebir, y hablar la lengua
Castellana. Con algunas curiosidades (París,1661)”. En Diálogos entre la lengua y la literatura, eds. C. J. Álva-
rez López y M.ª del R. Martínez Navarro, 15–49. Sevilla: Vitela.
Sáez Rivera, D. M. 2021. “Las formas de tratamiento en las gramáticas del español en los siglos XVIII y
XIX”. Revista Internacional de Lingüística Iberorrománica (RILI) 38: 151–172.
Salvador Plans, A. 1996. “Las fórmulas de tratamiento en la teoría gramatical de los siglos XVI y XVII”.
En Scripta Philologica in memoriam Manuel Taboada Cid, vol. 1, 185–206. La Coruña: Universidade da
Coruña.
Salvador Plans, A. 2006. “Los tratadistas del siglo de oro como fuente para el análisis de la historia de la
lengua”. En Actas del VI Congreso Internacional de Historia de la Lengua Española, eds. J. J. Bustos Tovar y
J. L. Girón Alconchel, vol. 1, 159–183. Madrid: Arco Libros.
Sánchez Pérez, A. 1992. Historia de la enseñanza del español como lengua extranjera. Madrid: SGEL.
Swales, J. M. 1990. Genre Analysis: English in Academic and Research Settings. Cambridge: Cambridge Uni-
versity Press.
Tollis, F. 1984. “À propos des ‘Circunloquios’ du verbe castillan chez Nebrija: le ‘nombre participial infi-
nito’”. Historiographia Linguistica 11: 55–76.
38
4
Los diccionarios del español como
fuentes de datos lingüísticos1
(Spanish dictionaries as
sources of linguistic data)
Gloria Clavería Nadal
1. Introducción
Los diccionarios del pasado se constituyen en una fuente de conocimientos esencial para la his-
toria de la lengua española, muy en particular, aunque no exclusivamente, de su léxico. Por los
datos que atesoran y por la elaboración metalingüística que entrañan, son fuentes privilegiadas
para la reconstrucción del sistema lingüístico de la época a la que pertenecen y, además, forman
parte del proceso de estandarización de la lengua y de la creación de la conciencia lingüística.
Palabras clave: diccionarios; fuentes; historia del español; historiografía lingüística; historia de
la lexicografía
Dictionaries from the past constitute an essential source of knowledge for the history of
the Spanish language, especially (though not exclusively) regarding its lexicon. The data and
the metalinguistic comments they contain render these dictionaries privileged sources for the
reconstruction of the language of the times when they were produced. In addition, these dic-
tionaries form part of the process of language standardization and of the creation of a linguistic
awareness or consciousness.
Keywords: dictionaries; sources; history of Spanish language; linguistic historiography; history
of lexicography
2. Conceptos fundamentales
Se incardina este capítulo en la intersección de dos disciplinas lingüísticas cercanas, la historio-
grafía lingüística y la historia de la lengua. Para esta, los diccionarios representan una fuente
de datos imprescindible en la reconstrucción de la evolución del español porque constituyen
un ejemplo de la lengua de la época en la que fueron elaborados y también por el particular
procesamiento de la realidad lingüística que involucran de modo que, según Reyre (2006, xlv),
“un diccionario antiguo es un ‘museo de la palabra’”. Las fuentes lexicográficas se enraízan en
la enseñanza y aprendizaje de lenguas, y su comparación —“arqueología lexicográfica” según
DOI: 10.4324/9781003035565-6 39
Gloria Clavería Nadal
Ilson (2003)—, manifiesta la propia evolución de la lengua, pese a que son obras en las que la
tradición alcanza un peso relevante. El diccionario es, además, un objeto cultural en el que muy
fácilmente se revelan las actitudes e ideologías lingüísticas, reflejadas tanto en la macroestructura,
con la selección de entradas (exclusiones e inclusiones), como en la microestructura, desde la
información sobre el lema tratado.
La tradición lexicográfica del español se inicia en la Edad Media muy supeditada al latín. Sus
primeras manifestaciones son los glosarios latino-españoles (siglos xiv y xv),2 cuyos interpreta-
menta romances contienen un vocabulario esencialmente patrimonial (Castro 1991, lxxxii), y
el manuscrito editado por Mac Donald (2007). De 1490 es el Universal vocabulario de Alfonso
Fernández de Palencia (Gemmingen 2003, 164–166), un diccionario monolingüe latino con
traducción aproximada al romance, parte que, como bien atestigua el DECH, resulta muy
valiosa para la documentación del léxico. Desde finales del siglo xv es Antonio de Nebrija el
iniciador de un nuevo modelo de lexicografía latino-romance con el Lexicon hoc est dictionarium
ex sermone latino in hispaniensem (Salamanca, 1492) y el Dictionarium ex hispaniensi in latinum
sermonem (Salamanca, ¿1495?) (Gemmingen 2003, 167–171). Cuando con el Renacimiento se
revalorizó el aprendizaje del español por la dimensión internacional que alcanzó la nación (Gili
Gaya 1960, x), las obras nebrisenses fueron aprovechadas para establecer las equivalencias del
español con otras lenguas vernáculas. Entre los diccionarios bilingües, cabe destacar, además de
las equivalencias entre español y las diferentes lenguas europeas (Acero 2003), el Vocabulario ará-
vigo en letra castellana de Pedro de Alcalá (Granada 1505), con correspondencias en árabe vulgar
granadino, y los vocabularios hispano-amerindios (Smith-Stark 2009; Hernández 2018a) com-
pilados por los misioneros para el aprendizaje de las lenguas indígenas con fines evangelizadores;
uno de sus primeros logros es el Vocabulario en lengua castellana y mexicana (México 1555, 1571)
de Alonso de Molina (Hernández 2018a, 94–96). También con raíces latinas y medievales,
se elaboraron a partir del Renacimiento obras multilingües en las que interviene el español;
no hay que olvidar, además, de las nomenclaturas, con tratamiento del léxico organizado por
materias (Acero 2003; Alvar Ezquerra 2013).
Uno de los hitos fundamentales de la historia de la lexicografía es el Tesoro de la lengua castellana
o española de Sebastián de Covarrubias (Madrid 1611), vinculado tanto a la lexicografía latina
como a la plurilingüe y centrado en la indagación etimológica. Aunque tradicionalmente se ha
considerado el primer diccionario “monolingüe” del español (Azorín 2000, 131; Carriazo y
Mancho 2003), no puede comprenderse adecuadamente fuera de las coordenadas descritas en
los párrafos anteriores (Lépinette 1989).
El diccionario monolingüe se consagra en el siglo xviii con la Real Academia Española y su
Diccionario de autoridades (1726–1739), cuyos modelos son los repertorios de la Accademia della
Crusca y de la Académie française. Exhibe, sin embargo, esta obra una personalidad propia con
amplios criterios de selección del vocabulario y abundante fundamentación textual (Freixas
2010). La tradición lexicográfica académica se consolida con una segunda edición del Autoridades
(1770, A–B), en la que se introducen algunas bases novedosas, y con las veintitrés ediciones del
diccionario académico en un solo volumen, desde el DRAE 1780 hasta el DLE 2014, disponible
en línea con actualizaciones anuales. En estas obras se ha ido gestando el concepto de norma
léxica del español (Ruhstaller 2003; Jiménez Ríos, En prensa; Fajardo 2021).
Existen, además, otros muchos diccionarios también valiosos para el historiador del español
moderno (García Platero 2003). Por ejemplo, el Diccionario castellano con las voces de ciencias y artes
de Esteban de Terreros y Pando (Madrid 1786–1793) interesa en particular por las palabras de
carácter técnico que registra y, en la consolidación decimonónica de la lexicografía no acadé-
mica, cabe destacar el Nuevo diccionario de la lengua castellana de Vicente Salvá (París 1846). Para
el siglo xx, sobresalen por su atención al uso el Diccionario de uso del español (Madrid 1966–1967)
40
Los diccionarios del español como fuentes de datos lingüísticos
de María Moliner y el Diccionario actual de la lengua española de Manuel Seco et al. (Madrid 1999),
como testimonios de los derroteros léxicos más recientes.
A partir del siglo xix, se produce una diversificación de los productos lexicográficos a la que
no se puede atender aquí por motivos de espacio: desde los diccionarios enciclopédicos a los
de provincialismos, sinónimos, etimológicos, sectoriales, etc. Todas estas obras han sido profu-
samente empleadas como fuentes para trazar la historia del léxico [caps. Dworkin, Mancho y
Gómez de Enterría].
41
Gloria Clavería Nadal
42
Los diccionarios del español como fuentes de datos lingüísticos
43
Gloria Clavería Nadal
se constituye en una de las mejores fuentes del español áureo porque contiene un verdadero
granero de estos datos (Eberenz 1992; Fernández Alcaide 2017). Este tipo de informaciones
aparece también en los diccionarios bilingües (Gemmingen 1990), siempre atentos a la lengua
común.
La presencia de la variación diatópica adopta dos vertientes complementarias. Por un
lado, hay notas geolingüísticas en los diccionarios generales ya desde el Tesoro (Eberenz
1992) y el Diccionario de autoridades, y también en la lexicografía posterior —por ejemplo,
Salvador Rosa (1985), Aliaga (1997), Fernández Gordillo (2006) o Peña (2019) para la
tradición académica; para Terreros, véase Echevarría Isusquiza (2001)—. Por otro lado, se
cuenta con los datos atesorados por la lexicografía regional peninsular e hispanoamericana
cuyo objetivo prioritario es la recolección del vocabulario no general y que, a menudo,
toma como piedra de toque la propia lexicografía académica (Álvarez de la Granja y Gon-
zález Seoane 2018).
De igual forma, en el léxico propio de América, se pueden distinguir las dos vertientes
enunciadas: por un lado, este tipo de voces ya se registran en el Tesoro (Lope Blanch 1977),
en el Diccionario de autoridades (bibliografía citada en Clavería y Hernández 2021, 402) y, con
un salto cualitativo, es uno de los ejes fundamentales del diccionario de Salvá, publicado
en época posterior a las independencias americanas (Azorín 2000: 257–272; Azorín 2008;
Álvarez de Miranda 2007). Dentro de la tradición académica, se empieza a conceder mayor
atención al léxico americano a partir del DRAE 1884 (Ezcurra 2019; Clavería y Hernández
2021) coincidiendo con la fundación de las Academias correspondientes, una actitud que se
ha acentuado en los siglos xx y xxi, y que culmina con la aplicación de la política panhispá-
nica al diccionario (Greußlich 2020) y con la introducción en él del concepto de españolismo
(Moreno Fernández 2020). Por otro lado, las obras lexicográficas que acopian elementos
léxicos americanos, aparte de los glosarios hispano-amerindios citados anteriormente y algu-
nos otros precedentes como el Diccionario de voces americanas de M. J. de Ayala (Quesada 1995)
o el Vocabulario de las voces provinciales de la América de A. Alcedo (1786–1789), experimentan
gran desarrollo después de las independencias; una de sus primeras muestras es el Diccionario
provincial de voces cubanas de E. Pichardo en 1836 (Huisa 2018, 251–258). Son obras que des-
tacan por su carácter diferencial con respecto al diccionario de la Academia y que, a menudo,
manifiestan una notable inclinación prescriptiva. Resultan de gran interés histórico tanto por
su contenido léxico como por las circunstancias sociales e ideológicas de su alumbramiento
(Huisa 2021); estos condicionamientos trascienden a la macroestructura con la selección de
voces, a la microestructura con la información lexicográfica y a los paratextos (por ejemplo,
Chávez Fajardo 2022, 119–142).
La variación diatécnica muestra también las dos perspectivas mencionadas. En la lexi-
cografía general, aunque el prólogo del Diccionario de autoridades anunciaba la intención de
elaborar un diccionario dedicado a las “artes liberales y mechánicas”, dio cabida a un buen
número de voces del léxico facultativo (Azorín 2000: 174–176; Freixas 2010: 177 y ss.), tal
como se refleja, por ejemplo, en el área de la medicina (Gutiérrez Rodilla 1993). Es, sin
embargo, el diccionario de Terreros, como muy bien recoge su título, el que mayor atención
prodigó a este tipo de voces. Los diccionarios generales del siglo xix reflejan con mayor o
menor celeridad los avances de la ciencia y de la técnica con la inclusión de voces científicas
y técnicas en su nomenclatura (Azorín 2000); el DRAE, por su parte, se suma a esta línea
de desarrollo a partir de finales de siglo (Blanco y Clavería 2021). Para el español moderno,
además, se pueden aprovechar las fuentes de la lexicografía especializada y enciclopédica
(cf. las investigaciones del grupo Neolcyt con fuerte apoyo en fuentes lexicográficas y, entre
otros, Prieto García-Seco 2010).
44
Los diccionarios del español como fuentes de datos lingüísticos
45
Gloria Clavería Nadal
ninguna duda, apreciables avances en su conocimiento; piénsese, por ejemplo, en los legajos de
la segunda edición del Diccionario de autoridades (Carriscondo y Carpi 2020a), identificados en
2016 y puestos a disposición pública en la página web de la RAE, u otros recursos académicos,
igualmente útiles, como el Fichero general y el Fichero de hilo. Las indagaciones sobre las fuen-
tes de las obras lexicográficas (Ruhstaller 2000; Blecua 2006; Freixas 2010; Jacinto 2012; Rojo
2014) ayudan a comprender su concepción y sus principios, y permiten tender pasarelas entre los
corpus textuales (cap. 2) y los lexicográficos. En este sentido, la existencia de ediciones críticas
de las principales obras lexicográficas espacio —cf. Arellano y Zafra (2006)— espacio reportaría
grandes ventajas, pues la reconstrucción filológica aplicada a los diccionarios trasciende incluso
los saberes históricos.
Teniendo en cuenta que el DLE entronca genéticamente con el primer diccionario acadé-
mico, la única ruta para su reestructuración definitiva como diccionario normativo y de uso
del español actual se encuentra en la indagación filológica espacio —cf. desde el punto de vista
geolectal Corbella (2021); Clavería y Julià (En prensa)—. La tradición lexicográfica española
hace evidente que la mirada al pasado y su comprensión resultan tareas ineludibles para la recta
comprensión del presente.
Notas
1 Agradezco a A. Fajardo, E. Hernández y N. Terrón la lectura de la versión inicial de este capítulo y sus
consejos y observaciones.
2 En general, las fuentes lexicográficas se citan a través de los estudios mencionados o a través del NTLLE.
3 Las acepciones lexicográficas se identifican con . Por ejemplo, en la entrada enagua parecen 11 acep-
ciones y estructuras complejas, 5 de las cuales tienen origen en fuentes lexicográficas.
Lecturas recomendadas
En Medina Guerra (2003) se encuentran varios capítulos en los que se puede ampliar el conoci-
miento de la historia de la lexicografía española (Acero 2003; Carriazo y Mancho 2003; García
Platero 2003; Gemmingen 2003; Ruhstaller 2003).
En Corbella, Fajardo y Langenbacher-Liebgott (2018) pueden consultarse varios estudios en los que
puede observarse desde perspectivas muy diferentes la investigación con fuentes lexicográficas y la
ref lexión acerca de su valor y los problemas que plantean (Blanco, Clavería y Jiménez Ríos 2018;
Corbella 2018; Hernández 2018b; Fajardo 2018).
En Huisa (2021) se hallan distintas contribuciones que abren nuevas perspectivas en el estudio
de la lexicografía americana y su aportación al estudio de la conformación del léxico
americano.
Referencias citadas
Acero, I. 2003. “La lexicografía plurilingüe del español”. En Lexicografía española, ed. A. M. Medina,
175–204. Barcelona: Ariel.
Aliaga, J. L. 1997. Contribucion al estudio de las voces aragonesas en las ediciones del Diccionario de la Real Academia
Espanola (Lexicografia y diversidad geolingüística). Zaragoza: Prensas Universitarias.
Alvar Ezquerra, M. 2013. Las nomenclaturas del español. Siglos XV–XIX. Madrid: Liceus.
Alvar Ezquerra, M., dir. 2022. Biblioteca Virtual de la Filología Española (BVFE): directorio bibliográfico
de gramáticas, diccionarios, obras de ortografía, ortología, prosodia, métrica, diálogos e historia de la lengua.
[Link].
Álvarez de la Granja, M. y E. González Seoane, eds. 2018. Léxico dialectal y lexicografía en la Iberorromania.
Madrid y Fráncfort: Iberoamericana y Vervuert.
Álvarez de Miranda, P. 1992. Palabras e ideas: el léxico de la ilustración temprana en España (1680–1760).
Madrid: Real Academia Española.
46
Los diccionarios del español como fuentes de datos lingüísticos
47
Gloria Clavería Nadal
Festschrift für Rudolf Engler zum 60. Geburtstag, eds. R. Liver, I. Werlen y P. Wunderli, 108–117. Narr:
Tübingen.
Eberenz, R. 1992. “Sebastián de Covarrubias y las variedades regionales del español. Sobre las precisiones
geolingüísticas del Tesoro de la lengua castellana o española”. En Actas del II Congreso Internacional de Historia
de la Lengua Española, eds. M. Ariza et al., 987–996. Madrid: Arco/Libros.
Echenique, M. T. 2013. “La obra de Nebrija como fuente para el estudio de la pronunciación castellana”.
En Historia de la pronunciación castellana, eds. M. T. Echenique y F. Satorre, 165–215. Valencia: Tirant
Humanidades.
Echevarría Isusquiza, I. 2001. “El primer vocabulario montañés y otros vocabularios castellanos. Terreros
y la dialectología en España en el siglo xviii: la experiencia del léxico”. Boletín de la Real Academia
Española 81: 53–150.
Egido, A. 2021. El árbitro de las lenguas. Anotaciones sobre la norma y el uso en la Real Academia Española.
Madrid: Cátedra.
Ezcurra, Á. 2019. “Léxico general y pluricentrismo. Aproximación a los americanismos en el diccionario
académico”. En El español, lengua pluricéntrica: discurso, gramática y medios de comunicación masiva, coord. S.
Greußlich y F. Lebsanft, 61–80. Göttingen: Vandenhoeck y Ruprecht.
Fajardo, A. 2018. “Lexicografía histórica con corpus y recursos digitales: aspectos metodológicos”. En
Historia del léxico español y humanidades digitales, eds. D. Corbella, A. Fajardo y J. Langenbacher-Liebgott,
255–278. Berlín: Peter Lang.
Fajardo, A. 2021. “La norma en la lexicografía del español: conflicto, contraste y consenso”. Revista Inter-
nacional de Lingüística Iberoamericana (RILI) 37: 17–29.
Fernández Alcaide, M. 2017. “Nuevo acercamiento a la variación lingüística en el Tesoro de Covarrubias”.
Revista de Filología Española 97: 69–90.
Fernández Gordillo, Luz. 2006. Tratamiento lexicográfico de los mexicanismos yseudomexicanismosen los dicciona-
rios académicos. Tesis doctoral. México: El Colegio de México.
Fichero de hilo: Real Academia Española. s. f. Fichero de hilo. [Link]
Fichero general: Real Academia Española. s.f. Fichero general de la lengua española. [Link]
[Link].
Freixas, M. 2010. Planta y método del Diccionario de autoridades. Orígenes de la técnica lexicográfica de la Academia
(1713–1739). Coruña: Universidade da Coruña.
García Platero, J. M. 2003. “La lexicografía no académica en los siglos xviii y xix”. En Lexicografía española,
ed. A. M. Medina, 263–280. Barcelona: Ariel.
Gemmingen, B. F. von. 1990. “Recherches sur les marques d’usage dans le Tesoro de las dos lenguas de Cesar
Oudin (1607)”. En Les marques d’usage dans les dicionnaires (xviie-xviiie siècles). Lexique 9: 31–41.
Gemmingen, B. F. von. 2003. “Los inicios de la lexicografía española”. En Lexicografía española, ed. A. M.
Medina. Barcelona: Ariel.
Gili Gaya, S. 1960. Tesoro lexicográfico (1492–1726), Tomo I (A–E). Madrid: CSIC.
Gómez de Enterría, J. 2020. El vocabulario de la medicina en el español del siglo xviii. Berna: Peter Lang.
Greußlich, S. 2020. “Normative Dictionaries (Spanish)”. En Manual of Standardization in the Romance Lan-
guages, eds. F. Lebsanft y F. Tacke, 605–627. Berlín y Boston: De Gruyter.
Gutiérrez Cuadrado, J. 2005. “Arcaísmos y otros – ismos. La selección léxico en el Quijote”. Boletín de la
Real Academia Española 85: 335–374.
Gutiérrez Cuadrado, J. 2018. “Cuestiones pertinentes e impertinentes a propósito del léxico dialectal en la
nomenclatura de los diccionarios generales”. En Léxico dialectal y lexicografía en la Iberorromania, eds. M.
Álvarez de la Granja y E. González Seoane, 101–119. Madrid y Fráncfort: Iberoamericana y Vervuert.
Gutiérrez Rodilla, B. M. 1993. “Los términos relacionados con la medicina en el Diccionario de autoridades”.
Boletín de la Real Academia Española 78: 463–512.
Hamlin, C. M. 2021. “Alfonso de Palencia: ¿autor del primer vocabulario romance latín que llegó a la
imprenta?”. Boletín de la Real Academia Española 101: 173–218.
Hernández, E. 2018a. Lexicografía hispano-amerindia 1550–1800. Catálogo descriptivo de los vocabularios del
español y las lenguas indígenas americanas. Madrid y Fráncfort: Iberoamericana y Vervuert.
Hernández, E. 2018b. “Tesoro lexicográfico de los americanismos contenidos en los vocabularios hispano-
amerindios coloniales (1550–1800) [TELEAM]”. En Historia del léxico español y humanidades digitales,
eds. D. Corbella, A. Fajardo y J. Langenbacher-Liebgott, 107–131. Berlín: Peter Lang.
Huisa, J. C. 2018. “Lexicografía del español de América”. En Léxico dialectal y lexicografía en la Iberorromania,
eds. M. Álvarez de la Granja y Ernesto González Seoane, 247–266. Madrid y Fráncfort: Iberoamericana
y Vervuert.
48
Los diccionarios del español como fuentes de datos lingüísticos
Huisa, J. C., ed. 2021. Fuentes lexicográficas del estudio histórico del léxico hispanoamericano. Berlín: Peter Lang.
Ilson, R. F. 2003. “Lexicographic Archaeology: Comparing Dictionaries of the Same Family”. En Lexico-
graphy: Critical Concepts, ed. R. R. K. Hartmann, 76–84. Nueva York: Routledge.
Jacinto, E. J. 2012. El principio de autoridad en los diccionarios generales del español (siglos xviii–xx). Tesis doctoral.
Madrid: Universidad Complutense.
Jiménez Ríos, E. 2001. Variación léxica y diccionario: los arcaísmos en el diccionario de la Academia. Madrid y
Fráncfort: Iberoamericana y Vervuert.
Jiménez Ríos, E. 2018. “La revisión de arcaísmos en el DRAE en la primera mitad del siglo xix”. Estudios
humanísticos. Filología 40: 405–429.
Jiménez Ríos, E. En prensa. “Los diccionarios de la Real Academia Española”. En Manual de lexicografía,
eds. M. P. Battaner et al. Londres: Routledge.
Lapesa, R. 1996. “Nuestra lengua en la España de 1898 a 1936”. En El español moderno y contemporáneo.
Estudios lingüísticos, 343–396. Barcelona: Crítica.
Lemateca del DRAE. [Link].
Lépinette, B. 1989. “Contribution a l’ètude du Tesoro de la lengua castellana o española de Sebastián de Cova-
rrubias”. Historiographia Linguistica 16: 357–310.
Lope Blanch, J. M. 1977. “Los indoamericanismos del Tesoro de Covarrubias”. Nueva Revista de Filología
Hispánica 26: 293–315.
Mac Donald, G. J. 2007. Diccionario español-latino del siglo XV: An Edition of [Link].10 Anonymous Manuscript of
the Real Biblioteca de San Lorenzo de El Escorial. Nueva York: HSMS.
Mapa de diccionarios: Instituto de Investigación Rafael Lapesa de La Real Academia Española. 2013. Mapa de
diccionarios [en línea: [Link]/ntllet].
Martínez Alcalde, M. J. 2007a. “Lexicografía y codificación ortográfica en el siglo xviii”. En Historia de la
lexicografía española, eds. J. I. Pérez Pascual, M. Campos y R. Cotelo, 111–118. Coruña: Universidade.
Martínez Alcalde, M. J. 2007b. “Pragmática y lexicografía histórica del español en el siglo xviii: Esteban de
Terreros”. Quaderns de Filologia. Estudis Lingüístics 12: 289–300.
Moreno Fernández, F. 2020. “Los ismos nacionales de la lengua española”. Boletín de la Real Academia Espa-
ñola 100: 115–145 y 543–614.
Morreale, M. 1988. “Virgilio en el Tesoro de Sebastián de Covarrubias”. Boletín de la Real Academia Española
68: 203–273.
Muñoz y Manzano, C., conde de la Viñaza. 1893. Biblioteca histórica de la filología castellana. Madrid: Imprenta
y fundición de Manuel Tello.
Neolcyt: [Link].
NTLE: Nieto Jiménez, Lidio y Manuel Alvar Ezquerra. 2007. Nuevo tesoro lexicográfico del español
(s. XIV-1726). Madrid: Arco/Libros.
NTLLE: Real Academia Española 2001. Nuevo tesoro lexicográfico de la lengua española, edición en DVD.
Madrid: Espasa. [Link].
Pascual, J. A. 1997. “La caracterización de los arcaísmos en un diccionario de uso”. En Lèxic, corpus i diccio-
naris. Cicle de conferències, 94–95, 9–30. Barcelona: Universitat Pompeu Fabra.
Peña, J. 2019. El léxico de Cantabria en los diccionarios de la Academia: de Autoridades al DLE-2014. Santander:
Ediciones Tantín.
Prieto García-Seco, D. 2010. “El Diccionario enciclopédico hispano-americano de literatura ciencias y artes (1887–
1910) de la editorial Montaner y Simón”. Boletín de la Real Academia Española 87: 97–121.
Prieto García-Seco, D. 2021. Un eslabón recuperado de la lexicografía española. La reimpresión retocada del Diccio-
nario académico de 1780. Madrid: Visor Lingüística.
Provencio, H. 2020. “En punto a: un caso de variación onomasiológica desde los inicios del español
moderno”. En Tradiciones discursivas y tradiciones idiomáticas en la historia del español moderno, eds. A. López
Serena, S. del Rey y E. Carmona, 269–301. Berlín: Peter Lang.
Quesada, M. A. 1995. “Prólogo”. Al Diccionario de M. J. de Ayala, ix–xliv. Madrid: Arco/Libros.
Quilis Merín, M. 2013a. “Observaciones sobre pronunciación en el Tesoro de la lengua castellana o española
(1611) de Sebastián de Covarrubias”. Beiträge zur Geschichte der Sprachwissenschaft 23: 71–86.
Quilis Merín, M. 2013b. “La pronunciación del español a través de la lexicografía”. En Historia de la pronun-
ciación castellana, eds. M. T. Echenique y F. Satorre, 491–523. Valencia: Tirant Humanidades.
Reyre, D. 2006. “Prólogo segundo. Las llaves de Tesoro de Covarrubias”. En Tesoro de la lengua castellana
o española de S. de Covarrubias Horozco, edición integral e ilustrada, eds. I. Arellano y R. Zafra, xlv–xlvi.
Madrid: Universidad de Navarra, Iberoamericana, Vervuert, Real Academia Española, Centro para la
Edición de Clásicos Españoles.
49
Gloria Clavería Nadal
50
5
Dialectología histórica de la
Península Ibérica
(Historical dialectology of
the Iberian Peninsula)
Inés Fernández-Ordóñez
1. Introducción
La comprensión cabal del cambio lingüístico necesita acotar no solo sus coordenadas históricas y
estructurales, sino también las geográficas, sociales y de registro, en comparación sistemática de
las varias áreas románicas del espacio peninsular. La compilación de nuevos corpus que reúnen
documentación cercana a la oralidad, geolocalizada y fechada, facilita este ambicioso abordaje.
Los estudios históricos que han adoptado una perspectiva dialectal arrojan un panorama nuevo y
complejo sobre la formación histórica del español, en el que las soluciones que fueron imponién-
dose con el tiempo proceden de focos geográficos y de grupos sociales diferentes, y no siempre,
como se asumía tradicionalmente, del castellano septentrional ni de los sociolectos de prestigio.
Es tarea pendiente de la dialectología histórica definir las áreas dialectales con capacidad expansiva
(y las que carecieron de ella) en la historia del español en cada época y tratar de buscar los motivos
históricos que subyacen a su formación, persistencia temporal o, en su caso, desaparición.
Palabras clave: dialectos; historia del español; corpus; morfosintaxis
The complete understanding of linguistic change needs to determine not only its historical and
structural limits, but also its geographical, social and register settings, through a systematic compa-
rison of the various Romance areas of the Iberian Peninsula. The difficulty of finding sources that
allow such an ambitious approach has been solved thanks to the compilation of new corpora that
gather geolocalized and dated documentation that comes close to reflecting the spoken language,
and that complement traditional corpora based on literary texts. Historical studies that hitherto
have adopted a dialect perspective shed a new and complex overview on the historical formation
of Spanish, in which the options that prevail over time come from different geographical foci
and social groups, and not always, as was assumed traditionally, from northern Castilian or from
prestigious sociolects. It is the future task of historical dialectology to define the dialect areas with
expansive capacity in the history of Spanish in each period, as well as the areas that lacked it, and to
try to find the historical reasons that underlie their formation, survival, or disappearance.
Keywords: dialects; history of Spanish; corpora; morphosyntax
DOI: 10.4324/9781003035565-7 51
Inés Fernández-Ordóñez
52
Dialectología histórica de la Península Ibérica
existe, y su consiguiente difusión áreal), la social (el grupo que promueve la innovación) y la fun-
cional (el grado de formalidad o elaboración consciente de la variante innovadora que determina
su uso o ausencia en las varias situaciones comunicativas). Y ello en una perspectiva que compare
simultáneamente todas las variedades románicas peninsulares, entre cuyos hablantes nunca se ha
interrumpido el contacto.
Un abordaje multidimensional del proceso de difusión de las innovaciones está mucho más
limitado en lingüística histórica que para la lengua actual, pues únicamente disponemos de los
textos que el azar o la historia han querido salvar. Con todo, en los últimos años se han desarro-
llado metodologías y corpus que permiten, con ciertas salvedades, sortear los obstáculos.
53
Inés Fernández-Ordóñez
54
Dialectología histórica de la Península Ibérica
español a lo largo de su historia. De entrada, Castilla aparece dividida en dos áreas, occidental y
oriental. A la variedad occidental del castellano pertenecen habitualmente Palencia, Valladolid
y Ávila, y sus rasgos se prolongan con frecuencia por Extremadura y Andalucía occidental. En
la variedad oriental suelen integrarse las tierras alavesas, riojanas, Soria, Guadalajara, Cuenca y
Albacete, a las que se suman, a veces, Murcia y Andalucía oriental. Las provincias situadas en el
eje central, Cantabria, Burgos, Segovia, Toledo y Ciudad Real, basculan entre las dos variedades,
al igual que Córdoba y Málaga oscilan entre la Andalucía occidental y la oriental según el aspecto
considerado. El castellano occidental puede agruparse con los territorios leoneses y el oriental
con los navarros y aragoneses (incluida su prolongación por tierras valencianas). En ocasiones,
la evolución histórica del español medieval al moderno ha privilegiado las soluciones centro-
occidentales, en otras, las centroorientales y, por lo general, esa victoria depende de qué solución
ha conseguido imponerse en el área centromeridional en torno a Madrid y Toledo, avanzadilla
privilegiada para su difusión generalizada en el sur.
55
Inés Fernández-Ordóñez
(Fernández-Ordóñez 2011) y, desde el siglo XV, de encima como adverbio locativo (Octavio de
Toledo 2018a) o de la penetración del cuantificador alguien (Malkiel 1948), que solo se haría
mayoritario frente a alguno mucho después, en el siglo XX (Pato 2009). Quizá también tuvo
un origen centrooccidental la preposición para (Ueda 2015), así como multitud de elementos
léxicos (a modo de ejemplo, yugo: Morala 2016).
56
Dialectología histórica de la Península Ibérica
el área cántabra y del norte de Burgos se distancia nítidamente respecto a Burgos ciudad en
la frecuencia con que manifiesta rasgos orientales (futuro de subjuntivo -ero en 1.ª persona del
singular, síncopa -ertes, -erdes en 2.ª persona del plural) y occidentales (asimilaciones de prepo-
sición y artículo como enna, síncopa -ermos del futuro de subjuntivo en 1.ª persona del plural,
empleo de -u para referentes contables), conformando un área de personalidad propia (Moral
del Hoyo 2019, 2020). Y comparando cómo se manifiestan contornos estructurales en el espa-
cio, ha podido probarse que el adverbio medieval ý funcionó como tal en gallegoportugués,
asturleonés y castellano centrooccidental, pero adquirió propiedades de pronombre adverbial
en el castellano oriental, navarro, aragonés y catalán (Matute Martínez 2016). A partir de la
Edad Moderna, las diferencias de frecuencia hacen posible no solo identificar las áreas focales,
sino a menudo también los grupos sociales que promueven el cambio. Por ejemplo, desde la
segunda mitad del siglo XVI hasta finalizar el siglo XVII la perífrasis deóntica deber de se vio
promovida por los hablantes jóvenes de la mitad septentrional de la Península que no perte-
necían a la cúpula social (Blas Arroyo et al. 2019), y la extensión del tuteo fuera del ámbito
familiar se trasladó desde las clases populares a los jóvenes de clases educadas durante la primera
mitad del siglo XX (Molina Martos 2020).
Conviene no olvidar, por otro lado, que un área adquiere identidad dialectal precisamente por
las soluciones no generalizadas. En ocasiones, tales soluciones se mantuvieron como opciones
poco prestigiosas en la zona. Por ejemplo, es característico del español rural oriental el recurso a
infinitivos reflexivos “conjugados” con sujeto plural (usaban carbón para calentarsen), concordancia
abundantemente documentada desde el siglo XVIII y ya con ejemplos tardomedievales (Pato y
Heap 2012), pero este empleo no ha rebasado las fronteras de Castilla oriental, Navarra y Ara-
gón. Una segunda posibilidad es que podamos documentar el rasgo dialectal solo en un periodo
limitado: así, el patrón de las áreas laterales frente al centro se reproduce en la geografía medieval
del adverbio ensemble, solo conocido en León y Aragón, que se perdió en el siglo XVI sin haber
llegado a difundirse en Castilla (Rodríguez Molina 2012). Un tercer tipo evolutivo, más com-
plejo, es que la solución característica se haya perdido del área originaria que podemos recons-
truir y que, en cambio, se haya preservado en otras zonas a las que se difundió posteriormente.
Por ejemplo, el adverbio asín, propio del área navarroaragonesa en la Edad Media (Rodríguez
Molina 2015), parece haber desaparecido allí, pero está hoy día extrañamente extendido en el
habla rural de toda la mitad meridional de la Península (como el portugués assim). Una cuarta
posibilidad es el cambio de adscripción sociolingüística de la variante geolectal, de forma que en
el área originaria ha perdido prestigio y se conserva restringida, mientras que en las zonas a las
que se difundió ha conseguido alcanzar cierta altura en el empleo social: ese contraste se da, por
ejemplo, entre la Península y Canarias, de un lado, y América, de otro, con las formas concor-
dadas de haber existencial en primera persona (Castillo Lluch y Octavio de Toledo 2016) o entre
el español europeo, de una parte, y Andalucía occidental, Canarias y el Caribe, de otra, con la
anteposición de más a palabras negativas como nada o nunca (Peña Rueda 2022).
57
Inés Fernández-Ordóñez
fuentes documentales, del castellano norteño en la Edad Media (Moral del Hoyo 2019, 2020;
Sánchez González de Herrero et al. 2014), del andaluz oriental en la Edad Moderna (Calderón
Campos 2015, 2019), del castellano del centro peninsular entre la Edad Media y la Moderna
(Sánchez-Prieto 2019; Sánchez-Prieto et al. 2021; Grande López et al. 2017), así como de las
variedades que se hablaban en contacto con el vasco en el siglo XIX (Camus 2015; Gómez
Seibane 2014) y con el catalán entre los siglos XVIII y XIX en Mallorca (Enrique-Arias y
Miguel Franco 2015). Aunque gracias a estos valiosos estudios monográficos es posible abordar
preguntas antes inimaginables, la edificación sólida de una dialectología histórica no será posible
mientras que no tengamos además la posibilidad de comparar, en una red equilibrada y común,
todos los nuevos datos disponibles en distintos cortes cronológicos, en diferentes grupos sociales
de hablantes y en variadas situaciones comunicativas.
La Edad Media, como punto de partida, es quizá la época con más estudios con orien-
tación geolectal, pero no hay que olvidar que las lenguas no cesan de transformarse y que
tenemos que dar respuesta a la génesis histórica de muchas de las áreas dialectales del pre-
sente (véase una síntesis de las del español europeo en Fernández-Ordóñez 2016b). Si bien
la disposición geográfica de algunos rasgos dialectales puede tener un origen medieval, otros
fenómenos, necesariamente tardíos, apuntan a una persistencia areal que quizá debemos
explicar mediante el contacto establecido a través de las vías de comunicación, por mo-
vimientos demográficos posteriores o por cambios en la estima social acaecidos a lo largo
del tiempo. Un ejemplo claro es el área convergente del occidente peninsular —saltando la
frontera política y lingüística entre Extremadura y Andalucía, de un lado, y el centro y sur
de Portugal, de otro— que subyace a la formación del seseo, a finales de la Edad Media,
pero también a la generalización de ustedes como único alocutivo, formal e informal, en el
plural, desde el siglo XVIII en adelante (Fernández-Ordóñez 2011; Lara Bermejo 2018).
Otro cometido no menos importante de la dialectología histórica es descartar la naturaleza
geolectal de las innovaciones y acotar los factores gramaticales, sociales y diafásicos que
explican su recurrencia y, al tiempo, sus dificultades de generalización (De Benito Moreno
2020). Y la dialectología histórica tampoco puede olvidarse de los cambios fallidos o de
las áreas pasajeras, innovaciones que podemos documentar en un territorio, un grupo de
hablantes o un registro diafásico, pero que finalmente no se generalizaron, como el discurso
latinizante, quizá de origen oriental, propio de la lengua elaborada en el siglo XV (Pons
Rodríguez 2015; Lleal 2019), la elisión de la conjunción que en las oraciones completivas,
típica de la lengua coloquial entre los siglos XVI y XVII (Blas Arroyo 2019: cap. 7) o los
demostrativos estotro y esotro, trasmitidos desde el oeste peninsular hacia el occidente de
Castilla y potenciados por la lengua cortesana de la misma época (Octavio de Toledo 2018b).
Nota
1 La exposición que sigue se centra en aquellos trabajos que han abordado la variación lingüística, espe-
cialmente la morfosintáctica, comparando varias áreas de la Península. Los estudios de un área geográfica
concreta sin duda son preciosas teselas del mosaico que, mediante la comparación, ayudan a imaginar
cómo sería la pintura completa, pero la falta de muchas piezas intermedias —geográfica, social y crono-
lógicamente— impide aún extraer de ellos conclusiones generales.
Lecturas recomendadas
Fernández-Ordóñez (2011) expone los problemas generales que afronta la dialectología histórica y
propone causas de naturaleza comunicativa, demográfica e histórica en la constitución de áreas
lingüísticas modernas.
58
Dialectología histórica de la Península Ibérica
Del Barrio de la Rosa (2018) analiza simultáneamente las variables cronológica, geográfica y diafásica
en varios cambios medievales a partir de la comparación de documentos de distinta tipología.
Los trabajos contenidos en Blas Arroyo (2019) prestan particular atención a las dimensiones diastrá-
tica y diafásica del cambio sin perder de vista el factor geográfico.
Bibliografía citada
Almeida, B., R. Díaz Moreno y M.ª C. Fernández López, eds. 2017. “Cansada tendré a vuestra excelen-
cia con tan larga carta”. Estudios sobre aprendizaje y práctica de la escritura por mujeres en el ámbito hispánico
(1500–1900). Lugo: Axac.
Almeida, B., P. Sánchez-Prieto Borja y D. Vázquez Balonga. 2018. “Para una geografía diacrónica:
CODEA+ 2015 como atlas lingüístico dinámico del español”. En Actas del X Congreso Internacional de
Historia de la Lengua Española, eds. M.ª L. Arnal Purroy et al., vol. 2, 1537–1551. Zaragoza: Institución
Fernando el Católico y Diputación de Zaragoza.
ALPI = Navarro Tomás, Tomás, dir. 2016. Atlas Lingüístico de la Península Ibérica, eds. P. García Mouton, I.
Fernández-Ordóñez, D. Heap, M.ª P. Perea, J. Saramago y X. Sousa [en línea]. Madrid: CSIC. www.
[Link].
Blas Arroyo, ed. 2019. Sociolingüística histórica del español. Tras las huellas de la variación y el cambio lingüístico a
través de textos de inmediatez comunicativa. Madrid y Fráncfort: Iberoamericana Vervuert.
Bustos Gisbert, E. y J. Sánchez Méndez, eds. 2019. La configuración histórica de las normas del castellano.
Valencia: Tirant.
Calderón Campos, M. 2015. El español del reino de Granada en sus documentos (1492–1833). Berna: Peter
Lang.
Calderón Campos, M. 2019. “La configuración de la variedad meridional en el reino de Granada”. En La
configuración histórica de las normas del castellano, eds. E. Bustos Gisbert, J. P. Sánchez Méndez y V. Codita,
109–134. Valencia: Tirant lo Blanch.
Calderón Campos, M. y G. Vaamonde. 2020. “Oralia diacrónica del español, un nuevo corpus de la Edad
Moderna”. Scriptum Digital 9: 167–189.
Camus Bergareche, D. 2015. “El castellano del País Vasco en el siglo XIX: las cartas del Archivo Zavala”.
En Actas del IX Congreso Internacional de Historia de la Lengua Española, ed. J. M.ª García Martín, vol. 2,
1777–1790. Madrid y Fráncfort: Iberoamericana Vervuert.
Castillo Lluch, M. 2015. “El orden de palabras en los fueros medievales”. En El orden de palabras en la historia
del español y otras lenguas iberorromances, eds. M. López Izquierdo y M. Castillo Lluch, 279–318. Madrid:
Visor.
Castillo Lluch, M. y E. Díez del Corral, eds. 2019. Reescribiendo la historia de la lengua española a partir de la
edición de documentos. Berna: Peter Lang.
Castillo Lluch, M. y Á. Octavio de Toledo. 2016. “Habemos muchos que hablamos español: distribución e
historia de la concordancia existencial en primera persona del plural”. En En torno a ‘haber’. Construc-
ciones, usos y variación desde el latín hasta la actualidad, eds. C. de Benito Moreno y Á. Octavio de Toledo,
111–168. Berna: Peter Lang.
Catalán, Diego. 1989a. “Hacia un atlas toponímico del diminutivo. -īnu en la toponimia hispano-románica”.
En Las lenguas circunvecinas del castellano, 219–247. Madrid: Paraninfo.
Catalán, Diego. 1989b. “La toponimia del diminutivo y la re-romanización de Hispania”. En Las lenguas
circunvecinas del castellano, 248–253. Madrid: Paraninfo.
De Benito Moreno, C. 2020. “Reflexiones sobre la ‘lengua vulgar dialectal’ y el vulgarismo”. En El legado
de Ramón Menéndez Pidal (1869–1968) a principios del siglo XXI, ed. I. Fernández-Ordóñez, vol. 2,
19–56. Madrid: CSIC.
Del Barrio de la Rosa, F. 2014. “Factores externos y cambio lingüístico: la pérdida de la distinción genérica
de los posesivos del español antiguo”. Revista de Historia de la Lengua Española 9: 3–26.
Del Barrio de la Rosa, F. 2016a. “De haber a tener. La difusión de tener como verbo de posesión en la
historia del español: contextos y focos”. En En torno a ‘haber’. Construcciones, usos y variación desde el
latín hasta la actualidad, eds. C. de Benito Moreno y Á. S. Octavio de Toledo, 239–279. Fráncfort:
Peter Lang.
Del Barrio de la Rosa, F. 2016b. “La distribución de las variantes -mente, -miente y -mientre en el CODEA
(1221–1420): espacio variacional y cambio lingüístico”. Scriptum Digital 5: 85–102.
Del Barrio de la Rosa, F. 2018. Espacio variacional y cambio lingüístico en español. Madrid: Visor.
59
Inés Fernández-Ordóñez
Del Barrio de la Rosa, F. 2021. “Sociodialectología histórica de las desinencias de 2.ª persona plural en el
español peninsular europeo. Transmisión, difusión y divergencia dialectal”. En Variación diatópica y mor-
fosintaxis en la historia del español, eds. B. Garrido Martín, M.ª C. Moral del Hoyo y M. Raab, 221–254.
Santiago de Compostela: Universidade de Santiago de Compostela.
Enrique-Arias, A. 2015. “La metodología de los corpus paralelos aplicada al estudio de fenómenos com-
plejos de variación morfosintáctica. El caso de los posesivos del español medieval”. En Actas del IX
Congreso Internacional de Historia de la Lengua Española, ed. J. M.ª García Martín, vol. 1, 735–750. Madrid
y Fráncfort: Iberoamericana Vervuert.
Enrique-Arias, A. 2018. “Factores diatópicos en la variación entre este y aqueste en la historia del español”.
En Actas del X Congreso Internacional de Historia de la Lengua Española, eds. M.ª L. Arnal Purroy et al., vol.
2, 1553–1569. Zaragoza, España: Instituto Fernando el Católico y Diputación de Zaragoza.
Enrique-Arias, E. y R. Miguel Franco. 2015. “Una nueva herramienta para el estudio del castellano en
contacto con el catalán en Mallorca”. En Temas, problemas y métodos para la edición y el estudio de documen-
tos hispánicos antiguos, eds. J. Sánchez Méndez y M. de la Torre, 407–434. Valencia: Tirant lo Blanch.
Fernández-Ordóñez, I. 2001. “Hacia una dialectología histórica. Reflexiones sobre la historia del leísmo,
el laísmo y el loísmo”. Boletín de la Real Academia Española 81: 389–464.
Fernández-Ordóñez, I. 2006. “La historiografía medieval como fuente de datos lingüísticos. Tradiciones
consolidadas y rupturas necesarias”. En Actas del VI Congreso Internacional de Historia de la Lengua Espa-
ñola, eds. J. J. de Bustos Tovar y J. L. Girón Alconchel, vol. 2, 1779–1807. Madrid: Arco Libros.
Fernández-Ordóñez, I. 2006–2007. “Del Cantábrico a Toledo. El ‘neutro de materia’ hispánico en un
contexto románico y tipológico”. Revista de Historia de la Lengua Española 1: 67–118 y 2: 29–81.
Fernández-Ordóñez, I. 2009. “Los orígenes de la dialectología hispánica y Ramón Menéndez Pidal”. En
Cien años de filoloxía asturiana (1906–2006), ed. X. Viejo Fernández, 11–41. Oviedo: Alvízoras y Trabe.
Fernández-Ordóñez, I. 2011. La lengua de Castilla y la formación del español. Madrid: Real Academia
Española.
Fernández-Ordóñez, I. 2012. “El norte peninsular y su papel en la historia de la lengua española”. En
Estudios sobre tiempo y espacio en el español norteño, eds. S. Gómez Seibane y C. Sinner, 23–68. San Millán
de la Cogolla (La Rioja): CILENGUA.
Fernández-Ordóñez, I. 2016a. “De más (demás), demasiado: la historia de dos cuantificadores contemplada
desde la dialectología”. En El español a través del tiempo. Estudios ofrecidos a Rafael Cano Aguilar, eds. A.
López Serena, A. Narbona y S. del Rey, 477–496. Sevilla: Universidad de Sevilla.
Fernández-Ordóñez, I. 2016b. “Dialectos del español peninsular”. En Enciclopedia lingüística hispánica, ed. J.
Gutiérrez Rexach, vol. 2, 387–404. Londres y Nueva York: Routledge.
Garachana, M. 2014. “Gramática e historia textual en la evolución de los marcadores discursivos: el caso de
no obstante”. RILCE 30: 959–984.
Gómez Seibane, S. 2014. “Cambios indirectos inducidos por contacto en el castellano del País Vasco del
siglo XIX”. En La historia del español hoy. Estudios y perspectivas, eds. J. L Ramírez Luego y E. P. Velásquez
Upegui, 97–111. Lugo: Axac.
Gomila Albal, M. 2016. “Sobre el origen y la difusión geográfica de las formas nosotros y vosotros en caste-
llano”. Iberorromania 83: 103–125.
Gomila Albal, M. 2018. “Variación diacrónica y diatópica de con + pronombre personal de 1.ª y 2.ª persona
del plural”. Bulletin of Hispanic Studies 95: 801–823.
Gomila Albal, M. 2021. “Variación y cambio de los pronombres personales nós y vós junto con los modifi-
cadores otros, todos, mismos y ambos”. En Variación diatópica y morfosintaxis en la historia del español, eds. B.
Garrido Martín, M.ª C. Moral del Hoyo y M. Raab, 95–112. Santiago de Compostela: Universidade
de Santiago de Compostela.
Grande López, C., L. Martín Aizpuru, M.ª N. Sánchez González de Herrero, R. Sánchez Romo y V. J.
Marcet Rodríguez. 2017. “La documentación medieval del sur de Ávila y la variación interna del espa-
ñol: el corpus CODOMSA”. Scriptum Digital 6: 155–174.
Horcajada Diezma, B. y P. Sánchez-Prieto Borja. 1999. “La reduplicación distributiva del numeral y el
arabismo morfosintáctico en el romance hispánico medieval”. Zeitschrift für Romanische Philologie 115:
280–299.
Lara Bermejo, V. 2018. La cortesía en la Península Ibérica. Dialectología del “Sprachbund” suroccidental. Berna:
Peter Lang.
Lleal, C. 2019. “De transferencias, préstamos e intercambios en la norma medieval: el catalán en la confi-
guración del castellano”. En La configuración histórica de las normas del castellano, eds. V. Codita, E. Bustos
Gisbert y J. P. Sánchez Méndez, 293–314. Valencia: Tirant lo Blanch.
60
Dialectología histórica de la Península Ibérica
Malkiel, Y. 1948. Hispanic Algu(i)en and Related Formations. A Study of the Stratification of the Romance Lexicon
in the Iberian Peninsula. Berkeley y Los Ángeles: University of California Press.
Matute Martínez, C. 2004. Los sistemas pronominales en español antiguo. Problemas y métodos para una reconstruc-
ción histórica. Madrid: Universidad Autónoma de Madrid.
Matute Martínez, C. 2016. “Entre pronombres y adverbios: mecanismos de cambio en la historia dialectal
peninsular de ý/hi < IBI”. Boletín de la Real Academia Española 96: 201–237.
Menéndez Pidal, Ramón. 1980 [1926]. Orígenes del español. Estado lingüístico de la Península Ibérica hasta el
siglo XI. 3ª ed. Madrid: Espasa-Calpe.
Molina Martos, I. 2020. “Linguistic Change and Social Transformation”. En Address in Portuguese and Spa-
nish, eds. M. Hummel and C. dos Santos Lopes, 443–478. Berlín y Boston: De Gruyter.
Morala, J. R. 2016. “Lexicografía dialectal histórica y evolución etimológica: el caso de yugo”. Revista de
Historia de la Lengua Española 11: 131–153.
Morala, J. R. 2018. “Variación diatópica y etimología en léxico del Siglo de Oro”. En Actas del X Congreso
Internacional de Historia de la Lengua Española, eds. M.ª L. Arnal Purroy et al., vol. 1, 215–238. Zaragoza:
Institución Fernando el Católico y Diputación de Zaragoza.
Moral del Hoyo, M.ª C. 2016. “El castellano en los orígenes del cambio gramatical: el pretérito imperfecto
de la 2.ª y 3.ª conjugación (-ié- / -ía)”. En Lingüística de corpus y lingüística histórica iberorrománica, eds. J.
Kabatek y C. de Benito Moreno, 322–357. Berlín y Boston: Mouton de Gruyter.
Moral del Hoyo, M.ª C. 2019. “Volver (y revolver) a los orígenes del castellano: El Corpus Histórico del
Español Norteño (CORHEN)”. En Reescribiendo la historia de la lengua española a partir de la edición de
documentos, eds. M. Castillo Lluch y E. Díez del Corral, 361–389. Berna: Peter Lang.
Moral del Hoyo, M.ª C. 2020. “(Dis)continuidad y vocal final -u en castellano de Orígenes (y de orígenes)
al siglo XIII”. En El legado de Ramón Menéndez Pidal (1869–1968) a principios del siglo XXI, ed. I.
Fernández-Ordóñez, vol. 1, 293–329. Madrid: CSIC.
Octavio de Toledo, Á. 2011. “Santa Teresa y la mano visible: sobre las variantes sintácticas del Camino de
perfección”. En “Así se van las lenguas variando”. Nuevas tendencias en la investigación del cambio lingüístico en
español, eds. M. Castillo Lluch y L. Pons Rodríguez, 241–304. Berna: Peter Lang.
Octavio de Toledo, Á. 2016. Los relacionantes locativos en la historia del español. Berlín y Boston: De Gruyter.
Octavio de Toledo, Á. 2017a. “Tres siglos de variantes: el cambio morfosintáctico en el prisma de la Historia
de la poncella de Francia”. Revista Internacional de Lingüística Iberoamericana (RILI) 29: 43–145.
Octavio de Toledo, Á. 2017b. “El pretérito perfecto de subjuntivo en la Edad Media: distribución dialectal,
entornos sintácticos y tradicionalidad discursiva”. Moenia 23: 317–366.
Octavio de Toledo, Á. 2018a. “Orónimos dialectales y morfosintaxis histórica: el método pidaliano y las
formaciones adverbiales con cima y somo”. Boletín de la Real Academia Española 98: 267–313.
Octavio de Toledo, Á. 2018b. “De un occidentalismo cortesano y una transfusión fallida: historia de es(t)otro”.
Estudios de Lingüística del Español 39: 305–361.
Octavio de Toledo, Á. 2021. “Why Spanish Historical Morphosyntax (Badly) Needs Dialectology”. Dia-
lectologia 26: 97–126.
Octavio de Toledo, Á. y L. Pons Rodríguez. 2016. Queja política y escritura epistolar durante la Guerra de Inde-
pendencia: documentación de la Junta Suprema Central en el AHN. Alcalá de Henares: Universidad de Alcalá.
Pato, E. 2009. “Notas aclaratorias sobre la historia del indefinido alguien: una aplicación directa del uso de
corpus diacrónicos”. En Diacronía de las lenguas iberorrománicas: nuevas aportaciones desde la lingüística de
corpus, ed. A. Enrique-Arias, 401–416. Madrid y Fráncfurt: Iberoamericana Vervuert.
Pato, E. y D. Heap. 2012. “Plurales anómalos en los dialectos y en la historia del español”. En Actas del
VIII Congreso Internacional de Historia de la Lengua Española, ed. E. Montero Cartelle, vol. 1, 829–840.
Madrid: Arco Libros.
Peña Rueda, C. 2022. Fenómenos de orden de palabras en el español rural de Canarias. El ascenso del cuantificador
más en las superlativas complejas y en las construcciones aditivo-negativas. Tesis doctoral. Lausana: Université
de Lausanne.
Pons Rodríguez, L. 2015. “La lengua del Cuatrocientos más allá de las Trescientas”. En Actas del IX Congreso
Internacional de Historia de la Lengua Española, ed. J. M.ª García Martín, 393–430. Madrid y Fráncfort:
Iberoamericana y Vervuert.
Post Scriptum = Centro de Lingüística da Universidade de Lisboa, ed. 2014. P. S. Post Scriptum. Arquivo
Digital de Escrita Quotidiana em Portugal e Espanha na Época Moderna [en línea: julio de 2021]. http://
[Link].
Rodríguez Molina, J. 2010. La gramaticalización de los tiempos compuestos en español antiguo: cinco cambios dia-
crónicos. Tesis doctoral. Madrid: Universidad Autónoma de Madrid.
61
Inés Fernández-Ordóñez
Rodríguez Molina, J. 2012. “Variantes léxicas y gramaticales del adverbio ensemble en la documentación
medieval”. Cuadernos del Instituto Historia de la Lengua 7: 405–424.
Rodríguez Molina, J. 2015. “Variantes morfofonéticas del adverbio así en español medieval”. En Actas del
IX Congreso Internacional de Historia de la Lengua Española, ed. J. M.ª García Martín, vol. 1, 1049–1064.
Madrid y Fráncfort: Iberoamericana Vervuert.
Rodríguez Molina, J. y Á. Octavio de Toledo. 2017. “La imprescindible distinción entre texto y testimo-
nio: el CORDE y los criterios de fiabilidad lingüística”. Scriptum Digital 6: 5–68.
Romero Cambrón, Á. 2009. “Sobre el origen de los posesivos tuyo y suyo”. Cahiers d’Études Hispaniques
Médiévales 32: 83–100.
Romero Cambrón, Á. 2016. “La expansión del posesivo pospuesto a la luz de documentación navarra (y
aragonesa) del siglo XIII”. SCRIPTA. Revista Internacional de Literatura i Cultura Medieval i Moderna 7:
1–20.
Rosemeyer, M. 2021. “Variación diatópica en la evolución del pluscuamperfecto sintético”. En Variación
diatópica y morfosintaxis en la historia del español, eds. B. Garrido Martín, M.ª C. Moral del Hoyo y M.
Raab, 195–220. Santiago de Compostela: Universidade de Santiago de Compostela.
Sánchez Gonzalez de Herrero, M.ª N., et al., eds. 2014. Textos para la historia del español IX: documentos
medievales de Miranda de Ebro. Alcalá de Henares: Universidad de Alcalá.
Sánchez Méndez, J. y M. de la Torre, eds. 2015. Temas, problemas y métodos para la edición y el estudio de docu-
mentos hispánicos antiguos. Valencia: Tirant lo Blanch.
Sánchez-Prieto Borja, P. 2019. “La llamada norma toledana a la luz de las fuentes documentales”. En La
configuración histórica de las normas del castellano, eds. E. Bustos Gisbert y J. Sánchez Méndez, 19–49.
Valencia: Tirant lo Blanch.
Sánchez-Prieto Borja, P., M.ª J. Torrens Álvarez y D. Vázquez Balonga, eds. 2021. La lengua de Madrid a lo
largo del tiempo. Sevilla: Universidad de Sevilla.
Sánchez-Prieto Borja, P. y D. Vázquez Balonga. 2018. “Toledo frente a Madrid en la conformación del
español moderno: el sistema pronominal átono”. Revista de Filología Española 98: 185–215.
Tabernero Sala, C. 2020. “Contribución al estudio del español norteño a partir de un corpus de declara-
ciones en procesos judiciales (siglos XVI-XIX)”. Scriptum Digital 9: 87–115.
Tomás Faci, G. 2020. El aragonés medieval. Lengua y estado en el reino de Aragón. Zaragoza: Universidad de
Zaragoza.
Tuten, D. N. 2003. Koineization in Medieval Spanish. Berlín y NuevaYork: De Gruyter.
Ueda, H. 2015. “Frecuencia contrastiva, frecuencia ponderada y método de concentración. Aplicación
al estudio de las dos formas prepositivas del español medieval, pora y para”. En Actas del IX Congreso
Internacional de Historia de la Lengua Española, ed. J. M.ª García Martín, vol. 1, 1139–1155. Madrid y
Fráncfort: Iberoamericana Vervuert.
62
6
Sociolingüística histórica
panhispánica
(Historical sociolinguistics in
a pan-Hispanic perspective)
José Luis Blas Arroyo
1. Introducción
Este capítulo aborda cuestiones relacionadas con el estudio de la diacronía del español desde
la perspectiva de la sociolingüística histórica. Tras exponer algunos principios teóricos de la
disciplina, se plantean cuestiones metodológicas como el grado de representatividad y exhaus-
tividad de los corpus más aptos para el acercamiento al habla vernácula, y se examina la inci-
dencia de diversos factores extralingüísticos atestiguados en la historia del español. Asimismo,
se plantean desafíos para una disciplina todavía incipiente en el estudio de la lengua española,
como el problema de la difusión de los cambios, la posibilidad de combinar las perspectivas
del tiempo real y el tiempo aparente, el papel de los individuos o un mayor rigor en el análisis
cuantitativo.
Palabras clave: sociolingüística histórica; variación y cambio lingüístico; factores externos;
inmediatez comunicativa; corpus diacrónicos
This chapter examines some relevant issues concerning the study of Spanish from the perspec-
tive of Historical sociolinguistics. After discussing some theoretical principles underlying the
analysis of language variation and change, some methodological questions are raised, such as
the degree of representativeness and exhaustiveness of the corpora that are more appropriate
for approaching the vernacular of past times. Some contributions are then summarized on
how several extralinguistic factors have conditioned various changes in the past. The chapter
concludes with an overiew of some of the challenges that lie ahead in the development of this
discipline, such as the problem of the transition of changes, the possibility of combining the
perspectives of both real and apparent time, the role of individuals in the diffusion of change,
and the need for greater rigour in the methods of quantitative analysis.
Keywords: historical sociolinguistics; language variation and change; external factors; commu-
nicative immediacy; diachronic corpora
DOI: 10.4324/9781003035565-8 63
José Luis Blas Arroyo
64
Sociolingüística histórica panhispánica
Sin embargo, los avances realizados en las últimas décadas han permitido a Nevalainen y
Raumolin-Brunberg (2003, 26) afirmar que lo que define a la sociolingüística histórica es,
más bien, “[to] make the best use of the data available”. Ciertamente, entre las características
metodológicas de esta disciplina están la ausencia de cualquier “paradoja del observador” (Labov
1994) o la posibilidad de emprender estudios en tiempo real con toda la profundidad temporal
que se quiera, frente a la (casi) obligada remisión a la hipótesis del tiempo aparente en la socio-
lingüística contemporánea. Por otro lado, los problemas de representatividad y exhaustividad
de los datos han podido mitigarse en los últimos tiempos mediante el recurso a grandes corpus
digitales. A este respecto, destacan iniciativas como la Biblioteca Virtual Miguel de Cervantes o
macrocorpus como CORDE y CE (cap. 2), si bien la utilidad de estas enormes bases de datos
textuales para el estudio sociolingüístico puede verse limitada, ya que los documentos compi-
lados son mayoritariamente de naturaleza formal y la información extralingüística que ofrecen
acerca de los escritores es escasa (Conde Silvestre 2007, 51–52). Afortunadamente, estos pro-
blemas se han venido paliando en los últimos años mediante la creación de un número cada vez
mayor de corpus de diversa índole y extensión que incluyen textos representativos de diferentes
tradiciones discursivas. Por mencionar aquí solo uno de ellos,1 el CODEA permite analizar la
variación según una escala registral que distingue entre los textos más formales, asociados a los
ámbitos de emisión cancillerescos y jurídicos, hasta los más espontáneos, como la documenta-
ción escrita por particulares, pasando por otros ámbitos intermedios (municipales y eclesiásticos).
En la práctica, se han comprobado algunas diferencias significativas acerca de la difusión de
ciertos fenómenos de variación y cambio lingüístico al comparar los testimonios basados en
géneros discursivos formales y los que atienden a tradiciones textuales más próximas al polo de
la inmediatez comunicativa (Oesterreicher 2005) (cap. 7). Entre estas destacan, por ejemplo,
las declaraciones de testigos, las crónicas y relaciones de conquista, las actas capitulares, los
diarios y memorias, etc. y, en especial, la correspondencia privada (Fernández Alcaide 2009;
Calderón Campos 2018; Blas Arroyo el al. 2019), sobre todo la escrita por semicultos. Por
fortuna, el contexto hispánico ha sido especialmente fértil en esta clase de textos, ya que la
colonización de América produjo un número ingente de cartas remitidas desde uno y otro
lado del Atlántico.
En los últimos tiempos contamos con una representación creciente de ediciones
filológicamente rigurosas de estos materiales. Las transcripciones a cargo de especialistas de otras
disciplinas pueden resultar también provechosas, siempre que respeten la literalidad de los textos,
con modificaciones mínimas, si acaso, en apartados como la puntuación o la acentuación para
facilitar la lectura al lector contemporáneo. Ciertamente, estas modernizaciones pueden dificultar
el estudio de la variación fónica o gráfica, pero no así el análisis de otro tipo de fenómenos,
como los que tienen lugar en la morfosintaxis o en el plano discursivo. Por otro lado, las cartas
autógrafas u hológrafas son más fiables que las dictadas, especialmente numerosas en periodos
en los que la alfabetización y la escritura estuvieron mucho más restringidas socialmente. Con
todo, algunos estudios recientes han señalado que el papel de escribanos y pendolistas pudo ser
mucho más determinante en el plano gráfico-fónico que en otros niveles, como el gramatical
(Bergs 2005; Blas Arroyo 2016).
3. Desarrollos actuales
Aunque el análisis de los condicionantes lingüísticos figura también como una tarea esencial de
la sociolingüística histórica, el objetivo primordial de esta es explicar cómo se han difundido
socialmente la variación y el cambio a lo largo de la historia. En lo que sigue repasamos
algunos resultados obtenidos en torno a esta premisa en el estudio del español. Aunque las
65
José Luis Blas Arroyo
investigaciones realizadas no siguen siempre los mismos principios y métodos de análisis y, por
tanto, sus resultados pueden no ser exactamente comparables en ocasiones, en todos ellos se
advierte una misma preocupación por las implicaciones sociales en la evolución de la lengua (cf.
también el cap. 5).
66
Sociolingüística histórica panhispánica
en las terminaciones del imperfecto de subjuntivo, los “advenedizos” se mantenían mucho más
fieles a la variante tradicional (-se), un comportamiento que este autor interpreta como un caso
de hipercorrección por parte de unas gentes especialmente concernidas por la promoción social.
Por su parte, Blas Arroyo et al. (2019) han advertido un caso similar en el freno a la inserción del
artículo en las relativas oblicuas (la casa en la que) y, por tanto, el regreso a la variante tradicional
(la casa en que) por parte de las élites sociales españolas del siglo XVIII. Con ello, estos grupos
privilegiados exhibían su resistencia ante el impulso de una nueva variante, que, pese a todo,
vendría a imponerse con el tiempo, aunque en absoluto de manera definitiva, como demuestra
la variación todavía hoy existente.
67
José Luis Blas Arroyo
norte traían consigo otro en el que la oposición de sonoridad estaba ya neutralizada, lo que bien
pudo funcionar como modelo para la simplificación.
La koiné madrileña habría afectado también a la morfosintaxis, por ejemplo, en la reestruc-
turación parcial del sistema de clíticos. Los usos sancionados hoy por la normativa (‘A Pedro
le vimos el jueves’, ‘El libro lo guardo en la estantería’) se habrían extendido desde el crisol
madrileño como una solución de compromiso (interdialectalismo) ente el sistema etimológico
(‘A Pedro lo vimos el jueves’, ‘El libro lo guardo en la estantería’) y otro que utilizaba sistemáti-
camente el pronombre le(s) para todos los complementos contables (‘A Pedro le vimos el jueves’,
‘El libro le guardo en la estantería’). En opinión de Penny (2004), este sistema híbrido vendría a
sustituir a los fenómenos generalizados de leísmo y laísmo con esta clase de objetos, que llegaron
a ser dominantes en las variedades escritas castellanas del Siglo de Oro, y que aún hoy persisten
en numerosas variedades castellanas.
Otra etapa decisiva en la koineización del castellano fue la que tuvo lugar en América en
paralelo al proceso de colonización. Autores como Fontanella de Weinberg (1996) o Granda
(1994), entre otros, consideran que, durante las primeras décadas posteriores a la conquista, se
creó en el continente americano una koiné que más tarde se diversificaría regionalmente. En
esa koiné original habrían triunfado diversos fenómenos de simplificación en los que adquirió
un protagonismo destacado la variedad andaluza, la minoría lingüística más importante en ese
momento. Ello explica la presencia sistemática en el español americano de fenómenos como el
seseo, ausente, sin embargo, en las variedades norteñas y toledana del castellano. Por otro lado,
la llegada de otros contingentes andaluces (especialmente, sevillanos) al Caribe hispánico y a las
tierras bajas americanas pudo favorecer posteriormente otros procesos de rekoineización y la
introducción de fenómenos como la aspiración de /-s/ o la neutralización de /r/ y /1/, entre
otros. A juicio de Parodi (2001), el hecho de que estos fenómenos no hubieran formado parte
de la koiné original pudo deberse a razones de prestigio sociolingüístico, pues eran rasgos que ya
estaban presentes en el andaluz desde el siglo XV (Frago Gracia 1993).
68
Sociolingüística histórica panhispánica
mayor entre los hombres que entre las mujeres. Por ejemplo, la correspondencia privada de una
mujer bonaerense de comienzos del XIX (Romana J. López de Anaya) presentaba abundantes
ejemplos de confusiones yeístas. Sin embargo, en las cartas de sus hijos, esas confusiones resulta-
ban mucho más ocasionales. En su estudio sobre la adversatividad en la Celestina, Dietrick (1992)
observa también que los personajes masculinos siguen las tendencias favorables de la época a la
extensión del enlace pero en detrimento del más tradicional mas. Asimismo, comprueba que los
personajes femeninos retienen el empleo aditivo de sino, en vías de desaparición ya a finales del
siglo XV.
Ahora bien, como recuerda Conde Silvestre (2007), esta disociación del comportamiento de
las mujeres en la propagación de los cambios desde arriba en situaciones históricas pasadas no se
puede generalizar, ya que no faltan ejemplos de lo contrario. Así, Martínez (2001) ha advertido
que, a comienzos del siglo XIX, en los territorios meridionales del actual estado de Texas, las
mujeres utilizaban mucho más frecuentemente que los hombres la variante por entonces más
prestigiosa entre las terminaciones del imperfecto de subjuntivo (-se). Por su parte, Blas Arroyo
y Velando Casanova (2022) han comprobado que, durante la primera mitad del siglo XVII, el
impulso a las variantes preposicionales frente a las tradicionales queístas en subordinadas comple-
tivas dependientes de sustantivos y adjetivos (‘estoy seguro de que’ vs. ‘estoy seguro que’) ofrece
un perfil de cambio desde arriba, impulsado por las clases dominantes, y en el que las mujeres
parece que tuvieron también un protagonismo destacado. De hecho, en ese estudio, un cruce
entre ambos factores revela que, con independencia del estatus social, en todos los grupos las
mujeres aventajan a los hombres en las inserciones preposicionales.
Dadas las dificultades reseñadas para el análisis cuantitativo, otros estudios han optado por
una aproximación más cualitativa a las diferencias generolectales. Así, en su análisis sobre diversa
documentación indiana, García Mouton (1996–1997) advierte indicios que singularizan a las
mujeres en la afectividad de los vocativos, la presencia de diminutivos, el uso de refranes y fór-
mulas coloquiales, etc. Por su parte, Enrique-Arias (2006) comenta diversos usos vernáculos
derivados del contacto entre el español y el catalán en la correspondencia privada de una aristó-
crata mallorquina (Cecilia de Zaforteza) a mediados del siglo XVIII.
69
José Luis Blas Arroyo
aparecen también más a menudo en los contextos formales. Pountain (1998), por ejemplo, ha
mostrado que las diferencias de registro suponen un factor persistente en la posición del adjetivo
calificativo a lo largo de la historia del español: la anteposición se asocia fuertemente en todas las
épocas con los registros más formales, mientras que se halla prácticamente ausente en el habla
más espontánea. Del Barrio de la Rosa (2017), por su parte, ha señalado que el adverbio medie-
val ansí (frente a así) tuvo especial fortuna en un periodo situado a caballo entre los siglos XVI
y XVII, como consecuencia de su empleo sistemático en documentos judiciales. Con todo, el
ejemplo de ansí demuestra también cómo el sino de una misma variante puede cambiar con el
paso del tiempo, aunque su estigmatización, debida a un progresivo arrinconamiento dialectal,
habría de esperar todavía al siglo XVIII. En ese mismo trabajo se muestra también cómo los
ámbitos de uso más formales pueden frenar la expansión de las innovaciones, incluso de aquellas
que acaban triunfando. Así ocurre en el XVI con la expansión de tener para la posesión léxica
en detrimento del tradicional haber, un verbo que, pese a todo, abunda todavía en gramáticas y
tratados hasta 1625, así como en los textos judiciales.
Ahora bien, no siempre un mismo tipo de texto se corresponde con un estilo determinado.
De hecho, algunos encierran en su seno ejemplos de variación estilística dignos de estudio.
Pountain (2006), por ejemplo, utiliza el concepto de registro para dar cuenta de las variaciones
situacionales que presentan textos literarios como el Corbacho, cuyo autor muestra una especial
sensibilidad hacia el contínuum socioestilístico. Por su parte, Martínez (2000) analiza la variación
sociolingüística en función del interlocutor al que van dirigidos los textos (audience design) en
su estudio sobre el uso de ciertas construcciones sintácticas complejas en textos decimonónicos
del sur de Texas, como las construcciones gerundivas absolutas. De los resultados de esa inves-
tigación se desprende que los relatos e informes dirigidos a una audiencia general utilizaban
esta construcción mucho más que los textos dirigidos a interlocutores particulares. En parecido
sentido, la distinción entre cartas dirigidas a destinatarios unidos al remitente por estrechos
lazos familiares y de solidaridad, por un lado, y la correspondencia menos personal, por otro, se
ha revelado significativa en diversos fenómenos de variación estudiados por Blas Arroyo et al.
(2019).
70
Sociolingüística histórica panhispánica
uruguayos del siglo XIX en los que se aprecia un vuelco brusco (favorable a -ra) en las ocurrencias
de cada forma en un lapso temporal de apenas 60–70 años. Por su parte, Blas Arroyo y Velando
Casanova (2019) han comprobado que la sustitución del relativo quien para antecedentes plurales
por el analógico quienes (‘mis primos, a quien/quienes vimos’) experimentó también un cambio
abrupto en apenas unas décadas (1661–1740: 60 %) con respecto al periodo inmediatamente
anterior (1581–1660: 13 %). El estudio sobre la dirección y el grado de difusión histórica de los
cambios es, pues, una línea de investigación en la que queda todavía un largo camino por recorrer.
Al mismo tiempo, son necesarios estudios que analicen no solo cómo evolucionan las
frecuencias de uso de las variantes en cada periodo, sino también los cambios experimen-
tados tanto en la gramática interna como en el eje socioestilístico durante esas etapas.
Mediante la adopción de una perspectiva comparatista, Blas Arroyo et al. (2019) han estu-
diado esa cuestión a propósito de diversos fenómenos de variación sintáctica en textos cer-
canos al polo de la inmediatez comunicativa a lo largo de casi cinco siglos. De estos análisis
se desprende que, junto a no pocos patrones de persistencia, que revelan el mantenimiento
de idénticos condicionantes a lo largo de la historia —con independencia de las fluctua-
ciones frecuenciales—, otros exhiben un claro debilitamiento e, incluso, su neutralización
con el paso del tiempo.
Otro ámbito que merece una mayor atención en el futuro es la posibilidad de realizar
investigaciones en tiempo aparente, al modo en que la sociolingüística contemporánea aborda
mayoritariamente el estudio del cambio lingüístico. Ciertamente, se trata de una tarea difícil,
por la previsible falta de información acerca de la edad precisa de muchos informantes en
el momento de escribir sus textos. Sin embargo, cuando esa información está disponible, el
contraste entre diferentes generaciones puede arrojar resultados sugestivos. En combinación
con los datos del tiempo real, en los que se basa generalmente la sociolingüística histórica,
esta comparación podría desentrañar, por ejemplo, el carácter generacional o comunitario
de algunos cambios (Labov 2001), así como otros desenlaces genolectales como el age gra-
ding, esto es, la repetición de los mismos patrones de variación en los mismos grupos de edad
generación tras generación.
Del mismo modo, nuevas líneas de investigación deberían animar al estudio acerca del papel
que los individuos desempeñan en la difusión de los cambios y el modo en que ese papel puede
variar con el paso del tiempo. Frente a la teoría que sostiene que, al menos en los niveles más
profundos del análisis, el repertorio verbal se fosiliza en el tránsito entre la juventud y la primera
edad adulta, algunas investigaciones recientes han demostrado que ciertos individuos cambian
sus usos lingüísticos a lo largo de la vida (Blas Arroyo 2022). Asimismo, cobra interés determinar
el carácter conservador, contemporizador o innovador de esos individuos en relación con los
cambios en marcha con los que conviven.
Finalmente, el estado actual de la disciplina pone de manifiesto también la necesidad de pro-
fundizar en el aparato metodológico de las investigaciones. Aunque, como hemos visto, se ha
avanzado mucho en el problema de la representatividad de los corpus, todavía son necesarias
bases de datos extensas, que faciliten muestras de habla suficientes de ciertos grupos tradicional-
mente mal representados (como las mujeres), así como de variables lingüísticas lastradas por una
escasa recurrencia en el discurso. Al mismo tiempo, es necesaria la comparación entre géneros
y tradiciones discursivas diferentes, así como entre situaciones comunicativas distintas dentro de
un mismo género. Es también una asignatura pendiente la sofisticación de los análisis cuantita-
tivos, hasta tiempos muy recientes limitada a una estadística meramente descriptiva, en la que
no se consideraban las posibles relaciones de interacción o dependencia entre factores distintos.
Igualmente, en el análisis riguroso de la variación se echa en falta la consideración del llamado
principio de responsabilidad ante los datos (accountability) (Labov 1994), esto es, la atención a
71
José Luis Blas Arroyo
todas las variantes potencialmente alternantes en un mismo hueco funcional, y no solo a aquella
sobre la que se pone el foco.
Ni que decir tiene, por último, que la atención a otros aspectos sociolingüísticos, como los
apuntados al comienzo de estas páginas (actitudes lingüísticas, procesos de estandarización, etc.)
es necesaria también para completar un panorama que en este breve capítulo tan solo hemos
podido describir de manera (muy) parcial.
Nota
1 Para un resumen de otros corpus, editados conforme a normas filológicas rigurosas y distribuidos por
muy diferentes regiones, véase Calderón Campos (2018).
Lecturas recomendadas
Conde Silvestre (2007) es un excelente manual introductorio en el que se repasan las principales
cuestiones relacionadas con el análisis sociolingüístico de la variación y el cambio lingüístico
aplicado a textos antiguos. Aunque buena parte de las ejemplificaciones están referidas al inglés,
contiene también abundante información sobre el español.
Hernández-Campoy y Conde Silvestre (2012) es un manual de referencia internacional, en el que
participan destacados especialistas en las principales cuestiones teóricas y metodológicas rela-
cionadas con la sociolingüística histórica. Aunque atiende también principalmente al inglés, la
calidad y profundidad de sus contribuciones convierten sus estados de la cuestión en sumamente
útiles.
Blas Arroyo et al. (2019) reúne diversos estudios de sociolingüística variacionista centrados en fenó-
menos de variación sintáctica de los siglos XVI–XX, a partir de un corpus de textos cercanos a la
inmediatez comunicativa, fundamentalmente correspondencia privada. El uso de una metodolo-
gía comparativa permite analizar no solo las frecuencias de uso de las variantes en cada periodo,
sino también la evolución de la gramática interna de cada fenómeno y de sus condicionantes
socioestilísticos.
Bibliografía citada
Bergs, A. 2005. Social Network Analysis and Historical Sociolinguistics. Berlín: De Gruyter.
Blake, R. 1988. “Sound Change and Linguistic Residue: The Case of (f –) > (h –) > /(o)/”. En George-
town University Round Table on Languages and Linguistics, ed. T. Walsh, 53–62. Georgetown: Georgetown
University Press.
Blas Arroyo, J. L. 2016. “The Rise and Fall of a Change from Below in the Spanish Syntax of the Golden
Age Period: deber & deber de + Infinitive in Communicative Immediacy Texts”. Journal of Historical
Linguistics 6: 1–31.
Blas Arroyo, J. L. 2022. “Patterns of Individual Variation and Change in Golden Age Spanish. Analysis of
Three Linguistic Variables in a Private Correspondence Corpus”. Folia Linguistica Historica 43 [en línea].
[Link]
Blas Arroyo, J. L., M. Porcar, M. Velando y J. Vellón. 2019. Sociolingüística histórica del español. Tras las huellas
de la variación y el cambio lingüístico a través de textos de inmediatez comunicativa. Madrid y Fráncfort: Ibe-
roamericana Vervuert.
Blas Arroyo, J. L. y M. Velando Casanova. 2019. “Auge y caída de una forma moribunda: la evolu-
ción del relativo quien con antecedente plural en la historia del español”. Studia Neophilologica 91:
355–382.
Blas Arroyo, J. L. y M. Velando Casanova. 2022. El queísmo en la historia. Variación y cambio lingüístico en el
régimen preposicional del español (siglos XVI–XXI). Berlín: De Gruyter.
Calderón Campos, M. 2018. “Muestras de oralidad en el corpus diacrónico del español del Reino de Gra-
nada (siglo XVIII)”. Oralia 17: 117–145.
72
Sociolingüística histórica panhispánica
Cano Aguilar, R. 2005. “Cambios en la fonología del español durante los siglos XVI y XVII”. En Historia
de la lengua española, ed. R. Cano. 2ª ed., 825–857. Barcelona: Ariel.
Conde Silvestre, J. C. 2007. Sociolingüística histórica. Madrid: Gredos.
Del Barrio de la Rosa, F. 2017. “Piezas léxicas y variación morfosintáctica en la historia del español. Tres
casos en el español de los Siglos de Oro (1581–1620)”. En Palabras Vocabulario Léxico. La lexicología
aplicada a la didáctica y a la diacronía, ed. F. del Barrio de la Rosa, 251–266. Venecia: Edizioni Ca’
Foscari.
Dietrick, D. 1992. “Estudio sociolingüístico de la adversatividad en La Celestina”. En Actas del II Congreso
Internacional de Historia de la Lengua Española, ed. M. Ariza, R. Cano, J. M.ª Mendoza y A. Narbona,
359–371. Madrid: Pabellón de España.
Enrique-Arias, A. 2006. “Spanish/Catalan Contact in Historical Perspective: 18th Century Documents
from Majorca”. En New Perspectives in Iberian Dialectology/Nouvelles perspectives en dialectologie ibérique,
eds. D. Heap, E. Pato y C. Gurski. London (Canadá): University of Western Ontario. [Link]/
linguistics/methodsxii.
Fernández Alcaide, Marta. 2009. Cartas de particulares en Indias del siglo XVI: edición y estudio discursivo.
Madrid y Fráncfort: Iberoamericana Vervuert.
Fernández-Ordóñez, I. 2001. “Hacia una dialectología histórica. Reflexiones sobre la historia del leísmo,
el laísmo y el loísmo”. Boletín de la Real Academia Española 81: 389–464.
Fontanella de Weinberg, M. B. 1996. “El aporte de la sociolingüística histórica al estudio del español”.
International Journal of the Sociology of Language 117: 27–38.
Frago Gracia, J. A. 1993. Historia de las hablas andaluzas. Madrid: Arco Libros.
García Mouton, P. 1996–1997. “Las mujeres que escribieron cartas desde América (siglos XVI–XVII)”.
Anuario de Lingüística Hispánica 12–13: 319–326.
Giles, H. J. Coupland y N. Coupland (eds.). 1991. Contexts of Accommodation: Developments in Applied Socio-
linguistics. Cambridge: Cambridge University Press.
Gimeno Menéndez, F. 1995. Sociolingüística histórica. Madrid: Visor.
Granda, G. de. 1994. “El proceso de koineización en el período inicial de desarrollo del español de Amé-
rica”. En El español de América en el siglo XVI, ed. Jens Lüdtke, 87–108. Fráncfort y Madrid: Vervuert
e Iberoamericana.
Hernández-Campoy, J. M. y J. C. Conde-Silvestre, eds. 2012. The Handbook of Historical Sociolinguistics.
Malden, MA: Wiley-Blackwell.
Jodl, F. 2015. “Estigma y auge de prestigio: el cambio f > h en castellano y gascón visto desde la sociolin-
güística histórica y la lingüística variacional”. Revista de Filología Románica 32: 21–40.
Labov, W. 1994. Principles of Linguistic Change, vol. 1, Internal Factors. Philadelphia: Blackwell Publi-
shing Co.
Labov, W. 2001. Principles of Linguistic Change, vol. 2, Social Factors. Oxford: Blackwell.
Martínez, G. A. 2000. “A Sociohistorical Basis of Grammatical Simplification: The Absolute Cons-
truction in Nineteenth-century Tejano Narrative Discourse”. Language Variation and Change 12:
251–266.
Martínez, G. A. 2001. “Política lingüística y contacto social en el español mexico-tejano: la oposición -ra
y -se en Tejas durante el siglo XIX”. Hispania 84: 114–124.
Milroy, J. y L. Milroy. 1985. “Linguistic Change, Social Network, and Speaker Innovation”. Journal of
Linguistics 21: 339–384.
Moreno Fernández, F. 2005. Historia social de las lenguas de España. Barcelona: Ariel.
Nevalainen, T. y H. Raumolin-Brunberg. 2003. Historical Sociolinguistics: Language Change in Tudor and
Stuart England. Londres: Longman y Pearson Education.
Oesterreicher, W. 2005. “Textos entre inmediatez y distancia comunicativas. El problema de lo hablado
escrito en el Siglo de Oro”. En Historia de la lengua española, ed. R. Cano. 2ª ed., 729–769. Barcelona:
Ariel.
Parodi, C. 2001. “Contacto de dialectos y lenguas en el Nuevo Mundo: la vernacularización del español
en América”. Intemational Joumal of the Sociology of Language 149: 33–53.
Penny, R. 2004. Variación y cambio en español. Madrid: Gredos.
Pountain, C. J. 1998. “Nuevo enfoque de la posición del adjetivo atributivo”. En Atti del XXI Congresso
Internazionale di Linguistica e Filologia Romanza, vol. 2, ed. G. Rufino, 697–708. Tubinga: Niemeyer.
Pountain, C. J. 2006. “Towards a History of Register in Spanish”. Spanish in Context 3: 5–24.
Ramírez Luengo, J. L. 2001. “Alternancia de las formas ra/se en el español uruguayo del siglo XIX”. Estu-
dios Filológicos 36: 173–186.
73
José Luis Blas Arroyo
Romaine, S. 1982. Socio-historical Linguistics: Its Status and Methodology. Cambridge: Cambridge University
Press.
Trudgill, P. 1986. Dialects in Contact. Oxford: Basil Blackwell.
Tuten, D. N. 2003. Koineization in Medieval Spanish. Berlín: De Gruyter.
Weinreich, U., W. Labov y M. Herzog. 1968. “Empirical Foundations for a Theory of Language Change”.
En Directions for Historical Linguistics, eds. W. P. Lehman y Y. Malkiel, 95–189. Austin: University of
Texas Press.
74
7
Tradiciones discursivas e
historia lingüística
(Discursive traditions
and historical linguistics)
Araceli López Serena
1. Introducción
El concepto de tradición discursiva (TD) surgió, dentro de la romanística alemana, en el seno de
la lingüística de las variedades de filiación coseriana. Sus orígenes se remontan a los desarrollos
teóricos iniciados por las Escuelas de Tubinga (Coseriu, Schlieben-Lange, Kabatek) y Friburgo
(Oesterreicher, Koch) desde finales de los años 70. Acuñado por Peter Koch, el concepto de TD
ha resultado ser altamente rentable en el campo de la lingüística histórica cuando se trata de ana-
lizar en qué medida un determinado proceso de cambio lingüístico o un hecho lingüístico parti-
cular identificado en un texto podrían haberse visto propiciados o inhibidos por condicionantes
discursivo-tradicionales. En este capítulo, que pretende mostrar hasta qué punto la lingüística
histórica ha sabido sacar partido de la noción de TD, se hace un breve repaso histórico de los
orígenes y el desarrollo del concepto de TD en el marco de la romanística alemana y se remite a
algunos trabajos sobre la historia del español a fin de ilustrar en qué medida el paradigma de las
TD ha servido de inspiración para determinados tipos de investigación.
Palabras clave: tradiciones discursivas; tradicionalidad discursiva; lingüística de las variedades
de filiación coseriana; niveles y dominios del lenguaje; distancia/inmediatez comunicativas
The concept of discursive tradition (DT) was developed, within German Romance linguis-
tics, inside the framework of Coserian-inspired Varieties Linguistics. Its origins go back to the
theoretical developments carried out by the Schools of Tübingen (Coseriu, Schlieben-Lange,
Kabatek) and Freiburg (Oesterreicher, Koch) since the late 70s and the 80s. Coined by Peter
Koch, the concept of discursive tradition has proved to be extraordinarily fruitful in the field of
historical linguistics, when it comes to analyzing to what extent a particular linguistic change or
a particular linguistic fact witnessed in a past language state may have been favoured or inhibited
by discursive-traditional factors. Starting with a very brief historiographic review of the origins
and the development of the concept of discursive tradition within German Romance linguistics,
this chapter will show in which way historical linguistics has profited from this concept. For this
purpose, a few contributions dealing with the history of the Spanish language will be chosen
DOI: 10.4324/9781003035565-9 75
Araceli López Serena
in order to illustrate the extent to which the notion of discursive tradition has proved useful in
this kind of research.
Keywords: discursive traditions; discursive traditionality; Coserian-inspired Varieties Linguis-
tics; linguistic levels and domains; communicative immediacy/distance
Figura 7.1 Los niveles universal, histórico y actual del lenguaje y los saberes elocucional,
idiomático y expresivo de acuerdo con la propuesta de Coseriu (2019, 32)
Figura 7.2 Niveles y dominios de lo lingüístico (apud Koch 1997, 45; cf. también Koch 2008, 54)
76
Tradiciones discursivas e historia lingüística
Mientras que en la propuesta originaria de Coseriu solo las lenguas y las modalidades de variación
diasistemática (diatópicas, diastráticas y diafásicas) que conforman el saber idiomático se ubicaban en
el nivel histórico del análisis lingüístico y de la competencia de los hablantes, Koch, tanto en su tesis
de habilitación como en trabajos posteriores (cf. Koch 1997, 2008), consideró necesario subdividir
este nivel en dos dominios diferenciados: el de las lenguas históricas particulares y el de las TD. Si
proyectamos sobre las dos figuras anteriores la distinción entre materia y objeto de estudio a la que se
ha hecho mención anteriormente, el nivel actual del discurso correspondería para Koch a la materia
de estudio, es decir, a la realidad de los testimonios discursivos y textuales, mientras que los niveles
histórico y universal constituirían abstracciones propias del objeto de estudio.4
Koch proponía, con ello, poner de relieve la falta de coincidencia entre (i) el saber histórico
que tiene que ver con la competencia idiomática y (ii) el producir textos según tradiciones y
modelos históricos, perteneciente también al saber sociohistóricamente determinado, pero inde-
pendiente de las tradiciones de las lenguas particulares. En esto último se mostraba de acuerdo
con el propio Coseriu en que “los textos tienen también sus tradiciones particulares, indepen-
dientes de las lenguas” (Coseriu 2007, 137–138). Por este motivo Coseriu entendía que se podía
aludir, dentro de las tradiciones del hablar (Traditionen des Sprechens, cf. Schlieben-Lange 1983), a
tradiciones textuales o TD, tanto en relación con “los textos incorporados a la tradición lingüística
misma” (Coseriu 2007, 138), p. ej., las formas históricamente establecidas en una comunidad
idiomática para el saludo o para las secuencias de cierre de una conversación, como en relación
con “los [tipos de] textos supraidiomáticos, [pues] debería resultar evidente que existe una con-
figuración tradicional enteramente independiente de la tradición del hablar según una técnica
transmitida históricamente (= independiente de las lenguas históricas)” (Coseriu 2007, 139).
Desde el punto de vista de su intensión, el concepto de TD está vinculado con la variación lingüís-
tica de naturaleza textual o discursiva. En este sentido, la definición que ha tenido mayor repercusión
es la de Kabatek (2005a, 159), para quien las TD no forman parte, sin embargo, del nivel histórico
del análisis, sino del individual,5 y en cuya opinión una TD consiste en “la repetición de un texto o
de una forma textual o de una manera particular de escribir o de hablar que adquiere valor de signo
propio” (cf. Kabatek 2018, cap. 8). Desde el punto de vista de su extensión, las reglas discursivas, que
proporcionan a los hablantes modelos para realizar de manera adecuada sus discursos, “remiten a tra-
diciones discursivas, es decir, a determinados estilos, géneros, clases de textos, universos discursivos,
actos de habla, etc., todos los cuales aprehenden clases de discursos” (Koch 1987, 31).
Algunos especialistas (p. ej., Sáez Rivera 2006; López Serena 2011) han manifestado su pre-
ocupación por la laxitud de la definición tanto intensiva como extensiva del término TD, que
ha conducido, de una parte, a su solapamiento con categorías tradicionalmente aplicadas a la
descripción de la variación lingüística como registro o estilo (cf. Company 2008), que para Koch
son TD (cf. su pasaje recién citado) y que, además, caben perfectamente dentro de la mencio-
nada definición de Kabatek, pues tanto los registros como los estilos se pueden interpretar como
“maneras particulares de escribir o de hablar que adquieren valor de signo propio”. Además, la
etiqueta TD ha confluido también con la noción, igualmente tradicional, de género (cf. Kabatek
2018, cap. 10), así como con conceptos procedentes de propuestas de teorización lingüística
más recientes, como los de clases de textos, tipos de textos o incluso actos de habla y funciones
expresivas (cf. cap. 21). Ahora bien, tal y como defiende López Serena (2021a) o señala Octavio
de Toledo (2018), justamente la holgura de esta concepción tan laxa de TD, “basada en la idea
de repetición evocadora y ampliable a elementos o secuencias inferiores al texto e incluso a la
oración”, es, probablemente, uno de los motivos por los que las TD se han convertido
77
Araceli López Serena
El estudio diacrónico de una lengua particular que se basa empíricamente en textos (‘dis-
cursos’) no tiene que engañarse con la ilusión de que los datos extraídos de estos discursos
reflejen directamente reglas idiomáticas de la lengua en cuestión ni que los datos sacados
de discursos sucesivos en el tiempo reflejen directamente cambio de reglas idiomáticas.
Hay que tener en cuenta los “filtros” no solo de las variedades lingüísticas, sino también de
las tradiciones discursivas que intervienen en cada discurso individual. Esta consideración
conlleva consecuencias importantísimas para la metodología de una lingüística del corpus (cfr.
Oesterreicher 2001, 1569ss; Kabatek 2005a, 163ss., 172–174).
(Koch 2008, 80; cursiva original)
El corolario del rechazo a una lingüística de corpus derivada de una visión lineal de la evolución
de las lenguas es el propósito de
modificar [...] un monolitismo que parte del supuesto de la existencia de una —y una
sola— gramática representativa de cada lengua y cada época, monolitismo reanimado
por modelos actuales y por una lingüística de corpus en la que se supone que la varia-
ción textual no es más que un problema de cantidad y que, a partir de un cierto tamaño
de la muestra, la variación se esfuma en la nada del “ruido” estadísticamente irrelevante.
(Kabatek 2008, 8)7
A este respecto, no extraña que Kabatek vincule el “enorme eco” que tuvo su primer libro sobre
TD en el mundo hispánico (Jacob y Kabatek 2001) con el hecho de que apareció
78
Tradiciones discursivas e historia lingüística
hispánica hubo una especie de oleada de estudios de sintaxis histórica. Entre la tradición
filológica española y una nueva lingüística de índole más bien teórica y basada en datos
masivos faltaba algo: una diferenciación de las tradiciones de los textos y una crítica a una
diacronía demasiado simplista que ignoraba la diversidad de las tradiciones textuales.
(Kabatek 2018, 22)
79
Araceli López Serena
En consonancia con esta definición está la postura que expresa Pons Rodríguez en las conclu-
siones de uno de sus primeros trabajos sobre TD, y que podemos hacer extensiva a todos los
hispanistas que aplican esta noción a sus investigaciones.8 De acuerdo con esta autora, desde la
perspectiva del historiador de la lengua (medieval, en su caso concreto),
[d]e nada sirve una clasificación histórica de los textos [...] que los descomponga en cate-
gorías herméticas o discretas; tampoco nos valen concepciones de los discursos como cons-
tructos monotípicos. Si queremos dar cuenta de la relación de la textualidad medieval con
el código que le da cuerpo, tenemos que buscar una teoría de la clasificación textual que
considere los rasgos lingüísticos y su relación con las condiciones de enunciación, que con-
temple los discursos como acontecimientos, como objetos sociohistóricos, que considere
la relación entre cambios en la historia social y cambios en los tipos de discursos. Esa es la
visión que está en la base de la teoría de las TD, que exige la puesta en marcha de mecanis-
mos de relación con otros componentes del discurso debidos también al modelo textual
elegido y determinados por la realidad social o institucional, y, en consecuencia, susceptibles
de ser modificados o alterados por cualquier cambio de esos parámetros.
(Pons Rodríguez 2006a, 78)
En este estudio, la autora ofrece también pistas sobre otros motivos adicionales que han condu-
cido a la extraordinaria difusión de la noción de TD entre los historiadores de la lengua española.
Por un lado, en su opinión, los trabajos pioneros sobre TD vinieron a cubrir el hueco, denun-
ciado por Marimón Llorca (2005, 1022), que suponía “la casi total ausencia de estudios histó-
ricos en la investigación sobre tipos de textos”: no extraña, pues, que cuando Pons Rodríguez
(2006a, 70) se refiere a la escasez de categorizaciones textuales aplicadas a la diacronía mencione
como excepción la clasificación de muestras de escrituralización en lenguas románicas hecha,
precisamente, por Koch (1993). Por otro lado, en la acogida del marbete TD como alternativa a
los de género textual o discursivo desempeñó un papel fundamental el hecho de que los lingüistas
han considerado, de manera general, el término género más bien propio de los estudios literarios.
De hecho, el propio Oesterreicher no tuvo reparos en aclarar que él prefería hablar de TD y no
de géneros textuales o tipos de textos, “[e]n primer lugar, para enfatizar la dinámica interna de
estos modelos discursivos históricos”, pero “en segundo lugar, para evitar la identificación con
una teoría literaria de los géneros” (Oesterreicher 2012, 231–232; cf. también Pons Rodríguez
2006a, 72–73).
80
Tradiciones discursivas e historia lingüística
que la historia de una lengua no presenta solo variación a nivel de dialectos, sociolectos
o estilos sino que la lengua varía también de acuerdo con las tradiciones de los textos, es
decir, que estos no solo añaden sus elementos formales, sus características de género o las
marcas de un tipo determinado de estructuración a los productos de sistemas ya dados sino
que condicionan o pueden condicionar, a su vez, la selección de elementos procedentes de
diferentes sistemas (o de un sistema de sistemas).
(Kabatek 2008, 8–9)
Aunque no de forma tan sistemática como sobre sintaxis, también se ha investigado en algunas
ocasiones sobre TD y léxico (sobre todo en relación con la selección léxica que se opera en los
textos: cf. p. ej,. Dworkin 201). Es de esperar que en futuras investigaciones aumente la consi-
deración de los cambios léxicos desde la perspectiva de su carácter discursivo-tradicional.
Notas
1 Los contenidos de este epígrafe sintetizan parcialmente lo que se expone, de manera más extensa y
pormenorizada, en López Serena (2021a).
81
Araceli López Serena
2 Las traducciones de todas las citas cuyos textos originales no están en español son mías.
3 La oposición entre las aproximaciones a las TD que adoptan un enfoque de materia y las que abrazan,
más bien, un enfoque de objeto de estudio está basada en la distinción epistemológica entre materia y
objeto de estudio (cf. Fernández Pérez 1993; López Serena 2021a). Materia es la realidad fenoménica,
heterogénea y compleja, que se da en todas las manifestaciones lingüísticas, a partir de las cuales los
lingüistas delimitamos y perfilamos objetos de estudio específicos en virtud de determinados criterios e
intereses de investigación, sometiendo la materia de estudio a procesos de abstracción, modelización e
interpretación a través de los cuales esta deja de ser realidad fenoménica y se torna constructo teórico.
4 Nótese, sin embargo, que, como todas las distinciones terminológicas, la oposición entre materia y
objeto de estudio y su correlación con la teorización y la descripción lingüísticas, respectivamente,
incurren en una simplificación sobre la que es preciso advertir, toda vez que tampoco la descripción
existe al margen de categorías teóricas.
5 No es posible profundizar aquí en la falta de acuerdo, dentro de este paradigma teórico, sobre el lugar
que las TD deben ocupar en los tres niveles de abstracción del lenguaje presentados, pero conviene
advertir, al menos, sobre el hecho de que mientras Koch (1987, 1997, 2008) y Oesterreicher (1997) las
sitúan en el nivel histórico, Kabatek (2005b, 2015, 2018) y Lebsanft (2005, 2006) prefieren ubicarlas
en el nivel individual. En la postura de Koch y Oesterreicher es determinante el hecho de que, en la
lingüística de las variedades de filiación coseriana, el término histórico está relacionado con el carácter
universal de la historicidad del lenguaje (cf. Coseriu 1978); para Koch, así, “[a]tribuir al discurso, como
nivel genuinamente actual del lenguaje, [...] un saber acerca de reglas sería una contradicción intrínseca,
puesto que las reglas entrañan tipificaciones y no pueden ser empleadas una única vez” (Koch 1987, 31;
traducción mía), por lo que “[e]n la medida en que se trata de un saber profundamente impregnado
de historicidad, el saber expresivo pertenece al mismo nivel que el saber idiomático” (Koch 1987,
31; traducción mía). Para Kabatek, sin embargo, tiene más peso la distinción entre primera y segunda
historicidad: a su modo de ver, la historicidad propia de las lenguas (primera historicidad) es muy distinta
de la historicidad de segundo orden que caracteriza a las TD, pues “los fenómenos tradicionales [...] no se
relacionan entre sí como técnicas, sino como productos, como ocurrencias individuales” (Kabatek 2015,
59; traducción mía), de modo que “esta segunda historicidad es limitada, pues se refiere a los textos ya
producidos en una comunidad, al acervo cultural, la memoria textual o discursiva” (Kabatek 2008, 9; cf.
también Kabatek 2018, 15 y 24). Sobre esta distinción, cf. ahora López Serena (2023).
6 En efecto, como ya advertía Coseriu (2007, 133), “las reglas del nivel de las lenguas pueden quedar en
suspenso en el texto, es decir, pueden dejar de aplicarse por la configuración tradicional del texto o por
alguna motivación que se encuentre en el texto mismo”.
7 Cf. en el mismo sentido Oesterreicher (2008, 241).
8 En el rechazo de la consideración de constructos monotípicos insisten también Guzmán Riverón
(2006, 87) y Kabatek (2018, cap. 7).
9 Cf., p. ej., los trabajos contenidos en Kabatek (2008) o los mencionados por Cano Aguilar (cap. 21).
10 En una línea semejante, Pons Rodríguez (2010, 82) analiza “cómo varían el prestigio y la marcación
de los adverbios originalmente bajolatinos inclusive, exclusive y respective a partir de que trascienden sus
tradiciones discursivas y su lengua particular de partida”, concluyendo que “[e]l modelo lingüístico del
latín técnico-jurídico fue, sin duda, un estímulo para que se produjeran trasvases entre similares tradi-
ciones discursivas (TD) de lenguas distintas”.
Lecturas recomendadas
De los trabajos contenidos en Kabatek (2018), volumen compilatorio de contribuciones que el autor
había publicado en forma de artículos dispersos en varios sitios y lenguas distintas, se recomiendan
especialmente los capítulos 6 a 11, en los que se abordan, respectivamente, la rentabilidad de las
TD en los “nuevos rumbos” adoptados por la “sintaxis histórica”, el problema de cómo confec-
cionar corpus lingüísticos diacrónicos representativos (cap. 7), el papel que las TD desempeñan
en el estudio del cambio lingüístico (cap. 8), la delimitación entre TD y géneros (cap. 10) o la
categorización y tipología de las TD (cap. 11).
Los trabajos recogidos en Kabatek (2008) interesan, especialmente, por dos motivos (cf. también la
reseña de Narbona Jiménez 2009): porque ilustran el tipo de aproximación a la sintaxis histórica
que prima en el paradigma de las TD y porque contienen la única publicación originalmente en
82
Tradiciones discursivas e historia lingüística
español que dedicó Peter Koch a presentar su visión de las TD, que ejemplifica con la historia de
la forma de tratamiento vuestra merced.
Tres trabajos recientes de López Serena (2021a, 2021b y 2023) forman una tripla complementaria.
El primero aplica al estudio de las TD la diferencia entre el enfoque de materia y el de objeto de
estudio. Atendiendo a la definición de las TD desde su consideración como materia de estudio,
la autora se pregunta si es posible o necesario diferenciar las TD en sentido estrecho, concebidas
como objetos de estudio, de categorías como género, registro, estilo y perfil concepcional.
Finalmente, se denuncia cierto uso “inf lacionario” del término TD en los estudios de historia de
la lengua española de la última década. El segundo analiza la recepción del concepto de TD en la
investigación lingüística hispánica y brasileña. En sus páginas se ponen de relieve los principios,
métodos y orientaciones en que se han sustentado los acercamientos a este enfoque de análisis
que han tenido lugar en España, Hispanoamérica y Brasil. Su lectura puede ser de utilidad tanto
para quienes deseen informarse sobre las principales referencias que cabe destacar, en los ámbitos
geográficos señalados, en relación con el paradigma de las TD, como, sobre todo, para quienes
quieran formarse una idea acerca de los pilares metodológicos sobre los que se erige esta corriente
de la lingüística histórica. El tercer trabajo reconstruye el porqué de la necesaria adscripción de las
TD al nivel individual del lenguaje, tal y como lo concibe Coseriu.
Bibliografía citada
Company, C. 2008. “Gramaticalización, género discursivo y otras variables en la difusión del cambio sin-
táctico”. En Sintaxis histórica del español y cambio lingüístico: nuevas perspectivas desde las tradiciones discursivas,
ed. J. Kabatek, 17–51. Madrid y Fráncfort: Iberoamericana y Vervuert.
Coseriu, E. 1957 [1988]. Sincronía, diacronía e historia. El problema del cambio lingüístico. Madrid: Gredos.
Coseriu, E. 1978. Los universales lingüísticos y los otros, trad. C. Parodi. México: Instituto de Investigaciones
Filológicas. [Link].
Coseriu, E. 2007. Lingüística del texto. Introducción a la hermenéutica del sentido, ed. Ó. Loureda Lamas. Madrid:
Arco Libros.
Coseriu, E. 2019. Competencia lingüística y criterios de corrección, ed. A. Matus y J. L. Samaniego. Sevilla:
Editorial Universidad de Sevilla.
Dworkin, Steven N. 2011. “La variación y el cambio léxico: algunas consideraciones”. En Así se van las
lenguas variando: nuevas tendencias en la investigación del cambio lingüístico en español, eds. Mónica Castillo
Lluch y L. Pons, 155–169. Madrid y Fráncfort: Iberoamericana Vervuert.
Fernández Pérez, M. 1993. “Sociolingüística y lingüística”. Lingüística Española Actual 15: 149–248.
Frank, B., T. Haye y D. Tophinke, eds. 1997. Gattungen mittelalterlicher Schriftlichkeit. Tubinga: Narr.
Guzmán Riverón, M. 2006. “Tradiciones discursivas e historia de la lengua española en América”. En
Cuatrocientos años de la lengua del Quijote. Estudios de historiografía e historia de la lengua española, eds. M.
Fernández Alcaide y A. López Serena, 79–87. Sevilla: Universidad de Sevilla.
Jacob, D. y J. Kabatek, eds. 2001. Lengua medieval y tradiciones discursivas en la península Ibérica. Descripción
gramatical, pragmática histórica, metodología. Madrid y Fráncfort: Iberoamericana y Vervuert.
Kabatek, J. 2001. “¿Cómo investigar las tradiciones discursivas medievales? El ejemplo de los textos jurídi-
cos castellanos”. En Lengua medieval y tradiciones discursivas en la Península Ibérica. Descripción gramatical,
pragmática histórica, metodología, eds. D. Jacob y J. Kabatek, 97–132. Madrid y Fráncfort: Iberoamericana
y Vervuert.
Kabatek, J. 2005a. “Tradiciones discursivas y cambio lingüístico”. Lexis 29: 151–177.
Kabatek, J. 2005b. “Sobre a historicidade de textos”, trad. J. Simões. Linha d’Água 17: 159–170.
Kabatek, J. 2008. “Introducción”. En Sintaxis histórica del español y cambio lingüístico: Nuevas perspectivas desde
las tradiciones discursivas, ed. J. Kabatek, 7–16. Madrid y Fráncfort: Iberoamericana y Vervuert.
Kabatek, J. 2012. “Nuevos rumbos en la sintaxis histórica”. En Actas del VIII Congreso Internacional de
Historia de la Lengua Española, ed. E. Montero Cartelle, vol. 1, 77–100. Santiago de Compostela:
Meubook.
Kabatek, J. 2015. “Warum die ‘zweite Historizität’ eben doch die zweite ist – von der Bedeutung von
Diskurstraditionen für die Sprachbetrachtung”. En Diskurse, Texte, Traditionen: Modelle und Fachkulturen
in der Diskussion, eds. F. Lebsanft y A. Schrott, 49–62. Gotinga: Bonn University Press y Vandenhoeck
& Ruprecht.
83
Araceli López Serena
Kabatek, J. 2018. Lingüística coseriana, lingüística histórica, tradiciones discursivas. Madrid y Fráncfort: Iberoame-
ricana y Vervuert.
Koch, P. 1987. Distanz im Dictamen. Zur Schriftlichkeit und Pragmatik mittelalterlicher Brief- und Redemodelle in
Italien. Tesis de habilitación. Friburgo: Albert-Ludwigs-Universität Freiburg.
Koch, P. 1993. “Pour une typologie conceptionelle et médiale des plus anciens documents/monuments
des langues romanes”. En Le passage à l’écrit des langues romanes, eds. M. Selig, B. Frank y J. Hartmann,
39–81. Tubinga: Narr.
Koch, P. 1997. “Diskurstraditionen: zu ihrem sprachtheoretischen Status und ihrer Dynamik”. En Gattun-
gen mittelalterlicher Schriftlichkeit, eds. B. Frank, T. Haye y D. Tophinke, 43–79. Tubinga: Narr.
Koch, P. 2008. “Tradiciones discursivas y cambio lingüístico: el ejemplo del tratamiento vuestra merced en
español”. En Sintaxis histórica del español y cambio lingüístico: nuevas perspectivas desde las tradiciones discursi-
vas, ed. J. Kabatek, 53–87. Madrid y Fráncfort: Iberoamericana y Vervuert.
Koch, P. y W. Oesterreicher. 2007. Lengua hablada en la Romania: español, francés, italiano, trad. de A. López
Serena. Madrid: Gredos.
Lebsanft, F. 2005. “Kommunikationsprinzipien, Texttraditionen, Geschichte”. En Historische Pragmatik und
historische Varietätenlinguistik in den romanischen Sprachen, eds. A. Schrott y H. Völker, 25–43. Gotinga:
Universitätsverlag Göttingen.
Lebsanft, F. 2006. “Sprecher zwischen Tradition und Innovation: Zum Problem von ‘Diskurstraditionen’
und ‘Diskursgemeinschaften’ am Beispiel der Sprache der Politik”. Zeitschrift für Romanische Philologie
122: 531–548.
López Serena, A. 2011. “La doble determinación del nivel histórico en el saber expresivo. Hacia una nueva
delimitación del concepto de tradición discursiva”. Romanistisches Jahrbuch 62: 59–97.
López Serena, A. 2013. “Variación y variedades lingüísticas: un modelo teórico dinámico para abordar
el estatus de los fenómenos del español hablado en Andalucía”. En Conciencia y valoración del habla
andaluza, ed. A. Narbona, 73–127. Sevilla: UNIA.
López Serena, A. 2021a. “La tradicionalidad discursiva como materia y las tradiciones discursivas como objeto
de estudio”. Verba 48 [en línea]. [Link]
López Serena, A. 2021b. “Tradiciones discursivas, historia de la lengua española e historia del portugués brasileño.
Fundamentos teóricos, principios metodológicos y aproximaciones descriptivas”. Lexis 45: 483–553.
López Serena, A. 2023. “Entre lo individual y lo histórico. El lugar de las tradiciones discursivas en la
tripartición coseriana del lenguaje”, Boletín de Filología de la Universidad de Chile 58 (1), en prensa.
Marimón Llorca, C. 2005. “La investigación histórica sobre tipos de textos en español: problemáticas y
perspectivas”. En Actas del IV Congreso Internacional de la SEHL, ed. C. Corrales, 1021–1032. Madrid:
Arco Libros.
Narbona Jiménez, A. 2009. “Reseña de Johannes Kabatek, ed. Sintaxis histórica del español y cambio
lingüístico: nuevas perspectivas desde las tradiciones discursivas”. Revista de Historia de la Lengua Española
4: 79–87.
Octavio de Toledo, Á. 2014. “Entre gramaticalización, estructura informativa y tradiciones discursivas:
algo más sobre nada”. En Procesos de gramaticalización en la historia del español, eds. J. L. Girón y D. Sáez,
263–319. Madrid y Fráncfort: Iberoamericana Vervuert.
Octavio de Toledo, Á. 2017. “Juan de Mena como traductor: aspectos lingüísticos del Omero romançado”.
En Romanische Sprachgeschichte und Übersetzung, eds. H. Aschenberg y S. Dessì-Schmidt, 53–114. Hei-
delberg: Winter.
Octavio de Toledo, Á. 2018. “¿Tradiciones discursivas o tradicionalidad? ¿Gramaticalización o sintactización?
Difusión y declive de las construcciones modales con infinitivo antepuesto”. En Procesos de textualización
y gramaticalización en la historia del español, eds. J. L. Girón, F. J. Herrero y D. M. Sáez Rivera, 79–134.
Madrid y Fráncfort: Iberoamericana Vervuert.
Oesterreicher, W. 1997. “Zur Fundierung von Diskurstraditionen”. En Gattungen mittelalterlicher Schrift-
lichkeit, eds. B. Frank, T. Haye y D. Tophinke. Tubinga: Narr, 19–41.
Oesterreicher, W. 2001. “Historizität – Sprachvariation, Sprachverschiedenheit, Sprachwandel”. En Lan-
guage Typology and Language Universals, eds. M. Haspelmath et al., vol. 2, 1554–1595. Berlín y Nueva
York: De Gruyter.
Oesterreicher, W. 2003. “Autonomización del texto y recontextualización. Dos problemas fundamentales
en las ciencias del texto”. En Homenaje a Luis Jaime Cisneros, ed. E. Hopkins, 343–387. Lima: Pontificia
Universidad Católica del Perú.
Oesterreicher, W. 2008. “Dinámicas de estructuras actanciales en el Siglo de Oro: el ejemplo del verbo
encabalgar”. En Sintaxis histórica del español y cambio lingüístico: nuevas perspectivas desde las tradiciones discur-
sivas, ed. J. Kabatek, 225–248. Madrid y Fráncfort: Iberoamericana y Vervuert.
84
Tradiciones discursivas e historia lingüística
85
8
Oralidad y escrituralidad
(Orality and writing)
Silvia Iglesias Recuero y Eugenio Bustos Gisbert
1. Introducción
En este capítulo se analiza la importancia de la distinción entre oralidad y escritura en el estu-
dio de la evolución histórica del español. En primer lugar, se aborda la propia definición de tal
dicotomía, especialmente a raíz de la publicación de la obra de Koch y Oesterreicher (1990),
que define un espacio variacional de carácter gradual entre ambas categorías. En segundo lugar,
se examina su aplicación al estudio de nuestra lengua en tres grandes ámbitos: los textos de
impronta oral, la organización textual y los mecanismos de oralidad especialmente sintácti-
co-discursivos presentes en los testimonios escritos (teniendo en cuenta también el problema de
la “oralidad fingida”), y el desarrollo de los conectores discursivos y otros mecanismos de cone-
xión textual. Por último, se señalan las limitaciones y carencias de los estudios realizados, toda
vez que se sugieren nuevas perspectivas y aplicaciones del concepto de oralidad/escrituralidad,
en relación con los condicionamientos discursivos y retóricos de los textos, su interacción con
las diferentes tradiciones discursivas (TD), la existencia de otros mecanismos de expresión de la
oralidad y su papel en la configuración de las normas del español, especialmente en el caso de
las variedades americanas.
Palabras clave: oralidad; escrituralidad; lingüística histórica; historia del español; variación
lingüística
This chapter analyzes the importance of the distinction between speech and writing in the
study of the historical evolution of Spanish. It first deals with the definition of this dichotomy,
especially in the light of Koch and Oesterreicher’s (1990) work, which delimits a gradual space
of variation between both categories. Secondly, it studies the application to the study of our
language in three main areas: the texts with oral characteristics, the textual organization and the
mechanisms of orality, especially syntactic-discursive, present in written testimonies (also taking
into account the problem of “feigned orality”) and the development of discursive connectors
and other mechanisms of textual connection. Finally, it points out the limitations and shortco-
mings of current studies, while proposing at the same time new perspectives and applications
of the concept of orality/writing to the discursive and rhetorical conditioning of the texts,
their interaction with the different discursive traditions, the existence of other mechanisms of
86 DOI: 10.4324/9781003035565-10
Oralidad y escrituralidad
expression of orality and their role in the configuration of the norms of Spanish, especially in
the case of the American varieties.
Keywords: orality; writing; historical linguistics; history of Spanish language; historical variation
2. Aproximaciones teóricas
Son muy numerosos los estudios que se han hecho sobre las diferencias entre oralidad y escri-
turalidad y sus relaciones. Desde la perspectiva diacrónica, que es la que importa aquí, se han
planteado una serie de cuestiones:
Descartada la visión ingenua de la lengua escrita como mera representación de la lengua oral,
los primeros acercamientos al problema de la variación oralidad y escrituralidad en la investi-
gación diacrónica aceptaron la visión normativa habitual en las descripciones tradicionales (nor-
malmente centradas en el léxico y la fonética) de la variedad “coloquial”: la lengua hablada se
hacía corresponder con registros sociales bajos y estilísticamente descuidados. De esta manera,
los fenómenos típicamente adscritos a la oralidad eran aquellos “subnormativos”, alejados de
la “lengua ejemplar”, que se identificaba con la escritura preferentemente literaria, y se solían
atribuir al habla de personas incultas o de baja extracción social.
Esta concepción ha dado lugar a situaciones que pueden parecer paradójicas (Oesterreicher
1996): por un lado, sobre todo para los niveles fónico, (morfo)fonológico y léxico, los investi-
gadores recurrían a documentación no literaria (documentos jurídicos en su mayoría), puesto
que se consideraba que tales textos escapaban a las normas de la escritura cuidada, y, por tanto,
reflejaban mejor los usos orales vulgares que testimoniaban los cambios; ejemplos palmarios
de esta concepción son Orígenes del español de Menéndez Pidal (1926); por otro lado, una vez
pasadas las etapas iniciales de formación de las lenguas y variedades románicas, la historia de las
lenguas nacionales se “limitaba principalmente a la descripción de sus grandes obras literarias”
(Eberenz 1998, 243), y todas las demás variedades (con excepción de los dialectos “históricos”)
quedaban olvidadas (Menéndez Pidal 2005; Lapesa 1981). Esta tradición se continúa en obras
muy posteriores en las que lo que se busca es rastrear la pervivencia de variedades de los dialectos
primarios o secundarios en textos escritos en castellano (Sánchez Méndez 2012).
Posteriormente, desde supuestos teóricos aparentemente no normativos, teorías lingüísticas
como el estructuralismo, el generativismo e incluso el cognitivismo han mantenido una concep-
ción “escriptista” o “escriturista” de la lengua, lo que ha continuado el enfoque no variacionista
87
Silvia Iglesias Recuero y Eugenio Bustos Gisbert
88
Oralidad y escrituralidad
3. Perspectivas actuales
A continuación, trataremos los dos aspectos más relevantes en la investigación histórica de la
oralidad y la escritura. El primero atañe a la selección de las fuentes documentales; el segundo, a
la determinación de fenómenos propios de la oralidad.
89
Silvia Iglesias Recuero y Eugenio Bustos Gisbert
1994, 1996, 2004; Stoll 1998; Schmidt-Riese 2003) que presentan una doble ventaja: están
escritos (o dictados) por personas que carecen de una formación que les permita dominar el
registro escrito, por lo que no se trata de una “oralidad fingida”. Por otro lado, la existencia de
textos de un contenido similar, pero escritos por autores de una mayor competencia escritural
(Bernal Díaz del Castillo, Fernández de Oviedo, López de Gómara, etc.), permite evaluar de
forma más objetiva y no circular la presencia de la oralidad en esas crónicas (Stoll 1998). Además,
disponemos de cartas escritas por personas con un nivel medio o incluso bajo de competencia
escrita (Cano Aguilar1996; Fernández Alcaide 2009), aunque estas plantean el problema de la
mediación de los escribanos en el proceso de redacción. Y de las actas de procesos judiciales
de diverso tipo (penales, civiles o inquisitoriales) en que haya quedado registrada con aparente
fiabilidad la producción oral de algunos de los implicados en las transcripciones de las respuestas
a los interrogatorios o los testimonios de testigos y acusados, si bien estos documentos son de
una fiabilidad discutible pues pertenecen a una TD eminentemente escrita (Cano Aguilar 1998;
Eberenz 1998; Calderón Campos y Vaamonde 2020, entre otros). Que sepamos, no se han
tenido tanto en cuenta otros tipos de documentos que pueden reflejar la oralidad, como son los
censos, encuestas y relaciones que se hicieron en América del siglo XVI al XVIII.
El segundo gran tipo de fuentes son las obras literarias pertenecientes a géneros y subgéneros
(diálogo, teatro, novela, etc.) en los que se produce una mímesis de la oralidad o una oralidad
simulada, esto es, una representación literaria de interacciones dialógicas entre varios personajes.
Ahora bien, es fundamental tener siempre presente que esta “mímesis de la oralidad” ofrece, en
realidad, “oralidades elaboradas” (Del Rey Quesada 2019), donde conviven elementos prove-
nientes de distintas variedades —la lengua de la escrituralidad, la lengua estándar o no marcada y
la lengua de la inmediatez comunicativa— en mayor o menor grado, según las normas retóricas
o estilísticas propias de cada época y de cada género o subgénero, que conciben de formas muy
diferentes la “naturalidad dialógica”; intervienen también de manera decisiva las capacidades,
preferencias e intenciones de los propios autores (Bustos Tovar 1998, 2006). De esta manera, no
podemos pensar encontrar la misma “mímesis de la oralidad” en las interacciones dialogales del
Poema del Cid, del Libro de Apolonio, del Quijote o de Fortunata y Jacinta.
A estas dos grandes fuentes debemos añadir los comentarios metalingüísticos —descriptivos
o evaluativos, siempre más parcos de lo que nos gustaría— que ofrecen obras gramaticales, lexi-
cográficas, manuales de pronunciación, etc.
90
Oralidad y escrituralidad
En segundo lugar, se han investigado algunos de los mecanismos lingüísticos que caracte-
rizarían los textos o fragmentos orales. Hay que decir, en este sentido, que, en ocasiones (y esto
ya sucede en el trabajo seminal de Koch y Oesterreicher 1990 [2007]), no se distingue bien
la variación concepcional de la diastrática o diafásica, y se tiende a considerar “oral” lo que es
diastráticamente bajo o diafásicamente informal, sin tener en cuenta que existirían tantas orali-
dades como variaciones posibles en cada uno de estos niveles. No tiene por qué ser la misma la
“oralidad” de una persona de grupo sociocultural alto que la de un grupo medio o bajo, que,
además, se pueden encontrar en situaciones comunicativas diferentes. Esa identificación es espe-
cialmente relevante en el caso de los mecanismos de carácter fonético, donde lo oral se identifica
sin duda con subestándar (diatópica o diastráticamente), sin que tal opinión esté, a nuestro juicio,
suficientemente fundada.
Fuera de este ámbito, los mecanismos de oralidad que se han señalado son de naturaleza
esencialmente sintáctica y, siguiendo a Cano Aguilar (2008), son de dos tipos diferentes. Por un
lado, unidades de la lengua general que resultan más habituales en los intercambios comunicati-
vos y el coloquio, como son, por ejemplo, los usos de formas deícticas (pronombres personales
de referencia no siempre clara, señalamientos adverbiales de baja densidad informativa, etc.),
la utilización de vocativos, imperativos e interrogativos, o las expresiones fáticas con que el
hablante condiciona la interpretación del mensaje. Por otro lado, mecanismos específicos de la
oralidad como la concordancia semántica, la configuración agregativa no planificada del discurso
basada en la yuxtaposición y el empleo de la conjunción copulativa; la multifuncionalidad de
determinados conectores, especialmente de que, y, sobre todo, las dislocaciones del orden ora-
cional canónico. A ellos se han añadido otros que tienen que ver con el uso de determinados
mecanismos sintácticos en contextos de variación dialectal como puede ser la alternancia entre
el perfecto simple y compuesto en el español americano (Álvarez 2020).
La distinción de oralidad y escritura ha sido también fructífera para el estudio de los mar-
cadores discursivos (MD), que, a su vez, ha enriquecido la reflexión sobre las relaciones entre
los dos polos o variedades. Se han multiplicado los estudios sobre la formación y evolución de
marcadores y operadores propios de las interacciones orales y del desarrollo de funciones típica-
mente conversacionales en determinados MD; pero también ha surgido la necesidad de refinar
y ampliar las hipótesis sobre los procesos de formación de tales unidades y tener en cuenta las
complejas relaciones entre escritura y oralidad —así como la ubicación de las distintas TD en
el espacio variacional— en el nacimiento y la vida de estas unidades (Iglesias Recuero 2000;
Herrero Ruiz de Loizaga 2020; Pons Rodríguez 2020).
91
Silvia Iglesias Recuero y Eugenio Bustos Gisbert
92
Oralidad y escrituralidad
época muy reciente, y algunas lo siguen estando aún con excepciones. Sabemos que todo ello
existía por comentarios como el famosísimo de Juan de Valdés acerca de los “bordones”, que
nos descubre el uso de “palabrillas” en forma de marcadores discursivos para rellenar pausas de
búsqueda léxica o de organización sintáctica.
En otros casos, la documentación de los fenómenos es tardía y, aunque podamos sospechar un
origen y una difusión más tempranos en las variedades de la inmediatez, los datos con que con-
tamos solo permiten que permanezcamos en el terreno de las hipótesis sobre esas etapas previas.
Tomemos, por ejemplo, la construcción introductora de discurso directo típica de las narracio-
nes orales va y me dice (Garachana Camarero 2015): la encontramos a fines del XIX en Pereda
con su uso actual, pero ¿desde cuándo se utilizaba? Las normas retóricas que han pesado sobre la
escritura y, por tanto, también sobre la mímesis de la conversación explican por qué es frecuente
documentar solo a partir del XIX unidades o expresiones propias de la oralidad prototípica. Es
verdad que en la investigación no se debe abusar del recurso al “estado latente”, pero a veces es
plausible suponer un periodo de “oscuridad documental”.
Hemos hablado de cómo la nueva concepción variacional y discursiva de la distinción oralidad-
escrituralidad ha traído consigo una ampliación de la documentación empleada en la elabo-
ración de la historia del español: no solo se han introducido otro tipo de textos no literarios
más allá de los jurídicos (como las cartas), sino que se ha empezado a fijar la atención en “otras
partes” de los textos literarios y no literarios que recogen o recrean interacción oral —un buen
ejemplo es el corpus Oralia Diacrónica del Español (Calderón Campos y Vaamonde dos Santos
2020)—. Pero, lo que nos parece más relevante es que ha hecho nacer una nueva percepción
y acercamiento a todas las fuentes documentales: los textos ya no deberían ser tratados nunca
más como simples repositorios intercambiables de datos homogéneos, sino que se ha vuelto
necesario tomar conciencia de sus condiciones de producción y recepción, esto es recontex-
tualizarlos (Oesterreicher 2001) para poder calibrar dónde se sitúan los usos lingüísticos en el
espacio variacional del español. Este enfoque teórico y metodológico del corpus requiere de
un acercamiento cualitativo (y no simplemente cuantitativo) a los datos, porque no basta con
catalogar un género como potencialmente de “impronta oral”, sino que es fundamental tener
en cuenta sus condicionamientos discursivos y retóricos (Bustos Tovar 2000). Estudios como
Díaz Bravo y Fernández Alcaide (2018) han puesto de manifiesto diferencias importantes entre
géneros y textos cercanos a la inmediatez comunicativa; Octavio de Toledo (2011), la impor-
tancia de la(s) vida(s) textual(es), o Del Rey Quesada (En prensa), la gradualidad de la influencia
de los modelos o fuentes escritas.
Esa nueva visión de las fuentes ha supuesto asimismo un nuevo planteamiento del otro polo
de la escala: la escrituralidad, y, en consecuencia, las relaciones entre oralidad y escritura en el
origen y difusión de los cambios y en la pervivencia de las unidades “creadas” a lo largo de la
historia del español. Ya apuntados en Badía Margarit (1960), y desarrollados en trabajos sobre la
construcción de la prosa medieval y humanística (Cano Aguilar 1989), han cobrado un interés
renovado los procesos de elaboración extensiva e intensiva (Koch y Oesterreicher 1990 [2007])
en la historia de los distintos géneros y TD del español (Kabatek 2008; López Serena et al.
2020). Dentro de este campo, y siguiendo lo apuntado por Sornicola (1993), en los últimos
años se ha visto necesaria una reconsideración del influjo de las “escrituralidades” latinas: clásica,
medieval o humanística en la vida de las lenguas romances como fuente de unidades y construc-
ciones concretas a través de su valor como modelos de elaboración en distintos tipos discursivos.
Con ello, se han revitalizado —y complicado— los conceptos de préstamo, calco o transferencia.
Todo ello plantea el desafiante reto de ir trazando las relaciones entre oralidad y escritura a lo
largo de la historia del español, de tratar de descubrir si, como se ha propuesto, hay periodos o
no de mayor permeabilidad entre una y otra, en qué dirección(es) se produce esa permeabilidad
93
Silvia Iglesias Recuero y Eugenio Bustos Gisbert
y en qué géneros, y de intentar explicar, en ese marco, tanto la estabilidad como los cambios de
perfil concepcional de unidades y construcciones más amplias.
Por último, la relación entre oralidad(es) y escritura en la configuración de las normas del
español es también una cuestión que no se ha abordado como merece, especialmente en lo que
se refiere a la configuración de las normas de las variedades americanas del español. Es sabido
cómo la norma escrita española es modelo a lo largo del periodo colonial y parte del siglo XIX
(Garatea Grau 2009), pero no sabemos en qué momento se produce realmente la liberación de
las antiguas colonias de ese peaje al español peninsular y si se produce a la vez en las diferentes
áreas americanas. La norma española explica también determinados usos históricos americanos
contrarios a las normas americanas actuales como, por ejemplo, el leísmo e incluso el laísmo o
determinados usos del perfecto compuesto en zonas en las que hoy se ha generalizado el perfecto
simple hasta muy avanzado el siglo XIX (Álvarez 2020) También es probable que esa imitación
de lo español explique la latencia del voseo americano en no pocas zonas (Díaz Collazos 2015) y
su conversión en rasgo distintivo de la oralidad. Tampoco sabemos cuál es el papel de la oralidad
en la configuración de normas regionales subestándares en aquellas zonas donde la alfabetización
todavía está poco desarrollada.
Esperamos haber mostrado que es mucho el camino recorrido y también mucho el que
todavía falta. Sin duda, los próximos años ofrecerán nuevos estudios que enriquezcan, maticen
o superen lo que hoy sabemos sobre la oralidad y la escritura en la historia de nuestra lengua.
Nota
1 La cursiva es nuestra.
Lecturas recomendadas
En Koch y Oesterreicher (1990 [2007]), se establecen los fundamentos teóricos de la distinción con-
cepcional entre oralidad-inmediatez y escrituralidad-distancia comunicativas y de otros con-
ceptos como elaboración o cadena variacional (este último dentro del paradigma coseriano). En la
segunda parte se ofrece una visión de los principales fenómenos de la oralidad en las tres lenguas
románicas del título.
López Serena (2008) es el estudio más detallado en esp