0% encontró este documento útil (0 votos)
1K vistas613 páginas

DWORKIN S Et Al - Lingüistica Historica Del Español

Cargado por

Mariela Masih
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
1K vistas613 páginas

DWORKIN S Et Al - Lingüistica Historica Del Español

Cargado por

Mariela Masih
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Lingüística histórica del español

The Routledge Handbook of


Spanish Historical Linguistics

Lingüística histórica del español/The Routledge Handbook of Spanish Historical Linguistics ofrece una
síntesis actualizada de los diversos campos que componen la lingüística histórica del español.
Este volumen, pionero en su género, estudia la historia interna y externa de la lengua española
con atención a los desarrollos teóricos y conocimientos contemporáneos sobre la naturaleza del
cambio lingüístico y sobre el papel de los factores no lingüísticos en tales procesos. El volumen,
escrito íntegramente en español, reúne contribuciones de un nutrido grupo de expertos
internacionales. Con capítulos tanto de destacados filólogos como de lingüistas de orientación
más teórica, el volumen ofrece a los lectores una panorámica equilibrada y completa del objeto
de estudio desde muy diversas perspectivas de investigación.
Esta obra aspira a servir de referencia en el campo de la lingüística histórica española y
resultará de interés para estudiosos y profesores interesados en dicho ámbito, así como para los
estudiantes de lingüística hispánica.

Steven N. Dworkin es Catedrático jubilado de Lingüística Románica de la Universidad de


Michigan, EE. UU. Es especialista en etimología y lexicología diacrónica.

Gloria Clavería Nadal es Catedrática del Departamento de Filología Española de la Universitat


Autònoma de Barcelona, España, y especialista en historia del léxico e historia de la lexicografía
del español.

Álvaro S. Octavio de Toledo y Huerta es Científico titular en el Consejo Superior de


Investigaciones Científicas (ILLA). Doctor en Lingüística Románica por la Universidad
de Tubinga, Alemania, ha pertenecido igualmente a la de Múnich y a la Complutense y la
Autónoma de Madrid, España.
Routledge Spanish Language Handbooks
Series Editors: Manel Lacorte
University of Maryland, USA
Javier Muñoz-Basols
University of Oxford, UK

Routledge Spanish Language Handbooks provide comprehensive and state-of-the-art overviews


of topics in Hispanic Linguistics, Hispanic Applied Linguistics and Spanish Language Teaching.
Editors are well-known experts in the field. Each volume contains specially-commissioned
chapters written by leading international scholars.
Each Handbook includes substantial pieces of research that analyse recent developments in
the discipline, both from a theoretical and an applied perspective. Their user-friendly format
allows the reader to acquire a panoramic perspective of selected topics in the fields of Spanish
language and linguistics.
Published in English or in Spanish, the Handbooks are an indispensable reference tool for
undergraduate and postgraduate students, teachers, university lecturers, professional researchers,
and university libraries worldwide. They are also valuable teaching resources to accompany
textbooks, research publications, or as self-study material. Proposals for the series will be
welcomed by the Series Editors.

Dialectología hispánica/The Routledge Handbook of Spanish Dialectology


Edited by Francisco Moreno-Fernández and Rocío Caravedo

Sintaxis del español/The Routledge Handbook of Spanish Syntax


Edited by Guillermo Rojo, Victoria Vázquez Rozas and Rena Torres Cacoullos

Lexicografía hispánica/The Routledge Handbook of Spanish Lexicography


Edited by Sergi Torner, Paz Battaner and Irene Renau

Lingüística histórica del español/The Routledge Handbook of Spanish Historical


Linguistics
Edited by Steven N. Dworkin, Gloria Clavería Nadal y Álvaro S. Octavio de Toledo y Huerta

For more information about this series please visit: [Link]/Routledge-Spanish-


Language-Handbooks/book-series/RSLH
Lingüística histórica
del español
The Routledge Handbook of
Spanish Historical Linguistics

Editado por
Steven N. Dworkin,
Gloria Clavería Nadal y
Álvaro S. Octavio de
Toledo y Huerta

DIRECTORES DE LA COLECCIÓN:

MANEL LACORTE Y JAVIER MUÑOZ-BASOLS

ASESOR PARA LA COLECCIÓN DE ESPAÑOL:

JAVIER MUÑOZ-BASOLS
Designed cover image: Nikada/Getty Images
First published 2024
by Routledge
4 Park Square, Milton Park, Abingdon, Oxon OX14 4RN
and by Routledge
605 Third Avenue, New York, NY 10158
Routledge is an imprint of the Taylor & Francis Group, an informa business
© 2024 selection and editorial matter, Steven N. Dworkin, Gloria Clavería Nadal and
Álvaro S. Octavio de Toledo y Huerta; individual chapters, the contributors
The right of Steven N. Dworkin, Gloria Clavería Nadal and Álvaro S. Octavio de
Toledo y Huerta to be identified as the authors of the editorial material, and of the
authors for their individual chapters, has been asserted in accordance with sections 77
and 78 of the Copyright, Designs and Patents Act 1988.
All rights reserved. No part of this book may be reprinted or reproduced or utilised in
any form or by any electronic, mechanical, or other means, now known or hereafter
invented, including photocopying and recording, or in any information storage or
retrieval system, without permission in writing from the publishers.
Trademark notice: Product or corporate names may be trademarks or registered
trademarks, and are used only for identification and explanation without intent to
infringe.
British Library Cataloguing-in-Publication Data
A catalogue record for this book is available from the British Library
ISBN: 978-0-367-47433-1 (hbk)
ISBN: 978-1-032-54979-8 (pbk)
ISBN: 978-1-003-03556-5 (ebk)
DOI: 10.4324/9781003035565
Typeset in Bembo
by Apex CoVantage, LLC
Índice

Lista de tablas x
Lista de figuras xi
Biografías de los autores xii

Introducción y visión panorámica de la “Lingüística histórica del español” 1


Steven N. Dworkin, Gloria Clavería Nadal y Álvaro S. Octavio de Toledo y Huerta

PARTE I
Perspectivas metodológicas y horizontes de investigación 5

1 Lingüística histórica y filología 7


Pedro Sánchez-Prieto Borja

2 Manejo de las fuentes: los corpus 17


Andrés Enrique-Arias

3 Las gramáticas del español como fuentes de datos lingüísticos 28


Daniel M. Sáez Rivera

4 Los diccionarios del español como fuentes de datos lingüísticos 39


Gloria Clavería Nadal

5 Dialectología histórica de la Península Ibérica 51


Inés Fernández-Ordóñez

6 Sociolingüística histórica panhispánica 63


José Luis Blas Arroyo

7 Tradiciones discursivas e historia lingüística 75


Araceli López Serena

8 Oralidad y escrituralidad 86
Silvia Iglesias Recuero y Eugenio Bustos Gisbert

v
Índice

9 Procesos de gramaticalización en la historia del español 98


Rena Torres Cacoullos y Carlos I. Echeverría

10 La creación de marcadores discursivos en español 111


Mar Garachana Camarero

11 La formación de nuevas variedades: koineización y criollización 123


Donald N. Tuten

12 Procesos de estandarización y prescriptivismo en la historia


del español 134
Sebastian Greusslich

PARTE II
Grandes procesos evolutivos 145

13 Fonética y fonología del castellano medieval 147


César Gutiérrez

14 Cambios fonológicos a partir del siglo XV 157


André Zampaulo

15 Morfología flexiva del verbo 168


Paul O’Neill

16 Morfosintaxis nominal: grandes procesos evolutivos 181


Joel Rini

17 Morfosintaxis verbal: grandes procesos evolutivos 195


Javier Elvira

18 Historia de las fórmulas de tratamiento 208


Miguel Calderón Campos y María Teresa García-Godoy

19 Cambios en el orden de palabras y la estructura informativa 221


Miriam Bouzouita y Ioanna Sitaridou

20 Evolución de las relaciones interoracionales 233


Francisco Javier Herrero Ruiz de Loizaga

21 Cambios en la arquitectura discursiva 245


Rafael Cano Aguilar

22 Formación de palabras 256


Franz Rainer

vi
Índice

23 Unidades fraseológicas 267


María Teresa Echenique Elizondo

24 Caracterización del léxico medieval 279


Steven N. Dworkin

25 Caracterización del léxico del español premoderno 291


María Jesús Mancho Duque

26 Caracterización del léxico de los siglos XVIII–XIX 303


Josefa Gómez de Enterría

PARTE III
Historia lingüística desde la época prerromana al
español europeo actual 315

27 Periodización de la historia de la lengua española 317


Rolf Eberenz

28 La influencia de las lenguas prerromanas como consecuencia del


contacto lingüístico 328
Luján, Eugenio R.

29 En torno a la existencia de una variedad hispánica del latín 339


Santiago Del Rey Quesada

30 El estadio lingüístico de la época visigótica 351


Isabel Velázquez

31 La contribución del árabe al hispanorromance 362


Patricia Giménez-Eguíbar

32 Aspectos sociolingüísticos del contacto entre cristianos,


judíos y musulmanes 372
Laura Minervini

33 Latín tardío y romance temprano 383


Roger Wright

34 La “época de orígenes”: los primeros testimonios romances hasta


los inicios del siglo XIII 393
María Jesús Torrens Álvarez

35 Latín e hispanorromance durante la Edad Media (1200–1450) 404


Marta López Izquierdo
vii
Índice

36 El castellano de los siglos XIII y XIV 415


Javier Rodríguez Molina

37 Transición de la lengua medieval a la premoderna 427


Lola Pons Rodríguez

38 Latín y romance como lenguas de cultura desde 1450 hasta 1700 438
Christopher J. Pountain

39 El español clásico 450


Florencio del Barrio de la Rosa

40 El español europeo de los siglos XVIII y XIX: aspectos generales


y fenómenos gramaticales 461
Álvaro S. Octavio de Toledo y Huerta

41 El español, lengua en ebullición: cambios en curso en las


variedades del español moderno 473
Francisco Moreno Fernández

42.1 Historia de los contactos entre el español y otras lenguas de


la península ibérica. Contactos entre el español y el vasco 485
Bruno Camus Bergareche y Sara Gómez Seibane

42.2 Historia de los contactos entre el español y otras lenguas de


la península ibérica. Contactos entre el español y el gallego 493
Montserrat Recalde

42.3 Historia de los contactos entre el español y otras lenguas de


la península ibérica. Contactos entre el español y el catalán 501
Carsten Sinner

PARTE IV
Historia de las variedades no europeas del español 509

43 El español en América (I): primera etapa colonial (siglos XVI–XVII) 511


Juan Pedro Sánchez Méndez

44 El español en América (II): de la Colonia a las Independencias


(ca. 1680–1830) 522
Concepción Company Company

45.1 El español en América (III): de las Independencias a nuestros


días. Variedades de México y Centroamérica 532
José Luis Ramírez Luengo
viii
Índice

45.2 El español en América (III): de las Independencias a nuestros


días. Variedades andinas y caribeñas 539
Miguel Gutiérrez Maté y Elena Diez del Corral Areta

45.3 El español en América (III): de las Independencias a nuestros


días. Variedades del Cono Sur 546
Virginia Bertolotti y Magdalena Coll

46 El español en América (IV): los Estados Unidos 554


Sonia Kania

47 El judeoespañol (djudezmo, ladino): formación, rasgos lingüísticos,


estado moderno 565
David M. Bunis

48 La historia de la lengua española en África 577


John M. Lipski y Lotfi Sayahi

Índice de materias 589

ix
Tablas

10.1 Clasificación de los marcadores del discurso del español 112


12.1 Modelo de Haugen 136
15.1 Los tiempos PYTA en español y portugués, herederos de los tiempos
perfectivos del latín 174
15.2 Los tiempos PYTA para los verbos portugueses modernos estar, fazer,
vir ‘venir’, comer 175
16.1a Paradigma de rosa, –ae (fem.) ‘rosa’ 182
16.1b Paradigma de amīcus, –ī (masc.) ‘amigo’ 182
16.1c Paradigma de vīnum, –ī (neutro) ‘vino’ 183
16.1d Paradigma de folĭum, –ī (neutro) ‘hoja’ 183
16.2a Declinación del pronombre personal de primera persona del
latín al español antiguo 184
16.2b Declinación del pronombre personal de segunda persona
del latín al español antiguo 184
16.3 Declinación del pronombre personal ILLĔ del latín al español antiguo 185
18.1 Paradigma de los pronombres de tratamiento (plural) 209
18.2 Paradigma de los pronombres de tratamiento (singular) 210
18.3 Sistemas pronominales binarios o ternarios 211
18.4 Sistemas binarios en singular y de pronombre único en plural 213
39.1 Incidencia del factor estilístico en la variación de tres fenómenos típicos
del español clásico 455
45.3.1 Distribución regional, social y situacional del voseo en el Cono Sur
(siglos xx y xxi) 550
48.1 Ubicación dialectológica del español de Guinea Ecuatorial
(apud Lipski 2004) 585

x
Figuras

7.1 Los niveles universal, histórico y actual del lenguaje y los saberes elocucional,
idiomático y expresivo de acuerdo con la propuesta de Coseriu 76
7.2 Niveles y dominios de lo lingüístico 76
9.1a Expresión del pronombre de sujeto de 3.ª sg. según el rol sintáctico de
la mención previa y el género del referente en textos premodernos 105
9.1b Número y distribución de sujetos de 3.ª sg. según el rol sintáctico de
la mención previa: referentes femeninos versus masculinos 105
29.1 Remodelación del esquema del espacio variacional entre inmediatez
y distancia comunicativas de Koch y Oesterreicher (1990, 39)
propuesta en Del Rey Quesada (2021) 347
29.2 Ejemplos de variantes marcadas y no marcadas en el espacio variacional del latín 348

xi
Biografías de los autores

Bertolotti, Virginia. Profesora titular (Catedrática) en la Facultad de Información y Comunicación


de la Universidad de la República, Uruguay. Investigadora de nivel II del Sistema Nacional de
Investigadores y académica de número de la Academia Nacional de Letras del Uruguay. Ha
centrado sus intereses académicos en la conformación histórica del español en América, en la
gramática y en la enseñanza de la lengua escrita, así como en la historia lingüística del Uruguay.
Web: [Link]

Blas Arroyo, José Luis. Catedrático de Lengua Española en la Universidad Jaume I


(Castellón, España), donde imparte cursos de sociolingüística y gramática y en la que
dirige el Laboratorio de Sociolingüística. Al frente de este ha dirigido varios proyectos
de investigación sobre sociolingüística histórica del español. En el último de ellos
(Componentes socioestilísticos, idiolectales y discursivos en la variación y el cambio lingüístico en
español, PID2021–122597NB-I00), financiado por el Ministerio de Ciencia e Innovación,
se inscribe su contribución en esta obra.

Bouzouita, Miriam. Catedrática en Lenguas Románicas (español) en la Universidad Humboldt


de Berlín (Alemania). Con anterioridad fue profesora en la Universidad de Gante (Bélgica) y
en Queen Mary, Universidad de Londres (Reino Unido). Ha publicado sobre temas históricos
(p. ej., el orden de palabras, clíticos, futuros y condicionales), diatópicos, sociolingüísticos y
de contacto de lenguas y dialectos. Ha coordinado varios proyectos internacionales, como
Dialectos del español ([Link]), para investigar la variación morfosintáctica
en el mundo hispanohablante, y el proyecto de creación de infraestructura para anotar y parsear
morfosintácticamente el Corpus oral y sonoro del español rural (COSER) a través de videojuegos
([Link]).

Bunis, David M. Catedrático jubilado de la Universidad Hebraica de Jerusalén. Sus investigaciones


se centran en la lengua y la literatura judeoespañolas. Entre sus libros figuran A Lexicon of
the Hebrew and Aramaic Elements in Modern Judezmo (Jerusalén, 1993); The Judezmo Language
(en hebreo, Jerusalén, 1999); Voices from Jewish Salonika (Jerusalén y Salónica, 1999), además
de numerosos estudios en revistas, tomos colectivos y homenajes sobre aspectos lingüísticos y
literarios del judezmo.

Bustos Gisbert, Eugenio. Profesor de Lengua Española en la Universidad Complutense de


Madrid. Su investigación y publicaciones se centran en la morfología y pragmática históricas, así
como en la dialectología histórica del español americano.

xii
Biografías de los autores

Calderón Campos, Miguel. Catedrático del Departamento de Lengua Española de la Universidad


de Granada. Su investigación y publicaciones actuales se centran en la configuración de corpus
diacrónicos y en la selección de documentación archivística de interés para el estudio de la
oralidad (siglos XVI–XIX). Es IP de los proyectos “ALEA XVIII” y “ALEA XVIII-Oriental”,
financiados por FEDER/Junta de Andalucía-Consejería de Transformación Económica, Indus-
tria, Conocimiento y Universidades/ P18-FR-695, A-HUM-116-UGR20.

Camus Bergareche, Bruno. Catedrático de Lengua Española en la Universidad de Castilla-La


Mancha. Ha publicado trabajos sobre sintaxis histórica de la negación y de los cuantificadores
españoles y catalanes, las perífrasis verbales, morfología teórica y descriptiva y sobre distintos
problemas de gramática del español. Su actividad más reciente incluye la elaboración de un
corpus de español hablado en el País Vasco, en colaboración con Sara Gómez Seibane y en
el marco del proyecto COREC: Corpus oral de referencia del español en contacto. Fase I: Lenguas
minoritarias del Ministerio de Ciencia e Innovación (PID2019–105865GB-I00), dirigido por
Azucena Palacios (UAM) y Sara Gómez Seibane (Universidad de La Rioja).

Cano Aguilar, Rafael. Catedrático emérito de Lengua Española en la Universidad de Sevilla.


Su investigación se ha centrado en la historia del español, la sintaxis histórica y la formación
del español en Andalucía. El capítulo del que es autor se enmarca en los proyectos I+D
Tradicionalidad discursiva e idiomática, sintaxis del discurso, traducción y cambio lingüístico en la historia
del español moderno: prosa (pre-) periodística/ensayística y literaria (PGC2018 -097823-B-I00) y Hacia
una diacronía de la oralidad/escrituralidad: variación concepcional, traducción y tradicionalidad discursiva en
el español y otras lenguas románicas (DiacOralEs) (PID2021-123763NA-I00).

Clavería Nadal, Gloria. Catedrática del Departamento de Filología Española de la Universitat


Autònoma de Barcelona y especialista en historia del léxico e historia de la lexicografía del
español. El capítulo del que es autora se integra en el proyecto de investigación Historia interna
del Diccionario de la lengua castellana de la Real Academia Española en el siglo XIX (1869–1899)
(PGC2018–094768-B-I00 y SGR2021–00157).

Coll, Magdalena. Profesora titular (Catedrática) del Departamento de Psico y Sociolingüística


de la Facultad de Humanidades y Ciencias de la Educación de la Universidad de la República,
Uruguay. Investigadora de nivel II del Sistema Nacional de Investigadores y Académica de
Número de la Academia Nacional de Letras. Doctora en el Programa de Lengua y Literatura
Hispánicas del Departamento de Español y Portugués de la Universidad de California, ha
publicado libros y artículos en lingüística histórica, lexicografía y lenguas en contacto.

Company Company, Concepción. Investigadora emérita de la Universidad Nacional Autónoma


de México, miembro de número de la Academia Mexicana de la Lengua y miembro de El
Colegio Nacional. Su trabajo se ha centrado en sintaxis histórica, en teoría del cambio lingüístico
y en ecdótica de documentos americanos. Es autora de más de cien artículos y capítulos de libros
con arbitraje internacional. Es directora y coautora de la Sintaxis histórica de la lengua española
(7 volúmenes, 2006, 2009 y 2014) y codirectora del Corpus diacrónico y diatópico del español de
América (CORDIAM).

Del Barrio de la Rosa, Florencio. Doctor en filología hispánica por la Universidad de Valladolid,
es Catedrático de Lengua Española en la Università Ca’ Foscari de Venecia (Italia). Ha

xiii
Biografías de los autores

pronunciado conferencias e impartido seminarios en distintas universidades europeas, así como


en la Xi’an International Studies University (China) y en la George Mason University (Estados
Unidos). La morfosintaxis histórica del español y las consecuencias del cambio lingüístico en la
formación de esta lengua constituyen uno de los focos principales de su investigación. Se ocupa
también del análisis de aspectos morfológicos, sintácticos y léxicos de la lengua española desde
una perspectiva sincrónica y contrastiva. En 2018 ha publicado el volumen Espacio variacional y
cambio lingüístico en español.

Del Rey Quesada, Santiago. Licenciado en Filología Hispánica y Filología Clásica por la
Universidad de Sevilla, en la que es Catedrático de Lengua Española. Alumnus de la Fundación
Alexander von Humboldt, ha sido profesor en las universidades de Tubinga y Múnich. Sus
principales líneas de investigación giran en torno a la elaboración lingüística de las lenguas
romances desde la época medieval hasta la moderna, el análisis histórico del discurso, la lingüística
de variedades, el contacto de lenguas y la teoría y la historia de la traducción. El capítulo del
que es autor se enmarca en los proyectos PGC2018-097823-B-I00 y PID2021-123763NA-I00.

Diez del Corral Areta, Elena. Profesora titular de Lingüística Hispánica en la Universidad
de Lausana. Sus líneas de investigación se centran en la historia del español de América,
principalmente en el nivel de la sintaxis, y en la edición y estudio de textos antiguos manuscritos
no literarios. Es miembro de la Red CHARTA ([Link] desde 2008 y actualmente
dirige el proyecto CorColombia (Corpus histórico del español de Colombia). Para más información
sobre sus proyectos y publicaciones puede consultarse su página web institucional: <[Link]
ch/esp/elenadiezdelcorralareta>.

Dworkin, Steven N. Catedrático jubilado de Lingüística Románica de la Universidad de


Michigan. Sus investigaciones se centran en la historia de la lengua española, sobre todo en
la evolución de su léxico. Además de un centenar de artículos en revistas científicas, tomos
colectivos y homenajes, es el autor de A History of the Spanish Lexicon: A Linguistic Perspective
(2012) y A Guide to Old Spanish (2018).

Eberenz, Rolf. Catedrático emérito de Filología y Lingüística Españolas de la Universidad de


Lausana. Su investigación se ha centrado en la historia de la lengua y la periodización de la
trayectoria histórica del español, la morfosintaxis diacrónica, el análisis histórico del diálogo y las
huellas de la oralidad en la tradición escrita.

Echenique Elizondo, María Teresa. Catedrática jubilada de la Universitat de València y


profesora honorífica de la Universidad Complutense de Madrid (Instituto Universitario
Menéndez Pidal). Investiga sobre diacronía del español. Entre sus publicaciones se
encuentran Cómo se hacen las unidades fraseológicas: continuidad y renovación en el espacio caste-
llano (2018) y Diccionario histórico fraseológico del español (DHISFRAES). Muestra arquetípica
(2021).

Echeverría, Carlos I. Se desempeña como profesor asistente (assistant profesor) en el Departamento


de Lenguas y Literaturas Clásicas y Modernas de Texas Tech University, en las áreas de lingüística
hispánica y traducción. Sus principales líneas de investigación son la morfosintaxis española
(desde los puntos de vista sincrónico y diacrónico), la teoría del lenguaje y los estudios sobre la
traducción.

xiv
Biografías de los autores

Elvira, Javier. Catedrático de Lengua Española en la Universidad Autónoma de Madrid. Dedica


su investigación a la lingüística histórica y a la gramática histórica del español. Se he ocupado de
problemas variados de morfología y sintaxis históricas y también de cuestiones relacionadas con
la teoría del cambio. Sus libros más recientes son Lingüística histórica y cambio gramatical (2015) y
La inteligencia verbal (2020).

Enrique-Arias, Andrés. Catedrático de Lengua Española en la Universitat de les Illes Balears


(Palma de Mallorca, España). Ha desempeñado tareas de investigación y ha impartido docencia
en diversas universidades, como University of Southern California, Colgate University, Harvard
University, Boston University, Albert-Ludwigs-Universität Freiburg y Università Ca’ Foscari
de Venecia. Es autor de más de un centenar de publicaciones sobre morfosintaxis histórica del
español, lingüística de corpus, sociolingüística, filología, traducción bíblica medieval y la historia
del contacto del castellano y el catalán en Mallorca. Es investigador principal del proyecto Biblia
Medieval y del Proyecto del Atlas Histórico del Español. Asimismo, es coautor de Sociolingüística y
pragmática del español (Georgetown University Press).

Fernández-Ordóñez, Inés. Catedrática de Lengua Española en la Universidad Autónoma de


Madrid y miembro de la Real Academia Española. Es especialista en la dialectología, actual
e histórica, del español y se interesa sobre todo por la variación gramatical. Dentro de esta
última faceta dirige el Corpus oral y sonoro del español rural <[Link]> y participa del
proyecto de edición digital del Atlas Lingüístico de la Península Ibérica <www. [Link]>.

Garachana Camarero, Mar. Catedrática de Lengua Española en la Universidad de Barcelona.


Sus líneas de investigación se centran en el estudio de la semántica y de la sintaxis del español
desde una perspectiva cognitiva. De manera particular, se ha ocupado de la evolución de los
marcadores del discurso y de las perífrasis verbales del español, asuntos a los que ha dedicado
diversas publicaciones. En la actualidad dirige el proyecto Diccionario histórico de las perífrasis verbales
del español. Gramática, pragmática y discurso (III). Perífrasis formadas a partir de verbos superléxicos y de
movimiento (PID2019–105415RB-I00) y coordina el grupo de investigación GRADIA (https://
[Link]/gradia).

García-Godoy, María Teresa. Catedrática de Historia de la Lengua Española en la Universidad de


Granada. Su investigación y sus publicaciones se centran en la evolución léxica y morfosintáctica
del español en los siglos XVI a XIX, con particular atención a los sistemas de tratamiento. Es
IP del proyecto Hispanae Testium Depositiones. Las declaraciones de testigo en la historia de la lengua
española (FFI2017–83400-P, MINECO/AEI/FEDER/UE).

Giménez-Eguíbar, Patricia. Catedrática de Lingüística Hispánica de la Western Oregon


University (EE. UU.). Su investigación se centra en el impacto de los factores sociales y
culturales en la evolución del léxico desde el punto de vista de la sociolingüística histórica. Su
perfil investigador cuenta con más de una veintena de artículos y capítulos en las revistas más
prestigiosas de su campo.

Gómez de Enterría, Josefa. Profesora Honorífica de Investigación en la Universidad de Alcalá.


Sus publicaciones se centran en diversos léxicos de especialidad en español, tanto en diacronía
como en sincronía. Ha sido investigadora principal de varios proyectos financiados por el Plan
Nacional del Gobierno de España, desde el año 2000 hasta el 2019 ininterrumpidamente.

xv
Biografías de los autores

Gómez Seibane, Sara. Profesora de Lengua Española en la Universidad de La Rioja. Es


investigadora de la (morfo)sintaxis del español en un amplio marco cronológico y en contacto
con la lengua vasca. Actualmente, codirige junto a Azucena Palacios el proyecto de investi-
gación COREC. Corpus oral de referencia del español en contacto. Fase I: lenguas minoritarias (AEI/
PID2019/105865GB-I00).

Greusslich, Sebastian. Docente investigador y colaborador de la cátedra de lingüística románica


en la Philips Universität de Marburg. Su investigación y sus publicaciones se centran en la historia
de la lengua española, lingüística variacional y tradiciones textuales, morfosintaxis histórica,
lexicografía hispánica y el español como lengua pluricéntrica con especial atención al área andina.

Gutiérrez, César. Assistant professor de español en Wake Forest University (EE. UU.), donde
imparte clases de lengua, lingüística y cultura españolas. Sus áreas de investigación son la fonética
y fonología históricas, la etimología y la dialectología de las lenguas iberorromances.

Gutiérrez Maté, Miguel. Profesor en la Universidad de Augsburgo. Su tesis doctoral (2013) fue sobre
sintaxis histórica del español de Colombia y de Santo Domingo. Actualmente prepara, a partir de
su tesis de habilitación, el libro ROMANIA BANTU. Restructuring with and without Transfer in Two
Ibero-Romance/Kikongo (De Gruyter) Varieties: Palenquero Creole and Cabindan Portuguese (De Gruyter)
y está coeditando los volúmenes Contact Varieties of Spanish and Spanish-Lexified Contact Varieties (De
Gruyter, HSK). Es miembro de la Red BayMis dedicada al Sprachbund de Misiones, Argentina.

Herrero Ruiz de Loizaga, Francisco Javier. Catedrático de Lengua Española en la Universidad


Complutense de Madrid. Su investigación se centra en la historia de la lengua española,
especialmente en sintaxis histórica (por ejemplo, Sintaxis histórica de la oración compuesta en español,
de 2005, o el capítulo dedicado a la conjunción que en la Sintaxis histórica de la lengua española
coordinada por C. Company, de 2014) y en el análisis histórico del discurso. Ha dedicado a la
gramaticalización de diversos elementos numerosos estudios. Dirige actualmente el proyecto
PROLEGRAMES (Procesos de lexicalización y gramaticalización en la historia del español: cambio,
variación y pervivencia en la historia discursiva del español, PID2020–112605GB-I00), en el que se
inserta su contribución en este volumen.

Iglesias Recuero, Silvia. Profesora del Departamento de Lengua Española y Teoría de la Lite-
ratura de la Universidad Complutense de Madrid. Sus principales líneas de investigación se
centran en la pragmática histórica y el análisis histórico del discurso, especialmente en la historia
de la formulación lingüística y discursiva de los actos de habla en español.

Kania, Sonia. Catedrática de Lingüística Hispánica en la Universidad de Texas en Arlington.


Su investigación y sus publicaciones se centran principalmente en la edición y estudio de textos
coloniales no literarios de México y Nuevo México. Es codirectora del corpus Textos coloniales
de la Biblioteca digital de textos del español antiguo (BiDTEA) del Hispanic Seminary of Medieval
Studies.

Lipski, John M. Catedrático de Lingüística Hispánica y General en la Universidad del


Estado de Pennsylvania, EE. UU. Estudia los contactos lingüísticos que han contribuido a la
evolución del español y a la formación de lenguas nuevas (pidgins, criollos, lenguas mixtas).
Sus libros más recientes son Palenquero and Spanish in Contact (2020) y El habla de los congos
de Panamá (2011).

xvi
Biografías de los autores

López Izquierdo, Marta. Catedrática de Lingüística Española y Humanidades Digitales en la


Universidad París 8. Sus trabajos versan sobre la historia de la lengua española desde una pers-
pectiva de sociolingüística histórica y textual. Es autora de varias publicaciones recientes sobre
procesos de traducción desde una perspectiva comparada (latín/romance) y sobre fenómenos de
contacto de lenguas.

López Serena, Araceli. Catedrática de Lengua Española en la Universidad de Sevilla. Su


investigación se centra en la filosofía de la lingüística y la teorización sobre la variación lingüística,
en línea con las propuestas de la lingüística de las variedades de filiación coseriana. Entre 2015
y 2022 ha dirigido dos proyectos de investigación consecutivos, financiados por el Gobierno
de España (FFI2014–51826-P y PGC2018–097823-B-I00) sobre tradiciones discursivas y
tradicionalidad discursiva aplicadas al estudio histórico del español moderno, con cuyos resultados
y los del proyecto PID2021-123763NAI00 se vincula su contribución a este volumen.

Luján, Eugenio R. Diploma de Estudios Avanzados en Gramática Comparada por la École


Pratique des Hautes Études de París y doctor en filología por la Universidad Complutense de
Madrid, es Catedrático de Lingüística Indoeuropea en esta universidad. Ha trabajado sobre
diversas cuestiones de morfología indoeuropea desde una perspectiva comparativa y tipológica
y una de sus principales líneas de investigación en la actualidad versa sobre el estudio de las
lenguas prerromanas de la península ibérica. El capítulo del que es autor forma parte del proyecto
de investigación Estudios de léxico paleohispánico (PID2019–106606GB-C3–1), financiado por el
Ministerio de Ciencia e Innovación de España y del que es investigador principal.

Mancho Duque, María Jesús. Catedrática de Lengua Española en la Universidad de Salamanca.


Sus publicaciones se centran en el léxico de los Siglos de Oro, en el registro de la espiritualidad,
preferentemente en la obra de san Juan de la Cruz y de santa Teresa de Jesús, y en el de la
ciencia y de la técnica. Es directora del Diccionario de la ciencia y de la técnica del Renacimiento
(DICTER).

Minervini, Laura. Profesora de Filología y Lingüística Románica en la Universidad de Nápoles


Federico II. Su investigación y publicaciones se centran en las situaciones de contacto lingüístico
y cultural en el espacio mediterráneo medieval y de la primera Edad Moderna.

Moreno Fernández, Francisco. Profesor Alexander von Humboldt en la Universidad de


Heidelberg. Investiga sobre sociolingüística, sociología del lenguaje y dialectología del español.
Entre sus publicaciones se encuentran Variedades de la lengua española (2020) y Dialectología
Hispánica. The Routledge Handbook of Spanish Dialectology (2022), con Rocío Caravedo.

Octavio de Toledo y Huerta, Álvaro S. Científico titular en el Consejo Superior de


Investigaciones Científicas (ILLA). Doctor en Lingüística Románica por la Universidad de
Tubinga, ha pertenecido igualmente a la de Múnich y a la Complutense y a la Autónoma
de Madrid. Su investigación se centra en la morfosintaxis y la dialectología históricas del español,
con particular interés por la lengua de los textos españoles (pre)clásicos y (pre)modernos.
Codirige, junto a Javier Rodríguez Molina, el proyecto LIMES: límites y márgenes en la historia
del español (PGC2018.095553.A.100).

O’Neill, Paul. Catedrático de Filología Románica de la Ludwig-Maximilians Universität (LMU)


de Múnich, Alemania. Investiga sobre variación fonológica y morfológica del iberorromance.

xvii
Biografías de los autores

Actualmente está elaborando una gramática histórica del español y del portugués que publicará
en dos volúmenes en la editorial Oxford University Press.

Pons Rodríguez, Lola. Catedrática en la Universidad de Sevilla. Ha sido directora de los cuatro
proyectos de investigación Historia15, dedicados al castellano de la Baja Edad Media, época a
la que ha dedicado principalmente sus intereses investigadores. Recientemente ha publicado
una edición del Diálogo de la lengua (1535) de Juan de Valdés en la Biblioteca Clásica de la
Real Academia Española. Su capítulo forma parte del proyecto de investigación “La escritura
elaborada en el español de la Baja Edad Media al siglo XVII: lengua epistolar y cambio lingüístico”
(PID2020-113146GB-I00, Ministerio de Ciencia e Innovación), que codirige.

Pountain, Christopher J. Catedrático emérito de Queen Mary, Universidad de Londres. Autor


de muchos estudios que versan sobre la historia morfosintáctica del español, sus investigaciones
actuales se centran en la influencia culta en las lenguas románicas y en la variación diastrática y
diafásica en la historia del español.

Rainer, Franz. Profesor de Lenguas Románicas en la Universidad de Ciencias Económicas y


Empresariales de Viena. Su investigación y sus publicaciones se centran, además de en el lenguaje
económico, en la formación de palabras de las lenguas románicas, tanto en sincronía como en diacronía.

Ramírez Luengo, José Luis. Profesor de Lengua Española en la Universidad Complutense de


Madrid. Su investigación y sus publicaciones se centran en la diacronía de este idioma, muy
especialmente de sus variedades americanas, así como en el contacto del portugués y el español
y en la configuración histórica de la ortografía de este último.

Recalde, Montserrat. Profesora de Gramática del Español en la Universidad de Santiago de


Compostela ([Link] Sus líneas de investigación y sus
publicaciones pertenecen a las áreas de la sociolingüística y el análisis del discurso.

Rini, Joel. Catedrático de Filología y Lingüística Española, ha impartido cursos y realizado


investigaciones sobre la historia interna de la lengua española en la Universidad de Virginia desde
su doctorado en lingüística románica en 1987 (Universidad de Michigan). Ha publicado dos
libros y más de 30 artículos sobre diversos aspectos de la gramática histórica española.

Rodríguez Molina, Javier. Profesor titular de Lengua Española en la Universidad Complutense


de Madrid (UCM). Es investigador principal, junto con Álvaro S. Octavio de Toledo y Huerta,
del Proyecto LIMES: límites y márgenes en la historia del español, financiado por el Ministerio de
Ciencia e Innovación (PGC2018.095553.A.100) y del proyecto Panépica ([Link]
dedicado al estudio de la épica hispánica y financiado por la Fundación BBVA. Sus líneas de
investigación principales son la historia de la lengua, la sintaxis histórica, la lexicografía histórica
y la crítica textual.

Sáez Rivera, Daniel M. Profesor titular de la Universidad de Granada y antes de la Universidad


Complutense de Madrid (2019–2022). Sus intereses investigadores son amplios: historia
de la lengua española (sobre todo morfosintaxis y pragmática históricas, destacadamente
la historia de las formas de tratamiento), historiografía lingüística, sociolingüística y lingüística
aplicada. Su contribución en este volumen se inserta en el proyecto I+D Procesos de
lexicalización y gramaticalización en la historia del español: cambio, variación y pervivencia en la

xviii
Biografías de los autores

historia discursiva del español (PROLEGRAMES) (ref. PID2020–112605GB-I00, Ministerio


de Ciencia e Innovación).

Sánchez Méndez, Juan Pedro. Catedrático de Lingüística Iberorrománica de la Université de


Neuchâtel (Suiza). Investiga sobre la historia de la lengua española en América y sobre lingüística
iberorrománica, con especial atención a la época medieval. Entre sus publicaciones se encuentran
varios libros y una larga serie de artículos sobre fonética, fonología, morfosintaxis, lexicología,
historiografía lingüística y fuentes documentales y sus métodos.

Sánchez-Prieto Borja, Pedro. Catedrático de Lengua Española de la Universidad de Alcalá.


Sus ámbitos de investigación son la crítica textual, la historia de la lengua y la dialectología
históricas. Ha sido fundador y coordinador de la Red Internacional CHARTA (2005–2017). Le
fue concedido el Premio a la Transferencia del Conocimiento que otorga el Consejo Social de la
Universidad de Alcalá (2012) y fue nombrado académico correspondiente de la Real Academia
Española (2015).

Sayahi, Lotfi. Profesor de Lingüística Hispánica en la Universidad de Albany, State University


of New York. Su investigación se centra en el contacto entre el español y el árabe. Es autor del
libro Diglossia and Language Contact: Language Variation and Change in North Africa (2014) y de más
de 40 artículos y capítulos de libros.

Sinner, Carsten. Catedrático de Lingüística y Translatología de las Lenguas Iberorrománicas


en la Universidad de Leipzig, donde también dirige el Centro Gallego, el lectorado de catalán,
el Centro de Euskera, la Cátedra Marià Villangómez de Estudios Catalanes y el Núcleo de
Investigación del Judeoespañol. Su investigación se centra en las intersecciones de los estudios
del contacto lingüístico, la lingüística de variedades, la historia de las lenguas, la traductología y
la terminología, entre otros.

Sitaridou, Ioanna. Catedrática de Lenguas Románicas (español) y Lingüística Histórica en


la Universidad de Cambridge, cuyo Departamento de Español y Portugués ha dirigido hasta
2021. Es asimismo codirectora del Centro de Estudios Griegos de Cambridge y jefa de
estudios en Lingüística en el Queens’ College, del que es igualmente fellow. Ha investigado por
extenso en sintaxis histórica, adquisición y cambio lingüístico, contacto de lenguas y variación
(especialmente en el español rioplatense y el judeoespañol), y coedita actualmente la revista
Glossa Contact. Ha sido profesora invitada en las universidades de Oslo y Federal de Bahía, entre
otras, y su investigación sobre la pervivencia del infinitivo griego en el Mar Negro turco (www.
[Link]) le ha granjeado becas en las universidades de Princeton y Harvard, así como la
cátedra international Labex Empirical Foundations of Linguistics en la Sorbona Nueva (París 3).

Torrens Álvarez, María Jesús. Científica titular del Consejo Superior de Investigaciones
Científicas (Instituto de Lengua, Literatura y Antropología). Sus investigaciones se centran en
la edición y el estudio de textos castellanos medievales. Su capítulo en este volumen se enmarca
en el proyecto de investigación El castellano norteño en la Edad Media (PID2020–119308GB-I00),
financiado por MCIN/AEI/10.13039/501100011033.

Torres Cacoullos, Rena. Catedrática de Lingüística Hispánica en la Pennsylvania State


University. Estudia la gramaticalización y el contacto lingüístico, con enfoque en las restricciones
probabilísticas sobre las formas morfosintácticas que aparecen en alternancia en el discurso. Entre

xix
Biografías de los autores

sus publicaciones se encuentra Bilingualism in the Community: Code-Switching and Grammars in


Contact (2020).

Tuten, Donald N. Profesor de Español y Lingüística en la Universidad de Emory (Atlanta, EE. UU.).
Su investigación y sus publicaciones se centran en la sociolingüística histórica y la actuación de
los cambios lingüísticos.

Velázquez, Isabel. Catedrática de Filología Latina de la Universidad Complutense. Sus principales


líneas de investigación son la edición y estudio de textos epigráficos y literarios latinos de la
Antigüedad Tardía y Alta Edad Media, en especial de época visigoda, aunque en ocasiones en
textos humanísticos. El capítulo que presenta está adscrito a los proyectos Avipes-CM (H2019-
HUM5442, Comunidad de Madrid/Fondo Social Europeo) y Estudios de léxico paleohispánico
(PID2019-106606GB-C-3-1, Ministerio de Ciencia e Innovación de España).

Wright, Roger. Catedrático emérito de Historia de la Lengua Española en la Universidad de


Liverpool; se jubiló en 2008. Su investigación y sus muchas publicaciones se han centrado en la
historia del romance y del castellano entre el Imperio romano y la época de Alfonso el Sabio;
su libro más conocido es Latín tardío y romance temprano en España y la Francia carolingia (1989
[1982]).

Zampaulo, André. Es catedrático de Lingüística Hispánica y Lusófona en Saint Louis University.


Su investigación y sus publicaciones exploran el papel de la fonética y de la información
probabilística en la formación de los patrones fonológicos del español y del portugués (tanto
diacrónica como sincrónicamente), así como sus consecuencias para la fonología y el cambio
lingüístico. Entre sus publicaciones se encuentran A History of the Portuguese Language (Oxford
University Press, en prensa) o Palatal Sound Change in the Romance Languages: Diachronic and
Synchronic Perspectives (Oxford University Press, 2019).

xx
Introducción y visión panorámica
de la “Lingüística histórica
del español”
(Introduction and overview to
“The Routledge Handbook of
Spanish Historical Linguistics”)
Steven N. Dworkin, Gloria Clavería Nadal y Álvaro
S. Octavio de Toledo y Huerta

La historia de la lengua y la lingüística histórica son disciplinas cuyo objetivo es el estudio de


la evolución de las lenguas y del cambio lingüístico. La conformación de estas disciplinas se
produjo en el siglo XIX (Várvaro 1972–1973) y siempre han sido áreas prioritarias de estudio
dentro del amplio campo de la lingüística y la filología dedicadas al español. En los primeros
decenios del siglo XXI, se hace necesario, más que nunca, un manual en el que se pongan al día
los conocimientos más recientes de la lingüística histórica aplicada al español, pues la venerable
obra de Lapesa (1981), aunque de valor atemporal, no recoge las investigaciones de los últimos
cuarenta años, en los que se han producido notables avances de todo tipo. Igualmente, la Historia
de la lengua española coordinada por Cano Aguilar (2005), aunque es obra mucho más moderna,
no establece un vínculo sistemático entre los hallazgos fundamentales de la lingüística histórica
del español y los presupuestos teóricos y metodológicos de los estudios más innovadores sobre
el cambio lingüístico. Por su parte, la lexicología y la lexicografía históricas del español, aunque
cuentan con larga tradición y alguna obra de conjunto moderna (Dworkin 2012), tienen aún
muchas posibilidades de desarrollo, pues no existe un diccionario etimológico actualizado, ya
que el DCECH corresponde a la investigación etimológica de la primera mitad del siglo XX, y se
carece, a principios de siglo XXI, de un diccionario histórico completo, pese a que actualmente
existe un proyecto en curso (DHLE) con unas bases metodológicas y filológicas adecuadas, pero
de ejecución extremadamente compleja. En cuanto a la sintaxis, la SHLE viene trazando desde
hace algo más de una década un completo panorama que incorpora los avances recientes en la
investigación de (haces de) fenómenos concretos, pero se echa en falta, pues no es propósito de
esa obra, la actualización de las correspondencias generales entre conjuntos de cambios diversos
y periodos históricos en el desarrollo del castellano/español. Las investigaciones que atienden
específicamente a la fonética/fonología y la morfología históricas, en fin, han quedado quizás un

DOI: 10.4324/9781003035565-1 1
Steven N. Dworkin et al.

tanto en sombra en las dos últimas décadas con respecto al estudio del léxico y la sintaxis, muy
favorecidos estos por el empleo, desde comienzos de siglo, de corpus electrónicos; es de notar, en
todo caso, la escasez en los últimos 15 años de visiones de conjunto sólidamente fundadas acerca
de la evolución fónica y morfológica del idioma.
La obra que presentamos, Lingüística histórica del español/The Routledge Handbook of Spanish
Historical Linguistics, entraña novedades sustanciales con respecto a las obras existentes hasta este
momento. No pretende ser una historia de la lengua en sentido convencional y tradicional,
sino que intenta proporcionar una síntesis de vanguardia de las cuestiones más candentes de
los últimos treinta años desde la perspectiva, original y amplia, de las investigaciones que se
están desarrollando modernamente y de los avances que se están consiguiendo. Persigue este
manual combinar la historia interna o gramática histórica —es decir, el estudio de los cambios
lingüísticos— con la historia externa o historia de la lengua —esto es, el estudio de la evolución
del castellano/español dentro de sus sucesivos entornos históricos, culturales, sociopolíticos,
etc.—. Se atiende a la metodología y a las fuentes de la disciplina desde la mirada compleja
y esperanzadora de principios de siglo XXI, y se combinan enfoques globales con otros más
restringidos pero igualmente iluminadores, siempre trazando puentes entre esa historia interna,
que toma como base el cambio lingüístico como hecho de lengua, y la historia externa, que
atiende al peso de los factores no lingüísticos en los procesos de cambio. Por primera vez, se
intenta cubrir la descripción histórica del español en toda su geografía y de forma equilibrada,
con igual atención al desarrollo del español europeo y también, desde sus orígenes, al americano,
así como, con mirada más amplia, al resto de territorios y comunidades de hablantes entre los
que el español llegó a encontrar cierto arraigo.
La Lingüística histórica del español/The Routledge Handbook of Spanish Historical Linguistics es,
pues, una obra que proporciona un examen amplio de la historia de la lengua española con
una síntesis del estado de la cuestión de los conocimientos que se integran en los varios campos
(fónico, gramatical, léxico) que comprende siguiendo el hilo cronológico, desde las lenguas
prerromanas hasta el español del siglo XXI; con un alcance amplio e innovador, en el que se
conjugan las cuestiones de carácter metodológico con la atención a la evolución propiamente
lingüística y a la historia externa. Este manual muestra, además, como esta disciplina puede
contribuir y se puede beneficiar de las investigaciones tanto de la lingüística sincrónica como de
la lingüística histórica.
Los capítulos que conforman la obra se organizan en cuatro grandes secciones que represen-
tan cuatro grandes perspectivas (con frecuencia íntimamente relacionadas) en los estudios de
lingüística histórica del español: la que toma por objeto los fundamentos metodológicos de la
disciplina y los modelos de análisis más destacados, la que trata de describir las principales trans-
formaciones lingüísticas experimentadas por el idioma, la que procura la caracterización de los
tramos cronológicos más claramente perceptibles en su evolución y, finalmente, la que explora
las raíces y los efectos de la muy considerable variación interna que hoy presenta. La primera y la
última de estas perspectivas, en particular, encuentran en este volumen un desarrollo notable en
relación con otras obras semejantes, como corresponde a los intereses de la lingüística histórica
hispánica más reciente.
Así, en la parte primera se ofrecen las “Perspectivas metodológicas y horizontes de investi-
gación” y en ella se exponen las principales cuestiones teóricas y metodológicas de la lingüística
histórica actual y su aplicación al estudio del español, como, por ejemplo, las consideraciones
filológicas relativas a los textos en el estudio de la historia de la lengua, el uso crítico de los cor-
pus y las bases de datos, la dialectología y la sociolingüística históricas, las tradiciones discursivas,
la función de la oralidad y la escrituralidad, los procesos de gramaticalización y pragmatización,
de koineización y estandarización en el español.

2
Introducción de la “Lingüística histórica del español”

En la parte segunda, y tomando como base la naturaleza sistémica del cambio lingüístico,
se atiende a los “Grandes procesos evolutivos” que configuran la formación y evolución de la
lengua, desde la fonética y la fonología a la arquitectura discursiva y los cambios léxicos, con
una perspectiva amplia en la que se considera también la formación de palabras, las unidades
fraseológicas o la investigación de los cambios en el orden de constituyentes y la estructura
informativa.
La parte tercera tiene como hilo conductor la “Historia externa del latín al español europeo
actual”; toma como punto de partida la consideración de las distintas propuestas de periodización,
y el punto de arranque del recorrido histórico se encuentra en las posibles influencias ejercidas
por las lenguas prerromanas para extenderse a la caracterización de la época latina, el castellano
plenamente medieval, el cuatrocentista, el español clásico y el de los siglos XVIII y XIX, para
acabar con el español actual y sus cambios en marcha, así como con la historia de los contactos
entre el español y otras lenguas de España (vasco, gallego y catalán). Se trata, pues, del apartado
más cercano a la histoire de la langue tradicional, pero renovado no solo con la consideración de
las principales aportaciones de las últimas décadas acerca de cada periodo, sino también con
una visión de conjunto (y, en los capítulos individuales, de detalle) sobre la periodización del
español y con la atención específica a algunas de las épocas del idioma menos estudiadas hasta el
momento, sobre todo desde el punto de vista gramatical (por ejemplo, el siglo XIV o los siglos
XVIII–XIX).
La parte cuarta, atendiendo a la variación interna de la lengua pluricéntrica que es hoy el
español, dirige su mirada a la conformación y evolución de la “Historia de las variedades no
europeas” y considera la historia del español de América en toda su amplitud, la formación y
evolución del judeoespañol y la historia de la presencia del español en otras partes del mundo,
fundamentalmente África y Filipinas.
En suma, la obra consta de 52 contribuciones distribuidas en 48 capítulos que van desgra-
nando las múltiples y complejas facetas que han ido constituyendo la historia de la variedad que
hoy denominamos “español” a lo largo de más de veinte siglos. Aunque cada capítulo tiene un
contenido que lo hace único, en casi todos ellos se encontrará una misma estructura organizativa
—introducción, conceptos fundamentales, aproximaciones teóricas, perspectivas actuales y futuras y
conclusiones, además de tres lecturas recomendadas para profundizar en el tema del capítulo y las
referencias citadas en el mismo— que persigue un fácil manejo por parte del lector, especialmente
el alumno universitario, principal destinatario de esta obra, en atención al cual todos los autores
han hecho lo posible por lograr una exposición sucinta, concisa y clara en forma y contenidos. Las
abundantes remisiones entre unos capítulos y otros permitirán al lector una lectura comprensiva
y abarcadora que superará los límites que impone la fragmentación de la obra en microcapítulos.
Las referencias bibliográficas al final de cada capítulo persiguen proporcionar al lector, ante todo,
una visión panorámica de los estudios más relevantes y recientes sobre cada tema.
Han intervenido en esta obra 60 especialistas destacados de más de cuarenta universidades de
Europa y América. La calidad de los contribuyentes y el esfuerzo de síntesis que han realizado
hacen del estado de la cuestión que ofrece este manual, por la pluralidad de asuntos y la actua-
lidad de los planteamientos, una guía apta para iniciarse en el amplio campo de la lingüística
histórica del español.

Agradecimientos
La elaboración de este volumen ha sido posible gracias a la participación de muchas personas y
queremos expresar nuestra gratitud a todas ellas. En primer lugar, agradecemos a cada uno de
los autores que participan en este volumen el entusiasmo con el que aceptaron la propuesta, su

3
Steven N. Dworkin et al.

contribución y su paciencia en el dilatado proceso de revisión y corrección. Agradecemos tam-


bién el apoyo constante de los directores de la colección, Manel Lacorte y Javier Muñoz-Basols,
y del equipo de la editorial Routledge en la persona de Tassia Watson.

Referencias citadas
Cano Aguilar, R., coord. 2005. Historia de la lengua española. 2.ª ed. Barcelona: Ariel.
DCECH = Corominas, J. y J. A. Pascual.1980–1991. Diccionario crítico etimológico castellano e hispánico.
Madrid: Gredos.
DHLE = Real Academia Española. 2013–. Diccionario histórico de la lengua española (DHLE). [Link]
dhle.
Dworkin, S. N. 2012. A History of the Spanish Lexicon: A Linguistic Perspective. Oxford: Oxford University
Press.
Lapesa, R. 1981. Historia de la lengua española. 9.ª ed. Madrid: Gredos.
SHLE = Company, C., dir., 2006–. Sintaxis histórica de la lengua española. Ciudad de México: Fondo de
Cultura Económica / Universidad Nacional Autónoma de México.
Várvaro, A. 1972–1973. “Storia della lingua. Passato e prospettive di una categoria controversa (I), (II)”.
Romance Philology 26 (1): 16–51; 26 (3): 509–531.

4
Parte I
Perspectivas metodológicas y
horizontes de investigación
1
Lingüística histórica y filología
(Historical linguistics
and philology)
Pedro Sánchez-Prieto Borja

1. Introducción
En este capítulo inicial se examinan las relaciones entre lingüística histórica y filología o, pro-
piamente, crítica textual, puesto que esta última se ocupa de establecer ediciones fiables, tras
reconstruir la historia del texto a partir de su tradición manuscrita e impresa.
Palabras clave: filología, crítica textual, historia de la lengua, edición crítica, estudio lingüístico
de textos

This opening chapter examines the relationships between historical linguistics and philology or,
strictly speaking, textual criticism since the latter is concerned with establishing reliable editions,
after reconstructing the history of the text from its manuscript and printed tradition.
Language history, a discipline that combines descriptive and reconstructive methods, needs to
start from reliable textual materials. One of the tasks of the transcription and editing methods is
to provide the historians of the language with quotable sources, but at the same time, the latter
must know the history of the texts in order to contextualize and adequately assess the linguis-
tic data that the texts offer. The debate is between different editing methods; none of them is
definitive, since the study of the different levels, from the spelling to the lexicon and speech,
surely requires different editions. In the digital age, the editing of texts opens itself up to new
possibilities as a mandatory source of data for the language historian, but, for this very reason,
also to new demands for rigor and reliability.
Keywords: philology, textual criticism, history of the language, critical edition, linguistic study
of texts

La historia de la lengua, disciplina que combina los métodos descriptivo y reconstructivo, nece-
sita partir de materiales textuales fiables. Uno de los cometidos, pues, de los métodos de trans-
cripción y edición consiste en proporcionar fuentes citables al historiador de la lengua, pero, al
mismo tiempo, este último debe conocer la historia de los textos para poder contextualizar y
valorar adecuadamente los datos lingüísticos que los textos ofrecen. El debate se presenta entre
diferentes métodos de edición; ninguno de ellos es definitivo, pues el estudio de los diferentes

DOI: 10.4324/9781003035565-3 7
Pedro Sánchez-Prieto Borja

niveles, de la grafía al léxico y discurso, precisa, seguramente, de ediciones distintas. En la era


digital, la edición se abre a nuevas posibilidades como fuente obligatoria de datos para el histo-
riador de la lengua, pero, por esto mismo, a nuevas exigencias de rigor y fiabilidad.

2. Conceptos fundamentales
El punto de partida de la investigación en historia lingüística e historia de la lengua es el texto;
sin embargo, este no se presenta como una realidad objetiva per se, sino que se concreta dentro
de su historia, es decir, en el marco de una hipótesis sobre cómo surgió. La historia se puede
desglosar en génesis y transmisión (difusión del texto a través de copias), pero se ha de añadir otro
plano conceptual, el de la recepción, que no depende solo del texto recibido, sino de cómo este
es leído, glosado, comentado, interpretado y aun esperado. En un plano ontológico, el texto se
define por su tenor, es decir, por su expresión lingüística lineal y literal; por ello, una traducción
es otro texto; sin embargo, modernamente, se ha visto el texto como abierto (Shillingsburg
1996), de manera que bajo el mismo se incluyen todas sus manifestaciones o concreciones, por
la vía de la versión, resumen, amplificación y aplicaciones secundarias (citas y otros usos trans-
textuales). Con todo, dentro de la filología, el concepto de texto se liga al de original, al texto
prístino o autorial. Cabe distinguir un doble plano, el del texto ideal, libre de errores [Ω], y el
original como testimonio concreto, manuscrito o impreso (0), y que, con seguridad, no estará
libre de errores; los códices de la cámara regia alfonsí aspiran a este rótulo, pero no dejan de ser
una puesta en limpio, autorizada por el rey y con no pocas modificaciones respecto de los borra-
dores previos o cuadernos de trabajo (Catalán 1997). Si este original es de mano del autor, se
llamará autógrafo; si de otra mano, alógrafo. Auténtico puede ser el mismo original o el ejemplar
autorizado por el autor. Más difuso y controvertido es el concepto de arquetipo (Blecua 1987,
59), estado textual más antiguo al que es posible remontarse con la tradición manuscrita. Antí-
grafo es el modelo del que se copia.
Se habla corrientemente de modernización en las copias. Esta no es uniforme, por lo que da
lugar a un estado lingüístico mixto. Un problema conceptual es qué se entiende por variante de
lengua; su naturaleza depende de la tradición textual (cf. §§ 3 y 6). Suele distinguirse entre variantes
gráficas (las que no tienen transcendencia fonética) y de lengua (de la fonética al léxico). Las copias
pueden introducir formas marcadas geográficamente, aunque, en general, todo texto (y toda copia)
lo está. Con “dialectismo”, los editores suelen referirse a los usos no castellanos, con excepciones
(López Gutiérrez y Godino López 1997).
En cuanto al método de edición, no pertenecen a la misma categoría intelectual la transcrip-
ción de un manuscrito y el intento de elucidar el proceso por el que una obra nació, operación
imprescindible para establecer el texto crítico. En la perspectiva de la edición, la garantía
de autenticidad y rigor se liga a la consulta del facsímil, especialmente recomendable para
lecciones controvertidas. La transcripción paleográfica, que refleja en todo pormenor los usos
del manuscrito o impreso, conviene al estudio gráfico-fonético, mientras que la edición crítica (o
presentación crítica) es adecuada al examen morfosintáctico, léxico y discursivo. Se ha llamado
la atención acerca de la interpretación que toda edición implica, por lo que puede condicionar
al estudioso, p. ej., al proponer este una puntuación que tal vez no refleja la conformación
sintáctica del texto genuino. En El caballero de Olmedo de Lope de Vega (ed. de Rico 1981 y
2009; reseña de Morreale 1983, 3), Don Alonso, al oír el cantar “Que de noche le mataron/al
caballero,/la gala de Medina,/la flor de Olmedo” exclama “¡Cielos! ¿Qué estoy escuchando?/
Si es que avisos vuestros son,/ya que estoy en la ocasión,/¿de qué me estáis informando?”
(vv. 565–568), donde ha de leerse “ya que estoy en la ocasión de que (‘de la cual’) me estáis
informando”.

8
Lingüística histórica y filología

3. Aproximaciones teóricas
La crítica textual se ha aplicado sobre todo a las obras de la literatura y, desde sus orígenes
científicos en el siglo xix (Baker y Greub 2018, 61–62), ha centrado su atención en los pro-
blemas propiamente textuales (o de sustancia) y no en los lingüísticos ni en los de la forma
verbal del texto editado, aunque no faltan excepciones, desde el mismo Cantar de mio Cid
(Menéndez Pidal 1976). El modelo lachmanniano parte de la exigencia de reconstruir el
arquetipo a partir del acopio y cotejo de testimonios manuscritos e impresos (collatio), aplicado
al Nuevo Testamento en griego, según un método reformado por Dom Quentim para la
edición benedictina de la Vulgata, que compara los testimonios de tres en tres, y ensayado
parcialmente en la edición de la General estoria de Solalinde (1930). La reconstrucción del
original ha sido criticada por historiadores de la lengua, que han preferido partir de un solo
manuscrito, y se han orientado hacia al bédierismo (Bédier 1928), aunque con evidente
simplificación de las ideas del sabio parisino. Según Faulhaber (2011, 2), “para Bédier,
entonces, la mejor solución es editar el mejor manuscrito, enmendándolo sólo para corregir
los errores evidentes. Así tendremos un texto verdaderamente medieval, sin injertar en él la
subjetividad de los editores. Y esto es precisamente lo que hizo el equipo de Solalinde, cuyas
intervenciones se redujeron al mínimo”. Pero el concepto de “evidente” está lejos de ser
objetivo, y las correcciones ocasionales dan lugar a un texto fallido que ni es una transcripción
ni una edición propiamente dicha. Solo una filología que se plantee la génesis y transmisión
del texto en su integridad y sitúe a este en la historia lingüística está en situación de formular
la propuesta de lectura que implica toda edición que merezca este nombre: “la solución
positivista de Bédier, escamotea, bajo el pretexto de la objetividad del manuscrito base, el
carácter inexorablemente problemático del texto” (Orduna 2000, 171).
La rica discusión inicial entre ambas corrientes, lachmanniana y bedierista, ha conocido una
simplificación polemizante en autores que defienden la variación como modelo único de acceso
plural al texto, sin establecer una jerarquía entre los testimonios, de manera que las variantes se
presenten en pie de igualdad; surge así el lema, en apariencia aceptable, de éloge de la variante
(Cerquiglini 1989); antecedente notable en el ámbito hispánico es la edición sinóptica experimental
de Los siete tiempos de las leyes, de Jacobo de Junta (Roudil 1986); propiamente, es una transcrip-
ción paleográfica interlineada.
La desconfianza en la estemática o clasificación genealógica de los testimonios llevó a posturas
más ponderadas que ponen el foco en la historia del texto. Así nació hace un siglo en Italia la
filología neolachmanniana de Barbi, reformulada recientemente (Orlandi 1995), y que se fun-
damenta en el juicio crítico sobre cada paso del texto. De este modo, todas las enmiendas han
de ser justificadas. El aparato se convierte así en una fuente de información sobre las elecciones
lingüísticas del autor, pues estas son modificadas, o alteradas, en las copias por incomprendidas
(en el Calila e Dimna, “E fallé las leyes mucho alongadas e las setas [‘sectas’] muchas” de A es en
B e las letras muchas; Döhla 2009, 134). Progresivamente, la variación que recogen los aparatos
críticos va siendo utilizada en los estudios lingüísticos. Los conceptos de lectio facilior y difficilior
son señalados con frecuencia y en ellos el plano lingüístico tiene importancia. Cuentan a este
propósito pasajes raros, difíciles y hápax o formas no documentadas, fuente valiosa esta para la
historia del idioma (cf. el caso de la repetición del numeral, con valor distributivo, en “mas val
con sendos ojos salvar vuestro pecados/que con dos dos veerbos [‘veros’] en infierno dañados”,
en la Vida de San Millán, de Berceo (Horcajada Diezma y Sánchez-Prieto Borja 1999), o el
empleo de la conjunción disyuntiva do en documentación burgalesa como euskerismo (Torrens
Álvarez 2014). La regla que podría guiarnos es que una lección no documentada o rara puede
ser errónea en un pasaje, dudosa en dos, y segura si se repite en tres lugares del texto.

9
Pedro Sánchez-Prieto Borja

Una línea que no se identifica ni con el reconstructivismo neolachamanniano ni con el mero


seguimiento del manuscrito o impreso propio de las posturas más simplificadas del bédierismo es
la de la bibliografía textual y el concepto de copy text (Greg 1950–1951; Tanselle 1989). Aunque
en sus ediciones del teatro isabelino, Tanselle y otros críticos se decantan por las lecciones de la
princeps, aun ante sospechas de intervención autorial en la redacción, su comparación porme-
norizada entre ediciones, tiradas y aun ejemplares puso a la imprenta dentro de la filología, e
incorporó las variantes al estudio de la creación textual y de la lengua del autor (cf. en Quijote
“rasgó una gran tira de las faldas de la camisa, que andaban colgando, y diole once ñudos” para
hacer un rosario, mientras que en la reimpresión de la princeps los nudos son agallas de árbol).
Aunque menos que las tradiciones manuscritas, los textos impresos sufren modificaciones, e
incluso la censura estuvo presente desde antiguo. En El pastor de Fílida (Castillo Martínez 2009),
la edición de Lisboa (1589) altera la lección genuina, representada por Madrid (1590), “El Tajo,
morada antigua de las sagradas musas” en “El Tajo, morada antigua de las musas” como señala
la editora para evitar las referencias gentílicas en un contexto contrarreformista. Otras veces
son motivos comerciales los que explican los cambios. Cuando Cromberger publica el Libro
del caballero Zifar (Sevilla and Cromberger 1512), para que el libro sea vendible, su lengua ha de
actualizarse; así, usos de los manuscritos como “faze aquel polvo tan bermejo que semeja san-
gre” (89,17–18) son ahora “parece el polvo de color de sangre”. El historiador de la lengua ha
de advertir que rasgos como el uso de los pronombres objeto son fácilmente modificados en la
preparación del original de imprenta y en la composición de la forma, por lo que el loísmo de un
Gracián en su Tercera parte del Criticón pudo deberse a las prensas de Pablo de Val (Madrid 1657),
frente a los usos aragoneses de los dos primeros volúmenes (Zaragoza 1651; Huesca 1653).
La presentación gráfica de los textos guarda relación directa con sus posibilidades de estudio.
Ya Menéndez Pidal (1976) propuso una edición paleográfica y otra crítica para el Cantar de mio
Cid; la primera no es estrictamente paleográfica, pues ofrece puntuación y ciertas intervencio-
nes; la segunda es injustificadamente enmendatoria (“Ý se echaua myo çid despues que fue
çenado” (v. 403), que cambia en fo de noch). Precisamente, la autenticidad textual, y con ella
lingüística, es uno de los problemas principales en el estudio de los textos. Por otra parte, ha sido
frecuente la confusión entre manuscrito y rama, pues suelen atribuirse a un manuscrito (y a su
copista) todos los errores que porta un testimonio, cuando muchos de ellos serán heredados de
su rama, y lo mismo cabe decir para los usos lingüísticos, heredados unos, innovados otros; por
ello Segre (1979) dijo que cada manuscrito es portador de un diasistema.
En cuanto a la fiabilidad de las ediciones críticas, no cabe un juicio general, pues algunas se
mueven en lo razonable, mientras que otras intervienen contra los principios de la emendatio. Frente
a la enmienda conjetural u ope ingenii, cabe apoyarse en el texto mismo, pues unos pasajes iluminan
a otros; ejemplo puede ser, con Blecua (1992), “ángel de Dios veno,/saludó a ella”, frente a la
banalización “ángel de Dios bueno”, en el ms. S del Libro de buen amor, aquí testimonio único (cf.
“El septeno/fue más bueno,/cuando tu fijo por ti veno”, v. 1640c). Otras veces, la reconstrucción
sobrepasa los límites de la identidad del texto consigo mismo, como en la propuesta de Hilty (1986)
para el Auto de los Reyes Magos, “nacido es Dios, por ver, de fembra/in achest mes de december”,
que enmienda en “nacito es Dios de mugier/en achest mes de december” (vv. 15–16). Precisamente,
uno de los grandes peligros es enmendar todo lo aparentemente raro, pues se escamotean al
estudioso lecciones genuinas o que posiblemente lo sean.

4. Perspectivas actuales
Una cuestión que se dirime casi más en el plano práctico que en el teórico es la de qué texto
estudiar. La respuesta está condicionada por diversos imperativos; muchas veces, lo primario es

10
Lingüística histórica y filología

el texto y, en el marco de la preparación de la edición, se lleva a cabo el estudio lingüístico. Otras


veces es el tema estudiado el condicionante. Son perspectivas diferentes, pues en el primer caso
se promueve el estudio integral, mientras que en el segundo es la orientación e interés del inves-
tigador la que determina el objeto. Por descontado, la selección cronológica es un aspecto básico,
y cabe distinguir entre los estudios centrados en un período, o en un siglo, y los que abarcan un
espacio evolutivo más amplio. Esta cuestión es fundamental, porque cada período ofrece unos u
otros tipos textuales. Si en el siglo xx predominó el estudio de la Edad Media y siglos xvi–xvii,
en el xxi se han visto privilegiados los siglos xviii y xix (p. ej., García Godoy 2012). Al respecto,
se ha de notar, que en los siglos más cercanos no se acaban los problemas textuales. Las Cartas
marruecas de José Cadalso aparecieron póstumas por entregas en 1789 en El Correo de Madrid, y
luego como libro, en 1793, con correcciones debidas al impresor Sancha (Blecua 1987, 224).
En cuanto al tipo de texto, los estudios de Menéndez Pidal para la época de orígenes se basa-
ban, obligatoriamente, en fuentes documentales; él mismo consideraba que, del xv en adelante,
eran preferibles las obras literarias, por su riqueza y variedad, frente al carácter estereotipado de
los documentos. Así sucede con la Historia de la lengua española de Lapesa (1981). Ya en las últimas
décadas del siglo xx se produjo un giro significativo, pues no pocos investigadores empezaron
a acudir a los archivos para recuperar directamente testimonios y transcribirlos (cabe citar gru-
pos de las universidades de Salamanca, Deusto, Sevilla, Málaga, León, Alcalá y el CSIC, entre
otros). Un fenómeno paralelo se ha dado para el catalán y el gallego. Tienen gran interés las
manifestaciones espontáneas, como los dicterios de contenido político durante la guerra de la
Independencia: “Señor José Segundo y señores mierdas” (Octavio de Toledo y Pons Rodríguez
2016). Un espacio en el que se han dado grandes progresos es el de la escritura femenina, estu-
diada ahora con rigor a partir de las cartas personales. Las manifestaciones anteriores al siglo xvii
son escasas, mientras que desde el xviii abarcan casi todos los ámbitos sociales. Se han podido
señalar ciertas características diferenciales desde el punto de vista registral y sociolingüístico, pero
incluso en el de la manuscritura se han avanzado caracterizaciones (Almeida Cabrejas et al. 2017).
Pero la renovación no ha alcanzado solo a aquellos ámbitos menos trabajados por los grandes
maestros. Incluso la época de orígenes ha conocido nuevos estudios, y textos emblemáticos,
como la Nodicia de kesos, reciben nuevas lecturas (cf. “en ke puseron organo”, leído ahora ogano
‘hogaño’), así como una datación precisa (974 aprox., Fernández Catón et al. 2003). Más llama-
tivo es el caso de cartularios como el de San Millán de la Cogolla. Según nota García Andreva
(2010, 85), el LHP toma como fuente la edición de Serrano, plagada de errores (damos el lema
del LHP, y luego las lecturas de García Andreva y Serrano separando con |): albergaria (albergaria
| alberguaria); almude (almude | almute); benefetria (benfetria | benefectria); bodeguero (botecarius |
votecarius). Además, las lecturas de Serrano se incorporaron al CORDE, con lo que esto implica
para los estudios actuales de historia lingüística.
La posibilidad de acceder a facsímiles de gran calidad, sobre todo, en línea, ha abierto nue-
vas posibilidades tanto en la investigación como en la enseñanza. Así sucede, p. ej., con el
Cid (Riaño Rodríguez y Gutiérrez Aja 2003, y Cervantes Virtual [Link]/
portales/cantar_de_mio_cid/obra_manuscritos/). Incluso la datación de esta obra ha conocido
nuevas propuestas, no necesariamente definitivas (Bayo Julve 2002).
La ampliación de la tipología textual no puede limitarse al binomio literatura y documentación
de archivo, pues se han de considerar otros, como los historiográficos (Fernández-Ordóñez 2006)
y los llamados de especialidad, entre los cuales destacan los de materia médica (Herrera y Sánchez
González de Herrero 1997), desde el siglo xvi; en el ámbito de la economía, de 1688 es el tratado
sobre los orígenes de la bolsa en Ámsterdam, por José de la Vega (Buezo et al. 2000).
Otro espacio que ha conocido una importante ampliación ha sido América; frente a las
colecciones propiciadas por los historiadores, de calidad irregular, se ha emprendido de manera

11
Pedro Sánchez-Prieto Borja

rigurosa la recuperación de los fondos archivísticos, especialmente de México (Company Com-


pany 1994; Arias Álvarez et al. 2014), pero también de otros ámbitos, como Honduras y El
Salvador (Ramírez Luengo 2017). Cabe destacar la especificidad americana que representa el
bilingüismo o, si se quiere, la interferencia de las lenguas indígenas de quienes escriben el caste-
llano. Es referencia al respecto el estudio de Rivarola Rubio (2000), pues solo tras una cuidada
transcripción es posible recuperar las peculiaridades gráficas que pueden revelar, a su vez, rasgos
de la pronunciación del español por los mayas: “dos coplos y una corpea y dos parenas y un
martillo de adaracar calvos, una pecornea piquiña” (I, 1587).
Se ha asistido desde las últimas décadas del siglo xx a una toma de conciencia de la necesidad
de llevar a cabo ediciones transcritas con criterios normalizados, pues esto facilitaba su estudio
lingüístico y la comparación entre textos. La insuficiencia de una sola presentación justifica la
propuesta de diferencias entre transcripción paleográfica y presentación crítica; el inicio a finales
de los años 80 de los grandes corpus llevó a plantear la necesidad de estandarización; surgieron
así propuestas como la San Millán de la Cogolla (Sánchez-Prieto Borja 1998, 2011) pensada,
sobre todo, para textos literarios medievales y clásico, y los criterios de la CHARTA (2013), que
han logrado una notable aceptación.
Un desarrollo reciente es el de la marcación TEI. Esta afecta tanto a la cabecera descriptiva
del documento (head), organizada en campos, por lo que también puede presentarse como base
de datos y al texto mismo. Una aplicación concreta es la marcación XML-TEI basada en los
criterios CHARTA (Isasi et al. 2020). La edición digital ofrece dos ventajas fundamentales: la
posibilidad de presentar materiales diversos, de acuerdo con el concepto de edición integral, y
la recuperación de los datos del texto mismo, así como los metadatos. Las posibilidades para el
estudio son enormes y dependen de qué se haya marcado previamente en el texto; p. ej., las
estructuras sintácticas, o la puntuación misma del manuscrito o impreso (Isasi et al. 2020, 73).
Un breve repaso por niveles de análisis muestra un cierto declive del nivel fonético, lógico
ante la llamada “ley del péndulo”, como se ve por las actas de los congresos de la Asociación de
Historia de la Lengua Española. Sin embargo, cabe señalar un progreso metodológico impor-
tante, que nace de partir, en la mayoría de los casos, de las fuentes manuscritas e impresas
antiguas; sobre todo en tesis doctorales, se lleva a cabo un examen paleográfico, dentro una
perspectiva integral que comprende la materialidad de la escritura en lo filológico-lingüístico
(Martín Aizpuru 2020). Nótese, p. ej., la necesidad de examinar el sistema de abreviación, y al
respecto cabe dudar si formas como fuerds con lineta han de resolverse como fuéredes o fuerdes;
de igual modo, es testimonio más seguro muncho (ya en Toledo, 1236) que mucho con lineta
sobre h, pues este parece hábito paleográfico convencional. La integración de la paleografía en
la filología es una exigencia metodológica que redunda en beneficio de la valoración apropiada
de los datos lingüísticos; es destacable al respecto el caso de las dos formas de la “i” en la letra
cursiva medieval, prolongada hacia abajo para el valor vocálico (mj) y hacia arriba y abajo para el
consonántico (justos), según señaló Fernández López (1996).
En el nivel sintáctico, las alteraciones a las que la transmisión somete a los textos son impor-
tantes y condicionan el estudio, pues ciertos elementos conectivos, y no solo la conjunción y, se
añaden y suprimen con facilidad en las copias, configurando patrones sintácticos distintos. Sobre
la repercusión de la variación entre testimonios para el análisis de la sintaxis versa el estudio de
Romero Cambrón (2006), aplicado a la obra de Fernández de Heredia; Almeida Cabrejas (2013)
señala fenómenos sintácticos que podrían hacer dudar al estudioso, como membrar con lo recor-
dado como sujeto (“cuémo me mienbra que fablando en aquella razon oí unas vozes com en el
cielo”, Estoria de España, Y.I.2, 28rb).
La documentación de un rasgo en fuentes documentales y literarias, prosa y poesía, apunta a
la extensión de ese determinado rasgo en la lengua de uso. En cuanto a la adscripción registral,

12
Lingüística histórica y filología

formas como el pues explicativo (y explicativo-causal) empezaron claramente en el registro más


elevado (cancilleresco), pero acabaron popularizándose; incluso expresiones que, a primera vista,
pasarían por populares, como diz que (o dizque), se encuentran primero y con mayor frecuencia
en los registros más elevados.

5. Perspectivas futuras y conclusiones


¿Cuál es la mejor manera de editar los textos? En el caso de los textos literarios, resulta sesgado,
por parcial, oponer interés literario a interés lingüístico, de acuerdo con la manida expresión de
texto como “monumento” frente a texto como “documento”. Entender y valorar el texto en
todas sus dimensiones ayudará, sin duda, a plantear adecuadamente cualquier estudio. Por otro
lado, la facilidad de disponer de grandes volúmenes de textos es, al mismo tiempo y sin contra-
dicción alguna, una gran ventaja y un gran inconveniente. En realidad, las dos perspectivas, la
filológica y la lingüística, son complementarias, y la necesaria especialización no debe hacernos
perder de vista la corriente evolutiva general de la lengua, solo aprehensible en el texto íntegro.
Es bastante probable que en el futuro sigan coexistiendo estos dos caminos, el de la sensibilidad
filológica que quiere ver el texto en su contexto sociohistórico y en su historia misma, y el del
manejo del enorme caudal de datos que proporcionan los textos digitales. Es posible también
que la primera orientación pierda peso, pero, aun de manera reducida, el examen minucioso
del texto particular, frente a la disolución de este en los corpus, va a seguir reclamando su lugar.
Los métodos filológicos seguirán atrayendo a estudiosos por su valor interpretativo acerca de la
historia textual y lingüística; como señala para la Historia troyana en verso Barbato (2020, 22), la
métrica permite, a veces, entrever la lengua del texto que hay detrás de la de los copistas: avré >
averé (M), morredes > moriredes (M), perdremos > perdermos (E), y del mismo modo, la rima: veyo
> veo (M).
La edición crítica seguirá siendo reclamada por aquellos lectores que deseen un texto com-
prensible; cf. la edición citada de la Historia troyana en verso, con cuidada puntuación, que es el
elemento de más alcance para presentar una propuesta de lectura. Lo que es seguro es que la
edición digital ocupará prácticamente todo el espacio, frente a la que tenga el papel como soporte,
pero no sobresaldrá la que se limite a mostrarse en medio digital (p. ej., para lector tipo e-book),
sino que se primará la interactividad; por una parte, que explote la multiplicidad permitida por
la web, y que ofrezca facsímiles de los testimonios manuscritos, transcripciones paleográficas y
edición crítica, además de formas de interactividad con enlaces entre estos materiales y búsque-
das selectivas que permitan recuperar amplia información. En esta vía se inserta el proyecto sobre
textos historiográficos Transcribe Historia ([Link] coordinado
por Ward (2018). Otro camino será la edición múltiple de textos paralelos (cf. Biblia Medieval). En
este sentido, la recuperación de información se ligará a las posibilidades de explotación del texto,
que ofrece dos alternativas ahora, no incompatibles entre sí, las del encasillado del texto en una
base de datos y la marcación según el modelo TEI; el éxito definitivo de esta vía para numerosos
proyectos de edición interactiva dependerá, a nuestro juicio, del grado en que el proceso pueda
automatizarse; pensamos, p. ej., en la marcación de las estructuras sintácticas.
Con vistas a la explotación de las ediciones digitales, un elemento fundamental es la lema-
tización, en cuanto que permite recuperar información inalcanzable de otro modo. La atribución
de categorías léxico-gramaticales que implica la lematización, junto con la adición de metadatos
XML, hacen posible búsquedas complejas, como la de adjetivos que emplean las mujeres de
Madrid en el siglo xix en sus cartas con el sustantivo hijo. En la misma dirección apunta la cuan-
tificación, para la que resulta imprescindible relativizar los datos, p. ej., con apariciones de una
invariante cada diez mil palabras (véase, por ejemplo, LYNEAL, de Ueda).

13
Pedro Sánchez-Prieto Borja

En definitiva, las ediciones no solo se diferencian por ser críticas o paleográficas, sino por
su rigor. Así, para el Calila e Dimna, Döhla (2009) no intenta una reconstrucción del texto
genuino, tarea no del todo hacedera ante lo innovador de las dos ramas, sino que presenta en
columnas paralelas los testimonios A y B, con amplia anotación explicativa, y se convierte en
una fuente importante para el estudio lingüístico, con el inconveniente, eso sí, de la distancia
de casi dos siglos con el original del xiii. El historiador de la lengua ha de ser consciente de
que recuperar el texto del siglo xiii y, más aún su lengua, es tarea imposible para obras como
esta. Situación infinitamente mejor es la de contar con el original, aunque tampoco es garantía
de autenticidad autorial absoluta. La historia de la lengua, en tanto basada en fuentes escri-
tas problemáticas por su propia naturaleza, no puede consistir en otra cosa que en formular
hipótesis; eso sí, cuanto mejor se comprenda la trayectoria textual de las mismas más sólidas
serán estas hipótesis.

Lecturas recomendadas
El Manual de crítica textual de Blecua (1987) sigue siendo lectura obligatoria para quienes se quieran
adentrar en la edición de textos, o pretendan valorarlos en cuanto testimonio lingüístico. Blecua
se adhiere a una postura neolachmannina, y, por tanto, no es excéptico acerca de la capacidad
enmendatoria del editor ante errores de la transmisión, a condición de que este sea capaz de expli-
car cómo se ha producido el error. Aunque no es muy explícito este manual acerca de las variantes
lingüísticas, sí propone darles cabida en un segundo aparato de variantes adiáforas (frente al que
recoge las variantes propiamente textuales o elegibles).
Fernández-Ordóñez (2002) se encuentra entre los pocos estudiosos que se han planteado los pro-
blemas lingüísticos de la edición y, en particular, el límite entre variantes textuales y de lengua.
Señala qué variantes de la tradición manuscrita de un texto medieval, la Segunda Parte de la
General estoria y la versión Vulgata de la Estoria de España, han de considerarse lingüísticas y, por
tanto, no elegibles per se en la tradición textual. Entre ellas, señala no solo las fonéticas y morfo-
sintácticas, sino ciertas diferencias discursivas, como la presencia o ausencia de los constituyentes
oracionales: “E Ruth fizo cómo (le) mandó Boos”.
La tesis doctoral de Torrens Álvarez, publicada (2002), se propone como modelo integrado de
edición y estudio de un texto medieval, el Fuero de Alcalá (ca. 1235). Cabe destacar la cuidada
edición con triple acceso: facsímil en blanco y negro, de notable calidad, la detallada transcrip-
ción paleográfica, en la que se marcan las linetas abreviativas, y la edición crítica, que facilita el
acceso al texto y el estudio de aspectos que van de la morfosintaxis al léxico y al discurso; véanse
p. ej., sus observaciones sobre las estructuras quiásticas: “el ochavo de la leche tome e del queso”
(Torrens Álvarez 2021).

Referencias citadas
Almeida Cabrejas, B. 2013. “Fenómenos sintácticos raros y edición de textos: el caso de la segunda parte
de la General estoria”. Revista de Historia de la Lengua Española 8: 3–28.
Almeida Cabrejas, B., R. Díaz Moreno y M. C. Fernández López, eds. 2017. “Cansada tendré a Vuestra
Excelencia con tan larga carta”. Estudios sobre aprendizaje y práctica de la escritura por mujeres en el ámbito his-
pánico (1500–1900). Lugo: Axac.
Arias Álvarez, B. (dir. y ed.), M. R. Delgado García, M. A. Mendoza Posadas y I. Mora Peralta. 2014.
Documentos públicos y privados del siglo xvi. Textos para la historia del español colonial mexicano I. México:
Universidad Nacional Autónoma de México.
Baker, C. y Y. Greub. 2018. “Sous le signe de Lachmann: la domination de la méthode critique
d’édition entre 1872 et 1913”. En L’Ombre de Joseph Bédier. Théorie et pratique éditoriales au xxe siècle,
eds. C. Baker, M. Barbato, M. Cavagna et Y. Greub, 61–89. Estrasburgo: Éditions de Linguistique
et Philologie.
Barbato, M., ed. 2020. Historia troyana. Versos. Alessandria: Edizioni dell’Orso.

14
Lingüística histórica y filología

Bayo Julve, J. C. 2002. “La datación del Cantar de mio Cid y el problema de su tradición manuscrita”. En
Mio Cid Studies: ‘Some Problems of Diplomatic’ Fifty Years On, eds. A. Deyermond, D. G. Pattison and
E. Southworth, 15–35. Londres: University of London.
Bédier, J. 1928. “La tradition manuscrite du Lai de l’Ombre”. Romania 54: 161–198 y 321–356 (tirada aparte
París: Champion, 1929, reimpr. 1970).
Blecua, A. 1987. Manual de crítica textual. 2.ª ed. Madrid: Castalia.
Blecua, A., ed. 1992. Juan Ruiz, Arcipreste de Hita, Libro de buen amor. Madrid: Cátedra.
Buezo, C., P. Corrales, P. Fanconi, L. Guerra, C. Moral, M. M. Paúl and J. Satter, eds. 2000. José de la Vega,
Confusión de confusiones. Madrid: Universidad Europea y CES Ediciones.
Castillo Martínez, C. 2009. “La edición moderna de textos del Siglo de Oro: el caso de El pastor de Fílida”.
En Lecturas y textos en el siglo xxi. Nuevos caminos en la edición textual, coords. C. Castillo Martínez y J. L.
Ramírez Luengo, 95–102. Lugo: Axac.
Catalán, D. 1997. De la silva textual al taller historiográfico alfonsí. Códices, crónicas, versiones y cuadernos de trabajo.
Madrid: Fundación Ramón Menéndez Pidal y Universidad Autónoma de Madrid.
Cerquiglini, B. 1989. Éloge de la variante. Histoire critique de la philologie. París: Seuil.
CHARTA 2013 = Red CHARTA. Criterios de edición. [Link]/criterios-de-edicion [22/11/2020].
Company Company, C. 1994. Documentos lingüísticos de la Nueva España. Altiplano Central. Universi-
dad Nacional Autónoma de México: Instituto de Investigaciones Filológicas, Centro de Lingüística
Hispánica.
CORDE = Real Academia Española. Corpus diacrónico del español. [Link]
[21/11/2020].
Döhla, H.-J. 2009. El libro de Calila e Dimna (1251): nueva edición y estudio de los dos manuscritos castellanos.
Zaragoza: Instituto de Estudios Islámicos y del Oriente Próximo.
Faulhaber, C. B. 2011. “Reseña de Alfonso X el Sabio, General estoria. Madrid: Biblioteca Castro/
Fundación José Antonio de Castro”, Infoling, 18 marzo de 2011. [Link]
[Link].
Fernández Catón, J. M., M. Díaz y Díaz, J. A. Pascual Rodríguez, J. M. Ruiz Asencio, J. R. Morala
Rodríguez, J. A. Fernández Flórez y J. M. Díaz Bustamante. 2003. Documentos selectos para el estudio de
los orígenes del romance en el Reino de León. Siglos X-XII. León: Centro de Estudios e Investigación “San
Isidoro”. [Link]/web/biblioteca/libros/documentos-selectos-estudio-origenes-romance-reino-
leon-siglos-x-xii/html/[Link]?idLibro=155 [22/11/2020].
Fernández López, M. C. 1996. “Una distinción fonética inadvertida en el sistema gráfico medieval”. En
Actas del III Congreso Internacional de Historia de la Lengua Española, eds. A. Alonso González, L. Castro
Ramos, B. Gutiérrez Rodilla and J. A. Pascual Rodríguez, 113–123. Madrid: Arco Libros.
Fernández-Ordóñez, I. 2002. “Tras la collatio o cómo establecer correctamente el error textual”. La Corónica
30 (2): 105–180.
Fernández-Ordóñez, I. 2006. “La historiografía medieval como fuente de datos lingüísticos. Tradiciones
consolidadas y rupturas necesarias”. En Actas del VI Congreso Internacional de Historia de la Lengua española,
eds. J. L. Girón Alconchel y J. J. de Bustos Tovar, vol. 2, 1779–1808. Madrid: Arco/Libros.
García Andreva, F. (2010). El Becerro Galicano de San Millán de la Cogolla. Edición y estudio. Logroño: Cilen-
gua (incluye CD-ROM).
García Godoy, M. T., ed. 2012. El español en el siglo xviii. Cambios diacrónicos en el primer español moderno.
Berna: Peter Lang.
Greg, W. W. 1950–1951. “The Rationale of Copy-Text”. Studies in Bibliography 3: 19–36 (Reimpresión
con cambios menores en Greg, W. W. 1966. Collected Papers, ed. J. C. Maxwell, 374–391. Oxford:
Clarendon-Oxford University Press).
Herrera, T. y M. N. Sánchez González de Herrero, eds. 1997. Tratado de patología. Madrid: Arco
Libros.
Hilty, G. 1986. “El Auto de los Reyes Magos (prolegómenos para una edición crítica)”. En Philologica Hispa-
niensia in Honorem Manuel Alvar, vol. 3, 221–232. Madrid: Gredos.
Horcajada Diezma, B. y P. Sánchez-Prieto Borja. 1999. “La reduplicación distributiva del numeral y el
arabismo morfosintáctico en el romance hispánico medieval”. Zeitschrift für romanische Philologie 115 (2):
280–299.
Isasi Martínez, C., L. Martín Aizpuru, S. Pérez Isasi, E. Pierazzo y P. Spence. 2020. Edición digital de docu-
mentos antiguos: marcación XML-TEI basada en los criterios CHARTA. Sevilla: Editorial Universidad de
Sevilla.
Lapesa, Rafael. 1981. Historia de la lengua española. 9.ª ed. Madrid: Gredos.

15
Pedro Sánchez-Prieto Borja

LHP = Léxico Hispánico Primitivo (siglos viii al xii). Versión primera del Glosario del primitivo léxico ibero-
rrománico, proyectado y dirigido inicialmente por Ramón Menéndez Pidal, redactado por Rafael Lapesa
con la colaboración de Constantino García. Edición al cuidado de Manuel Seco. Madrid: Fundación
Menéndez Pidal y Real Academia Española, 2003.
López Gutiérrez, L. y A. Godino López. 1997. “Algunos dialectalismos espigados en la obra de Delibes”.
Revista de Dialectología y Tradiciones Populares 52 (2): 261–268.
Martín Aizpuru, L. 2020. La escritura cancilleresca de Fernando III, Alfonso X, Sancho IV y Fernando IV. Berna:
Peter Lang.
Menéndez Pidal, R. 1976 (1908–1911). Cantar de mío Cid. Texto, gramática y vocabulario. 3 vols. 5.ª ed.
Madrid: Espasa Calpe.
Morreale, M. 1983. “Apostillas a una reciente reedición de El caballero de Olmedo de Lope de Vega (F. Rico,
a cura di, Madrid, 1981)”. Rassegna Iberistica 18: 3–14.
Octavio de Toledo, Á. S. y L. Pons Rodríguez. 2016. Textos para la historia del españo, vol. X. Queja política
y escritura epistolar durante la Guerra de Independencia: documentación de la Junta Suprema Central en el AHN.
Selección, edición y estudio lingüístico. Alcalá de Henares: Universidad de Alcalá.
Orduna, G. 2000. Ecdótica. Problemática de la edición de textos. Kassel: Edition Reicherberger.
Orlandi, G. 1995. “Perché non possiamo non dirci lachmanniani”. Filología Mediolatina. Rivista della Fon-
dazione Ezio Franceschini 2: 1–42.
Ramírez Luengo, J. L. 2017. Textos para la historia del español, vol. XI: Honduras y El Salvador. Alcalá de
Henares: Universidad de Alcalá.
Riaño Rodríguez, T. y M. C. Gutiérrez Aja, eds. 2003. El Cantar de mío Cid. Reproducción digitalizada del
manuscrito de la Biblioteca Nacional, transcripción paleográfica y texto modernizado. Alicante: Biblioteca Virtual
Miguel de Cervantes. [Link]/bib_obra/Cid/ [22/11/2020].
Rico, F., ed. 2009. Lope de Vega, El caballero de Olmedo. En Cervantes Virtual. [Link]/
obra/el-caballero-de-olmedo-0/ [21/11/2020].
Rivarola Rubio, J. L. 2000. Español andino. Textos de bilingües de los siglos xvi y xvii. Madrid: Vervuert.
Romero Cambrón, Á. 2006. “Sintaxis histórica y crítica textual: camino de ida y vuelta”. En Actas del VI
Congreso Internacional de Historia de la Lengua Española, eds. J. L. Girón Alconchel y J. J. de Bustos Tovar,
vol. 2, 2051–2062. Madrid: Arco Libros.
Roudil, J., ed. 1986. Jacobo de Junta, el de las Leyes, Œuvres, I. Summa de los nueve tiempos de los pleitos, édition
et étude d’une variation sur un théme. París: Annexes des Cahiers de Linguistique Hispanique Médiévale.
Sánchez-Prieto Borja, P. 1998. Cómo editar los textos medievales: criterios para su presentación gráfica. Madrid:
Arco Libros.
Sánchez-Prieto Borja, P. 2011. La edición de textos españoles medievales y clásicos. Criterios de presentación gráfica.
San Millán de La Cogolla: Cilengua.
Segre, C. 1979. “Les transcriptions en tant que diasystèmes”. En La pratique des ordinateurs dans la critique des
textes, 45–49. París: Éditons du CNRS.
Shillingsburg, P. 1996. Scholarly Editing in the Computer Age. Theory and Practice. 3.ª ed. Ann Arbor: Univer-
sity of Michigan Press.
Solalinde, A. G., ed. 1930. Alfonso el Sabio, General estoria. Primera parte. Madrid: Centro de Estudios
Históricos.
Tanselle, G. T. 1989. A Rationale of Textual Criticism. Filadelfia: University of Pennsylvania.
Torrens Álvarez, M. J. 2002. Edición y estudio lingüístico del Fuero de Alcalá (Fuero viejo). Alcalá de Henares:
Fundación Colegio del Rey.
Torrens Álvarez, M. J. 2014. “Los coordinadores disyuntivos latín et aut > castellano (e)do> vasco edo: una
historia inadvertida”. Zeitschrift für romanische Philologie 130 (3): 671–697.
Torrens Álvarez, M. J. 2021. “La lengua de Madrid en la Edad Media: los fueros”. En La lengua de Madrid a
lo largo del tiempo, coords. P. Sánchez-Prieto Borja, M. J. Torrens Álvarez y D. Vázquez Balonga, 41–86.
Sevilla: Editorial Universidad de Sevilla.
Ward, A. (2018). “The Estoria de Espanna Digital. Collating Medieval Prose – Challenges... and More
Challenges”. Digital Philology: A Journal of Medieval Cultures 7 (1): 65–92. [Link]
article/700509.

16
2
Manejo de las fuentes: los corpus
(Use and analysis of sources:
linguistic corpora)
Andrés Enrique-Arias

1. Introducción
El análisis comparativo de textos de diferentes épocas, géneros y dialectos es una herramienta
fundamental en las investigaciones lingüísticas de orientación diacrónica, pues los textos son la
principal fuente de datos para estudiar los estados de lengua del pasado. En las últimas décadas
el método ha adquirido una nueva dimensión con la creación de una amplia variedad de corpus
diacrónicos en formato electrónico y la aplicación de herramientas informáticas que permiten
analizar un gran volumen de datos a una escala que era inalcanzable con los procedimientos
manuales tradicionales. En este capítulo se repasan las bases metodológicas de la lingüística de cor-
pus aplicada al estudio diacrónico del español; para ello se establece el valor empírico relativo de
los principales planteamientos vigentes, se evalúan algunos de los recursos que están disponibles
de modo libre en Internet y se presentan las principales vías de investigación de la diacronía del
español que están siendo impulsadas por la lingüística de corpus. Asimismo, se exponen para cada
técnica o recurso los problemas, cautelas y limitaciones metodológicas que conlleva su empleo.
Palabras clave: corpus informatizados; lingüística de corpus; lingüística histórica; español;
metodología

The comparative analysis of texts from different historical periods, genres and dialects is a funda-
mental tool in diachronic linguistic research, as written texts are the main data source for studying
the language of the past. In recent decades, this method has acquired a new dimension with
the creation of a wide variety of diachronic corpora in electronic format and the application of
computer tools that allow the analysis of a large volume of data on a scale that was unattainable with
traditional manual methods. This chapter includes a review of the methodological foundations of
corpus linguistics applied to the diachronic study of Spanish; to this end, the relative empirical value
of the main current approaches is established, along with an evaluation of some of the resources
that are freely available on the internet as well as a survey of the main lines of corpus-based research
in Spanish historical linguistics. Finally, there is a discussion of the potential problems, precautions
and methodological limitations entailed by the use of these resources.
Keywords: electronic corpora; corpus linguistics; historical linguistics; Spanish; methodology

DOI: 10.4324/9781003035565-4 17
Andrés Enrique-Arias

2. Conceptos fundamentales
La lingüística de corpus, entendida como el estudio del lenguaje a través del análisis de textos,
es sin duda la metodología más utilizada en el estudio diacrónico del español desde el mismo
momento en que la lingüística románica se constituyó como disciplina científica hace ya más
de un siglo. El motivo es que los textos son la principal fuente de datos para estudiar los estados
de lengua del pasado; en consecuencia, la investigación en lingüística histórica exige el dominio
de las herramientas metodológicas adecuadas para interpretar, analizar y comparar datos proce-
dentes de testimonios escritos de diferentes periodos, géneros, y dialectos. Aunque en sentido
estricto un corpus es una colección de textos en cualquier formato (libro, audio, CD, microfilm,
etc.), hoy en día esa denominación se aplica básicamente a colecciones de textos almacenados en
soporte informático, organizados y clasificados de acuerdo con parámetros como registro, pro-
cedencia geográfica o fecha de producción, y dotados de algún tipo de herramienta de búsqueda
que permita extraer la información mediante procesos automáticos. La lingüística de corpus es
en sí misma una subdisciplina consolidada con aplicaciones a prácticamente todas las áreas de la
investigación lingüística (Lüdeling y Kytö 2008).
Los estudios sobre la diacronía del español se han beneficiado de la explotación de los datos
procedentes de los corpus, especialmente para la compilación de diccionarios y el estudio de
fenómenos morfosintácticos. La razón es que, como los corpus informatizados permiten hacer
búsquedas a través de cientos de millones de palabras en una fracción de segundo, son de gran
ayuda a la hora de localizar un alto número de ocurrencias y superar el problema que supone la
baja frecuencia de determinadas estructuras en el lenguaje natural. Por este motivo los corpus
son la base empírica fundamental para aplicar métodos de análisis cuantitativo en la investigación
de problemas de variación y cambio lingüísticos en perspectiva diacrónica.
En el análisis de los corpus diacrónicos que se presenta en las páginas que siguen no se
pretende proporcionar un repertorio exhaustivo de recursos digitales (los interesados en un
listado actualizado de estos recursos pueden consultar el Portal de Corpus Históricos Iberorrománicos
CORHIBER), sino más bien plantear una serie de reflexiones metodológicas generales que
servirán de guía para evaluar el mérito relativo de las diferentes tipologías de recursos disponibles.
Además de considerar la cantidad y calidad de los datos, que sin duda son aspectos esenciales a la
hora de evaluar un corpus diacrónico, se tendrán en cuenta otros componentes metodológicos
no menos importantes relacionados con la extracción y análisis de datos, como son la interfaz de
consulta de los corpus, el formato en que se presentan los resultados y las metodologías para su
análisis. Se consideran, por tanto, no solo las aplicaciones de búsqueda y visualización de resulta-
dos que forman parte de los corpus, sino también las herramientas computacionales usadas por
los lingüistas para el procesamiento y análisis externo de los datos, ya sean módulos de descarga
de resultados, hojas de cálculo para la anotación manual de las concordancias o lenguajes de
programación para el análisis cuantitativo.
Finalmente, no se incluye el estudio de recursos electrónicos que no son propiamente corpus
textuales, como los diccionarios históricos (cap. 4) o los atlas dialectales (cap. 5). Tampoco se
consideran los corpus que no están en formato accesible de manera libre en Internet, es decir,
las colecciones en formato impreso, CD, microfichas o similar.

3. Pautas metodológicas generales


A la hora de valorar la solidez metodológica de un corpus textual como herramienta para la
investigación diacrónica del español, la cuestión que cabe plantearse es en qué medida facilita la
obtención de información precisa y libre de errores sobre las variedades diatópicas, diastráticas y

18
Manejo de las fuentes: los corpus

diafásicas de la lengua a lo largo de las diversas fases de su evolución. Los recursos disponibles son
muy diferentes en lo que respecta a tamaño, tipologías textuales, rango cronológico o herramien-
tas de extracción de datos. En esta sección se proponen algunas pautas metodológicas generales
que conviene tener en cuenta para evaluar la adecuación de un corpus para una investigación
científica. Para ello se toman como punto de partida los parámetros de representatividad, diver-
sidad, comparabilidad, análisis, perspectiva y calidad (cf. Silva-Corvalán y Enrique-Arias 2017,
65). Conviene advertir que no es necesario que un solo recurso satisfaga todos estos requisitos,
pues es también posible combinar datos de varios corpus especializados en un género, periodo
o variedad geográfica particular.

3.1 Representatividad
La representatividad es uno de los problemas esenciales de la lingüística de corpus (Kabatek
2013). Es bien conocido que Labov (1994, 11) definió la lingüística histórica como “the art
of making the best of bad data”. En efecto, los textos históricos solo permiten una visión
artificiosa y fragmentaria de los sistemas lingüísticos del pasado, por múltiples razones. Para
empezar, los textos disponibles en los corpus no son necesariamente los más representativos,
sino simplemente los que han sobrevivido a las vicisitudes de la historia y, entre ellos, los que
han despertado el suficiente interés como para llegar a ser seleccionados y publicados. En el
caso del español, es bien sabido que hay épocas, como el siglo xiv o el periodo de la segunda
mitad del xvii y primera del xviii, que están relativamente peor representadas en los corpus
disponibles (cap. 36, cap. 40). Por otro lado, los textos escritos tampoco son un reflejo directo
de las interacciones orales de los hablantes del pasado, pues las convenciones de la escritura
filtran muchas características de la lengua viva (cap. 8). Dado que, además, durante gran
parte de la historia la escritura ha sido una actividad restringida a un grupo muy minoritario
de la población (hasta finales del siglo xix la inmensa mayoría de los hispanohablantes era
analfabeta), los testimonios escritos en gran medida dejan fuera la lengua de la gente común,
y más aún si cabe en el caso de las mujeres, minorías raciales y grupos desfavorecidos en
general (cap. 6).
Por otro lado, la realidad indiscutible es que los corpus diacrónicos son el mejor método a
nuestra disposición para reconstruir los estados de lengua del pasado. Si bien no existen infor-
mantes que nos puedan confirmar directamente que un enunciado x es posible, la aparición
reiterada del enunciado en cuestión en los corpus textuales permite concluir con seguridad
razonable que tal enunciado era compatible con las reglas del sistema lingüístico en vigor en
la época en que aparece representado en los textos pues, a no ser que se trate de una situación
de diglosia extrema, el registro escrito será coherente con los usos orales. En cualquier caso,
el diseño de una investigación basada en corpus diacrónicos debe tratar de aproximarse al ideal
de representatividad mediante la inclusión de una variedad de registros y evitando un número
desproporcionado de textos marcados estilísticamente (poéticos, litúrgicos, técnicos, traduccio-
nes serviles) que puedan introducir sesgos en los resultados.

3.2 Diversidad y comparabilidad


La composición de un corpus de textos históricos conlleva la paradoja que resulta de tener que
introducir un componente de diversidad en la nómina de textos incluidos y, al mismo tiempo,
mantener cierto grado de homogeneidad entre las diferentes secciones del corpus (Enrique-Arias
2012, 97, 2018, 263). Partiendo de la base de que los corpus deben servir para estudiar la
variación lingüística en sus dimensiones diacrónica, diafásica y diastrática, los textos deben

19
Andrés Enrique-Arias

cubrir un arco cronológico lo suficientemente amplio como para registrar las fases evolutivas de
la lengua, y los datos deben incluir una pluralidad de tipologías textuales en lo que se refiere a
registros, procedencia geográfica o tipologías textuales. Al mismo tiempo, el corpus debe estar
equilibrado, y las diferentes dimensiones de la variación representadas en el corpus (registros,
dialectos, tipos de textos) deben constituir a su vez subcorpus equilibrados, de tal modo que
sea posible establecer comparaciones entre los diferentes cortes diacrónicos representados en la
muestra.
Una alternativa pensada precisamente para controlar mejor la comparabilidad de los textos en
un corpus diacrónico es la metodología de los corpus paralelos. Se trata de contrastar versiones
alineadas en paralelo de textos con el mismo contenido pero compuestos en diferentes épocas
o variedades, como puedan ser traducciones de un mismo original o las colecciones de los dis-
tintos testimonios o copias de una misma obra (Enrique-Arias 2018). La utilidad de los corpus
paralelos en lingüística histórica es evidente, pues en ellos se aprecia con particular claridad la
evolución diacrónica de las estructuras de la lengua.

3.3 Análisis
El diseño de un corpus debe permitir analizar de manera óptima los elementos relevantes para el
tipo de fenómeno que se quiere estudiar. Por ejemplo, para el estudio de los usos escriptológicos
de los textos es preciso contar con un corpus en transcripción paleográfica que incluya imágenes
facsimilares de los originales; los corpus formados a partir de ediciones críticas no nos servirán,
pues, en estos materiales, los editores tienden a normalizar el texto descartando variantes de
interés lingüístico. Por otro lado, si se trata de investigar fenómenos de tipo léxico, el ideal es
un corpus que permita hacer búsquedas por lemas (el lema es la forma básica por la que una
palabra aparece en el diccionario, como el infinitivo en los verbos o el masculino singular en los
adjetivos), de modo que, por ejemplo, una búsqueda de [cantar] permita obtener todas las formas
flexionadas (canté, cantaría, he cantado, etc). Por último, las investigaciones de tipo morfosintáctico
son mucho más fáciles en corpus que ofrecen la opción de rastrear palabras gramaticales y en los
que la anotación posibilita hacer búsquedas introduciendo rasgos morfológicos o constituyentes
sintácticos.
El problema a la hora de editar los textos para un corpus es que mantener la variación gráfica
del manuscrito tiene como contrapartida una pérdida de claridad, así como dificultades añadidas
para la lematización del texto y su etiquetado gramatical; este problema es más evidente en los
escritos más alejados de la norma general, como los procedentes de escribientes semicultos o los
que incluyen variantes dialectales (Enrique-Arias 2015, 402–403). La solución para cumplir las
expectativas de los que se acercan al texto desde diferentes perspectivas pasa por ofrecer al lector
varios niveles de acceso al texto (facsímil, transcripción paleográfica y presentación crítica), ya
sea como versiones paralelas o a través de la anotación de diferentes capas. Como se verá más
adelante, estos sistemas de múltiple presentación han sido aplicados con fortuna en las ediciones
de varios corpus en línea.
De modo semejante, las investigaciones sobre el foco geográfico original de los fenómenos
de variación requieren textos con datación cronogeográfica precisa. Este tipo de corpus nor-
malmente está formado por colecciones documentales con textos del ámbito jurídico (cap. 5).

3.4 Perspectiva
Bajo la noción de perspectiva se analiza el medio de acceso a los datos, un parámetro que condi-
ciona crucialmente el planteamiento y alcance de las investigaciones. En la mayoría de los corpus

20
Manejo de las fuentes: los corpus

los datos se obtienen a través de un buscador: los usuarios necesitan introducir una palabra o frase
en un cuestionario de consulta y la aplicación de búsqueda crea una concordancia que muestra
todos los ejemplos del texto buscado en el corpus junto a su contexto de aparición, con infor-
mación básica sobre el texto de origen. Esto significa que es necesario conocer de antemano por
medio de gramáticas, diccionarios o estudios previos las formas que son relevantes para rastrear
el fenómeno que se desea investigar, pues el investigador no accede al texto completo de donde
proceden los datos. Este método puede funcionar bien cuando se conoce la lista exhaustiva de las
formas relacionadas con aquello que se pretende estudiar, pero no es lo idóneo cuando se trata de
investigar estructuras que se pueden expresar con elementos de clase abierta o para los que no es
posible saber de antemano todas las formas posibles de expresión (Enrique-Arias 2016). Cons-
cientes de estas limitaciones, algunos corpus ofrecen medios alternativos de acceso a los datos,
como concordancias del texto completo, posibilidad de descarga de los textos o disposición en
paralelo de varias versiones.

3.5 Calidad
Los textos deben estar libres de errores de transcripción y la herramienta de búsqueda y con-
sulta debe funcionar sin dar fallos. Otro aspecto que se podría adscribir al parámetro de calidad
(aunque también podría verse bajo el subapartado del análisis) es la correcta datación cronológica
de los textos. A este respecto, una distinción crucial es la que se da entre copias tardías y copias
contemporáneas o cercanas al original del autor, pues es bien sabido que durante la transmisión
manuscrita la intervención de los copistas puede llegar a alterar de manera sustancial la lengua
del original. Si, por ejemplo, analizamos un texto de una época dada en testimonios copiados
tardíamente, corremos el riesgo de caracterizar la lengua de los copistas de siglos posteriores y
no la del autor que se quiere analizar. Los corpus informatizados hechos a partir de obras litera-
rias tienden a datar los textos a partir de la fecha conocida o supuesta de composición y no de
acuerdo con la de la copia que se ha utilizado como base en la edición volcada en el corpus, lo
cual tiene consecuencias para la correcta situación cronológica de los procesos de cambio que
se reflejan en los textos.

4. Panorámica de los corpus diacrónicos del español


Existe a día de hoy un buen número de bases de datos textuales informatizadas diseñadas para el
estudio diacrónico del español. Por su gran tamaño y por cubrir toda la historia de las manifes-
taciones escritas de la lengua, destacan los corpus de acceso libre en Internet desarrollados por
la Real Academia Española (RAE) para su trabajo lexicográfico. Uno de ellos es el Corpus Dia-
crónico del Español (CORDE), que cubre las variedades del español desde sus inicios hasta 1974
con 250 millones de formas; el otro es el Corpus del Diccionario Histórico de la Lengua Española
(CDH), conformado actualmente por unos 350 millones de registros distribuidos en tres capas
de consulta. El CDH nuclear consta de un subconjunto de 53 millones de ocurrencias de textos
españoles y americanos (en gran medida comunes con el CORDE y el CREA) sometidos a un
proceso semiautomático de anotación lingüística y lematización. Junto a los corpus de la RAE
existe también otro gran corpus que abarca toda la historia de la lengua hasta el siglo XX, el
Corpus del español (CE), con 100 millones de palabras, lematizado y con anotación gramatical.
La ventaja más evidente de los corpus grandes es la cantidad y variedad de textos que con-
tienen y el amplio rango cronológico que cubren. Como ilustra Octavio de Toledo (2019)
con varios ejemplos de fenómenos morfosintácticos, las bases de datos más extensas, como el
CORDE, tienen algunas ventajas en el estudio de la variación, no solo por facilitar el análisis de

21
Andrés Enrique-Arias

estructuras con una frecuencia muy baja sino porque permiten apreciar correlaciones entre cam-
bios sin relación aparente, o porque al reunir un mayor número de ejemplos posibilitan estudiar
coocurrencias con más factores.
Por otro lado, estos corpus tienen el inconveniente de la pérdida de contacto con las fuentes
primarias: los resultados, que se obtienen en forma de concordancias a través de un formulario
de búsqueda, no dan acceso a los textos completos ni al facsímil del original de donde proceden
los ejemplos. Esta configuración no permite comprobar la exactitud de las ocurrencias concretas
en los resultados de búsqueda y, así, descartar que se hayan producido errores en las diversas fases
de preparación de los textos para la base de datos. Asimismo, estos recursos presentan los incon-
venientes ya señalados de los corpus creados a partir de ediciones, en particular el hecho de no
poder distinguir las lecturas genuinas del original de las que son resultado de las intervenciones
de los editores. Finalmente, como los textos se clasifican de acuerdo con la fecha conocida o
supuesta de producción, y no la de la copia del testimonio, hay riesgo de atribuir a la lengua
de los autores fenómenos que son en realidad característicos de copistas de épocas posteriores.
Para poder utilizar con propiedad los corpus creados a partir de ediciones de textos medie-
vales existe un excelente recurso: Rodríguez Molina y Octavio de Toledo (2017) han creado
un índice de las ediciones de los textos medievales presentes en el CORDE. Se trata de un
repertorio en que se evalúan aspectos como la fiabilidad y representatividad del testimonio que
se ha seleccionado para incluir la obra en el corpus, la existencia de problemas de datación o la
calidad de la edición utilizada. Dado que muchos de los textos reseñados se emplean también en
el CDH, el CE y otros corpus, el recurso tiene un gran valor para los interesados en la fiabilidad
filológica de las ediciones reunidas en estos corpus.
Otro complemento interesante a los corpus creados a partir de ediciones de textos literarios
son los portales de Internet que dan acceso a todo un complejo de elementos útiles para la cons-
titución del texto, como imágenes de los manuscritos y transcripciones paleográficas de varios
testimonios de una tradición. Este es el caso, por ejemplo, del proyecto acerca de la poesía can-
cioneril del siglo XV dirigido por Dorothy Severin An Electronic Corpus of 15th Century Castilian
Cancionero Manuscripts o del portal Biblia Medieval. Asimismo, cada vez es mayor la disponibilidad
de acceso a las fuentes primarias a través de colecciones digitales de manuscritos publicadas en
línea por un número creciente de bibliotecas y archivos, como la Biblioteca Nacional de España
o la Biblioteca de la Real Academia de la Historia, entre otras.
Frente a las limitaciones de acceso a los datos en los corpus que solo permiten resultados en
forma de concordancias, algunos recursos ofrecen alternativas con una perspectiva más abierta.
Es el caso de la Biblioteca Digital de Textos del Español Antiguo (BiDTEA), que reúne el texto com-
pleto de un buen número de manuscritos medievales hispánicos en transcripción paleográfica.
Los textos se pueden descargar de manera libre y van acompañados de unas muy útiles con-
cordancias de los textos completos organizadas de acuerdo con parámetros diversos (alfabético,
frecuencia, alfabético inverso).
Otra alternativa para el acceso a los resultados es la metodología de los corpus paralelos, es
decir, la posibilidad de comparar textos con el mismo contenido, pero compuestos en diferentes
épocas. Para el estudio diacrónico del español existe el portal Biblia Medieval, que reúne trans-
cripciones paleográficas descargables, versiones normalizadas, imágenes facsimilares y concor-
dancias completas de la totalidad de los testimonios que han transmitido traducciones bíblicas en
castellano durante la Edad Media y el Renacimiento. Cuando el usuario introduce una consulta,
las diferentes versiones aparecen dispuestas en paralelo junto a sus fuentes, hebrea o latina. Este
tipo de búsqueda tiene un valor heurístico particular, pues los resultados permiten descubrir
en las versiones paralelas equivalentes de la estructura buscada que en muchos casos no estaban
previstos en el rastreo inicial (Enrique-Arias 2012, 2016).

22
Manejo de las fuentes: los corpus

Un tipo de recurso informatizado de especial relevancia para los estudios diacrónicos son las
colecciones documentales en línea. Los documentos del ámbito jurídico tienen la característica
de ser la única manifestación escrita que tiende a llevar sistemáticamente indicación de fecha
y lugar; por ello, los corpus documentales son los recursos más adecuados para poder adscribir
fenómenos lingüísticos a unas coordenadas cronogeográficas concretas. En lo que respecta a
la publicación de corpus documentales del castellano y romances vecinos (asturleonés y nava-
rro-aragonés), se han hecho progresos sustanciales gracias a los esfuerzos concertados de los gru-
pos de la red internacional CHARTA (Corpus Hispánico y Americano en la Red. Textos Antiguos),
que trabajan en la edición de fondos documentales del mundo hispánico. Fruto de esta iniciativa
se ha creado el sistema de triple presentación (facsímil, transcripción paleográfica y presentación
crítica) adoptado ya en numerosos proyectos de corpus (Sánchez-Prieto Borja 2011). Destaca
el Corpus de Documentos Anteriores a 1900 (CODEA), que contiene 4000 documentos antiguos
(más de dos millones de registros) procedentes de distintos archivos españoles. El corpus, que
además incorpora una función que permite cartografiar los resultados, ya ha sido empleado con
éxito para determinar el origen geográfico de algunas variables lingüísticas (cap. 5, cap. 39). Con
un planteamiento semejante, pero centrado en el español de América, está el Corpus Diacrónico y
Diatópico del Español de América (CORDIAM), que reúne documentos, textos literarios y textos
periodísticos producidos en América entre 1494 y 1905 y permite descargar las concordancias
con los resultados de búsqueda (cap. 44).
Por último, cabe mencionar los corpus que tratan de aproximarse a la lengua de la vida coti-
diana o de las clases populares a través de los textos más próximos a la inmediatez comunicativa.
Se trata de recursos especialmente apropiados para el cultivo de una disciplina de reciente crea-
ción: la sociolingüística histórica, que estudia la relación entre lengua y sociedad a lo largo de
la historia (cap. 6). Por ejemplo, el proyecto Post Scriptum reúne un corpus de cartas privadas
escritas en España y Portugal durante la Edad Moderna con varios formatos de presentación
(paleográfico, normalizado, facsímil) (cap. 5). Un enfoque similar es el del Corpus Mallorca, que
contiene más de un millar de cartas privadas, declaraciones de testigos e inventarios de bienes en
castellano producidos en el contexto catalanohablante de Mallorca. El corpus sigue el sistema de
triple presentación de la red CHARTA y permite la descarga de resultados en formato de hoja
de cálculo.
Una distinción crucial es la que se da entre los corpus con texto plano sin anotar (la mayoría
de los que se han ido presentando en las páginas precedentes) y los que tienen texto lematizado
y etiquetado gramaticalmente, como los ya mencionados CDH, CE y Biblia Medieval o, para
el periodo medieval, el Old Spanish Textual Archive (OSTA) En estos últimos se pueden hacer
búsquedas más sofisticadas: es posible obtener, por ejemplo, ocurrencias de uso de los lemas (es
decir, de todas las formas flexionadas de una palabra), así como comprobar las agrupaciones más
frecuentes de una palabra (coapariciones) o hacer búsquedas de acuerdo con categorías grama-
ticales (por ejemplo, qué adjetivos acompañan a una determinada palabra, o qué combinaciones
hay de artículo y nombre propio). Como complemento a la gran oferta de recursos que existen
y sus funcionalidades, muchos investigadores optan por crear sus propios materiales mediante la
descarga de los textos o los resultados de búsquedas y la utilización de programas diversos para
etiquetar los fenómenos, introducir anotación gramatical, crear concordancias o usar expresiones
regulares para hacer búsquedas especialmente complejas.
En suma, existe una gran variedad de recursos para aplicar la metodología de la lingüística de
corpus al estudio diacrónico del español. Dado que cada uno de ellos presenta al mismo tiempo
ventajas y limitaciones, en muchos casos el proceder más efectivo será combinar el empleo de
más de un recurso: así, los corpus más grandes son el medio ideal para hacer búsquedas prelimi-
nares que permiten hacerse una idea general de la documentación de una estructura a lo largo de

23
Andrés Enrique-Arias

la historia del español; al mismo tiempo, otros corpus más pequeños especializados en una época,
área geográfica o tipología textual concreta pueden servir para afinar los resultados y centrarse
con más detalle en algún aspecto del fenómeno que se pretende investigar. Al mismo tiempo, el
aprovechamiento de los corpus se puede ampliar mediante el uso de herramientas externas para
la descarga, marcación y análisis de los resultados.

5. Perspectivas futuras
Uno de los procedimientos más eficientes para entender los mecanismos que rigen los cambios
lingüísticos es el examen de los textos que muestran los momentos de transición en que convi-
ven el sistema original anterior al cambio y el sistema innovador. La distribución y la frecuencia
relativa de las estructuras asociadas con el sistema antiguo y con el nuevo proporcionan informa-
ción valiosa sobre los factores que motivan el cambio, los contextos en los que se ha originado
y los canales por los que se ha extendido. Los corpus diacrónicos informatizados facilitan enor-
memente esta labor, pues permiten obtener en un instante listados de ocurrencias que en otro
tiempo hubieran supuesto meses de laboriosa búsqueda.
El otro gran desarrollo metodológico reciente de la lingüística histórica es la adaptación de
los métodos de estudio de la variación desarrollados por la sociolingüística para el estudio de los
datos históricos obtenidos de los corpus (Silva-Corvalán y Enrique-Arias 2017, 295–296) (cap.
6). Sin embargo, las investigaciones de la diacronía del español no han explotado esta posibilidad
en toda su dimensión, lo que contrasta con la atención dispensada a otras cuestiones metodo-
lógicas, como los problemas filológicos de selección y presentación de textos en los corpus
o la efectividad de las herramientas de búsqueda. En efecto, en muchos trabajos de variación
diacrónica del español el análisis de los datos se limita a hacer conteo de ocurrencias y cálculo
de porcentajes sin ni siquiera incluir un test estadístico de significatividad; más infrecuente aún
es el empleo de técnicas que son de uso común en sociolingüística cuantitativa y lingüística de
corpus, como el análisis multivariable mediante programas de regresión logística. La aparición de
nuevas herramientas para el análisis cuantitativo, como el modelado estadístico de efectos mix-
tos (mixed-effects modeling), así como la posibilidad de presentar resultados en un amplio elenco
de formatos gráficos, ensanchan considerablemente los métodos para el estudio de los datos
de los corpus. Una muestra del potencial de los nuevos recursos es el trabajo de Rosemeyer y
Enrique-Arias (2016) sobre la expresión de la posesión en castellano medieval. Frente al pro-
ceder tradicional de identificar el contexto variable y reducirlo a una oposición binaria de dos
estructuras en competición, un análisis estadístico de regresión logística multinomial calcula la
probabilidad del empleo del esquema más frecuente (su casa) frente a cualquiera de sus compe-
tidores (la su casa, la casa de él, la casa): el análisis multinomial refleja mejor que el binario cómo
opera en realidad el fenómeno variable, puesto que el hablante dispone de más de dos opciones
a la hora de expresar la posesión.
Otra de las tareas pendientes de la lingüística histórica hispánica es constituir el “mapa varia-
cional” del español, es decir, establecer una tipología de cuáles son los principales fenómenos
sujetos a variación en cada época y área geográfica en la evolución de la lengua. La creación
de corpus documentales con textos datados y situados en su espacio geográfico de producción
proporciona, finalmente, el material base para poder llevar a cabo este objetivo mediante la con-
fección de un listado filológicamente fiable de rasgos lingüísticos situados en sus coordenadas
cronogeográficas. La compilación y análisis de estos datos, además de servir para delimitar el foco
geográfico donde se originan los cambios, permitirá establecer mediante cálculos matemáticos
la data cronogeográfica de textos comparables para los que no disponemos de esa información
(Kawasaki 2014).

24
Manejo de las fuentes: los corpus

Las posibilidades de uso de los corpus se van ensanchando gracias a la creación de nuevos
recursos; normalmente se trata de corpus de pequeño ámbito asociados a un proyecto par-
ticular, pero que contribuyen a incorporar variedades poco representadas, como dialectos,
variedades de contacto, habla de mujeres o de minorías. En esta línea está el corpus Programes,
concebido para complementar a otros corpus mediante la compilación de testimonios de una
época insuficientemente representada, como es el caso del primer español moderno (cap. 40):
el corpus da acceso a textos descargables de los siglos xvii al xix, con particular atención al
periodo 1640–1725. En la misma línea, el Corpus Histórico del Español Norteño (CORHEN)
reúne documentos particulares de las variedades castellanas del centro-norte peninsular, con
especial atención a una época umbría como es la del periodo de orígenes (siglos X–XIII)
(cap. 34). El ámbito limitado de estos nuevos recursos normalmente se corresponde con un
alto grado de especialización por parte de sus creadores, quienes, al ser especialistas en la
tipología textual asociada, aportan un alto grado de calidad en la selección y edición de los
textos.
Uno de los aspectos de los corpus que seguramente tendrá mayor relevancia en el futuro es la
participación de los investigadores mediante la habilitación de herramientas colaborativas. Cabe
imaginar que las nuevas aplicaciones facilitarán cada vez más que el trabajo realizado por un pro-
gramador, o la codificación de datos hecha por el usuario lingüista, sean aprovechables para otros
usuarios. Un avance en este sentido es el que los creadores de corpus pongan a la disposición
de los usuarios los textos completos y provistos de las diferentes capas de anotación disponibles,
como se hace por ejemplo en Biblia Medieval o en BiDTEA. Los formatos digitales facilitan ade-
más el poner a la disposición de los usuarios un amplio elenco de recursos para el estudio y com-
prensión de los textos: facsímiles digitales de los manuscritos, transcripciones paleográficas así
como las herramientas analíticas necesarias para manipular los textos (herramientas de búsquedas
con posibilidad de filtrado por diferentes parámetros, concordancias, glosarios, enlaces externos,
estudios monográficos, etc.). Otra iniciativa destacable es el planteamiento de la plataforma Tei-
Tok, un programa creado originalmente para el corpus del proyecto Post Scriptum pero que se ha
hecho de acceso libre; el programa permite que filólogos con conocimientos informáticos de
nivel usuario puedan gestionar todo el proceso de creación de un corpus diacrónico: edición,
anotación y visualización de los textos.
Por otro lado, la metodología de los corpus informatizados está fuertemente ligada a los
cambios tecnológicos y es, por tanto, una disciplina en continuo movimiento. Es previsible,
por ejemplo, que el desarrollo de macrobuscadores permita extraer datos de manera masiva
rastreando varios corpus simultáneamente. Otra innovación será la posibilidad de interacción de
imagen y texto con el desarrollo de documentos legibles por máquina, de modo que sea posi-
ble analizar y recuperar información grafémica y textual de los facsímiles digitalizados. Otros
avances tecnológicos que son aplicables a la lingüística de corpus son el empleo de programas de
inteligencia artificial para el análisis de la variación o la geolocalización para el cartografiado de
resultados. Asimismo, el rastreo de la web como corpus tiene un gran potencial: entre los billo-
nes de páginas existentes hay recursos como las colecciones de Google Libros, alimentadas por
un gran número de bibliotecas y cuya herramienta de búsqueda OCR mejora constantemente,
que pueden proporcionar datos complementarios a los corpus convencionales. Por ejemplo,
Enrique-Arias (2019, 355–358) localiza a partir de búsquedas en Google la distribución diatópica
en el sur de Aragón y norte de Valencia de la forma jublar, variante antigua y dialectal de ‘juglar’
no documentada en los corpus diacrónicos. La limitación actual de este método es que requiere
visitar uno a uno cada enlace de los resultados de búsqueda y cerciorarse de que los ejemplos
son legítimos; posiblemente en el futuro habrá posibilidades de mejorar el proceso de búsqueda
y filtrado para poder usar procesos automáticos en las búsquedas en la red.

25
Andrés Enrique-Arias

6. Conclusiones
El desarrollo y amplia accesibilidad de los recursos informáticos ha abierto grandes posibilidades
para avanzar en el estudio diacrónico del español. La disponibilidad creciente de nuevos datos
y herramientas de análisis, las iniciativas de colaboración e intercambio entre equipos creadores
de recursos y el mayor rigor y exigencia por parte de los investigadores en lo que respecta a la
calidad filológica de los textos abren un panorama prometedor para el futuro de la disciplina. No
obstante, a pesar de la abundante oferta de recursos electrónicos no existe un corpus en línea que
sea capaz de satisfacer todas las necesidades de la investigación de la diacronía del español. Cada
uno de los recursos disponibles, ya sean los grandes corpus, las colecciones documentales o la
explotación de datos de Internet, tiene sus ventajas metodológicas y sus debilidades. En términos
generales es posible concluir que los grandes corpus que permiten compilar un mayor número
de datos y cubren un arco cronológico más amplio implican un menor control de la calidad
filológica, datación y origen geográfico de los textos y, por tanto, un nivel más alto de posibles
resultados mal clasificados. Al mismo tiempo, los recursos que permiten un mejor control del
origen de los datos tienden a ser corpus más pequeños y reúnen tipologías textuales concretas
que pueden introducir sesgos en los resultados. Por todo ello, la capacidad del investigador a la
hora de evaluar el mérito relativo de los diferentes recursos y la habilidad para valorar la validez
empírica de los datos son cualidades esenciales para poder aprovechar en todo su potencial las
ventajas metodológicas del empleo de los corpus en investigaciones de orientación diacrónica.

Lecturas recomendadas
Torruella (2017) ofrece, en un tono accesible, una panorámica amplia sobre los corpus diacrónicos y
una síntesis práctica de las bases teóricas y metodológicas de la investigación con corpus diacró-
nicos, los diferentes elementos que intervienen en la creación de los recursos informatizados o los
procedimientos para el análisis de los datos extraídos de los corpus.
Kabatek (2016) contiene una muestra de las investigaciones recientes que se llevan a cabo con corpus
diacrónicos del español e incluye, además, aportaciones acerca de otras lenguas iberorromances.
Los lingüistas a menudo optan por no limitarse a emplear las herramientas que ofrecen los corpus
y procesan los resultados de manera externa con otros programas. Anthony (2013) presenta una
revisión crítica de los programas informáticos que se pueden emplear para codificar y analizar
estadísticamente los datos lingüísticos extraídos de corpus.

Bibliografía citada

A Recursos
BiDTEA = Gago Jover, F., ed. Biblioteca Digital de Textos del Español Antiguo. [Link]/
[Link].
CDH = Real Academia Española. Corpus del Diccionario Histórico de la Lengua Española. [Link]
CNDHE.
CE = Davies, M., dir. Corpus del Español. [Link]
CODEA = Sánchez-Prieto Borja, P., coord. Corpus de Documentos Anteriores a 1900. [Link]
es.
CORDE = Real Academia Española. Corpus Diacrónico del Español. [Link]
CORDIAM = Company, C. y V. Bertolotti, dirs. Corpus Diacrónico y Diatópico del Español de América. www.
[Link].
CORHEN = Torrens Álvarez, M.J., dir. Corpus Histórico del Español Norteño. [Link]
CORHIBER = Torruella, J. y J. Kabatek, coords. Portal de Corpus Históricos Iberorrománicos. [Link]
[Link]/portal-corhiber.

26
Manejo de las fuentes: los corpus

Enrique-Arias, A., dir. Biblia Medieval. [Link].


Enrique-Arias, A., coord. Corpus Mallorca. [Link].
OSTA = Gago Jover, F. y J. Pueyo Mena. Old Spanish Textual Archive. [Link]
org/
Post Scriptum = Marquilhas, R., coord. P.S. Post Scriptum. A Digital Archive of Ordinary Writing (Early Modern
Portugal and Spain). [Link]
Programes = Procesos de Gramaticalización en la Historia del Español. [Link]/procesosdegramaticalizacion
enlahistoriadelespanol/documentos-programes.
Severin, D., dir. An Electronic Corpus of 15th Century Castilian Cancionero Manuscripts. [Link]
[Link].
TeiTok = Janssen, M. 2014 [recurso en línea]. [Link].

B Estudios
Anthony, L. 2013. “A Critical Look at Software Tools in Corpus Linguistics”. Linguistic Research 30 (2):
141–161.
Enrique-Arias, A. 2012. “Dos problemas en el uso de corpus diacrónicos del español: perspectiva y com-
parabilidad”. Scriptum Digital 1: 85–106.
Enrique-Arias, A. 2015. “Edición digital y corpus diacrónicos: problemas en la edición de textos históricos
producidos en un entorno bilingüe”. En Temas, problemas y métodos para la edición y el estudio de documentos
hispánicos antiguos, eds. J. P. Sánchez Méndez, M. de la Torre y V. Codita, 395–406. Valencia: Tirant lo
Blanch.
Enrique-Arias, A. 2016. “Sobre la noción de perspectiva en lingüística de corpus: algunas ventajas de los
corpus paralelos”. En Lingüística de corpus y lingüística histórica iberorrománica, ed. J. Kabatek, 21–39.
Berlín: De Gruyter.
Enrique-Arias, A. 2018. “Some Methodological Issues in the Corpus-Based Study of Morphosyntactic
Variation. The Case of Old Spanish Possessives”. En Diachronic Corpora, Genre and Language Change, ed.
R. J. Whitt, 261–279. Ámsterdam: John Benjamins.
Enrique-Arias, A. 2019. “Los corpus informatizados aplicados al estudio del libro antiguo. Técnicas, recur-
sos, problemas”. En La producción del libro en la Edad Media: una mirada interdisciplinar, eds. G. Avenoza,
L. Fernández y M. Lourdes Soriano, 335–363. Madrid: Sílex.
Kabatek, J. 2013. “¿Es posible una lingüística histórica basada en un corpus representativo?”. Iberoromania
77: 8–28.
Kabatek, J., ed. 2016. Lingüistica de corpus y lingüistica histórica iberorrománica. Berlín: De Gruyter.
Kawasaki, Y. 2014. “Datación crono-geográfica de documentos medievales españoles”. Scriptum Digital 3:
29–63.
Labov, W. 1994. Principles of Linguistic Change: Internal Factors. Oxford: Blackwell.
Lüdeling, A. y M. Kytö, eds. 2008. Corpus Linguistics: An International Handbook. Berlín: De Gruyter.
Octavio de Toledo, Á. 2019. “Large Corpora and Historical Syntax: Consequences for the Study of Mor-
phosyntactic Diffusion in the History of Spanish”. Frontiers in Psychology 10 (780): 1–15 [en línea].
[Link]
Rodríguez Molina, J. y Á. Octavio de Toledo. 2017. “La imprescindible distinción entre texto y testimo-
nio: el CORDE y los criterios de fiabilidad lingüística”. Scriptum Digital 6: 5–68.
Sánchez-Prieto Borja, P. 2011. La edición de textos españoles medievales y clásicos. Criterios de presentación gráfica.
San Millán de la Cogolla: Cilengua.
Silva-Corvalán, C. y A. Enrique-Arias. 2017. Sociolingüística y pragmática del español. Washington, DC:
Georgetown University Press.
Torruella Casañas, J. 2017. Lingüística de corpus: génesis y bases metodológicas de los corpus (históricos) para la
investigación científica. Nueva York: Peter Lang.

27
3
Las gramáticas del español como
fuentes de datos lingüísticos
(Spanish grammars as sources
of linguistic data)
Daniel M. Sáez Rivera

1. Introducción
En el presente capítulo se aborda el empleo de las antiguas gramáticas del castellano (hasta el
siglo XIX), como fuente de datos lingüísticos para la historia del español. Tras un breve estado
de la cuestión, se señalan la utilidad, pertinencia y cautela necesarias al utilizar las gramáticas del
pasado como fuentes histórico-lingüísticas. Se distinguirá entre gramática interna y gramática
externa, siendo la última un género historiográfico que permite atisbar la gramática interna de
hablantes del español del pasado. Sigue una breve historia de la gramática del español según sus
tipos textuales al hilo de la cual se proporcionan herramientas teóricas adecuadas para el análisis
de gramáticas: la distinción entre usos descritos, prescritos y escritos, de un lado, y la diferencia
entre gramatización y gramaticalización, de otro. Todo lo anterior se ejemplifica en gramáticas
concretas con atención a distintos niveles lingüísticos.
Palabras clave: gramáticas antiguas, fuentes, historia del español, historiografía lingüística,
gramatización

This chapter explains how linguists can use older grammars of Spanish (understood as those
published through the 19th century), as sources of linguistic data for the history of the Spanish
language. After a brief state of the art survey, this chapter will describe the usefulness, necessity,
relevance and appropriate cautions on the use of grammars from the past as historical-linguistical
sources. It will next distinguish between inner grammar and outer grammar, the latter being a
historiographic genre which allows us to glimpse the inner grammar of speakers of Spanish in
the past. The chapter then offers a brief history of Spanish grammars according to their main
text types. Several useful theoretical tools are provided at this point: the distinction between des-
criptive, prescriptive, and written uses, and the difference between grammatisation and gram-
maticalization. Several examples from concrete grammars are supplied with attention paid to
different levels of linguistic analysis.
Keywords: old grammars, sources, history of Spanish language, linguistic historiography,
grammatisation

28 DOI: 10.4324/9781003035565-5
Las gramáticas del español como fuentes de datos lingüísticos

2. Breve estado de la cuestión


Consideraremos antiguas gramáticas del castellano aquellas publicadas entre finales de la Edad Media
y el siglo XIX (inclusive), siguiendo el título y la propuesta de la compilación de Gómez Asencio
(2001).
El empleo de las gramáticas como fuente para la historia de la lengua española constituye una
tradición que arranca con Cuervo (1893, 1895a, b) tanto para el estudio de lo fónico-gráfico
como de lo morfosintáctico (segundas personas de las formas verbales, leísmo, laísmo y loísmo,
etc.). Existen hitos posteriores, como Alonso (1955/1967) para la historia de la pronunciación
o Girón Alconchel (1996) para la historia morfosintáctica. Para la historia de las formas de tra-
tamiento (tú, vos, usted, etc.), es ejemplar y seminal el trabajo de Salvador Plans (1996), aunque
existe alguno anterior y muchos posteriores, que amplían las fuentes a manuales epistolares y de
urbanidad (cf. Sáez Rivera 2021).

3. Cuestiones metodológicas. Utilidad, pertinencia y cautelas en el


empleo de gramáticas antiguas como fuente lingüística
Evidentemente, las gramáticas antiguas prácticamente solo son fuente de datos a partir de la
Gramática de la lengua castellana (1492) de Nebrija. Una vez que empiezan a publicarse, las gra-
máticas han sido muy utilizadas como fuente de datos sobre todo para el Siglo de Oro (siglos
XVI–XVII), debido a que, como señala Salvador Plans (2006), dan noticia de la competencia
de hablantes del pasado, proporcionan información sobre la lengua hablada —especialmente
sobre la pronunciación— y también valiosos datos sobre variación (dialectal, social, de situación,
lenguas de especialidad, tradiciones discursivas, etc.), así como sobre actitudes lingüísticas e
ideología lingüística, manifestadas por ejemplo en el señalamiento de lo que la tradición histo-
riográfica de la historia de la lengua española llama “normas” (Martínez Alcalde 2019) o en el
establecimiento de un canon de autores (cf. Ramajo Caño 1993 para el Siglo de Oro y Quijada
van den Berghe 2011 para el siglo XVIII).
No obstante, pese a la utilidad de este tipo de fuente, hay que observar una serie de cautelas
en su manejo. En primer lugar, las gramáticas muestran una serie de inercias, herencia sobre
todo del latín (Gómez Asencio 2001): por ejemplo, hasta muy tarde, incluso el siglo XIX, se
sigue hablando de “caso” en el español, aunque se señale que se establece no por terminaciones
sino por preposiciones (Merrill 1962). En segundo lugar, es necesario atender a los procesos
de copia entre gramáticas, especialmente frecuentes a partir del siglo XVII, constituyendo estas
una “tradición editorial” o “tradición de copias, alteraciones y adiciones encadenadas” (Sáez
Rivera 2005, 793); estas copias pueden ser incrementales, cuando se añade información nueva,
con frecuencia de actualización a la lengua coetánea, o detrimentales, cuando se deforma la fuente
introduciendo errores (Sáez Rivera 2009): por tanto, cualquier dato extraído de una gramá-
tica tiene que ser comprobado para decidir si es original de su época o no. En tercer lugar, los
gramáticos extranjeros pueden escribir y describir una interlengua, no un español nativo, con
el ejemplo extremo del español asevillanado e interferido con el francés de Huillery (1661)
(Sáez Rivera 2016), por lo que hay que cotejar los datos extraídos con gramáticas coetáneas de
nativos y con textos paralelos sin atisbo posible de interferencia, cotejo hoy facilitado por las
herramientas de corpus (cf. Cap. 2). En cuarto lugar, resulta necesaria la historiografía lingüística
para poder interpretar correctamente los conceptos y categorías gramaticales del pasado (p. ej.,
el famoso “nombre participal infinito” de Nebrija: cf. Tollis 1984): así, es especialmente difícil la
interpretación de las noticias de pronunciación de las gramáticas y tratados ortográficos antiguos,
que desconocen la distinción fonema/sonido/alófono y emplean términos como “voz”, “letra”,

29
Daniel M. Sáez Rivera

“oficio”, “fuerça”, “figura” o “nombre” con mezcla de observaciones fonéticas y distinciones


fonológicas o nociones opacas a la hora de describir las pronunciaciones (p. ej., “ceceo”).
Tampoco se puede olvidar la cautela filológica, que implica la necesidad de acudir direc-
tamente a las fuentes, comprobando, contextualizando y, si es necesario, reinterpretando los
datos. Hoy día disponemos de completas bibliografías que facilitan la localización de ejemplares,
como la Bibliografía nebrisense (Esparza Torres y Niederehe 1999; cf. también el portal <http://
[Link]/[Link]>, mantenido por Pedro Martín Baños) o toda la serie de la
BICRES o Bibliografía cronológica de la lingüística, la gramática y la lexicografía del español (Niederehe
1995–2005; Esparza Torres y Niederehe 2012; Esparza Torres et al. 2012), que abarca desde el
siglo XVI al XIX. Muchos ejemplares están digitalizados en bibliotecas, catálogos y repositorios
en la red, en curso de recopilación en el portal de la Biblioteca Virtual de la Filología Española
(BFVE, <[Link] que además ofrece valiosas biobibliografías de los autores. Todo
ello facilita la tradicional tarea ecdótica de recensio y collatio de los textos historiográficos (Sáez
Rivera 2014) y el consiguiente trazado de stemmas o árboles de relación de testimonios textuales
(p. ej., el propuesto para la Nouvelle grammaire espagnole de Sobrino en Sáez Rivera 2006, 297).
La existencia de digitalizaciones en red no exime de la consulta de los ejemplares originales ni
de la producción de nuevas ediciones, sobre todo críticas (p. ej., la reciente y modélica edición
de Franciosini citada aquí entre las fuentes primarias).

4. La gramática “externa” como fuente de la gramática “interna”


Partiendo de la conocida distinción chomskyana (Chomsky 1986, 15–50) entre lengua-I y
lengua-E, podrían diferenciarse una “gramática-E(xterna)” y una “gramática-I(nterna)”. La
primera consistiría en la gramática como género historiográfico o tradición discursiva en sí
misma, con las siguientes características prototípicas: denominarse en su época precisamente
“gramática”, presentar un texto corrido a una columna (frente a diccionarios, nomenclaturas y
diálogos, que se suelen presentar como mínimo a dos columnas), pertenecer a un tipo textual
descriptivo, presentarse editorialmente en un formato editorial más pequeño que el folio (frente
a los diccionarios, normalmente en folio), poseer un contenido metalingüístico centrado en el
nivel fónico-gráfico y el morfosintáctico (aunque las gramáticas antiguas suelen añadir conte-
nido léxico, fraseológico y pragmático) y practicar pedagógicamente una enseñanza deductiva
de los contenidos señalados (Sáez Rivera 2011, 559). Esta “gramática-E” serviría históricamente
de fuente de la “gramática-I” o “gramática interna” de los hablantes del pasado, entendiendo
gramática en un sentido amplio que incluiría desde las reglas de la fonética/fonología/grafía a la
morfología, la sintaxis, el léxico y la pragmática, pues las gramáticas antiguas recogían todos los
niveles lingüísticos en su contenido.
Para poder emplear adecuadamente las gramáticas-E como fuente de la gramática-I con-
viene un conocimiento sólido de las gramáticas como género historiográfico, reparando en las
siguientes cuestiones: contexto histórico-cultural de producción; vida y obra de los gramáticos;
desarrollo de teorías gramaticales o lingüísticas; polémicas gramaticales de la época; nómina y
definición de las categorías gramaticales y empleo coetáneo de los términos lingüísticos.

5. Breve historia de la gramática del español en sus tipos textuales


Las gramáticas constituyen un género historiográfico más entre los empleados en una comunidad
discursiva (Swales 1990, 24–27) concreta, entendida esta como un conjunto de individuos que
se comunican para lograr metas comunes a través de textos pertenecientes a géneros discursivos
en particular, siendo en este caso la meta común el aprendizaje y la enseñanza del español, sobre

30
Las gramáticas del español como fuentes de datos lingüísticos

todo a extranjeros (Sáez Rivera 2011, 559). En tal comunidad discursiva, la gramática sería un
género más junto a diálogos escolares, nomenclaturas o vocabularios temáticos, diccionarios alfa-
béticos, narraciones breves, colecciones de refranes, cartas o notas histórico-lingüísticas, entre
otros.
Una parte destacada del género historiográfico gramática es el prólogo inicial en el que se
indica su propósito, objetivo y público. A continuación, las gramáticas antiguas suelen incluir
una sección de pronunciación (normalmente denominada “pronunciación de las letras”, pos-
teriormente —en particular a partir del siglo XVIII— desglosada en ortografía y prosodia)
y desarrollan a continuación especialmente la morfología (denominada habitualmente “ana-
logía”) y la exposición de las categorías gramaticales o partes del discurso (usualmente en
torno a nueve, a saber: artículo, nombre, adjetivo, pronombre, verbo, adverbio, preposición,
conjunción e interjección). Sigue la sintaxis, inicialmente de poca entidad y extensión (pues
se desgranaba más bien en los tratados retóricos), y al final algunas notas léxicas y fraseológicas
además de observaciones varias (relación del vernáculo con el latín, por ejemplo). Son apéndi-
ces frecuentes (sobre todo en gramáticas para extranjeros) nomenclaturas, breves diccionarios,
diálogos escolares, cartas e incluso textos literarios, con lo que se crean verdaderos manuales
completos. La gramática puede ser también texto liminar de un diccionario (por ejemplo, el
inglés-español de Minsheu 1599, que incluye además una serie de diálogos de mucha fortuna
posterior) o una colección de diálogos (como la serie multilingüe bajo el nombre de Noël de
Berlaimont que arranca en el siglo XVI y llega incluso al XIX, y que incluye el español por
primera vez en 1551).
Se puede dividir la gramática en subtipos o subgéneros según el público al que se dirige, esto
es, la comunidad discursiva en la que se insertan (Sáez Rivera 2011), lo cual produce diferencias
en sus contenidos y metodología que pasamos a abordar.

5.1 Gramáticas para nativos


Con la excepción de la Gramática de la lengua castellana (1492) de Nebrija, las gramáticas de espa-
ñol para nativos se desarrollan sobre todo a partir del siglo XVII. Las podemos dividir en gene-
ralistas o de referencia, de largo aliento y consulta especializada, y escolares, que sirven de manuales
formativos.

5.1.1 Gramáticas generalistas o de referencia


En el siglo XVII destacan el manchego Bartolomé Jiménez Patón (Instituciones de la gramática
española 1614) y el extremeño Gonzalo Correas, profesor en Salamanca y autor de un Trilingüe
de tres artes de las tres lenguas castellana, latina, i griega (1627) que incluye una gramática del español
conocida como “arte chica”, resumen del “arte grande” o Arte de la lengua española castellana
(1626), que quedó manuscrito hasta el siglo XX. Descuella igualmente la gramática del jesuita
jiennense Juan Villar (Arte de la lengua española, 1651). Ya a mediados del siglo XVIII aparece la
Gramática de la lengua castellana (1743/1769) de Benito Martínez Gómez-Gayoso, seguida por el
Arte del romance castellano (1769) en dos volúmenes de Benito de San Pedro. La primera gramática
de la Real Academia Española se publica como Gramática de la lengua castellana (GRAE, 1771) y
se va reeditando con cambios hasta llegar a principios del XX, con hitos como la cuarta edición
de 1796 (en la que se desecha p. ej., el laísmo de la norma) y las de 1854, 1870 y 1880. Los dos
mayores gramáticos del siglo XIX son el valenciano Vicente Salvá (Gramática de la lengua caste-
llana, 1830) y el venezolano Andrés Bello, famoso por su Gramática de la lengua castellana destinada
al uso de los americanos (1847), reeditada y anotada por Cuervo en 1874.

31
Daniel M. Sáez Rivera

5.1.2 Gramáticas escolares


Se producen a partir del siglo XVIII, siglo en el que destacan los Rudimentos de gramática castellana
(1770) de Salvador Puig y numerosas obras que se acumulan a finales de siglo, como los Elementos
de gramática castellana, ortografía, caligrafía y urbanidad (1790) de Santiago Delgado y Marín, el Arte
nuevo de enseñar las reglas de gramática y orthografía castellana (1791) de José Balbuena o el Curso de
gramática castellana en solo ochenta días (1798) de Guillermo Cristóbal y Jaramillo. En el siglo XIX,
a raíz de la Ley de Instrucción Pública de Moyano (1857), por la que se declaran la gramática y
la ortografía de la Real Academia Española textos únicos y obligatorios en el sistema educativo,
la corporación publica el Compendio y el Epítome, resúmenes de la GRAE. Serán numerosas las
gramáticas escolares en la América española tras las independencias, fruto de la creación de los
sistemas propios y nacionales de educación, y son objeto de especial estudio actualmente.

5.2 Gramáticas para enseñar español a extranjeros


Son las primeras en desarrollarse: ya la quinta parte (libro V) de la gramática de Nebrija va de
hecho dirigida a la enseñanza a extranjeros. Se suelen estudiar por “focos” nacionales, conforme
se denominan en la serie de libros dirigidos por Gómez Asencio (2006–2011). Ahora bien,
estos “focos” en la práctica se suelen entrelazar en fuertes procesos de internacionalización,
especialmente visibles a partir del siglo XIX con la difusión de diversos métodos denominados
normalmente por sus creadores (Ahn, Ollendorf, Robertson, etc.), mientras en el siglo XX
priman etiquetas de método (natural, estructural, comunicativo, ecléctico) y, más tarde, de enfoque
(p. ej., por tareas). Para una historia completa de la enseñanza del español a extranjeros, puede
consultarse Sánchez Pérez (1992).
Destacan, hasta las primeras décadas del siglo XIX, los siguientes “focos”:

1) Flandes.—Es el primero que surge, por la presencia española en la zona, dado que los
Países Bajos (esto es, Flandes) formaron parte de la Corona española desde Carlos I hasta
el Tratado de Utrecht (1713), por el cual se enajenaron (Sáez Rivera 2008, 169, n. 2). Por
ello no extraña que aparecieran en Lovaina, en el taller de Gravio, dos gramáticas, ambas
anónimas (1555 y 1559), y en Amberes la Gramática castellana (1558), de Cristóbal de Villa-
lón. A finales del siglo XVII se imprime en Bruselas la Nouvelle grammaire espagnole (1697)
de Francisco Sobrino, copia incremental de la exitosa Grammaire espagnole de César Oudin
(cf. inf. nº 3) con numerosas reediciones hasta incluso principios del siglo XX.
2) Italia.—Es el segundo foco, también debido a la influencia política española en el área,
especialmente en el Sur (Nápoles) y en las islas (Cerdeña y Sicilia): cf. Sáez Rivera (2008,
111–113). Así, las Osservationi della lingua castigliana (1556) de Juan de Miranda inician
la gramática basada en el contraste lingüístico (en este caso, con el italiano), modelo
que influirá poderosamente en la gramática de Oudin. Sobresale igualmente Lorenzo
Franciosini, cuya Grammatica spagnuola e italiana (1624) debe mucho a Oudin y algo a
Miranda. Franciosini es el primer traductor del Quijote al italiano, igual que Oudin lo fue
al francés, abriendo ambos una tradición aún viva de empleo de la obra magna cervantina
para la enseñanza del español.
3) Francia.—El país vecino de España, en el siglo XVI enemigo, tarda un poco más en tener su
primera gramática para enseñar español: La parfaicte méthode pour apprendre l’Espagnol (1596)
de Nicolas Charpentier. Al año siguiente publicó César Oudin, secretario e intérprete del
rey francés, su ya mencionada Grammaire espagnole (1597), muy reeditada en el siglo XVII y
que siguió retocando su hijo Antoine, también secretario e intérprete regio al que sucedió

32
Las gramáticas del español como fuentes de datos lingüísticos

Claude Dupuis, autor de La grammaire espagnole de Des Roziers (1659). A Juan de Luna,
protestante refugiado en Francia y luego Inglaterra, se debe un Arte breve y compendiosa para
aprender la lengua española (1616). Resulta asimismo señero Claude Lancelot, coautor de la
famosa Grammaire générale et raisonnée (1660) que, con el seudónimo de De Trigny firma
en el mismo año una Nouvelle méthode pour apprendre la langue espagnole (1660). En el siglo
XVIII destaca por su calidad la gramática de Jean de Vayrac, autor en 1708 de una volumi-
nosa Nouvelle grammaire espagnole, muy ampliada en la segunda edición de 1714.
4) Inglaterra (y Estados Unidos).—Uno de los primeros profesores de español en Inglaterra
fue Antonio del Corro, también protestante refugiado, que publicó en Oxford sus Reglas
gramaticales para aprender la lengua española y francesa (1586). No mucho después, Richard Per-
cyvall hace publicar su Bibliotheca hispanica, containing a grammar, with a dictionarie in Spanish,
English and Latine. El relevo en la producción de materiales para enseñar español lo toma el
ya mencionado Minsheu con su diccionario bilingüe (1599). Ya en el siglo XVII, Juan de
Luna publica en Londres una edición de su Arte breve (1623). El siglo XVIII se inicia con
A new Spanish and English Dictionary (1706) del capitán John Stevens, con una gramática y
unos diálogos muy inspirados en Minsheu. En 1725 sale una edición muy aumentada de
esa gramática (A new Spanish Grammar, more perfect than any hitherto publish’d) que constituye
el arranque de toda una cadena editorial posterior (Sebastián Puchol 1739; Giral Del Pino
1766; Raimundo del Pueyo 1792; Felipe Fernández 1797). Esta tradición desembarca en
Estados Unidos a través del catalán-cubano Mariano Cubí y Soler, que publicó en Balti-
more en 1822 A new Spanish Grammar, adapted to every class of learners, con gran repercusión
en su momento.
5) Países germanófonos.—Las primeras gramáticas de español se publican aquí en latín, así las
Institutiones in linguam hispanicam (1614) de Doergank, obra derivada de Oudin con influen-
cia también de Miranda. El cántabro Juan Ángel Sumarán da a la luz en Viena una destacada
Grammática y pronunciación alemana y española (1634). En torno a la corte vienesa se publican
varias gramáticas y manuales más en los siglos XVII y XVIII, como la muy apreciable Gram-
matica et syntaxis linguae Hispanicae (1711) de Matías Cramer. A partir del último cuarto del
siglo XVIII, con la Kurzgefasste Spanische Grammatik (1778) de Barth como bisagra, pro-
liferan las gramáticas del español: a comienzos del siglo XIX destaca Theoretisch-Praktische
Lehre der Spanischen Sprache (1806) de Manuel Pérez Ramajo.
6) Otros focos.—En el arranque de la gramática de español en Holanda se sitúa Linguæ hispan-
icæ compendiosa institutio (1630) firmada por Carolus Mulerius (Karl van Muller). Con un
título similar se publicó en Dinamarca la pionera en ese país, Linguae Hispanicae Compendium
(1662) de Carolus Rodriguez Matritense, esto es, Carlos Rodríguez de Madrid. La primera
gramática para enseñar español en Portugal es muy tardía, la Grammatica hespanhola para uso
dos portuguezes (1848) de Nicolau António Peixoto.

Cabe distinguir, en fin, un subgénero transversal, el de las gramáticas dialogadas o erotemáticas,


ya para extranjeros (Espejo de la gramática en diálogos del murciano Ambrosio de Salazar, publicada
en Rouen, 1614) o para nativos, especialmente escolares.

6. Herramientas teóricas de análisis


Conviene distinguir, siguiendo a Girón Alconchel (1996), entre usos descritos, prescritos y
escritos: no siempre es lo mismo lo que el gramático dice que hay que decir (uso prescrito) que
lo que dice que se dice o se suele decir (uso descrito) y lo que realmente dice (usos escritos).
En los usos descritos se suelen incluir apreciaciones de frecuencia de formas o construcciones

33
Daniel M. Sáez Rivera

y diferentes marcas diatópicas (geográficas o dialectales), diastráticas (de grupos sociales, inclui-
dos lenguajes de especialidad) y diafásicas (o de situación: distinciones de estilo o de registro) e
incluso diacrónicas (señalamiento de arcaísmos), pudiendo adjudicarse formas o construcciones
a tradiciones discursivas específicas (Sáez Rivera 2007). Estas marcas suelen estar además entre-
veradas o entrelazadas.
Valga un ejemplo: el gramático castellano Villalón incorpora informaciones diatópicas simi-
lares o asimilables a las marcas lexicográficas en su Gramática castellana (1558), sobre todo en la
sección dedicada al género de los sustantivos. Así, señala que “[t]odo nombre de árbol es del
género masculino. [...] Aunque en algunas partes de Castilla dizen esta peral, esta moral, esta nogal”
(Villalón 1558, 22). El uso descrito puede mutar rápidamente en prescrito (o proscrito, esto es,
condenado como incorrecto): en la misma sección del género, al indicar que todo nombre aca-
bado en -ar es masculino (mar, par, azúcar, aljófar, azahar), se añade: “en algunas partes de Castilla
dizen esta mar, del género femenino: pero mal dicho” (Villalón 1558, 28). Un caso de combina-
ción de marcas es el siguiente: en su gramática, Stevens (1706, 48) señala que la paragoge o aña-
dido de una letra o sílaba al final de una palabra es rara en el presente pero usada antiguamente
(un arcaísmo), conforme se encuentra en antiguas canciones y baladas, de modo que la asigna a
una tradición discursiva concreta, un género poético popular. Se añade, además, que voy y soy
muestran paragoge de -y respecto a vo y só, siendo estas últimas las formas antiguas.
Los usos escritos pueden encontrarse en la lengua de metalenguaje si la gramática está escrita
en español, como suele ser el caso de las gramáticas para nativos, mientras que las gramáticas para
extranjeros suelen adoptar como lengua de metalenguaje la del foco o público al que se dirige.
Podemos clasificar también dentro de los usos escritos los ejemplos de las reglas y las muestras
de lengua (diálogos, cartas, narraciones breves, etc.) que suelen acompañar a las gramáticas. Sin
embargo, es necesario considerar que los ejemplos son parte de la teoría (Auroux 1994, 110)
y los usos lingüísticos que muestran pueden estar al servicio de esta, aparte de que suelen ser
con frecuencia copiados; las muestras de lengua, por otro lado, están pregramaticalizadas (Besse
2001; Sáez Rivera 2005) o preparadas para enseñar ciertas estructuras, y las lecturas incluidas
en las gramáticas poseen un valor de modelo de lengua, sobre todo cuando están firmadas por
autoridades literarias.
Otra noción teórica útil para el análisis es la de gramatización (término de Auroux 1994),
entendido como la codificación de una forma o estructura lingüística en una gramática, noción
que, siguiendo a Girón Alconchel (2018), podemos poner en paralelo con la de gramaticaliza-
ción (cf. cap. 9), proceso de cambio lingüístico que puede seguirse mediante datos extraídos de
gramáticas. Por ejemplo, Bello (1847, § 923), al tratar la duplicación de los pronombres de acu-
sativo y dativo simplemente señala (gramatización por uso descrito) que “[e]s usual el acusativo a
usted después del caso complementario: Le han sorprendido a usted; Los aguardábamos a ustedes”,
dando a entender que no es aún obligatoria (no está, por tanto, enteramente gramaticalizada) tal
duplicación con usted, forma que además no considera aún pronombre, sino “nombre indecli-
nable” (Bello 1847, § 920).

7. Ejemplos de obtención de datos en gramáticas antiguas

7.1 Nivel fónico-gráfico


Las observaciones sobre pronunciación de las gramáticas, sobre todo para extranjeros, permiten
afinar la historia de los usos fónicos. Por ejemplo Claude Dupuis (1659, fol. āix, r-v) señala que
“les veritables Castillans prononcent le g devant e & i comme vn demy c en ouurant la bouche
tant soit peu, mais plus fort que l’on ne prononce pas en France la (h) aspirée”, pasaje que Kiddle

34
Las gramáticas del español como fuentes de datos lingüísticos

(1975, 96) aduce como prueba de que las grafías <g, j + e, i> correspondían a la velar sorda
[x], si bien Menéndez Pidal (2005, 1006), con análisis más fino, considera que Dupuis revela un
paso intermedio entre la palatal fricativa /∫/ y la velar /x/, la palatoalveolar /ç/ (el ich-Laut del
alemán).

7.2 Nivel morfológico


Aparte de para diferentes cambios en el paradigma verbal, las gramáticas son utilísimas como
fuente de documentación del leísmo, laísmo o loísmo, con “gramáticos para todos los gustos”
(Gómez Asencio 1989). Es conocido el caso de Salvá, quien propuso reservar el pronombre le
de acusativo (hoy complemento u objeto directo) para referir entidades animadas (personas y
animales), influyendo en la GRAE y, por tanto, en la formulación del estándar actual del leísmo.

si bien hai quien dice siempre lo para el acusativo sin la menor distinción, y le para el dativo,
lo general es obrar con incertidumbre, pues los escritores más correctos que dicen adorarle,
refiriéndose a dios, ponen publicarlo, hablando de un libro. Pudiera conciliarse esta especie
de contradicción, estableciendo por regla invariable usar de le para el acusativo si se refiere a
los espíritus u objetos incorpóreos y a los individuos del género animal; y del lo, cuando se
trata de cosas que carecen de sexo, y de las que lo tienen, pero pertenecen al reino vegetal.
Así diré examinarle, si se trata de un espíritu, un hombre o un animal masculino, y exami-
narlo, si de un hecho.
( Salvá 1847, 152–153)

7.3 Nivel sintáctico


Jiménez Patón gramatiza en el siglo XVII el complemento directo preposicional según el rasgo
[+ humano], al señalar que la preposición a se emplea para marcar los complementos de los
verbos “activos” (lo que hoy llamamos “transitivos”) formados por “cosas animadas”, con una
ejemplificación que incluye solo nombres propios de persona.

La construción destos verbos actiuos es mediante preposición y sin ella. En cosas anima-
das, por la mayor parte, se pone la preposición, como siruo a Pedro, fauorezco a Ioan, amo a
Francisco. En cosa sin alma, están sin ella, como amo la verdad, leo los libros, oyo el Euangelio.
( Jiménez Patón 1614, 102)

7.4 Nivel léxico


Ya en Miranda (1566) se recoge la explicación léxica de las voces merced, hideputa e hidalgo, que
incluye una disquisición etimológica, de donde pasa a Oudin (1597) y reaparece en Franciosini
(1624), aunque este elimina toda hipótesis etimológica. Es tanta la frecuencia de explicaciones
de estas voces que Marcos Fernández incluye una etimología burlesca de hidalgo al final de su
Olla podrida a la española (1655).

7.5 Nivel pragmático


Han sido muy explotadas las gramáticas de los Siglos de Oro e incluso del siglo XVIII como
fuente para la historia de los tratamientos (p. ej., Salvador Plans 1996; Sáez Rivera 2008, 2021).
Pero las gramáticas escolares han sido menos sondeadas como fuentes de datos lingüísticos, cuando

35
Daniel M. Sáez Rivera

constituyen una mina por explorar, sobre todo para el nivel pragmático y la cortesía en particular.
Por ejemplo, Delgado Marín (1790, 94) condena el empleo de tú en el ambiente respetuoso de la
escuela: “En las Escuelas no se permita tratarse de tú, ni menos por apodos, ó nombres ridículos”;
los escolares han de emplear “vmd.”[=usted], según se deduce de los ejemplos: “Nunca llamará la
atencion quando habla diciendo, ¿me entiende Vmd.? ¿está Vmd.?” (Delgado Marín 1790, 90). Es
tal la importancia que se confiere en la escuela de primeras letras del siglo XVIII a la cortesía que
se supone obligación del maestro enseñarla, como recoge Balbuena Pérez (1791, 195): “Otra de
las obligaciones del Maestro, y no la menos importante, es el enseñar a los Niños cortesia, politica,
ò buena crianza, que consiste en el distinto modo de tratar con los superiores, con los iguales, é
inferiores, el aséo, y limpieza de su persona”. Delgado Marín (1790, 108–109), por otra parte, no
recoge los tratamientos especiales debidos a ciertas personas, “como V. S.ª Exc.ª Magd., &c. pues
nadie va á hablar á algun personage de estos sin enterarse ántes del tratamiento que se les da por
su casa, ó empleo”; en cambio, Balbuena sí los presenta y explica a colación de la enseñanza de la
escritura de cartas (una tradición discursiva), e incluso señala pragmáticas vigentes de tratamientos
como la Nueva recopilación de leyes (Balbuena Pérez 1791, 246–256).

8. Perspectivas futuras y conclusiones


Las gramáticas antiguas y otras herramientas lingüísticas, como los diccionarios (cf. cap. 4),
constituyen una fuente preciosa de datos para la historia del español, si bien a la hora de aprove-
charlas hay que adoptar la serie de cautelas ya señaladas (cf. § 3).
Como tareas pendientes, se puede señalar la necesidad de revisitar y revisar estudios clásicos (p.
ej., Alonso 1955, 1967) acudiendo directamente a las fuentes, así como sondear más fenómenos
de cualquier nivel lingüístico y en más gramáticas (sobre todo las de los siglos XVIII y XIX),
diversificar y ampliar las fuentes historiográficas (para la pronunciación, por ejemplo, catecismos
y cartillas: cf. Echenique Elizondo y Satorre Grau 2013; para la morfosintaxis y la pragmática,
géneros como los diálogos escolares, los formularios de cartas o las colecciones didácticas de
cuentos y otras muestras de textos, etc.: cf. Sáez Rivera 2008), así como adentrarse en la gramá-
tica del siglo XX como una fuente más de un siglo ya historiable.

Lecturas recomendadas
En un artículo aparecido un año antes de su muerte, Alonso (1951) ofreció el que sigue siendo el
trabajo más accesible para iniciarse en su labor con las gramáticas del Siglo de Oro como fuente
para la historia de la pronunciación del español (Alonso 1955/1967).
Siguiendo la estela de Amado Alonso, Girón Alconchel (1996) sondea las principales gramáticas del
Siglo de Oro explorando fenómenos morfosintácticos como la evolución de las segundas personas
de plural en el verbo español y del complemento directo preposicional.
Gómez Asencio (1989) es un artículo ya clásico de este llorado profesor que rastrea en gramáticas de
los siglos XVIII–XIX las diferentes opciones de leísmo, laísmo y loísmo (siendo “loístas” en esa
época los gramáticos que propugnaban lo como pronombre acusativo masculino singular).

Bibliografía citada

A Repertorios bibliográficos
Alvar Ezquerra, M. y Mª Á. García Aranda, dirs., 2023. Biblioteca Virtual de la Filología Española (BVFE):
directorio bibliográfico de gramáticas, diccionarios, obras de ortografía, ortología, prosodia, métrica, diálogos e historia
de la lengua. [Link].

36
Las gramáticas del español como fuentes de datos lingüísticos

Esparza Torres, M. Á., E. Battaner Moro, G. B. Garrido Vílchez, H.-J. Niederehe y A. Álvarez Fernández.
2012. Bibliografía cronológica de la lingüística, la gramática y la lexicografía del español (BICRES V): desde el año
1861 hasta al año 1899. Ámsterdam y Filadelfia: John Benjamins.
Esparza Torres, M. Á. y H.-J. Niederehe. 1999. Bibliografía Nebrisense: las obras completas del humanista Anto-
nio de Nebrija desde 1481 hasta nuestros días. Ámsterdam y Filadelfia: John Benjamins.
Esparza Torres, M. Á. y H.-J. Niederehe. 2012. Bibliografía cronológica de la lingüística, la gramática y la
lexicografía del español (BICRES IV): desde el año 1801 hasta el año 1860. Ámsterdam y Filadelfia: John
Benjamins.
Niederehe, H.-J. 1995–2005. Bibliografía cronológica de la lingüística, la gramática y la lexicografía del español
(BICRES I-III): desde el año 1501 hasta el año 1800, 3 vols. Ámsterdam y Filadelfia: John Benjamins.

B Fuentes primarias (gramáticas y otras herramientas lingüísticas citadas)


Balbuena Pérez, J. 1791. Arte nuevo de enseñar niños, y vasallos a leer, escrivir, y contar las Reglas de Gramatica,
y Orthografia Castellana, precisas para escrivir correctamente. Santiago: Ignacio Aguayo [ejemplar: Madrid,
BNE, 2–4353].
Bello, A. 1847 [1995]. “Gramática de la lengua castellana destinada al uso de los americanos”. En Obras
completas, vol. 4. 3ª ed. Caracas: La Casa de Bello.
Delgado Marín, S. 1790. Elementos de gramática castellana, ortografía, caligrafía y urbanidad, para uso de los discí-
pulos de las Escuelas Pías. Madrid: Benito Cano [ejemplar: Madrid, Palacio Real, VIII-2479].
Dupuis, Cl. 1659. La grammaire espagnole de Des Roziers. París: Chez l’Autheur [ejemplar: París, BNF, X-14692].
Fernández, M. 1655. Olla podrida a la española. Amberes [=Ámsterdam]: Felipe van Eyck.
Franciosini, L. 1624 [2018]. Gramatica spagnola e italiana, ed. F. San Vicente. Padua: CLEUP.
Gómez Asencio, J. J., ed. 2001. Antiguas gramáticas del castellano. Madrid: Fundación Histórica Tavera
[CD-ROM].
Jiménez Patón, B. 1614 [1965]. Epítome de la ortografía latina y castellana. Instituciones de la gramática española,
eds. A. Quilis y J. M. Rozas. Madrid: CSIC.
Salvá, V. 1847. Gramática de la lengua castellana. París: Librería de don Vicente Salvá.
Stevens, J. 1706. A New Spanish and English Dictionary: To Which is Added, A Copious English and Spanish
Dictionary. Likewise A Spanish Grammar. Londres: George Sawbridge [ejemplar: Madrid, BNE, R-6000].
Villalón, C. de. 1558 [1971]. Gramática castellana Por el Licenciado Villalón, ed. C. García. Madrid: CSIC.

C Fuentes secundarias (estudios)


Alonso, A. 1951. “Identificación de gramáticos españoles clásicos”. Revista de Filología Española 35: 221–236.
Alonso, A. 1955/1967. De la pronunciación medieval a la moderna, 2 vols. Madrid: Gredos.
Auroux, S. 1994. La révolution technologique de la grammatisation. París: Pierre Mardaga.
Besse, H. 2001. “Comenius et sa ‘méthode d’enseignement graduée’”. Langue Française 131: 7–22.
Chomksy, N. 1986. Knowldege of Language: Its Nature, Origin, and Use. London: Praeger.
Cuervo, R. J. 1893. “Las segundas personas de plural en la conjugación castellana”. Romania 22: 71–86.
Cuervo, R. J. 1895a [1987]. “Disquisiciones sobre la antigua ortografía y pronunciación castellanas”. En
Obras, 240–477. Bogotá: Instituto Caro y Cuervo.
Cuervo, R. J. 1895b. “Los casos enclíticos y proclíticos del pronombre de tercera persona en castellano”.
Romania 24: 95–113 y 219–263.
Echenique Elizondo, M.ª T. y F. J. Satorre Grau, eds. 2013. Historia de la pronunciación castellana. Valencia:
Tirant lo Blanch.
Girón Alconchel, J. L. 1996. “Las gramáticas del español y el español de las gramáticas en el Siglo de Oro”.
Boletín de la Real Academia Española 76: 285–308.
Girón Alconchel, J. L. 2018. “Gramaticalización y gramatización en la historia del español”. En Actas del X
Congreso Internacional de Historia de la Lengua Española, eds. M.ª L. Arnal Purroy et al., vol. 1, 321–330.
Zaragoza: Institución Fernando el Católico.
Gómez Asencio, J. J. 1989. “Gramáticos para todos los gustos: leístas, laístas y loístas”. En Philologica. Homenaje
a D. Antonio Llorente, eds. J. Borrego Nieto et al., vol. 2, 375–388. Salamanca: Universidad de Salamanca.
Gómez Asencio, J. J. 2001. “Lo latino en las gramáticas del español”. En Actas del II Congreso Internacional
de la Sociedad Española de Historiografía Lingüística, eds. M. Maquieira Rodríguez et al., 35–53. Madrid:
Arco Libros.

37
Daniel M. Sáez Rivera

Gómez Asencio, J. J., dir. 2006–2011. El castellano y su codificación gramatical, 3 vols. Burgos: Instituto Cas-
tellano y Leonés de la Lengua.
Kiddle, L. B. 1975. “The Chronology of the Spanish Sound Change š > x”. En Studies in Honor of Lloyd A.
Kasten, 73–100. Madison: Hispanic Seminary of Medieval Studies.
Martínez Alcalde, M.ª J. 2019. “La(s) norma(s) del castellano en los primeros tratados para su codificación:
testimonios y cautelas”. En La configuración histórica de las normas del castellano, eds. V. Codita, E. Bustos
Gisbert y J. P. Sánchez Méndez, 135–160. Valencia: Tirant lo Blanch.
Menéndez Pidal, R. 2005. Historia de la lengua española. Madrid: Fundación Ramón Menéndez Pidal y
Real Academia Española.
Merrill, J. S. 1962. “The Presentation of Case and Declension in Early Spanish Grammars”. Zeitschrift für
Romanische Philologie 78: 162–171.
Quijada van den Berghe, C. 2011. “Autoridades y canon en gramáticas del español del siglo XVIII”. En
El castellano y su codificación gramatical, Vol. 3, El siglo XVIII: de 1700 a 1835, dir. J. J. Gómez Asencio,
805–831. Burgos: Instituto Castellano y Leonés de la Lengua.
Ramajo Caño, A. 1993. “La norma lingüística y las autoridades de la lengua: de Nebrija a Correas”. Anua-
rio de Letras 31: 333–377.
Sáez Rivera, D. M. 2005. “La explotación pedagógica del diálogo escolar en la didáctica del español (ss.
XVI–XIX)”. En Las gramáticas y los diccionarios en la enseñanza del español como segunda lengua: deseo y
realidad, eds. M.ª A. Castillo Carballo et al., 792–798. Sevilla: Universidad de Sevilla.
Sáez Rivera, D. M. 2006. “Crítica textual, historiografía lingüística e historia de la lengua: propr(r)io-mismo
a partir de la Nouvelle grammaire espagnole de Francisco Sobrino”. En Historia de la lengua y crítica textual,
ed. L. Pons Rodríguez, 267–302. Madrid y Fráncfort: Iberoamericana y Vervuert.
Sáez Rivera, D. M. 2007. “Tradiciones discursivas, historiografía lingüística e historia de la lengua”. En
Cuatrocientos años de la lengua del Quijote: estudios de historiografía e historia de la lengua española, eds. M.
Fernández Alcaide y A. López Serena, 89–111. Sevilla: Universidad de Sevilla.
Sáez Rivera, D. M. 2008. La lengua de las gramáticas y métodos de español como lengua extranjera en Europa
(1640–1726). Tesis doctoral. Madrid: Universidad Complutense de Madrid. [Link]/BUCM/
tesis/fll/[Link].
Sáez Rivera, D. M. 2009. “La explosión pedagógica de la enseñanza del español en Europa a raíz de la
Guerra de Sucesión española”. Dicenda 27: 131–156.
Sáez Rivera, D. M. 2011. “Los libros de gramática del español en el siglo XVIII: estructura y tipología
textual”. En El castellano y su codificación gramatical, vol. 3, El siglo XVIII: de 1700 a 1835, dir. J. J. Gómez
Asencio, 549–570. Burgos: Instituto Castellano y Leonés de la Lengua.
Sáez Rivera, D. M. 2014. “Notas sobre la gramática para la enseñanza del español en el ámbito germánico
en el siglo XIX”. En Métodos y resultados actuales en historiografía de la lingüística, eds. M.ª L. Calero et al.,
vol. 2, 653–663. Münster: Nodus.
Sáez Rivera, D. M. 2016. “Un francés de Chartres en la Sevilla del siglo XVII: la interlengua asevillanada
de François Huillery en su Vocabvlario para facilmentey brieuemente deprender a ler, escrebir, y hablar la lengua
Castellana. Con algunas curiosidades (París,1661)”. En Diálogos entre la lengua y la literatura, eds. C. J. Álva-
rez López y M.ª del R. Martínez Navarro, 15–49. Sevilla: Vitela.
Sáez Rivera, D. M. 2021. “Las formas de tratamiento en las gramáticas del español en los siglos XVIII y
XIX”. Revista Internacional de Lingüística Iberorrománica (RILI) 38: 151–172.
Salvador Plans, A. 1996. “Las fórmulas de tratamiento en la teoría gramatical de los siglos XVI y XVII”.
En Scripta Philologica in memoriam Manuel Taboada Cid, vol. 1, 185–206. La Coruña: Universidade da
Coruña.
Salvador Plans, A. 2006. “Los tratadistas del siglo de oro como fuente para el análisis de la historia de la
lengua”. En Actas del VI Congreso Internacional de Historia de la Lengua Española, eds. J. J. Bustos Tovar y
J. L. Girón Alconchel, vol. 1, 159–183. Madrid: Arco Libros.
Sánchez Pérez, A. 1992. Historia de la enseñanza del español como lengua extranjera. Madrid: SGEL.
Swales, J. M. 1990. Genre Analysis: English in Academic and Research Settings. Cambridge: Cambridge Uni-
versity Press.
Tollis, F. 1984. “À propos des ‘Circunloquios’ du verbe castillan chez Nebrija: le ‘nombre participial infi-
nito’”. Historiographia Linguistica 11: 55–76.

38
4
Los diccionarios del español como
fuentes de datos lingüísticos1
(Spanish dictionaries as
sources of linguistic data)
Gloria Clavería Nadal

1. Introducción
Los diccionarios del pasado se constituyen en una fuente de conocimientos esencial para la his-
toria de la lengua española, muy en particular, aunque no exclusivamente, de su léxico. Por los
datos que atesoran y por la elaboración metalingüística que entrañan, son fuentes privilegiadas
para la reconstrucción del sistema lingüístico de la época a la que pertenecen y, además, forman
parte del proceso de estandarización de la lengua y de la creación de la conciencia lingüística.
Palabras clave: diccionarios; fuentes; historia del español; historiografía lingüística; historia de
la lexicografía

Dictionaries from the past constitute an essential source of knowledge for the history of
the Spanish language, especially (though not exclusively) regarding its lexicon. The data and
the metalinguistic comments they contain render these dictionaries privileged sources for the
reconstruction of the language of the times when they were produced. In addition, these dic-
tionaries form part of the process of language standardization and of the creation of a linguistic
awareness or consciousness.
Keywords: dictionaries; sources; history of Spanish language; linguistic historiography; history
of lexicography

2. Conceptos fundamentales
Se incardina este capítulo en la intersección de dos disciplinas lingüísticas cercanas, la historio-
grafía lingüística y la historia de la lengua. Para esta, los diccionarios representan una fuente
de datos imprescindible en la reconstrucción de la evolución del español porque constituyen
un ejemplo de la lengua de la época en la que fueron elaborados y también por el particular
procesamiento de la realidad lingüística que involucran de modo que, según Reyre (2006, xlv),
“un diccionario antiguo es un ‘museo de la palabra’”. Las fuentes lexicográficas se enraízan en
la enseñanza y aprendizaje de lenguas, y su comparación —“arqueología lexicográfica” según

DOI: 10.4324/9781003035565-6 39
Gloria Clavería Nadal

Ilson (2003)—, manifiesta la propia evolución de la lengua, pese a que son obras en las que la
tradición alcanza un peso relevante. El diccionario es, además, un objeto cultural en el que muy
fácilmente se revelan las actitudes e ideologías lingüísticas, reflejadas tanto en la macroestructura,
con la selección de entradas (exclusiones e inclusiones), como en la microestructura, desde la
información sobre el lema tratado.
La tradición lexicográfica del español se inicia en la Edad Media muy supeditada al latín. Sus
primeras manifestaciones son los glosarios latino-españoles (siglos xiv y xv),2 cuyos interpreta-
menta romances contienen un vocabulario esencialmente patrimonial (Castro 1991, lxxxii), y
el manuscrito editado por Mac Donald (2007). De 1490 es el Universal vocabulario de Alfonso
Fernández de Palencia (Gemmingen 2003, 164–166), un diccionario monolingüe latino con
traducción aproximada al romance, parte que, como bien atestigua el DECH, resulta muy
valiosa para la documentación del léxico. Desde finales del siglo xv es Antonio de Nebrija el
iniciador de un nuevo modelo de lexicografía latino-romance con el Lexicon hoc est dictionarium
ex sermone latino in hispaniensem (Salamanca, 1492) y el Dictionarium ex hispaniensi in latinum
sermonem (Salamanca, ¿1495?) (Gemmingen 2003, 167–171). Cuando con el Renacimiento se
revalorizó el aprendizaje del español por la dimensión internacional que alcanzó la nación (Gili
Gaya 1960, x), las obras nebrisenses fueron aprovechadas para establecer las equivalencias del
español con otras lenguas vernáculas. Entre los diccionarios bilingües, cabe destacar, además de
las equivalencias entre español y las diferentes lenguas europeas (Acero 2003), el Vocabulario ará-
vigo en letra castellana de Pedro de Alcalá (Granada 1505), con correspondencias en árabe vulgar
granadino, y los vocabularios hispano-amerindios (Smith-Stark 2009; Hernández 2018a) com-
pilados por los misioneros para el aprendizaje de las lenguas indígenas con fines evangelizadores;
uno de sus primeros logros es el Vocabulario en lengua castellana y mexicana (México 1555, 1571)
de Alonso de Molina (Hernández 2018a, 94–96). También con raíces latinas y medievales,
se elaboraron a partir del Renacimiento obras multilingües en las que interviene el español;
no hay que olvidar, además, de las nomenclaturas, con tratamiento del léxico organizado por
materias (Acero 2003; Alvar Ezquerra 2013).
Uno de los hitos fundamentales de la historia de la lexicografía es el Tesoro de la lengua castellana
o española de Sebastián de Covarrubias (Madrid 1611), vinculado tanto a la lexicografía latina
como a la plurilingüe y centrado en la indagación etimológica. Aunque tradicionalmente se ha
considerado el primer diccionario “monolingüe” del español (Azorín 2000, 131; Carriazo y
Mancho 2003), no puede comprenderse adecuadamente fuera de las coordenadas descritas en
los párrafos anteriores (Lépinette 1989).
El diccionario monolingüe se consagra en el siglo xviii con la Real Academia Española y su
Diccionario de autoridades (1726–1739), cuyos modelos son los repertorios de la Accademia della
Crusca y de la Académie française. Exhibe, sin embargo, esta obra una personalidad propia con
amplios criterios de selección del vocabulario y abundante fundamentación textual (Freixas
2010). La tradición lexicográfica académica se consolida con una segunda edición del Autoridades
(1770, A–B), en la que se introducen algunas bases novedosas, y con las veintitrés ediciones del
diccionario académico en un solo volumen, desde el DRAE 1780 hasta el DLE 2014, disponible
en línea con actualizaciones anuales. En estas obras se ha ido gestando el concepto de norma
léxica del español (Ruhstaller 2003; Jiménez Ríos, En prensa; Fajardo 2021).
Existen, además, otros muchos diccionarios también valiosos para el historiador del español
moderno (García Platero 2003). Por ejemplo, el Diccionario castellano con las voces de ciencias y artes
de Esteban de Terreros y Pando (Madrid 1786–1793) interesa en particular por las palabras de
carácter técnico que registra y, en la consolidación decimonónica de la lexicografía no acadé-
mica, cabe destacar el Nuevo diccionario de la lengua castellana de Vicente Salvá (París 1846). Para
el siglo xx, sobresalen por su atención al uso el Diccionario de uso del español (Madrid 1966–1967)

40
Los diccionarios del español como fuentes de datos lingüísticos

de María Moliner y el Diccionario actual de la lengua española de Manuel Seco et al. (Madrid 1999),
como testimonios de los derroteros léxicos más recientes.
A partir del siglo xix, se produce una diversificación de los productos lexicográficos a la que
no se puede atender aquí por motivos de espacio: desde los diccionarios enciclopédicos a los
de provincialismos, sinónimos, etimológicos, sectoriales, etc. Todas estas obras han sido profu-
samente empleadas como fuentes para trazar la historia del léxico [caps. Dworkin, Mancho y
Gómez de Enterría].

3. Aproximaciones teóricas y perspectivas actuales

3.1 La revolución en los recursos: los repositorios de diccionarios


La recopilación y estudio de los diccionarios antiguos ha experimentado, en los últimos tiempos,
grandes avances impulsados por las nuevas tecnologías. En poco más de un siglo, se ha pasado
de disponer solo de catálogos de obras lexicográficas en papel (Muñoz y Manzano 1893,
libro tercero; BICRES I–V) a su recolección y tratamiento digitales, con lo que ha mejorado
enormemente su accesibilidad. Progreso extraordinario representa, en este sentido, la BVFE,
repositorio digital creado por Manuel Alvar Ezquerra (2022) que reúne más de 5000 obras
lexicográficas alojadas en la red.
A mediados del siglo xx, el Tesoro lexicográfico de la lengua española (1492–1726) de Gili Gaya
(1960) supuso un avance decisivo en el acercamiento a los diccionarios antiguos. Entendido
como diccionario de diccionarios, permitió conjugar las perspectivas evolutiva y contrastiva en
el estudio del léxico (Corbella 2018, 134) y, aunque este proyecto quedó inconcluso, la idea y el
uso del concepto de tesoro han tenido varias derivaciones relevantes.
El Nuevo tesoro lexicográfico de la lengua española (NTLLE) facilita, a través de la palabra de la
entrada, la imagen digital de 66 obras, desde Nebrija hasta el DRAE 1992. Aunque recoge una
amplia muestra de la lexicografía española disponiendo el contenido de los diccionarios a modo
de corpus paralelo, carece de una mínima homogeneización y unificación de los lemas: así ocu-
rre, por ejemplo, con las simples variaciones gráficas (xeringa, geringa, jeringa) o las distintas for-
mas que una voz haya podido adoptar (yacht, yacte para el actual yate). Este inconveniente queda
resuelto en el Mapa de diccionarios académicos, que pone en paralelo seis ediciones del DRAE
(1780, 1817, 1884, 1925, 1992 y 2001), o en la Lemateca del DRAE, elaborada a partir de las
distintas ediciones decimonónicas del diccionario académico (cf., además, el portal Dicciocho).
Siguiendo la estela iniciada por Gili Gaya, el NTLE sistematiza a modo de corpus glossariorum
y hace fácilmente contrastable la información de las 145 fuentes que comprende, desde el siglo
xiv, con los glosarios mencionados anteriormente, hasta un texto de Feijoo de 1726. Es un ins-
trumento utilísimo para indagaciones sobre la historia de los diccionarios y sus dependencias, así
como para el estudio del léxico desde fuentes metalingüísticas.
Esta concepción de tesoro se ha aplicado con especial éxito al ámbito dialectal con el acopio
de vocabularios y otro tipo de materiales de diferentes épocas, como los reseñados en Corbe-
lla (2018, 142–149). Se ha empleado, asimismo, en la recolección de diccionarios históricos
(TDHLE: Real Academia Española 2021), aunque con datos muy fragmentarios.
En el terreno del español de América, existen distintos materiales y proyectos en curso.
La lexicografía bilingüe en español y lenguas indígenas de América constituye una cantera
extraordinaria. El catálogo de Hernández (2018a) proporciona una esmerada descripción de
más de 150 vocabularios (siglos xvi–xviii). Estos repertorios, aparte de ser testimonios de la
lengua de su época, mejoran el conocimiento de la gestación e historia del léxico americano y
del proceso de adopción de los préstamos indígenas, como ocurre, por ejemplo, con el origen

41
Gloria Clavería Nadal

de vainilla, presente ya en un vocabulario hispano-tzeltal de alrededor de 1571 (Hernández


2018a, 47). Vinculado a este catálogo (Hernández 2018b), se está elaborando el Tesoro léxico de
los americanismos contenidos en los vocabularios hispano-amerindios coloniales (TELEAM 1550–1800).
Entre España y América gravita el Tesoro léxico canario-americano (TLCA: Corrales y Corbella
2010), además del conjunto de recursos citados en Corbella (2018, 149–155), y recientemente
ha cristalizado el proyecto internacional Tesoro lexicográfico del español en América (TLEAM) con
un portal que se augura de gran utilidad en el estudio léxico de las variedades ultramarinas
(Corbella y Díaz 2023).

3.2 Los diccionarios como fuentes de información lingüística


El recurso a los diccionarios para el conocimiento de la historia del español es un procedimiento
que cuenta con estudios ya clásicos; modelos emblemáticos son las investigaciones de Colón
(2002) y sus múltiples análisis contrastivos del léxico nebrisense; también lo son los acercamien-
tos de Morreale (1988) al Tesoro de Covarrubias y, en el español moderno, cabe recordar los
trabajos de Lapesa (1996, 357–379) para el primer tercio del siglo xx con una notable funda-
mentación lexicográfica.
Gracias a la facilidad de identificación de las voces, los diccionarios se han utilizado fre-
cuentemente como pruebas documentales de la existencia de la palabra en un momento
determinado. Corominas, por ejemplo, tomó como base de su diccionario etimoló-
gico la nomenclatura del DRAE 1936 y el léxico más moderno se halla frecuentemente
documentado usando las distintas ediciones del diccionario académico. Los diccionarios, sin
embargo, aportan datos cronológicos de carácter complementario y la presencia de la pala-
bra en estas fuentes constituye un jalón más de su historia (Álvarez de Miranda 2006, 1230–
1231). Mientras algunos son novedosos por recoger el uso de la época, los diccionarios
normativos excluyen sistemáticamente cierto tipo de neologismos (Clavería 2016). Buena
ilustración de la primera postura representa Terreros en la entrada editor: “en Francia es voz
nueva, pero ha hecho fortuna; no sabemos si la hará en Castellano, en donde también lo es,
y quiere probarla”. Cobra sentido, pues, contraponer las documentaciones textuales con las
diccionarísticas con el fin de otorgar mayor alcance y exactitud a las investigaciones léxicas
(cf., como ejemplos, Battaner 1977; Álvarez de Miranda 1992; Gómez de Enterría 2020);
este contraste refleja la compleja relación entre uso y norma (Egido 2021) y su interacción
en los mismos fundamentos del diccionario (Fajardo 2021).
La ausencia de una voz en una fuente lexicográfica puede ser un dato revelador y, a menudo,
se utiliza como prueba de su inexistencia en un determinado momento (DECH, s. v. aplastar,
brillar, carroña, etc.); hay que contar, sin embargo, que la ausencia puede estar determinada por
motivos normativos o ideológicos, siempre presentes en el quehacer lexicográfico (San Vicente
et al. 2011).
Como ocurre con las fuentes gramaticales (cap. 3, epígrafe 7), las lexicográficas atesoran
multitud de datos lingüísticos. En el caso de las grafías, el diccionario contribuye a la
reconstrucción de la historia de la grafemática y de la pronunciación (Quilis Merín 2013a).
Tanto el orden alfabético como las definiciones de las letras aportan datos relevantes sobre la
pronunciación (Echenique 2013), aunque siempre a través del análisis filológico e interpretativo
(Blanco 2018). Buena ilustración de ello se encuentra en las ricas noticias sobre la pronunciación
del Tesoro de Covarrubias (por ejemplo, Ariza 2011; Quilis Merín 2013b), en el que se describen
fenómenos como la neutralización entre r y l (s. v. almario, por ejemplo) o se atestigua, incluso
en la nomenclatura, la g adventicia en casos como güerfano o güevo, una prueba de su difusión
en el siglo xvii. Desde el punto de vista normativo, el vínculo entre ortografía y diccionario se

42
Los diccionarios del español como fuentes de datos lingüísticos

manifiesta en el hecho de que históricamente este ha contribuido a la fijación de la primera,


como demuestran Martínez Alcalde (2007a) y Terrón (2022).
En el terreno de la morfosintaxis, los datos de los diccionarios son subsidiarios a los de
las gramáticas y, aunque en ellos no aparecen los elementos gramaticales con un tratamiento
detallado, se desprenden de estas fuentes pormenores de interés. En la microestructura, ade-
más, el discurso lexicográfico deviene en documentación textual y, así, se puede documentar,
por ejemplo. el empleo del leísmo en contraste con los usos descritos en la gramática (cf. el
publicarle referido a bando hasta el DRAE 1899). Se manifiestan también en los dicciona-
rios informaciones de carácter pragmático entre las que destacan las fórmulas de saludo, las
interjecciones o los tratamientos y la cortesía (cf. Ridruejo 2000 o Martínez Alcalde 2007b).
En la interfaz entre léxico y gramática, los diccionarios son buenas herramientas para el estu-
dio histórico de la fraseología (cap. 23) y, en este sentido, cabe mencionar investigaciones
como las de Scandola (2006), sobre el Diccionario de autoridades, o Romero (2015), sobre las
colocaciones y su tratamiento en los diccionarios de los siglos xvii–xxi. El propio texto del
diccionario puede utilizarse para reconstruir la historia de la evolución de las estructuras com-
plejas como hace Provencio (2020) con en punto a/en punto de contrastando diversos diccio-
narios del español moderno. En última instancia, los diccionarios de partículas y fraseológicos
(cf. Santos 2003; Seco 2018), aunque sincrónicos, por su propia estructuración son útiles en la
reconstrucción histórica del tipo de unidades que almacenan.

3.3 La variación en los diccionarios


Gran interés tienen las apreciaciones que proporcionan las fuentes lexicográficas sobre la varia-
ción lingüística. Esta información ha ido adquiriendo progresivamente mayor grado de codifi-
cación, pasando de su expresión en el propio enunciado definitorio al empleo de abreviaturas y
marcas; también se ha transformado su valor desde representar calificaciones fundamentalmente
retóricas basadas en la lengua literaria (Blecua 2006) hasta ser el resultado de planteamientos
eminentemente lingüísticos (Gutiérrez Cuadrado 2018).
La variación diacrónica, centrada en los arcaísmos, ocupa un puesto relevante en la tradición
lexicográfica y su origen se encuentra en la función que les otorgaba la retórica clásica (Gutié-
rrez Cuadrado 2005). La recolección de arcaísmos no puede disociarse del interés por los textos
antiguos, como se observa en una de las primeras recolecciones de este tipo de vocablos, el
Índice compuesto por D. Gonzalo Argote de Molina de algunos vocablos antiguos que se hallan en el
libro del Conde Lucanor, escrito por don Juan Manuel (1575) —cf. Gemmingen (2003, 162–164)—.
La presencia del arcaísmo en el diccionario cumple varias funciones, que van desde la propia-
mente filológica, como auxilio en la interpretación de textos antiguos, hasta su valor histórico
y “castizo” (Diccionario de autoridades: v). Estos elementos léxicos ya están bien presentes en el
Tesoro de Covarrubias (Reyre 2006: lvii; Ruhstaller 1995–1996; Eberenz 1990) y son funda-
mentales en la tradición lexicográfica académica desde el Diccionario de autoridades, en cuya base
filológica alcanzan un puesto relevante (Jiménez Ríos 2001). La exhumación de arcaísmos no
cesa de crecer en otros diccionarios —en el de Salvá, por ejemplo, su número asciende a más
de 11 000 voces (Azorín 2018)—. Pese a que la Academia en la primera mitad del xix supri-
mió muchas variantes arcaicas, fruto de un cambio de concepción del diccionario (Jiménez
Ríos 2018; Clavería 2020), la estela de esta tendencia permanece en el DLE, y persisten en la
nomenclatura actual acaloñar o engeño junto a variantes antiguas como grant/grand, falagüeño/ña
o fijodalgo (Pascual 1997).
Útiles para el conocimiento de la lengua del pasado, aunque no siempre fáciles de inter-
pretar, resultan las apreciaciones sobre el uso (diastráticas y diafásicas). El Tesoro de Covarrubias

43
Gloria Clavería Nadal

se constituye en una de las mejores fuentes del español áureo porque contiene un verdadero
granero de estos datos (Eberenz 1992; Fernández Alcaide 2017). Este tipo de informaciones
aparece también en los diccionarios bilingües (Gemmingen 1990), siempre atentos a la lengua
común.
La presencia de la variación diatópica adopta dos vertientes complementarias. Por un
lado, hay notas geolingüísticas en los diccionarios generales ya desde el Tesoro (Eberenz
1992) y el Diccionario de autoridades, y también en la lexicografía posterior —por ejemplo,
Salvador Rosa (1985), Aliaga (1997), Fernández Gordillo (2006) o Peña (2019) para la
tradición académica; para Terreros, véase Echevarría Isusquiza (2001)—. Por otro lado, se
cuenta con los datos atesorados por la lexicografía regional peninsular e hispanoamericana
cuyo objetivo prioritario es la recolección del vocabulario no general y que, a menudo,
toma como piedra de toque la propia lexicografía académica (Álvarez de la Granja y Gon-
zález Seoane 2018).
De igual forma, en el léxico propio de América, se pueden distinguir las dos vertientes
enunciadas: por un lado, este tipo de voces ya se registran en el Tesoro (Lope Blanch 1977),
en el Diccionario de autoridades (bibliografía citada en Clavería y Hernández 2021, 402) y, con
un salto cualitativo, es uno de los ejes fundamentales del diccionario de Salvá, publicado
en época posterior a las independencias americanas (Azorín 2000: 257–272; Azorín 2008;
Álvarez de Miranda 2007). Dentro de la tradición académica, se empieza a conceder mayor
atención al léxico americano a partir del DRAE 1884 (Ezcurra 2019; Clavería y Hernández
2021) coincidiendo con la fundación de las Academias correspondientes, una actitud que se
ha acentuado en los siglos xx y xxi, y que culmina con la aplicación de la política panhispá-
nica al diccionario (Greußlich 2020) y con la introducción en él del concepto de españolismo
(Moreno Fernández 2020). Por otro lado, las obras lexicográficas que acopian elementos
léxicos americanos, aparte de los glosarios hispano-amerindios citados anteriormente y algu-
nos otros precedentes como el Diccionario de voces americanas de M. J. de Ayala (Quesada 1995)
o el Vocabulario de las voces provinciales de la América de A. Alcedo (1786–1789), experimentan
gran desarrollo después de las independencias; una de sus primeras muestras es el Diccionario
provincial de voces cubanas de E. Pichardo en 1836 (Huisa 2018, 251–258). Son obras que des-
tacan por su carácter diferencial con respecto al diccionario de la Academia y que, a menudo,
manifiestan una notable inclinación prescriptiva. Resultan de gran interés histórico tanto por
su contenido léxico como por las circunstancias sociales e ideológicas de su alumbramiento
(Huisa 2021); estos condicionamientos trascienden a la macroestructura con la selección de
voces, a la microestructura con la información lexicográfica y a los paratextos (por ejemplo,
Chávez Fajardo 2022, 119–142).
La variación diatécnica muestra también las dos perspectivas mencionadas. En la lexi-
cografía general, aunque el prólogo del Diccionario de autoridades anunciaba la intención de
elaborar un diccionario dedicado a las “artes liberales y mechánicas”, dio cabida a un buen
número de voces del léxico facultativo (Azorín 2000: 174–176; Freixas 2010: 177 y ss.), tal
como se refleja, por ejemplo, en el área de la medicina (Gutiérrez Rodilla 1993). Es, sin
embargo, el diccionario de Terreros, como muy bien recoge su título, el que mayor atención
prodigó a este tipo de voces. Los diccionarios generales del siglo xix reflejan con mayor o
menor celeridad los avances de la ciencia y de la técnica con la inclusión de voces científicas
y técnicas en su nomenclatura (Azorín 2000); el DRAE, por su parte, se suma a esta línea
de desarrollo a partir de finales de siglo (Blanco y Clavería 2021). Para el español moderno,
además, se pueden aprovechar las fuentes de la lexicografía especializada y enciclopédica
(cf. las investigaciones del grupo Neolcyt con fuerte apoyo en fuentes lexicográficas y, entre
otros, Prieto García-Seco 2010).

44
Los diccionarios del español como fuentes de datos lingüísticos

4. Perspectivas futuras y conclusiones


Como instrumentos metalingüísticos, los diccionarios se configuran en una fuente de primer
orden para el conocimiento de la lengua y de su devenir, un hecho que se manifiesta claramente
en la documentación del DHLE, en el que una parte importante de las acepciones de cada
voz procede exclusivamente de los diccionarios.3 Además, en la lingüística histórica española,
la importancia de las obras lexicográficas se ve acrecentada tanto por la falta de un diccionario
etimológico actualizado como por la prolongada carencia de un diccionario histórico completo.
Las perspectivas futuras de investigación de las fuentes lexicográficas deberían, al menos,
seguir dos líneas: una, asociada a las nuevas tecnologías y otra, a su tratamiento filológico.
Los recursos digitales de los que se dispone actualmente deberían ser utilizados para paliar
la dispersión existente en los datos léxicos y conseguir una unificación eficiente de los mis-
mos a través de grandes plataformas con informaciones relacionadas con criterios lingüísticos
(Fajardo 2018, 273) de forma que se consiguiera el acceso sistemático al amplio caudal de
datos contenidos en estas fuentes con una recuperación de la información mediante métodos
científicos modernos (cf., por ejemplo, Corbella, Fajardo y Díaz, En prensa). El progreso en
la historia del léxico científico y técnico también requeriría la conformación de un tesoro de
diccionarios especializados (cf. el proyecto TeLeMe para el léxico de la medicina). La mejor
accesibilidad a los datos debería ser el punto de arranque para su explotación integral, es decir,
más allá del lema.
Como obras del pasado, las fuentes lexicográficas requieren un tratamiento eminentemente
filológico. Guardan entre ellas una elevada interdependencia porque el método de compilación
usual se fundamenta, en gran medida, en las obras precedentes: este particular es perfectamente
visible en la presencia del Tesoro de Covarrubias en el Diccionario de autoridades; los propios
diccionarios de la Academia sirven de base para la tradición extraacadémica, y estos, a su vez,
compilan fuentes de muy variado tipo, por lo que es imprescindible ahondar en estas filiaciones
interlexicográficas para conocer el origen y evolución de cada información. El análisis filológico,
por ejemplo, debería permitir la discriminación de los distintos materiales léxicos con la identifi-
cación de las palabras fantasma generadas por la propia historia textual de la labor diccionarística
(Pascual 1997, 17; Álvarez de Miranda 2000), un fenómeno que en la tradición lexicográfica
académica es muy evidente y cuyo origen se halla, a menudo, en los textos que nutrieron el
Diccionario de autoridades o en el simple hecho de que cada nueva edición se elaboraba sobre la
anterior, de ahí que, con la desaparición de las autoridades en el DRAE 1780, se desplazara el
foco de atención de la lengua del texto a “la metalengua del diccionario mismo” (Álvarez de Miranda
2007, 331). Así, por ejemplo, Rodríguez Molina (2005) demuestra que la acepción ‘amputación’
en la entrada decocción podría ser un error por decolación y que la acepción se añadió erróneamente
a la primera y no a la segunda; del mismo modo, en el DRAE (1803) se incorpora alfabética-
mente desordenada la palabra pucia para un tipo de vaso de uso farmacéutico; probablemente se
trate de una errata que, por la misma inercia y la dependencia interlexicográfica, se ha mantenido
en toda la lexicografía posterior (cfr. DLE): se comprende, por tanto, que para el DECH sea una
palabra de “origen desconocido”. Contiene, además, la tradición lexicográfica casos de (cuasi)
hápax de difícil explicación como, por ejemplo, los italianismos fazoleto en el Tesoro de Covarru-
bias (Eberenz 1990, 11) o aconchadillo, que Autoridades recoge a través del Estebanillo González
(Pascual 1997, 16).
Para progresar en el empleo eficaz de los datos lexicográficos, se precisa un conocimiento
depurado de cada una de las fuentes lexicográficas, que, en general, plantean aún muchos
interrogantes, como evidencian investigaciones recientes como las de Blanco y Clavería (2021),
Hamlin (2021), Prieto García-Seco (2021). El hallazgo de nuevos materiales proporcionará, sin

45
Gloria Clavería Nadal

ninguna duda, apreciables avances en su conocimiento; piénsese, por ejemplo, en los legajos de
la segunda edición del Diccionario de autoridades (Carriscondo y Carpi 2020a), identificados en
2016 y puestos a disposición pública en la página web de la RAE, u otros recursos académicos,
igualmente útiles, como el Fichero general y el Fichero de hilo. Las indagaciones sobre las fuen-
tes de las obras lexicográficas (Ruhstaller 2000; Blecua 2006; Freixas 2010; Jacinto 2012; Rojo
2014) ayudan a comprender su concepción y sus principios, y permiten tender pasarelas entre los
corpus textuales (cap. 2) y los lexicográficos. En este sentido, la existencia de ediciones críticas
de las principales obras lexicográficas espacio —cf. Arellano y Zafra (2006)— espacio reportaría
grandes ventajas, pues la reconstrucción filológica aplicada a los diccionarios trasciende incluso
los saberes históricos.
Teniendo en cuenta que el DLE entronca genéticamente con el primer diccionario acadé-
mico, la única ruta para su reestructuración definitiva como diccionario normativo y de uso
del español actual se encuentra en la indagación filológica espacio —cf. desde el punto de vista
geolectal Corbella (2021); Clavería y Julià (En prensa)—. La tradición lexicográfica española
hace evidente que la mirada al pasado y su comprensión resultan tareas ineludibles para la recta
comprensión del presente.

Notas
1 Agradezco a A. Fajardo, E. Hernández y N. Terrón la lectura de la versión inicial de este capítulo y sus
consejos y observaciones.
2 En general, las fuentes lexicográficas se citan a través de los estudios mencionados o a través del NTLLE.
3 Las acepciones lexicográficas se identifican con . Por ejemplo, en la entrada enagua parecen 11 acep-
ciones y estructuras complejas, 5 de las cuales tienen origen en fuentes lexicográficas.

Lecturas recomendadas
En Medina Guerra (2003) se encuentran varios capítulos en los que se puede ampliar el conoci-
miento de la historia de la lexicografía española (Acero 2003; Carriazo y Mancho 2003; García
Platero 2003; Gemmingen 2003; Ruhstaller 2003).
En Corbella, Fajardo y Langenbacher-Liebgott (2018) pueden consultarse varios estudios en los que
puede observarse desde perspectivas muy diferentes la investigación con fuentes lexicográficas y la
ref lexión acerca de su valor y los problemas que plantean (Blanco, Clavería y Jiménez Ríos 2018;
Corbella 2018; Hernández 2018b; Fajardo 2018).
En Huisa (2021) se hallan distintas contribuciones que abren nuevas perspectivas en el estudio
de la lexicografía americana y su aportación al estudio de la conformación del léxico
americano.

Referencias citadas
Acero, I. 2003. “La lexicografía plurilingüe del español”. En Lexicografía española, ed. A. M. Medina,
175–204. Barcelona: Ariel.
Aliaga, J. L. 1997. Contribucion al estudio de las voces aragonesas en las ediciones del Diccionario de la Real Academia
Espanola (Lexicografia y diversidad geolingüística). Zaragoza: Prensas Universitarias.
Alvar Ezquerra, M. 2013. Las nomenclaturas del español. Siglos XV–XIX. Madrid: Liceus.
Alvar Ezquerra, M., dir. 2022. Biblioteca Virtual de la Filología Española (BVFE): directorio bibliográfico
de gramáticas, diccionarios, obras de ortografía, ortología, prosodia, métrica, diálogos e historia de la lengua.
[Link].
Álvarez de la Granja, M. y E. González Seoane, eds. 2018. Léxico dialectal y lexicografía en la Iberorromania.
Madrid y Fráncfort: Iberoamericana y Vervuert.
Álvarez de Miranda, P. 1992. Palabras e ideas: el léxico de la ilustración temprana en España (1680–1760).
Madrid: Real Academia Española.

46
Los diccionarios del español como fuentes de datos lingüísticos

Álvarez de Miranda, P. 2000. “Palabras y acepciones fantasma en los diccionarios de la Academia”. En


La fabrique des mots. La néologie ibérique, eds. J.-C. Chevalier y M.-F. Delport, 55–73. París: Presses de
l’Université de Paris-Sorbonne.
Álvarez de Miranda, P. 2006. “Problemas y estado actual de los estudios sobre historia del léxico español”.
En Actas del VI Congreso Internacional de Historia de la Lengua Española, eds. J. L. Girón y J. J. de Bustos,
vol. 2, 1229–1240. Madrid: Arco/Libros.
Álvarez de Miranda, P. 2007. “Panorama de la lexicografía española en el siglo xix”. En Historiografía de la
lingüística en el ámbito hispánico. Fundamentos epistemológicos y metodológicos, eds. J. Dorta, C. Corrales y D.
Corbella, 329–356. Madrid: Arco/Libros.
Arellano, I. y R. Zafra. 2006. Edición integral e ilustrada del Tesoro de la lengua española castellana de Sebastián
de Covarrubias Horozco. Madrid: Universidad de Navarra, Iberoamericana, Vervuert, Real Academia
Española y Centro para la Edición de Clásicos Españoles.
Ariza, M. 2011. “Grafías y fonética en Covarrubias”. Académica 6: 97–110.
Azorín, D. 2000. Los diccionarios del español en su perspectiva histórica. Alicante: Publicaciones de la Univer-
sidad de Alicante.
Azorín, D. 2008. “Para la historia de los americanismos en los diccionarios del español”. Revista de Investi-
gación Lingüística 11: 13–43.
Azorín, D. 2018: “Salvá y la Academia Española frente al tratamiento lexicográfico de los arcaísmos léxi-
cos”. Revista de Filología de la Universidad de La Laguna 36: 49–84.
Battaner, M.a P. 1977. Vocabulario político-social en España (1868–1873). Madrid: Real Academia Española.
BICRES I–V: VVAA. Bibliografía cronológica de la lingüística, la gramática y la lexicografía del español (BICRES).
Amsterdam y Filadelfia: John Benjamins, 1995, 1999, 2005, 2012, 2015.
Blanco, M. Á. 2018. “Un proceso significativo de revisión: la definición de las letras”. En El diccionario de la
Academia en el siglo XIX: la quinta edición (1817) al microscopio, coords. G. Clavería y M. Freixas, 175–202.
Madrid: Arco/Libros.
Blanco, M. Á. y G. Clavería, eds. 2021. El diccionario académico en la segunda mitad del siglo XIX: evolución y
revolución. DRAE 1869, 1884 y 1899. Berlín: Peter Lang.
Blecua, J. M. 2006. Principios del Diccionario de autoridades, Discurso leído el día 25 de junio de 2006 en su
recepción pública por el Excmo. D. J. M. Blecua y su contestación por el Excmo. D. J. A. Pascual. Madrid.
Carriazo, J. R. y M. J. Mancho. 2003. “Los comienzos de la lexicografía monolingüe”. En Lexicografía
española, ed. A. M. Medina, 205–234. Barcelona: Ariel.
Carriscondo, F. M. y E. Carpi 2020a. “El diccionario más importante de la RAE no está impreso”. Nueva
Revista de Filología Española 68: 247–254.
Castro, A. 1991. Glosarios latino-españoles de la Edad Media. 2.ª ed. Madrid: CSIC.
Chávez Fajardo, S. 2022. Diccionarios del fin del mundo. Santiago de Chile: Fondo de Cultura Económica.
Clavería, G. 2016. De vacunar a dictaminar. La lexicografía académica decimonónica y el neologismo. Madrid y
Fráncfort: Iberoamericana y Vervuert.
Clavería, G. 2020. “El Diccionario de la lengua castellana (1817–1832) y la propuesta decimonónica de diccio-
nario manual”. Boletín de la Real Academia Española 100: 15–52.
Clavería, G. y E. Hernández. 2021. “América en el diccionario académico (DRAE 1869, DRAE 1884,
DRAE 1899): primera aproximación”. En El diccionario académico en la segunda mitad del siglo XIX: evolución
y revolución. DRAE 1869, 1884 y 1899, eds. M. Á. Blanco y G. Clavería, 401–438. Berlín: Peter Lang.
Clavería, G. y C. Julià. En prensa. “Los diatopismos en el diccionario de la Academia: orígenes y evolución”.
Colón, G. 2002: Para la historia del léxico español, 2 vols. Madrid: Arco/Libros.
Corbella, D. 2018. “Del tesoro lexicográfico analógico al digital”. En Historia del léxico español y humanidades
digitales, eds. D. Corbella, A. Fajardo y J. Langenbacher-Liebgott, 133–163. Berlín: Peter Lang.
Corbella, D. 2021. “Marcación geográfica y estandarización: diatopismos en los diccionarios de la RAE”.
Revista Internacional de Lingüística Iberoamericana (RILI) 37: 31–46.
Corbella, D., y C. Díaz. 2023. “El Tesoro Lexicográfico de Español en América: entre repositorio lexicográfico
y memoria patrimonial”. En Perspectives de recherche en linguistique et philologie romanes, eds. D. Corbella, J.
Dorta y R. Padrón, vol. I, 689–701. Estrasburgo: Editions de Linguistique et de Philologie.
DECH: Corominas, J. y J. A. Pascual. 1980–1991. Diccionario crítico etimológico castellano e hispánico. Madrid:
Gredos (versión en CD-ROM, 2012).
DHLE: Real Academia Española. 2013–. Diccionario histórico de la lengua española (DHLE) [en línea: rae.
es/dhle].
Dicciocho: Carriscondo, F. M. y E. Carpi. 2020b. Dicciocho. Portal lexicográfico del [Link].
Eberenz, R. 1990. “Sprachliche Norm und Varietäten in Sebastián de Covarrubias’ Tesoro de la lengua cas-
tellana o española (1611)”. En Sprachtheorie und Theorie der Sprachwissenschaft. Geschichte und Perspektiven.

47
Gloria Clavería Nadal

Festschrift für Rudolf Engler zum 60. Geburtstag, eds. R. Liver, I. Werlen y P. Wunderli, 108–117. Narr:
Tübingen.
Eberenz, R. 1992. “Sebastián de Covarrubias y las variedades regionales del español. Sobre las precisiones
geolingüísticas del Tesoro de la lengua castellana o española”. En Actas del II Congreso Internacional de Historia
de la Lengua Española, eds. M. Ariza et al., 987–996. Madrid: Arco/Libros.
Echenique, M. T. 2013. “La obra de Nebrija como fuente para el estudio de la pronunciación castellana”.
En Historia de la pronunciación castellana, eds. M. T. Echenique y F. Satorre, 165–215. Valencia: Tirant
Humanidades.
Echevarría Isusquiza, I. 2001. “El primer vocabulario montañés y otros vocabularios castellanos. Terreros
y la dialectología en España en el siglo xviii: la experiencia del léxico”. Boletín de la Real Academia
Española 81: 53–150.
Egido, A. 2021. El árbitro de las lenguas. Anotaciones sobre la norma y el uso en la Real Academia Española.
Madrid: Cátedra.
Ezcurra, Á. 2019. “Léxico general y pluricentrismo. Aproximación a los americanismos en el diccionario
académico”. En El español, lengua pluricéntrica: discurso, gramática y medios de comunicación masiva, coord. S.
Greußlich y F. Lebsanft, 61–80. Göttingen: Vandenhoeck y Ruprecht.
Fajardo, A. 2018. “Lexicografía histórica con corpus y recursos digitales: aspectos metodológicos”. En
Historia del léxico español y humanidades digitales, eds. D. Corbella, A. Fajardo y J. Langenbacher-Liebgott,
255–278. Berlín: Peter Lang.
Fajardo, A. 2021. “La norma en la lexicografía del español: conflicto, contraste y consenso”. Revista Inter-
nacional de Lingüística Iberoamericana (RILI) 37: 17–29.
Fernández Alcaide, M. 2017. “Nuevo acercamiento a la variación lingüística en el Tesoro de Covarrubias”.
Revista de Filología Española 97: 69–90.
Fernández Gordillo, Luz. 2006. Tratamiento lexicográfico de los mexicanismos yseudomexicanismosen los dicciona-
rios académicos. Tesis doctoral. México: El Colegio de México.
Fichero de hilo: Real Academia Española. s. f. Fichero de hilo. [Link]
Fichero general: Real Academia Española. s.f. Fichero general de la lengua española. [Link]
[Link].
Freixas, M. 2010. Planta y método del Diccionario de autoridades. Orígenes de la técnica lexicográfica de la Academia
(1713–1739). Coruña: Universidade da Coruña.
García Platero, J. M. 2003. “La lexicografía no académica en los siglos xviii y xix”. En Lexicografía española,
ed. A. M. Medina, 263–280. Barcelona: Ariel.
Gemmingen, B. F. von. 1990. “Recherches sur les marques d’usage dans le Tesoro de las dos lenguas de Cesar
Oudin (1607)”. En Les marques d’usage dans les dicionnaires (xviie-xviiie siècles). Lexique 9: 31–41.
Gemmingen, B. F. von. 2003. “Los inicios de la lexicografía española”. En Lexicografía española, ed. A. M.
Medina. Barcelona: Ariel.
Gili Gaya, S. 1960. Tesoro lexicográfico (1492–1726), Tomo I (A–E). Madrid: CSIC.
Gómez de Enterría, J. 2020. El vocabulario de la medicina en el español del siglo xviii. Berna: Peter Lang.
Greußlich, S. 2020. “Normative Dictionaries (Spanish)”. En Manual of Standardization in the Romance Lan-
guages, eds. F. Lebsanft y F. Tacke, 605–627. Berlín y Boston: De Gruyter.
Gutiérrez Cuadrado, J. 2005. “Arcaísmos y otros – ismos. La selección léxico en el Quijote”. Boletín de la
Real Academia Española 85: 335–374.
Gutiérrez Cuadrado, J. 2018. “Cuestiones pertinentes e impertinentes a propósito del léxico dialectal en la
nomenclatura de los diccionarios generales”. En Léxico dialectal y lexicografía en la Iberorromania, eds. M.
Álvarez de la Granja y E. González Seoane, 101–119. Madrid y Fráncfort: Iberoamericana y Vervuert.
Gutiérrez Rodilla, B. M. 1993. “Los términos relacionados con la medicina en el Diccionario de autoridades”.
Boletín de la Real Academia Española 78: 463–512.
Hamlin, C. M. 2021. “Alfonso de Palencia: ¿autor del primer vocabulario romance latín que llegó a la
imprenta?”. Boletín de la Real Academia Española 101: 173–218.
Hernández, E. 2018a. Lexicografía hispano-amerindia 1550–1800. Catálogo descriptivo de los vocabularios del
español y las lenguas indígenas americanas. Madrid y Fráncfort: Iberoamericana y Vervuert.
Hernández, E. 2018b. “Tesoro lexicográfico de los americanismos contenidos en los vocabularios hispano-
amerindios coloniales (1550–1800) [TELEAM]”. En Historia del léxico español y humanidades digitales,
eds. D. Corbella, A. Fajardo y J. Langenbacher-Liebgott, 107–131. Berlín: Peter Lang.
Huisa, J. C. 2018. “Lexicografía del español de América”. En Léxico dialectal y lexicografía en la Iberorromania,
eds. M. Álvarez de la Granja y Ernesto González Seoane, 247–266. Madrid y Fráncfort: Iberoamericana
y Vervuert.

48
Los diccionarios del español como fuentes de datos lingüísticos

Huisa, J. C., ed. 2021. Fuentes lexicográficas del estudio histórico del léxico hispanoamericano. Berlín: Peter Lang.
Ilson, R. F. 2003. “Lexicographic Archaeology: Comparing Dictionaries of the Same Family”. En Lexico-
graphy: Critical Concepts, ed. R. R. K. Hartmann, 76–84. Nueva York: Routledge.
Jacinto, E. J. 2012. El principio de autoridad en los diccionarios generales del español (siglos xviii–xx). Tesis doctoral.
Madrid: Universidad Complutense.
Jiménez Ríos, E. 2001. Variación léxica y diccionario: los arcaísmos en el diccionario de la Academia. Madrid y
Fráncfort: Iberoamericana y Vervuert.
Jiménez Ríos, E. 2018. “La revisión de arcaísmos en el DRAE en la primera mitad del siglo xix”. Estudios
humanísticos. Filología 40: 405–429.
Jiménez Ríos, E. En prensa. “Los diccionarios de la Real Academia Española”. En Manual de lexicografía,
eds. M. P. Battaner et al. Londres: Routledge.
Lapesa, R. 1996. “Nuestra lengua en la España de 1898 a 1936”. En El español moderno y contemporáneo.
Estudios lingüísticos, 343–396. Barcelona: Crítica.
Lemateca del DRAE. [Link].
Lépinette, B. 1989. “Contribution a l’ètude du Tesoro de la lengua castellana o española de Sebastián de Cova-
rrubias”. Historiographia Linguistica 16: 357–310.
Lope Blanch, J. M. 1977. “Los indoamericanismos del Tesoro de Covarrubias”. Nueva Revista de Filología
Hispánica 26: 293–315.
Mac Donald, G. J. 2007. Diccionario español-latino del siglo XV: An Edition of [Link].10 Anonymous Manuscript of
the Real Biblioteca de San Lorenzo de El Escorial. Nueva York: HSMS.
Mapa de diccionarios: Instituto de Investigación Rafael Lapesa de La Real Academia Española. 2013. Mapa de
diccionarios [en línea: [Link]/ntllet].
Martínez Alcalde, M. J. 2007a. “Lexicografía y codificación ortográfica en el siglo xviii”. En Historia de la
lexicografía española, eds. J. I. Pérez Pascual, M. Campos y R. Cotelo, 111–118. Coruña: Universidade.
Martínez Alcalde, M. J. 2007b. “Pragmática y lexicografía histórica del español en el siglo xviii: Esteban de
Terreros”. Quaderns de Filologia. Estudis Lingüístics 12: 289–300.
Moreno Fernández, F. 2020. “Los ismos nacionales de la lengua española”. Boletín de la Real Academia Espa-
ñola 100: 115–145 y 543–614.
Morreale, M. 1988. “Virgilio en el Tesoro de Sebastián de Covarrubias”. Boletín de la Real Academia Española
68: 203–273.
Muñoz y Manzano, C., conde de la Viñaza. 1893. Biblioteca histórica de la filología castellana. Madrid: Imprenta
y fundición de Manuel Tello.
Neolcyt: [Link].
NTLE: Nieto Jiménez, Lidio y Manuel Alvar Ezquerra. 2007. Nuevo tesoro lexicográfico del español
(s. XIV-1726). Madrid: Arco/Libros.
NTLLE: Real Academia Española 2001. Nuevo tesoro lexicográfico de la lengua española, edición en DVD.
Madrid: Espasa. [Link].
Pascual, J. A. 1997. “La caracterización de los arcaísmos en un diccionario de uso”. En Lèxic, corpus i diccio-
naris. Cicle de conferències, 94–95, 9–30. Barcelona: Universitat Pompeu Fabra.
Peña, J. 2019. El léxico de Cantabria en los diccionarios de la Academia: de Autoridades al DLE-2014. Santander:
Ediciones Tantín.
Prieto García-Seco, D. 2010. “El Diccionario enciclopédico hispano-americano de literatura ciencias y artes (1887–
1910) de la editorial Montaner y Simón”. Boletín de la Real Academia Española 87: 97–121.
Prieto García-Seco, D. 2021. Un eslabón recuperado de la lexicografía española. La reimpresión retocada del Diccio-
nario académico de 1780. Madrid: Visor Lingüística.
Provencio, H. 2020. “En punto a: un caso de variación onomasiológica desde los inicios del español
moderno”. En Tradiciones discursivas y tradiciones idiomáticas en la historia del español moderno, eds. A. López
Serena, S. del Rey y E. Carmona, 269–301. Berlín: Peter Lang.
Quesada, M. A. 1995. “Prólogo”. Al Diccionario de M. J. de Ayala, ix–xliv. Madrid: Arco/Libros.
Quilis Merín, M. 2013a. “Observaciones sobre pronunciación en el Tesoro de la lengua castellana o española
(1611) de Sebastián de Covarrubias”. Beiträge zur Geschichte der Sprachwissenschaft 23: 71–86.
Quilis Merín, M. 2013b. “La pronunciación del español a través de la lexicografía”. En Historia de la pronun-
ciación castellana, eds. M. T. Echenique y F. Satorre, 491–523. Valencia: Tirant Humanidades.
Reyre, D. 2006. “Prólogo segundo. Las llaves de Tesoro de Covarrubias”. En Tesoro de la lengua castellana
o española de S. de Covarrubias Horozco, edición integral e ilustrada, eds. I. Arellano y R. Zafra, xlv–xlvi.
Madrid: Universidad de Navarra, Iberoamericana, Vervuert, Real Academia Española, Centro para la
Edición de Clásicos Españoles.

49
Gloria Clavería Nadal

Ridruejo, E. 2000. “La formulación de componentes pragmáticos en el Tesoro de Covarrubias (1611)”. En


La lingüística española en la época de los descubrimientos, coord. B. Bagola, 135–148. Hamburgo: Helmut
Buske.
Rodríguez Molina, J. (2005): “Decocción ‘amputación’: una acepción fantasma en el diccionario de la Real
Academia Española”. Revista de Filología Española 85: 159–164.
Rojo, G. 2014. “Análisis cuantitativo de las citas del Diccionario de autoridades”. Boletín de la Real Academia
Española 94: 137–196.
Romero, L. 2015. El tratamiento de las colocaciones en la lexicografía monolingüe general del español (siglos
xvii–xxi). Tesis doctoral. Alicante: Universidad de Alicante.
Ruhstaller, S. 1995–1996. “Las palabras antiguas castellanas en el Tesoro de Covarrubias”. Travaux de Lin-
guistique et de Philologie 33–34: 439–453.
Ruhstaller, S. 2000. “Las autoridades del Diccionario de autoridades”. En Tendencias en la investigación lexico-
gráfica del español. El diccionario como objeto de estudio lingüístico y didáctico, eds. S. Ruhstaller y J. Prado,
193–224. Huelva: Servicio de Publicaciones.
Ruhstaller, S. 2003. “Las obras lexicográficas de la Academia”. En Lexicografía española, ed. A. M. Medina,
235–261. Barcelona: Ariel.
Salvador Rosa, A. 1985. “Las localizaciones geográficas en el Diccionario de autoridades”. Lingüística Española
Actual 7: 103–139.
Santos, L. 2003. Diccionario de partículas. Salamanca: Luso-Española de Ediciones.
San Vicente, F., C. Garriga y H. E. Lombardini, coords. 2011. Ideolex. Estudios de lexicografía e ideología.
Monza: Polimetrica.
Scandola, V. 2006. El tratamiento de la fraseología en los diccionarios de la Real Academia Española (1726–2001):
análisis fraseológico y fraseográfico. Contribución a la historia de la fraseología española. Tesis doctoral. València:
Universitat de València.
Seco, M., dir. 2018. Diccionario fraseológico documentado del español actual. Locuciones y modismos españoles. 2.ª
ed. Madrid: JdeJ.
Smith-Stark, T. C. 2009. “Lexicography in New Spain (1492–1611)”. En Missionary Linguistics IV/Lingüís-
tica misionera IV. Lexicography. Selected Papers from the Fifth International Conference on Missionary Linguistics,
eds. O. Zwartjes, R. Arzápalo y T. C. Smith-Stark, 3–82. Ámsterdam y Filadelfia: John Benjamins.
TDHLE: Real Academia Española. 2021. Tesoro de los diccionarios históricos de la lengua española. [Link]/tdhle.
TeLeMe: Gutiérrez Rodilla, B. M., dir. Tesoro lexicográfico médico (TeLeMe). [Link].
Terrón, N. 2022. Lexicografía y ortografía en el siglo XIX. La fijación de la ortografía académica a través del DRAE
(1803–1899). Berlín: Peter Lang.
TLCA: Corrales, C. J. y D. Corbella. 2010: Tesoro léxico canario-americano. Las Palmas de Gran Canaria: Casa
de Colón y Cabildo Insular de Gran Canaria.

50
5
Dialectología histórica de la
Península Ibérica
(Historical dialectology of
the Iberian Peninsula)
Inés Fernández-Ordóñez

1. Introducción
La comprensión cabal del cambio lingüístico necesita acotar no solo sus coordenadas históricas y
estructurales, sino también las geográficas, sociales y de registro, en comparación sistemática de
las varias áreas románicas del espacio peninsular. La compilación de nuevos corpus que reúnen
documentación cercana a la oralidad, geolocalizada y fechada, facilita este ambicioso abordaje.
Los estudios históricos que han adoptado una perspectiva dialectal arrojan un panorama nuevo y
complejo sobre la formación histórica del español, en el que las soluciones que fueron imponién-
dose con el tiempo proceden de focos geográficos y de grupos sociales diferentes, y no siempre,
como se asumía tradicionalmente, del castellano septentrional ni de los sociolectos de prestigio.
Es tarea pendiente de la dialectología histórica definir las áreas dialectales con capacidad expansiva
(y las que carecieron de ella) en la historia del español en cada época y tratar de buscar los motivos
históricos que subyacen a su formación, persistencia temporal o, en su caso, desaparición.
Palabras clave: dialectos; historia del español; corpus; morfosintaxis

The complete understanding of linguistic change needs to determine not only its historical and
structural limits, but also its geographical, social and register settings, through a systematic compa-
rison of the various Romance areas of the Iberian Peninsula. The difficulty of finding sources that
allow such an ambitious approach has been solved thanks to the compilation of new corpora that
gather geolocalized and dated documentation that comes close to reflecting the spoken language,
and that complement traditional corpora based on literary texts. Historical studies that hitherto
have adopted a dialect perspective shed a new and complex overview on the historical formation
of Spanish, in which the options that prevail over time come from different geographical foci
and social groups, and not always, as was assumed traditionally, from northern Castilian or from
prestigious sociolects. It is the future task of historical dialectology to define the dialect areas with
expansive capacity in the history of Spanish in each period, as well as the areas that lacked it, and to
try to find the historical reasons that underlie their formation, survival, or disappearance.
Keywords: dialects; history of Spanish; corpora; morphosyntax

DOI: 10.4324/9781003035565-7 51
Inés Fernández-Ordóñez

2. Cuestiones teóricas y metodológicas


La dialectología histórica del español ha estado fuertemente moldeada por el planteamiento de
Menéndez Pidal (1926), quien, al tiempo que alumbraba su estudio, la abocaba a su extinción
más allá del siglo XIII. De un lado, impuso la idea de que la delimitación (y la suerte evolutiva)
de las variedades románicas peninsulares correspondía grosso modo a las fronteras de los reinos
medievales, con un dialecto leonés y un dialecto castellano que no se ha probado que se sintieran
como entidades autónomas en la Edad Media. En cambio, agrupó las variedades habladas en
Navarra y Aragón bajo el paraguas lingüístico del navarroaragonés, aunque esas variedades sí
ganaron conciencia de identidad diferencial desde el siglo XIII y, en atención a los mismos
criterios políticos, hubiera sido legítimo diferenciarlas al menos desde el siglo XI. El empeño de
encajar los datos lingüísticos en el molde estructural de los reinos políticos condujo a que desde
entonces se iniciaran líneas de investigación que restringían su objeto de interés al “dialecto”
leonés, al castellano o al aragonés (que solía incluir el navarro), y no se plantearan, por lo gene-
ral, estudios históricos en un marco comparado que reuniera datos procedentes de distintas áreas
peninsulares. Debido al planteamiento de partida, cualquier cambio lingüístico consumado en
esas variedades parecía endógeno a ellas y nunca procedente del exterior.
De esa forma, los focos de difusión de las innovaciones lingüísticas iberorromances quedaban
ocultos en la imagen de su historia evolutiva. Desde el siglo XII solo una difusión parecía posi-
ble en la perspectiva pidalina: la de los rasgos supuestamente castellanos más allá de las fronteras
del reino de Castilla. La castellanización de los territorios del centro y sur peninsular, simbóli-
camente representada por la imagen de una cuña invertida, la llamada “cuña castellana”, es la
segunda idea que fue ampliamente aceptada y determinó que se concibiera el área castellana
como poco penetrable a la influencia externa. El tercer marco conceptual universalmente aca-
tado fue la selección de rasgos que definían la “castellanidad”. Menéndez Pidal seleccionó cinco
rasgos fonéticos cuya conjunción identificaba a una variedad como castellana: la glotalización f-
> [h-], la evolución de los grupos lj, k’l, t’l, g’l a una fricativa postalveolar [ʒ], la palatalización
de -kt-, -ŭlt- > [t͡ ʃ], la pérdida de la consonante resultante de la palatalización de g- / i- y el
͡
desarrollo -skj- > [ts]. La documentación de estos rasgos fuera de Castilla se interpretó como
castellanización del territorio afectado, sin valorar otros aspectos gramaticales o léxicos, y avaló
el estudio unitario, sin distinciones geográficas, de todas las obras y las áreas en que estos rasgos
se presentaran, sin sopesar que su difusión pudo no obedecer a proceso de “castellanización”
alguno. En la visión pidalina, la fragmentación dialectal del castellano aún tenía importancia en
el periodo previo a Alfonso el Sabio, pero desde la segunda mitad del siglo XIII la lengua lite-
raria se caracterizaba por la uniformidad, por lo que no cabía plantear distingos geográficos en su
estudio (Fernández-Ordóñez 2009, 2011). Solo se admitían la disidencia meridional, consumada
a finales de la Edad Media, y los remanentes del antiguo leonés y aragonés, tildados de “dialectos
históricos” pese a que el último siguió la misma senda estandarizadora que el castellano hasta
finales del siglo XIV (Tomás Faci 2020).
Este planteamiento conceptual ha prevalecido en el estudio histórico del español en gran
parte del siglo XX e, incluso, del siglo XXI, de forma que la dialectología comparada de las
variedades románicas peninsulares no parecía necesaria ni pertinente. Sin embargo, sabemos,
desde el desarrollo de la sociolingüística variacionista, que la investigación del cambio lin-
güístico no solo exige reconocer su inicio (la aparición de la innovación) y acotar su final (la
adopción generalizada de la nueva variante), sino también explicar su difusión (cf. cap. 6). Por
lo general, el estudio de la difusión se ha limitado a la dimensión cronológica (la extensión en
el tiempo) y a la estructural (a través de los distintos contextos lingüísticos), pero también debe-
ríamos aspirar a entender la dimensión geográfica (la identificación del epicentro del cambio, si

52
Dialectología histórica de la Península Ibérica

existe, y su consiguiente difusión áreal), la social (el grupo que promueve la innovación) y la fun-
cional (el grado de formalidad o elaboración consciente de la variante innovadora que determina
su uso o ausencia en las varias situaciones comunicativas). Y ello en una perspectiva que compare
simultáneamente todas las variedades románicas peninsulares, entre cuyos hablantes nunca se ha
interrumpido el contacto.
Un abordaje multidimensional del proceso de difusión de las innovaciones está mucho más
limitado en lingüística histórica que para la lengua actual, pues únicamente disponemos de los
textos que el azar o la historia han querido salvar. Con todo, en los últimos años se han desarro-
llado metodologías y corpus que permiten, con ciertas salvedades, sortear los obstáculos.

2.1 Dimensión geográfica o diatópica


La variable geográfica en la investigación en lingüística histórica podría deducirse del lugar de
nacimiento y crianza del autor de cada texto, pero no es frecuente disponer de esos datos antes
de 1500. En la Edad Media muchos textos son anónimos, e incluso cuando conocemos el autor
y su adscripción geográfica (p. ej., Gonzalo de Berceo o don Juan Manuel), no es seguro que el
testimonio que nos trasmite el texto corresponda a la lengua del autor. Rara vez conservamos
el original autógrafo o apógrafo y debemos conformarnos con copias posteriores que, debido al
proceso de transmisión manuscrita, han modificado la lengua del original adaptándola a la de los
sucesivos amanuenses, los cuales, además, pueden hablar dialectos diferentes (Fernández-Ordóñez
2001). A no ser que contemos con originales —o testimonios no separados más de 50–60 años
de la fecha de composición—, es arriesgado basar nuestra investigación en copias, tanto en la
dimensión cronológica como en la geográfica (Fernández-Ordóñez 2006; Rodríguez Molina y
Octavio de Toledo 2017). El problema no se extingue en la Edad Moderna, dado que los cajistas
de la imprenta tampoco se abstuvieron de intervenir sobre la lengua en las ediciones sucesivas.
Así, los textos literarios incluidos en los corpus históricos habituales deben manejarse con pre-
caución y emplearse como un corpus de control o complementario de otro tipo de fuentes,
compiladas en los últimos años, que permiten afianzar más la geolocalización y la originalidad
de los textos.
Se trata, de un lado, de colecciones de documentos jurídicos (CODEA, CHARTA, Cor-
LexIn: cf. cap. 2) fechados y localizados en el espacio, por lo que tienden a reflejar la lengua
del lugar en que fueron emitidos (Almeida et al. 2018). Las declaraciones judiciales resultan
especialmente interesantes por su cercanía a la oralidad (Calderón Campos y Vaamonde 2020;
Tabernero Sala 2020), no así los documentos de la cancillería regia, que suelen representar
más bien los sociolectos de prestigio. Por otro lado, las cartas privadas (p. ej., las del corpus
Post Scriptum para los ss. XVI–XIX) dan testimonio de la lengua de su autor y, por tanto, de
sus coordenadas geográficas, sociales y personales, por lo que actualmente está aumentando el
número de los estudios basados en este tipo de fuentes (p. ej., Gómez Seibane 2014; Camus
Bergareche 2015; Octavio de Toledo y Pons Rodríguez 2016; Almeida et al. 2017; Blas Arroyo
2019; Molina Martos 2020 y varios de los trabajos reunidos en Sánchez Méndez et al. 2015 y
Castillo Lluch y Diez del Corral 2019).
Proporcionan igualmente información preciosa los corpus dialectales y atlas lingüísticos ela-
borados a lo largo del siglo XX, especialmente el ALPI, único que ofrece un panorama general.
Estas fuentes permiten conectar las soluciones de los cuestionarios con los datos procedentes de
los textos antiguos (Fernández-Ordóñez 2011; Del Barrio de la Rosa 2018; De Benito Moreno
2020). También el análisis de la toponimia (sobre todo, menor) provee rica información, según
apuntó ya Menéndez Pidal, sobre la distribución espacial de algunas variantes morfológicas y
léxicas (Catalán 1989a y 1989b; Octavio de Toledo 2018a).

53
Inés Fernández-Ordóñez

2.2 Dimensión social o diastrática


Bastante más difícil es la reconstrucción histórica de los grupos sociales que promueven un
cambio, necesariamente restringida a quienes accedían a la escritura. Solo a partir de la Edad
Moderna tenemos textos escritos por mujeres y podríamos contrastar la variación asociada al
género (Almeida et al. 2017). La que se da entre distintas generaciones podría hipotéticamente
afrontarse mediante la comparación de textos escritos por individuos nacidos en una misma
área en intervalos de 20 años, aunque lo más usual es la comparación cronológica basada en la
fecha de composición o publicación de las obras. La variación basada en la adscripción social
de los escribientes solo parece posible en el Antiguo Régimen o en época posterior y mediante
corpus (como Post Scriptum) que proporcionen datos extralingüísticos suficientes, o mediante
la minuciosa tarea de componer un corpus de autores adecuado a esos fines (p. ej., Blas Arroyo
et al. 2019; Molina Martos 2020).

2.3 Dimensión estilística o diafásica


La sociolingüística ha podido demostrar que, cuando la variable en estudio es un marcador, la
variación asociada a la situación comunicativa —el estilo— es un reflejo indirecto de la varia-
ción social. Las variantes asociadas a la mayor formalidad, distancia comunicativa o elabora-
ción lingüística reciben prestigio porque son las preferidas de los sociolectos altos, mientras
que las asociadas a la menor formalidad e inmediatez en la comunicación suelen situarse en
los sociolectos bajos. Por ello, resulta crucial el contraste de textos que podemos adscribir a
diversas situaciones comunicativas de mayor o menor formalidad. Por ejemplo, la comparación
entre documentos jurídicos procedentes de la cancillería regia y los ámbitos judicial, municipal,
monástico y privado en CODEA, ordenados en esa escala de mayor a menor distancia comuni-
cativa, brinda información sobre la valoración social de las variantes y, al tiempo, sobre la direc-
ción del cambio (de arriba abajo, o viceversa) que pueda estar teniendo lugar (Del Barrio de la
Rosa 2016b). El mismo método se ha ensayado cotejando cartas de distinta naturaleza, privadas
frente a otras de carácter no íntimo (Blas Arroyo et al. 2019). Otra posibilidad es confrontar
el comportamiento de textos de discurso diferente (directo, narrativo o expositivo), como los
varios libros bíblicos, bajo la presunción de que el discurso directo reproduce un estilo espontá-
neo y cercano a la oralidad, mientras que la mayor elaboración y distancia comunicativa es típica
del discurso expositivo, con el narrativo en una posición intermedia (Enrique-Arias 2015). A la
inversa, puede ser prueba del carácter estilístico de una variante el que en una tipología textual
uniforme, como los fueros, se encuentren diferencias no atribuibles a la cronología ni la geo-
grafía (Castillo Lluch 2015). También el cotejo de las variantes introducidas al dar una obra a la
imprenta (entre los manuscritos apógrafos, los pensados para la imprenta y los propios impresos)
permite discernir soluciones que contaban entonces con prestigio social y otras que se descarta-
ban por arcaicas, regionales o vulgares (Octavio de Toledo 2011, 2017a).

3. Áreas dialectales y patrones de difusión


Hoy sabemos que la formación histórica del español y de su norma peninsular es más compleja
de lo tradicionalmente supuesto.1 Aparte del modelo de “cuña” castellana, que supone la tras-
lación al centro y al sur peninsular de los rasgos del norte central, p. ej., f- > [h-], voces como
comadreja (Menéndez Pidal 1980) y las llares del hogar (Morala 2018) o el diminutivo -illo (Fer-
nández-Ordóñez 2011), son cada vez más los estudios que apuntan a una realidad antes oculta
que configura otros patrones areales y otros focos de innovaciones triunfantes en la norma del

54
Dialectología histórica de la Península Ibérica

español a lo largo de su historia. De entrada, Castilla aparece dividida en dos áreas, occidental y
oriental. A la variedad occidental del castellano pertenecen habitualmente Palencia, Valladolid
y Ávila, y sus rasgos se prolongan con frecuencia por Extremadura y Andalucía occidental. En
la variedad oriental suelen integrarse las tierras alavesas, riojanas, Soria, Guadalajara, Cuenca y
Albacete, a las que se suman, a veces, Murcia y Andalucía oriental. Las provincias situadas en el
eje central, Cantabria, Burgos, Segovia, Toledo y Ciudad Real, basculan entre las dos variedades,
al igual que Córdoba y Málaga oscilan entre la Andalucía occidental y la oriental según el aspecto
considerado. El castellano occidental puede agruparse con los territorios leoneses y el oriental
con los navarros y aragoneses (incluida su prolongación por tierras valencianas). En ocasiones,
la evolución histórica del español medieval al moderno ha privilegiado las soluciones centro-
occidentales, en otras, las centroorientales y, por lo general, esa victoria depende de qué solución
ha conseguido imponerse en el área centromeridional en torno a Madrid y Toledo, avanzadilla
privilegiada para su difusión generalizada en el sur.

3.1 Foco oriental


Ya desde el siglo XIII, o incluso antes, la aparición de los adjetivos posesivos tuyo y suyo, así
como la posibilidad sintáctica de su posposición al nombre, parecen haberse iniciado en oriente
antes de difundirse hacia Castilla (Romero Cambrón 2009, 2016). Pero es sobre todo a finales de
la Edad Media, y a lo largo del siglo XV, cuando el castellano evolucionó fuertemente influido
desde el este de la Península, de forma que muchos cambios en la gramática que distinguen el
español medieval del moderno revelan un epicentro oriental que difunde innovaciones hacia el
centro y sur peninsular. Esta vía de difusión se ha aducido, por ejemplo, para la generalización
de vosotros y nosotros (en detrimento de nós y vós) y la consiguiente desaparición de connusco y
convusco (Fernández-Ordóñez 2011; Gomila Albal 2016, 2018, 2021), o la pérdida de la /d/
intervocálica en las desinencias -des de 2.ª persona del plural y la creación consiguiente de las
formas diptongadas (Del Barrio de la Rosa 2021). Otros cambios iniciados ya en el siglo XIII,
pero con un patrón de difusión semejante (desde Navarra y Aragón hacia el sur de Castilla),
son la desaparición de la expresión de género en los posesivos prenominales (Del Barrio de la
Rosa 2014), la pérdida de concordancia en el participio de los tiempos compuestos (Rodrí-
guez Molina 2010) o la generalización tardomedieval de esos tiempos, empleados original-
mente en un número mucho más restringido de contextos en el norte y occidente peninsular
(Rodríguez Molina 2010; Octavio de Toledo 2017b). A estos cambios consumados en el XV
deben sumarse los acaecidos en el siglo XVI como resultado de los anteriores: la difusión de
tener como verbo de posesión, arrastrada por la auxiliarización de haber (Del Barrio de la Rosa
2016a), y la de cantara como tiempo subjuntivo, también consecutiva a la adopción de había
cantado como forma preferente de pluscuamperfecto de indicativo (Rosemeyer 2021). Tam-
bién desde finales de la Edad Media nuevas piezas del léxico funcional procedentes del oriente
peninsular, generalmente por vía culta, fueron desplazando a las medievales: cuantificadores
(demasiado: Fernández-Ordóñez 2016a), adverbios locativos (detrás, debaxo: Octavio de Toledo
2016), conjunciones (no obstante (que): Garachana 2014; por bien que, ya sea que: Lleal 2019) o la
variante -mente de los adverbios, que acabó con las castellanoleonesas -miente y -mientre, antes
prestigiosas (Del Barrio de la Rosa 2016b).

3.2 Foco occidental


Al occidente peninsular debemos hacer responsable del triunfo en castellano de la reposi-
ción de la -e final apocopada desde el siglo XIV, de quien como relativo sujeto sin antecedente

55
Inés Fernández-Ordóñez

(Fernández-Ordóñez 2011) y, desde el siglo XV, de encima como adverbio locativo (Octavio de
Toledo 2018a) o de la penetración del cuantificador alguien (Malkiel 1948), que solo se haría
mayoritario frente a alguno mucho después, en el siglo XX (Pato 2009). Quizá también tuvo
un origen centrooccidental la preposición para (Ueda 2015), así como multitud de elementos
léxicos (a modo de ejemplo, yugo: Morala 2016).

3.3 Nivelación dialectal


Las soluciones adoptadas en el centro de la Península (con Toledo en el eje) por parte de los
sociolectos de prestigio determinaron muchas veces su generalización en el resto del territorio.
En ocasiones, la innovación triunfante encaja bien con los procesos de nivelación dialectal, los
cuales suelen implicar la pérdida de morfología flexiva, el triunfo de las formas menos marcadas
y la génesis de soluciones interdialectales (Tuten 2003). Un ejemplo de este tipo es el empleo
del infinitivo en lugar del imperativo plural, hoy plenamente establecido en la lengua coloquial:
aunque en el norte solo se registra hacia el este, se extiende por todo el centro y sur peninsula-
res (Fernández-Ordóñez 2012). También podrían someterse a este modelo simplificador otros
cambios extendidos desde el noreste hacia el sur de Castilla: la pérdida de concordancia de los
participios en los tiempos compuestos (Rodríguez Molina 2010) y del género en los posesivos
(Del Barrio de la Rosa 2014) y, quizá, el abandono de la duplicación del numeral con valor dis-
tributivo, desconocida en Navarra y Aragón (Horcajada Diezma y Sánchez-Prieto Borja 1999).
Otras veces la mezcla dialectal generó soluciones nuevas, no existentes en los dialectos de partida;
ese es quizá el caso de donde, variante central que parece haber combinado el adverbio medieval
de procedencia onde, de origen centrooccidental, con el adverbio locativo do, de origen oriental
(Del Barrio de la Rosa 2018).

3.4 Las áreas laterales aislan el centro


No siempre el área central castellana triunfó en la difusión externa de sus usos, y fueron las
áreas laterales las que acabaron por imponerse en el centro y el sur. El paradigma referencial
de los pronombres átonos, con la distinción gramatical asociada entre las entidades contables y
no contables, no se extendió más allá de los montes de Toledo, pese a estar documentado en la
Castilla centrooccidental entre los siglos XIII y XVI (Fernández-Ordóñez 2001, 2006–2007;
Matute Martínez 2004; Sánchez-Prieto y Vázquez Balonga 2018). También parece ajeno a la
Castilla central y bien establecido en los márgenes el auxiliar verbal hemos, que reemplazó al
castellano avemos en las perífrasis deónticas y el perfecto compuesto desde el siglo XVI (Octavio
de Toledo 2021). Este patrón también explica el abandono de los imperfectos y condicionales
en -ié, propios del habla central desde León oriental hasta La Rioja en el siglo XIII y que, pese
a ello, fueron mayoritariamente descartados de la lengua escrita a partir del siglo XIV (Moral
del Hoyo 2016).
La mayor parte de estas áreas no se definen por la presencia o ausencia de la forma o estruc-
tura consideradas: es su variable frecuencia de aparición en el tiempo y el espacio la que hace
posible la reconstrucción histórica. La dialectología tradicional se fijó sobre todo en los rasgos
privativos de las áreas “históricas”, y no en la diferente frecuencia de los rasgos comunes; por
ello, centró su atención en la caracterización individualizadora del asturleonés, el riojano, el
navarro y el aragonés (con estudios específicos de su documentación), y no tanto en los aspectos
compartidos con el castellano ni en las diferencias de frecuencia que pudieran existir con este.
Así, se ha podido probar que el demostrativo aqueste era una forma marginal en Castilla, León
y Navarra, y solo en Aragón tenía empleo regular (Enrique-Arias 2018). Del mismo modo,

56
Dialectología histórica de la Península Ibérica

el área cántabra y del norte de Burgos se distancia nítidamente respecto a Burgos ciudad en
la frecuencia con que manifiesta rasgos orientales (futuro de subjuntivo -ero en 1.ª persona del
singular, síncopa -ertes, -erdes en 2.ª persona del plural) y occidentales (asimilaciones de prepo-
sición y artículo como enna, síncopa -ermos del futuro de subjuntivo en 1.ª persona del plural,
empleo de -u para referentes contables), conformando un área de personalidad propia (Moral
del Hoyo 2019, 2020). Y comparando cómo se manifiestan contornos estructurales en el espa-
cio, ha podido probarse que el adverbio medieval ý funcionó como tal en gallegoportugués,
asturleonés y castellano centrooccidental, pero adquirió propiedades de pronombre adverbial
en el castellano oriental, navarro, aragonés y catalán (Matute Martínez 2016). A partir de la
Edad Moderna, las diferencias de frecuencia hacen posible no solo identificar las áreas focales,
sino a menudo también los grupos sociales que promueven el cambio. Por ejemplo, desde la
segunda mitad del siglo XVI hasta finalizar el siglo XVII la perífrasis deóntica deber de se vio
promovida por los hablantes jóvenes de la mitad septentrional de la Península que no perte-
necían a la cúpula social (Blas Arroyo et al. 2019), y la extensión del tuteo fuera del ámbito
familiar se trasladó desde las clases populares a los jóvenes de clases educadas durante la primera
mitad del siglo XX (Molina Martos 2020).
Conviene no olvidar, por otro lado, que un área adquiere identidad dialectal precisamente por
las soluciones no generalizadas. En ocasiones, tales soluciones se mantuvieron como opciones
poco prestigiosas en la zona. Por ejemplo, es característico del español rural oriental el recurso a
infinitivos reflexivos “conjugados” con sujeto plural (usaban carbón para calentarsen), concordancia
abundantemente documentada desde el siglo XVIII y ya con ejemplos tardomedievales (Pato y
Heap 2012), pero este empleo no ha rebasado las fronteras de Castilla oriental, Navarra y Ara-
gón. Una segunda posibilidad es que podamos documentar el rasgo dialectal solo en un periodo
limitado: así, el patrón de las áreas laterales frente al centro se reproduce en la geografía medieval
del adverbio ensemble, solo conocido en León y Aragón, que se perdió en el siglo XVI sin haber
llegado a difundirse en Castilla (Rodríguez Molina 2012). Un tercer tipo evolutivo, más com-
plejo, es que la solución característica se haya perdido del área originaria que podemos recons-
truir y que, en cambio, se haya preservado en otras zonas a las que se difundió posteriormente.
Por ejemplo, el adverbio asín, propio del área navarroaragonesa en la Edad Media (Rodríguez
Molina 2015), parece haber desaparecido allí, pero está hoy día extrañamente extendido en el
habla rural de toda la mitad meridional de la Península (como el portugués assim). Una cuarta
posibilidad es el cambio de adscripción sociolingüística de la variante geolectal, de forma que en
el área originaria ha perdido prestigio y se conserva restringida, mientras que en las zonas a las
que se difundió ha conseguido alcanzar cierta altura en el empleo social: ese contraste se da, por
ejemplo, entre la Península y Canarias, de un lado, y América, de otro, con las formas concor-
dadas de haber existencial en primera persona (Castillo Lluch y Octavio de Toledo 2016) o entre
el español europeo, de una parte, y Andalucía occidental, Canarias y el Caribe, de otra, con la
anteposición de más a palabras negativas como nada o nunca (Peña Rueda 2022).

4. Conclusiones finales y perspectivas de futuro


Está aún por escribir una historia de la lengua española que integre las variables geográfica, social
y diafásica en cada evolución descrita. Si bien hay un interés creciente por este planteamiento,
estamos faltos de estudios que integren, en una perspectiva comparada, muchos de los cambios
que definen la evolución del español a lo largo del tiempo.
No obstante, en los últimos años se ha dedicado atención creciente a la variación interna del
castellano desde un punto de vista histórico, así como a la relación que establece con las lenguas
con que convive. De ahí que hoy contemos con la caracterización extensiva, a partir de nuevas

57
Inés Fernández-Ordóñez

fuentes documentales, del castellano norteño en la Edad Media (Moral del Hoyo 2019, 2020;
Sánchez González de Herrero et al. 2014), del andaluz oriental en la Edad Moderna (Calderón
Campos 2015, 2019), del castellano del centro peninsular entre la Edad Media y la Moderna
(Sánchez-Prieto 2019; Sánchez-Prieto et al. 2021; Grande López et al. 2017), así como de las
variedades que se hablaban en contacto con el vasco en el siglo XIX (Camus 2015; Gómez
Seibane 2014) y con el catalán entre los siglos XVIII y XIX en Mallorca (Enrique-Arias y
Miguel Franco 2015). Aunque gracias a estos valiosos estudios monográficos es posible abordar
preguntas antes inimaginables, la edificación sólida de una dialectología histórica no será posible
mientras que no tengamos además la posibilidad de comparar, en una red equilibrada y común,
todos los nuevos datos disponibles en distintos cortes cronológicos, en diferentes grupos sociales
de hablantes y en variadas situaciones comunicativas.
La Edad Media, como punto de partida, es quizá la época con más estudios con orien-
tación geolectal, pero no hay que olvidar que las lenguas no cesan de transformarse y que
tenemos que dar respuesta a la génesis histórica de muchas de las áreas dialectales del pre-
sente (véase una síntesis de las del español europeo en Fernández-Ordóñez 2016b). Si bien
la disposición geográfica de algunos rasgos dialectales puede tener un origen medieval, otros
fenómenos, necesariamente tardíos, apuntan a una persistencia areal que quizá debemos
explicar mediante el contacto establecido a través de las vías de comunicación, por mo-
vimientos demográficos posteriores o por cambios en la estima social acaecidos a lo largo
del tiempo. Un ejemplo claro es el área convergente del occidente peninsular —saltando la
frontera política y lingüística entre Extremadura y Andalucía, de un lado, y el centro y sur
de Portugal, de otro— que subyace a la formación del seseo, a finales de la Edad Media,
pero también a la generalización de ustedes como único alocutivo, formal e informal, en el
plural, desde el siglo XVIII en adelante (Fernández-Ordóñez 2011; Lara Bermejo 2018).
Otro cometido no menos importante de la dialectología histórica es descartar la naturaleza
geolectal de las innovaciones y acotar los factores gramaticales, sociales y diafásicos que
explican su recurrencia y, al tiempo, sus dificultades de generalización (De Benito Moreno
2020). Y la dialectología histórica tampoco puede olvidarse de los cambios fallidos o de
las áreas pasajeras, innovaciones que podemos documentar en un territorio, un grupo de
hablantes o un registro diafásico, pero que finalmente no se generalizaron, como el discurso
latinizante, quizá de origen oriental, propio de la lengua elaborada en el siglo XV (Pons
Rodríguez 2015; Lleal 2019), la elisión de la conjunción que en las oraciones completivas,
típica de la lengua coloquial entre los siglos XVI y XVII (Blas Arroyo 2019: cap. 7) o los
demostrativos estotro y esotro, trasmitidos desde el oeste peninsular hacia el occidente de
Castilla y potenciados por la lengua cortesana de la misma época (Octavio de Toledo 2018b).

Nota
1 La exposición que sigue se centra en aquellos trabajos que han abordado la variación lingüística, espe-
cialmente la morfosintáctica, comparando varias áreas de la Península. Los estudios de un área geográfica
concreta sin duda son preciosas teselas del mosaico que, mediante la comparación, ayudan a imaginar
cómo sería la pintura completa, pero la falta de muchas piezas intermedias —geográfica, social y crono-
lógicamente— impide aún extraer de ellos conclusiones generales.

Lecturas recomendadas
Fernández-Ordóñez (2011) expone los problemas generales que afronta la dialectología histórica y
propone causas de naturaleza comunicativa, demográfica e histórica en la constitución de áreas
lingüísticas modernas.

58
Dialectología histórica de la Península Ibérica

Del Barrio de la Rosa (2018) analiza simultáneamente las variables cronológica, geográfica y diafásica
en varios cambios medievales a partir de la comparación de documentos de distinta tipología.
Los trabajos contenidos en Blas Arroyo (2019) prestan particular atención a las dimensiones diastrá-
tica y diafásica del cambio sin perder de vista el factor geográfico.

Bibliografía citada
Almeida, B., R. Díaz Moreno y M.ª C. Fernández López, eds. 2017. “Cansada tendré a vuestra excelen-
cia con tan larga carta”. Estudios sobre aprendizaje y práctica de la escritura por mujeres en el ámbito hispánico
(1500–1900). Lugo: Axac.
Almeida, B., P. Sánchez-Prieto Borja y D. Vázquez Balonga. 2018. “Para una geografía diacrónica:
CODEA+ 2015 como atlas lingüístico dinámico del español”. En Actas del X Congreso Internacional de
Historia de la Lengua Española, eds. M.ª L. Arnal Purroy et al., vol. 2, 1537–1551. Zaragoza: Institución
Fernando el Católico y Diputación de Zaragoza.
ALPI = Navarro Tomás, Tomás, dir. 2016. Atlas Lingüístico de la Península Ibérica, eds. P. García Mouton, I.
Fernández-Ordóñez, D. Heap, M.ª P. Perea, J. Saramago y X. Sousa [en línea]. Madrid: CSIC. www.
[Link].
Blas Arroyo, ed. 2019. Sociolingüística histórica del español. Tras las huellas de la variación y el cambio lingüístico a
través de textos de inmediatez comunicativa. Madrid y Fráncfort: Iberoamericana Vervuert.
Bustos Gisbert, E. y J. Sánchez Méndez, eds. 2019. La configuración histórica de las normas del castellano.
Valencia: Tirant.
Calderón Campos, M. 2015. El español del reino de Granada en sus documentos (1492–1833). Berna: Peter
Lang.
Calderón Campos, M. 2019. “La configuración de la variedad meridional en el reino de Granada”. En La
configuración histórica de las normas del castellano, eds. E. Bustos Gisbert, J. P. Sánchez Méndez y V. Codita,
109–134. Valencia: Tirant lo Blanch.
Calderón Campos, M. y G. Vaamonde. 2020. “Oralia diacrónica del español, un nuevo corpus de la Edad
Moderna”. Scriptum Digital 9: 167–189.
Camus Bergareche, D. 2015. “El castellano del País Vasco en el siglo XIX: las cartas del Archivo Zavala”.
En Actas del IX Congreso Internacional de Historia de la Lengua Española, ed. J. M.ª García Martín, vol. 2,
1777–1790. Madrid y Fráncfort: Iberoamericana Vervuert.
Castillo Lluch, M. 2015. “El orden de palabras en los fueros medievales”. En El orden de palabras en la historia
del español y otras lenguas iberorromances, eds. M. López Izquierdo y M. Castillo Lluch, 279–318. Madrid:
Visor.
Castillo Lluch, M. y E. Díez del Corral, eds. 2019. Reescribiendo la historia de la lengua española a partir de la
edición de documentos. Berna: Peter Lang.
Castillo Lluch, M. y Á. Octavio de Toledo. 2016. “Habemos muchos que hablamos español: distribución e
historia de la concordancia existencial en primera persona del plural”. En En torno a ‘haber’. Construc-
ciones, usos y variación desde el latín hasta la actualidad, eds. C. de Benito Moreno y Á. Octavio de Toledo,
111–168. Berna: Peter Lang.
Catalán, Diego. 1989a. “Hacia un atlas toponímico del diminutivo. -īnu en la toponimia hispano-románica”.
En Las lenguas circunvecinas del castellano, 219–247. Madrid: Paraninfo.
Catalán, Diego. 1989b. “La toponimia del diminutivo y la re-romanización de Hispania”. En Las lenguas
circunvecinas del castellano, 248–253. Madrid: Paraninfo.
De Benito Moreno, C. 2020. “Reflexiones sobre la ‘lengua vulgar dialectal’ y el vulgarismo”. En El legado
de Ramón Menéndez Pidal (1869–1968) a principios del siglo XXI, ed. I. Fernández-Ordóñez, vol. 2,
19–56. Madrid: CSIC.
Del Barrio de la Rosa, F. 2014. “Factores externos y cambio lingüístico: la pérdida de la distinción genérica
de los posesivos del español antiguo”. Revista de Historia de la Lengua Española 9: 3–26.
Del Barrio de la Rosa, F. 2016a. “De haber a tener. La difusión de tener como verbo de posesión en la
historia del español: contextos y focos”. En En torno a ‘haber’. Construcciones, usos y variación desde el
latín hasta la actualidad, eds. C. de Benito Moreno y Á. S. Octavio de Toledo, 239–279. Fráncfort:
Peter Lang.
Del Barrio de la Rosa, F. 2016b. “La distribución de las variantes -mente, -miente y -mientre en el CODEA
(1221–1420): espacio variacional y cambio lingüístico”. Scriptum Digital 5: 85–102.
Del Barrio de la Rosa, F. 2018. Espacio variacional y cambio lingüístico en español. Madrid: Visor.

59
Inés Fernández-Ordóñez

Del Barrio de la Rosa, F. 2021. “Sociodialectología histórica de las desinencias de 2.ª persona plural en el
español peninsular europeo. Transmisión, difusión y divergencia dialectal”. En Variación diatópica y mor-
fosintaxis en la historia del español, eds. B. Garrido Martín, M.ª C. Moral del Hoyo y M. Raab, 221–254.
Santiago de Compostela: Universidade de Santiago de Compostela.
Enrique-Arias, A. 2015. “La metodología de los corpus paralelos aplicada al estudio de fenómenos com-
plejos de variación morfosintáctica. El caso de los posesivos del español medieval”. En Actas del IX
Congreso Internacional de Historia de la Lengua Española, ed. J. M.ª García Martín, vol. 1, 735–750. Madrid
y Fráncfort: Iberoamericana Vervuert.
Enrique-Arias, A. 2018. “Factores diatópicos en la variación entre este y aqueste en la historia del español”.
En Actas del X Congreso Internacional de Historia de la Lengua Española, eds. M.ª L. Arnal Purroy et al., vol.
2, 1553–1569. Zaragoza, España: Instituto Fernando el Católico y Diputación de Zaragoza.
Enrique-Arias, E. y R. Miguel Franco. 2015. “Una nueva herramienta para el estudio del castellano en
contacto con el catalán en Mallorca”. En Temas, problemas y métodos para la edición y el estudio de documen-
tos hispánicos antiguos, eds. J. Sánchez Méndez y M. de la Torre, 407–434. Valencia: Tirant lo Blanch.
Fernández-Ordóñez, I. 2001. “Hacia una dialectología histórica. Reflexiones sobre la historia del leísmo,
el laísmo y el loísmo”. Boletín de la Real Academia Española 81: 389–464.
Fernández-Ordóñez, I. 2006. “La historiografía medieval como fuente de datos lingüísticos. Tradiciones
consolidadas y rupturas necesarias”. En Actas del VI Congreso Internacional de Historia de la Lengua Espa-
ñola, eds. J. J. de Bustos Tovar y J. L. Girón Alconchel, vol. 2, 1779–1807. Madrid: Arco Libros.
Fernández-Ordóñez, I. 2006–2007. “Del Cantábrico a Toledo. El ‘neutro de materia’ hispánico en un
contexto románico y tipológico”. Revista de Historia de la Lengua Española 1: 67–118 y 2: 29–81.
Fernández-Ordóñez, I. 2009. “Los orígenes de la dialectología hispánica y Ramón Menéndez Pidal”. En
Cien años de filoloxía asturiana (1906–2006), ed. X. Viejo Fernández, 11–41. Oviedo: Alvízoras y Trabe.
Fernández-Ordóñez, I. 2011. La lengua de Castilla y la formación del español. Madrid: Real Academia
Española.
Fernández-Ordóñez, I. 2012. “El norte peninsular y su papel en la historia de la lengua española”. En
Estudios sobre tiempo y espacio en el español norteño, eds. S. Gómez Seibane y C. Sinner, 23–68. San Millán
de la Cogolla (La Rioja): CILENGUA.
Fernández-Ordóñez, I. 2016a. “De más (demás), demasiado: la historia de dos cuantificadores contemplada
desde la dialectología”. En El español a través del tiempo. Estudios ofrecidos a Rafael Cano Aguilar, eds. A.
López Serena, A. Narbona y S. del Rey, 477–496. Sevilla: Universidad de Sevilla.
Fernández-Ordóñez, I. 2016b. “Dialectos del español peninsular”. En Enciclopedia lingüística hispánica, ed. J.
Gutiérrez Rexach, vol. 2, 387–404. Londres y Nueva York: Routledge.
Garachana, M. 2014. “Gramática e historia textual en la evolución de los marcadores discursivos: el caso de
no obstante”. RILCE 30: 959–984.
Gómez Seibane, S. 2014. “Cambios indirectos inducidos por contacto en el castellano del País Vasco del
siglo XIX”. En La historia del español hoy. Estudios y perspectivas, eds. J. L Ramírez Luego y E. P. Velásquez
Upegui, 97–111. Lugo: Axac.
Gomila Albal, M. 2016. “Sobre el origen y la difusión geográfica de las formas nosotros y vosotros en caste-
llano”. Iberorromania 83: 103–125.
Gomila Albal, M. 2018. “Variación diacrónica y diatópica de con + pronombre personal de 1.ª y 2.ª persona
del plural”. Bulletin of Hispanic Studies 95: 801–823.
Gomila Albal, M. 2021. “Variación y cambio de los pronombres personales nós y vós junto con los modifi-
cadores otros, todos, mismos y ambos”. En Variación diatópica y morfosintaxis en la historia del español, eds. B.
Garrido Martín, M.ª C. Moral del Hoyo y M. Raab, 95–112. Santiago de Compostela: Universidade
de Santiago de Compostela.
Grande López, C., L. Martín Aizpuru, M.ª N. Sánchez González de Herrero, R. Sánchez Romo y V. J.
Marcet Rodríguez. 2017. “La documentación medieval del sur de Ávila y la variación interna del espa-
ñol: el corpus CODOMSA”. Scriptum Digital 6: 155–174.
Horcajada Diezma, B. y P. Sánchez-Prieto Borja. 1999. “La reduplicación distributiva del numeral y el
arabismo morfosintáctico en el romance hispánico medieval”. Zeitschrift für Romanische Philologie 115:
280–299.
Lara Bermejo, V. 2018. La cortesía en la Península Ibérica. Dialectología del “Sprachbund” suroccidental. Berna:
Peter Lang.
Lleal, C. 2019. “De transferencias, préstamos e intercambios en la norma medieval: el catalán en la confi-
guración del castellano”. En La configuración histórica de las normas del castellano, eds. V. Codita, E. Bustos
Gisbert y J. P. Sánchez Méndez, 293–314. Valencia: Tirant lo Blanch.

60
Dialectología histórica de la Península Ibérica

Malkiel, Y. 1948. Hispanic Algu(i)en and Related Formations. A Study of the Stratification of the Romance Lexicon
in the Iberian Peninsula. Berkeley y Los Ángeles: University of California Press.
Matute Martínez, C. 2004. Los sistemas pronominales en español antiguo. Problemas y métodos para una reconstruc-
ción histórica. Madrid: Universidad Autónoma de Madrid.
Matute Martínez, C. 2016. “Entre pronombres y adverbios: mecanismos de cambio en la historia dialectal
peninsular de ý/hi < IBI”. Boletín de la Real Academia Española 96: 201–237.
Menéndez Pidal, Ramón. 1980 [1926]. Orígenes del español. Estado lingüístico de la Península Ibérica hasta el
siglo XI. 3ª ed. Madrid: Espasa-Calpe.
Molina Martos, I. 2020. “Linguistic Change and Social Transformation”. En Address in Portuguese and Spa-
nish, eds. M. Hummel and C. dos Santos Lopes, 443–478. Berlín y Boston: De Gruyter.
Morala, J. R. 2016. “Lexicografía dialectal histórica y evolución etimológica: el caso de yugo”. Revista de
Historia de la Lengua Española 11: 131–153.
Morala, J. R. 2018. “Variación diatópica y etimología en léxico del Siglo de Oro”. En Actas del X Congreso
Internacional de Historia de la Lengua Española, eds. M.ª L. Arnal Purroy et al., vol. 1, 215–238. Zaragoza:
Institución Fernando el Católico y Diputación de Zaragoza.
Moral del Hoyo, M.ª C. 2016. “El castellano en los orígenes del cambio gramatical: el pretérito imperfecto
de la 2.ª y 3.ª conjugación (-ié- / -ía)”. En Lingüística de corpus y lingüística histórica iberorrománica, eds. J.
Kabatek y C. de Benito Moreno, 322–357. Berlín y Boston: Mouton de Gruyter.
Moral del Hoyo, M.ª C. 2019. “Volver (y revolver) a los orígenes del castellano: El Corpus Histórico del
Español Norteño (CORHEN)”. En Reescribiendo la historia de la lengua española a partir de la edición de
documentos, eds. M. Castillo Lluch y E. Díez del Corral, 361–389. Berna: Peter Lang.
Moral del Hoyo, M.ª C. 2020. “(Dis)continuidad y vocal final -u en castellano de Orígenes (y de orígenes)
al siglo XIII”. En El legado de Ramón Menéndez Pidal (1869–1968) a principios del siglo XXI, ed. I.
Fernández-Ordóñez, vol. 1, 293–329. Madrid: CSIC.
Octavio de Toledo, Á. 2011. “Santa Teresa y la mano visible: sobre las variantes sintácticas del Camino de
perfección”. En “Así se van las lenguas variando”. Nuevas tendencias en la investigación del cambio lingüístico en
español, eds. M. Castillo Lluch y L. Pons Rodríguez, 241–304. Berna: Peter Lang.
Octavio de Toledo, Á. 2016. Los relacionantes locativos en la historia del español. Berlín y Boston: De Gruyter.
Octavio de Toledo, Á. 2017a. “Tres siglos de variantes: el cambio morfosintáctico en el prisma de la Historia
de la poncella de Francia”. Revista Internacional de Lingüística Iberoamericana (RILI) 29: 43–145.
Octavio de Toledo, Á. 2017b. “El pretérito perfecto de subjuntivo en la Edad Media: distribución dialectal,
entornos sintácticos y tradicionalidad discursiva”. Moenia 23: 317–366.
Octavio de Toledo, Á. 2018a. “Orónimos dialectales y morfosintaxis histórica: el método pidaliano y las
formaciones adverbiales con cima y somo”. Boletín de la Real Academia Española 98: 267–313.
Octavio de Toledo, Á. 2018b. “De un occidentalismo cortesano y una transfusión fallida: historia de es(t)otro”.
Estudios de Lingüística del Español 39: 305–361.
Octavio de Toledo, Á. 2021. “Why Spanish Historical Morphosyntax (Badly) Needs Dialectology”. Dia-
lectologia 26: 97–126.
Octavio de Toledo, Á. y L. Pons Rodríguez. 2016. Queja política y escritura epistolar durante la Guerra de Inde-
pendencia: documentación de la Junta Suprema Central en el AHN. Alcalá de Henares: Universidad de Alcalá.
Pato, E. 2009. “Notas aclaratorias sobre la historia del indefinido alguien: una aplicación directa del uso de
corpus diacrónicos”. En Diacronía de las lenguas iberorrománicas: nuevas aportaciones desde la lingüística de
corpus, ed. A. Enrique-Arias, 401–416. Madrid y Fráncfurt: Iberoamericana Vervuert.
Pato, E. y D. Heap. 2012. “Plurales anómalos en los dialectos y en la historia del español”. En Actas del
VIII Congreso Internacional de Historia de la Lengua Española, ed. E. Montero Cartelle, vol. 1, 829–840.
Madrid: Arco Libros.
Peña Rueda, C. 2022. Fenómenos de orden de palabras en el español rural de Canarias. El ascenso del cuantificador
más en las superlativas complejas y en las construcciones aditivo-negativas. Tesis doctoral. Lausana: Université
de Lausanne.
Pons Rodríguez, L. 2015. “La lengua del Cuatrocientos más allá de las Trescientas”. En Actas del IX Congreso
Internacional de Historia de la Lengua Española, ed. J. M.ª García Martín, 393–430. Madrid y Fráncfort:
Iberoamericana y Vervuert.
Post Scriptum = Centro de Lingüística da Universidade de Lisboa, ed. 2014. P. S. Post Scriptum. Arquivo
Digital de Escrita Quotidiana em Portugal e Espanha na Época Moderna [en línea: julio de 2021]. http://
[Link].
Rodríguez Molina, J. 2010. La gramaticalización de los tiempos compuestos en español antiguo: cinco cambios dia-
crónicos. Tesis doctoral. Madrid: Universidad Autónoma de Madrid.

61
Inés Fernández-Ordóñez

Rodríguez Molina, J. 2012. “Variantes léxicas y gramaticales del adverbio ensemble en la documentación
medieval”. Cuadernos del Instituto Historia de la Lengua 7: 405–424.
Rodríguez Molina, J. 2015. “Variantes morfofonéticas del adverbio así en español medieval”. En Actas del
IX Congreso Internacional de Historia de la Lengua Española, ed. J. M.ª García Martín, vol. 1, 1049–1064.
Madrid y Fráncfort: Iberoamericana Vervuert.
Rodríguez Molina, J. y Á. Octavio de Toledo. 2017. “La imprescindible distinción entre texto y testimo-
nio: el CORDE y los criterios de fiabilidad lingüística”. Scriptum Digital 6: 5–68.
Romero Cambrón, Á. 2009. “Sobre el origen de los posesivos tuyo y suyo”. Cahiers d’Études Hispaniques
Médiévales 32: 83–100.
Romero Cambrón, Á. 2016. “La expansión del posesivo pospuesto a la luz de documentación navarra (y
aragonesa) del siglo XIII”. SCRIPTA. Revista Internacional de Literatura i Cultura Medieval i Moderna 7:
1–20.
Rosemeyer, M. 2021. “Variación diatópica en la evolución del pluscuamperfecto sintético”. En Variación
diatópica y morfosintaxis en la historia del español, eds. B. Garrido Martín, M.ª C. Moral del Hoyo y M.
Raab, 195–220. Santiago de Compostela: Universidade de Santiago de Compostela.
Sánchez Gonzalez de Herrero, M.ª N., et al., eds. 2014. Textos para la historia del español IX: documentos
medievales de Miranda de Ebro. Alcalá de Henares: Universidad de Alcalá.
Sánchez Méndez, J. y M. de la Torre, eds. 2015. Temas, problemas y métodos para la edición y el estudio de docu-
mentos hispánicos antiguos. Valencia: Tirant lo Blanch.
Sánchez-Prieto Borja, P. 2019. “La llamada norma toledana a la luz de las fuentes documentales”. En La
configuración histórica de las normas del castellano, eds. E. Bustos Gisbert y J. Sánchez Méndez, 19–49.
Valencia: Tirant lo Blanch.
Sánchez-Prieto Borja, P., M.ª J. Torrens Álvarez y D. Vázquez Balonga, eds. 2021. La lengua de Madrid a lo
largo del tiempo. Sevilla: Universidad de Sevilla.
Sánchez-Prieto Borja, P. y D. Vázquez Balonga. 2018. “Toledo frente a Madrid en la conformación del
español moderno: el sistema pronominal átono”. Revista de Filología Española 98: 185–215.
Tabernero Sala, C. 2020. “Contribución al estudio del español norteño a partir de un corpus de declara-
ciones en procesos judiciales (siglos XVI-XIX)”. Scriptum Digital 9: 87–115.
Tomás Faci, G. 2020. El aragonés medieval. Lengua y estado en el reino de Aragón. Zaragoza: Universidad de
Zaragoza.
Tuten, D. N. 2003. Koineization in Medieval Spanish. Berlín y NuevaYork: De Gruyter.
Ueda, H. 2015. “Frecuencia contrastiva, frecuencia ponderada y método de concentración. Aplicación
al estudio de las dos formas prepositivas del español medieval, pora y para”. En Actas del IX Congreso
Internacional de Historia de la Lengua Española, ed. J. M.ª García Martín, vol. 1, 1139–1155. Madrid y
Fráncfort: Iberoamericana Vervuert.

62
6
Sociolingüística histórica
panhispánica
(Historical sociolinguistics in
a pan-Hispanic perspective)
José Luis Blas Arroyo

1. Introducción
Este capítulo aborda cuestiones relacionadas con el estudio de la diacronía del español desde
la perspectiva de la sociolingüística histórica. Tras exponer algunos principios teóricos de la
disciplina, se plantean cuestiones metodológicas como el grado de representatividad y exhaus-
tividad de los corpus más aptos para el acercamiento al habla vernácula, y se examina la inci-
dencia de diversos factores extralingüísticos atestiguados en la historia del español. Asimismo,
se plantean desafíos para una disciplina todavía incipiente en el estudio de la lengua española,
como el problema de la difusión de los cambios, la posibilidad de combinar las perspectivas
del tiempo real y el tiempo aparente, el papel de los individuos o un mayor rigor en el análisis
cuantitativo.
Palabras clave: sociolingüística histórica; variación y cambio lingüístico; factores externos;
inmediatez comunicativa; corpus diacrónicos

This chapter examines some relevant issues concerning the study of Spanish from the perspec-
tive of Historical sociolinguistics. After discussing some theoretical principles underlying the
analysis of language variation and change, some methodological questions are raised, such as
the degree of representativeness and exhaustiveness of the corpora that are more appropriate
for approaching the vernacular of past times. Some contributions are then summarized on
how several extralinguistic factors have conditioned various changes in the past. The chapter
concludes with an overiew of some of the challenges that lie ahead in the development of this
discipline, such as the problem of the transition of changes, the possibility of combining the
perspectives of both real and apparent time, the role of individuals in the diffusion of change,
and the need for greater rigour in the methods of quantitative analysis.
Keywords: historical sociolinguistics; language variation and change; external factors; commu-
nicative immediacy; diachronic corpora

DOI: 10.4324/9781003035565-8 63
José Luis Blas Arroyo

2. Cuestiones teóricas y metodológicas


Desde hace varias décadas, la sociolingüística histórica viene aplicando los principios y métodos
de la sociolingüística contemporánea al análisis de la variación y el cambio lingüístico en épocas
pasadas para las que no se dispone de testimonios orales. Aunque considerablemente menos
desarrollada que en el estudio del inglés y otras lenguas germánicas, esta disciplina ofrece, sin
embargo, algunas contribuciones destacadas al estudio del español, por no hablar del interés
mostrado tradicionalmente por representantes de la escuela filológica española acerca de los
aspectos sociales del cambio lingüístico.
La sociolingüística ha demostrado que la variación es un principio inherente de la lengua
y condición necesaria para la existencia del cambio, que se configura siempre —y hasta su
conclusión— como un cambio en marcha. La evolución de una lengua no es la mera sustitución
en el tiempo de unas formas por otras. Por el contrario, en cada estadio, unas variantes alternan
con otras para la expresión de un mismo contenido semántico o funcional, al tiempo que esa
alternancia adquiere un perfil social determinado, cuyo sentido determinará en buena medida la
propia suerte del cambio.
Se ha dicho que el trabajo seminal de Weinreich et al. (1968) acerca de los fundamentos
empíricos en que debe inspirarse una teoría abarcadora sobre el cambio lingüístico marca el
nacimiento de la sociolingüística histórica, aunque sus autores no se refirieran a ella con esta
denominación. Entre esos fundamentos destaca la propuesta de inscribir el estudio de las evo-
luciones lingüísticas en la estructura social, partiendo para ello del principio de uniformidad
(Labov 1994), según el cual los mecanismos básicos que funcionan para la producción y difusión
de los cambios en la actualidad son, en esencia, similares a los que intervinieron en el pasado: hoy
como ayer, los hablantes usan formas alternativas para expresar idénticos contenidos, la variación
está influida por condicionantes lingüísticos y sociales, y las diferencias en el uso de las variantes
son casi siempre de orden cuantitativo.
En el desarrollo de la sociolingüística histórica suelen distinguirse dos ramas, en correspon-
dencia aproximada con la clásica distinción entre la sociolingüística de la sociedad —o sociología
del lenguaje—, por un lado, y la sociolingüística de la lengua, por otro. La primera se centra
en los entornos macrosociales que presiden los cambios, ocupándose de aspectos tales como
los procesos de estandarización y planificación lingüística, las actitudes e ideologías, la opo-
sición entre bilingüismo y diglosia, etc. Por su parte, la sociolingüística de la lengua, que nos
ocupará en estas páginas, analiza la influencia de diversos condicionantes externos en fenómenos
de microvariación lingüística. Es conocida la afirmación de Labov (1994, 11) según la cual
“historical linguistics can then be thought of as the art of making the best use of bad data”.
Ciertamente, hasta tiempos recientes el analista debía conformarse a menudo con el acceso res-
tringido a la documentación escrita disponible, limitada en muchos casos a registros formales, en
los que la variación es siempre menor. Esos registros formales han estado tradicionalmente aso-
ciados al habla de las élites, con frecuencia más conservadoras, por lo que constituyen un recurso
incompleto para analizar la variación en el pasado. Además, en el acceso a los textos, especial-
mente a los más antiguos, la distinción entre originales y copias (a veces muy) posteriores puede
inducir a interpretaciones erróneas, al tiempo que existen ediciones valiosas desde el punto de
vista histórico a las que, sin embargo, no acompaña el suficiente rigor filológico (Fernández-Or-
dóñez 2001) (cap. 1). Por último, en la reconstrucción de la estructura social de épocas pretéritas,
la configuración de los factores externos puede presentar diferencias significativas con respecto al
presente, en paralelo a la naturaleza cambiante de la sociedad. De ahí la necesaria colaboración
con otras disciplinas, como la historia social, y la prevención ante potenciales anacronismos en
la interpretación del pasado.

64
Sociolingüística histórica panhispánica

Sin embargo, los avances realizados en las últimas décadas han permitido a Nevalainen y
Raumolin-Brunberg (2003, 26) afirmar que lo que define a la sociolingüística histórica es,
más bien, “[to] make the best use of the data available”. Ciertamente, entre las características
metodológicas de esta disciplina están la ausencia de cualquier “paradoja del observador” (Labov
1994) o la posibilidad de emprender estudios en tiempo real con toda la profundidad temporal
que se quiera, frente a la (casi) obligada remisión a la hipótesis del tiempo aparente en la socio-
lingüística contemporánea. Por otro lado, los problemas de representatividad y exhaustividad
de los datos han podido mitigarse en los últimos tiempos mediante el recurso a grandes corpus
digitales. A este respecto, destacan iniciativas como la Biblioteca Virtual Miguel de Cervantes o
macrocorpus como CORDE y CE (cap. 2), si bien la utilidad de estas enormes bases de datos
textuales para el estudio sociolingüístico puede verse limitada, ya que los documentos compi-
lados son mayoritariamente de naturaleza formal y la información extralingüística que ofrecen
acerca de los escritores es escasa (Conde Silvestre 2007, 51–52). Afortunadamente, estos pro-
blemas se han venido paliando en los últimos años mediante la creación de un número cada vez
mayor de corpus de diversa índole y extensión que incluyen textos representativos de diferentes
tradiciones discursivas. Por mencionar aquí solo uno de ellos,1 el CODEA permite analizar la
variación según una escala registral que distingue entre los textos más formales, asociados a los
ámbitos de emisión cancillerescos y jurídicos, hasta los más espontáneos, como la documenta-
ción escrita por particulares, pasando por otros ámbitos intermedios (municipales y eclesiásticos).
En la práctica, se han comprobado algunas diferencias significativas acerca de la difusión de
ciertos fenómenos de variación y cambio lingüístico al comparar los testimonios basados en
géneros discursivos formales y los que atienden a tradiciones textuales más próximas al polo de
la inmediatez comunicativa (Oesterreicher 2005) (cap. 7). Entre estas destacan, por ejemplo,
las declaraciones de testigos, las crónicas y relaciones de conquista, las actas capitulares, los
diarios y memorias, etc. y, en especial, la correspondencia privada (Fernández Alcaide 2009;
Calderón Campos 2018; Blas Arroyo el al. 2019), sobre todo la escrita por semicultos. Por
fortuna, el contexto hispánico ha sido especialmente fértil en esta clase de textos, ya que la
colonización de América produjo un número ingente de cartas remitidas desde uno y otro
lado del Atlántico.
En los últimos tiempos contamos con una representación creciente de ediciones
filológicamente rigurosas de estos materiales. Las transcripciones a cargo de especialistas de otras
disciplinas pueden resultar también provechosas, siempre que respeten la literalidad de los textos,
con modificaciones mínimas, si acaso, en apartados como la puntuación o la acentuación para
facilitar la lectura al lector contemporáneo. Ciertamente, estas modernizaciones pueden dificultar
el estudio de la variación fónica o gráfica, pero no así el análisis de otro tipo de fenómenos,
como los que tienen lugar en la morfosintaxis o en el plano discursivo. Por otro lado, las cartas
autógrafas u hológrafas son más fiables que las dictadas, especialmente numerosas en periodos
en los que la alfabetización y la escritura estuvieron mucho más restringidas socialmente. Con
todo, algunos estudios recientes han señalado que el papel de escribanos y pendolistas pudo ser
mucho más determinante en el plano gráfico-fónico que en otros niveles, como el gramatical
(Bergs 2005; Blas Arroyo 2016).

3. Desarrollos actuales
Aunque el análisis de los condicionantes lingüísticos figura también como una tarea esencial de
la sociolingüística histórica, el objetivo primordial de esta es explicar cómo se han difundido
socialmente la variación y el cambio a lo largo de la historia. En lo que sigue repasamos
algunos resultados obtenidos en torno a esta premisa en el estudio del español. Aunque las

65
José Luis Blas Arroyo

investigaciones realizadas no siguen siempre los mismos principios y métodos de análisis y, por
tanto, sus resultados pueden no ser exactamente comparables en ocasiones, en todos ellos se
advierte una misma preocupación por las implicaciones sociales en la evolución de la lengua (cf.
también el cap. 5).

3.1 Dimensiones socioculturales


La conciencia acerca de la variación tiene una larga presencia en la historia del español, como
demuestran los textos de varios humanistas del Siglo de Oro (Valdés, Correas, Aldrete, etc.),
quienes advertían ya que su lengua no era enteramente uniforme, ni geográfica ni socialmente
(cap. 39). En la lingüística histórica no han faltado tampoco alusiones acerca de la consideración
de tal o cual rasgo lingüístico como (más) propio de las clases altas o populares. Sin embargo,
el análisis de las diferencias sociales en el estudio de la variación no se ha emprendido de una
manera rigurosa y sistemática hasta tiempos recientes.
Conceptos tales como clase social o nivel sociocultural han ocupado un lugar central en el
desarrollo de la sociolingüística contemporánea. En ella han hecho considerable fortuna dos
metáforas que dan cuenta de diferentes puntos de partida en la génesis y extensión de los cam-
bios: de los denominados cambios desde arriba generalmente hay conciencia en la comunidad de
habla, dado que se originan en el extremo superior de la jerarquía social y en los estilos más
formales; frente a estos, los cambios desde abajo circulan por debajo del nivel de la conciencia, y
se difunden impulsados por ciertos sectores bajos o medio-bajos de la sociedad y en los registros
más espontáneos, al menos en sus fases iniciales (Labov 2001).
Como un prototípico cambio desde abajo se ha caracterizado, por ejemplo, la aspiración
meridional de /-s/ a principios del siglo XVI (Cano Aguilar 2005). Este mismo autor
sostiene que la eliminación de la distinción sorda/sonora en las sibilantes —paso previo a
fenómenos como el seseo o el ceceo— tuvo también a las clases populares como protagonistas
destacadas, mientras que la distinción se habría mantenido durante más tiempo entre las
élites.
La morfología de los tratamientos es otra parcela en la que se han advertido cambios de esta
naturaleza. Así, Fontanella de Weinberg (1996) recuerda que, durante la primera mitad del siglo
XIX, el uso general entre los hablantes bonaerenses de los niveles altos combinaba el voseo
pronominal con formas verbales correspondientes a tú (‘vos tienes, vos eres’). En cambio, los
hablantes rurales empleaban las formas voseantes etimológicas (‘vos tenés, vos sos’). Esta distri-
bución cambió, sin embargo, a partir de la segunda mitad de esa centuria, cuando el empleo de
estas últimas formas se extendió por toda la pirámide social, hasta llegar al voseo generalizado
que hoy conocemos.
En el extremo opuesto, algunos cambios desde arriba pudieron surgir como reacción cons-
ciente ante cambios desde abajo previos, que venían a poner en peligro el prestigio sociolingüís-
tico asociado a las élites. Por ejemplo, Blake (1988) considera que la fluctuación entre las grafías
<f-> y <ff-> que muestran numerosos documentos castellanos del siglo XIII pudo obedecer a
un ejercicio de hipercorrección por parte de ciertos sectores sociales intermedios con acceso a la
escritura, quienes de este modo exhibían su conservadurismo lingüístico y su resistencia frente a
un cambio desde abajo, [f] > [h], que estaba presente ya en Castilla desde hacía varios siglos. En
el mismo sentido, Jodl (2015) cree que este cambio del castellano medieval pudo encontrar nota-
bles dificultades para establecerse definitivamente debido al estigma social de la variante aspirada.
Esa misma tendencia al conservadurismo es observada por Martínez (2001) en su estudio
sobre textos decimonónicos de dos grupos de población en el sur de Texas. En el plano morfoló-
gico, mientras los “fundadores” de la colonia hispana abanderaban el cambio hacia la variante -ra

66
Sociolingüística histórica panhispánica

en las terminaciones del imperfecto de subjuntivo, los “advenedizos” se mantenían mucho más
fieles a la variante tradicional (-se), un comportamiento que este autor interpreta como un caso
de hipercorrección por parte de unas gentes especialmente concernidas por la promoción social.
Por su parte, Blas Arroyo et al. (2019) han advertido un caso similar en el freno a la inserción del
artículo en las relativas oblicuas (la casa en la que) y, por tanto, el regreso a la variante tradicional
(la casa en que) por parte de las élites sociales españolas del siglo XVIII. Con ello, estos grupos
privilegiados exhibían su resistencia ante el impulso de una nueva variante, que, pese a todo,
vendría a imponerse con el tiempo, aunque en absoluto de manera definitiva, como demuestra
la variación todavía hoy existente.

3.2 Acomodación, contacto de variedades y redes sociales


El contacto entre variedades se ha revelado un factor fundamental en la evolución lingüís-
tica. De hecho, para autores como Penny (2004), esta sería la contribución más importante
de la sociolingüística para entender la historia del español. Este autor ha sido pionero en la
aplicación de la noción de koineización a la diacronía. Esta se traduce en procesos lingüísticos de
nivelación y simplificación en situaciones de contacto demográfico y dialectal rápidas e inten-
sas, como sucede con los grandes movimientos de población hacia nuevas ciudades, fronteras y
colonias (Trudgill 1986). En los casos prototípicos de koineización, los hablantes de diferentes
variedades lingüísticas mutuamente inteligibles se desplazan a una nueva comunidad, lo que
favorece los procesos naturales de acomodación lingüística (Giles et al. 1991) (cap. 11). Ade-
más, esta mezcla demográfica y dialectal suele desembocar en la ruptura de las redes sociales
antiguas, tradicionalmente mucho más densas. Y este debilitamiento extremo de las redes socia-
les ha demostrado tener una incidencia considerable en la activación de los cambios lingüísticos
(Milroy y Milroy 1985).
A juicio de Penny (2004), una larga serie de (re)koineizaciones tuvieron lugar en España
durante el largo proceso de la Reconquista, hasta el punto de hacer de este país un ejemplo
único en el contexto europeo. No pocos hechos de variación y cambio lingüístico que sin-
gularizan al castellano habrían sido la consecuencia de alguna de esas fases de koineización.
Por el contrario, la naturaleza más conservadora de otras variedades, como las mozárabes o
ciertas hablas rurales asturianas y cántabras, podría explicarse por el carácter más cerrado de
las comunidades respectivas, con redes sociales mucho más densas y escasamente proclives
al contacto exterior. Incluso en tiempos mucho más recientes, la división en provincias a
mediados del siglo XIX habría favorecido, en opinión de Moreno Fernández (2005, 184), la
homogeneidad territorial y lingüística y el rechazo a innovaciones foráneas, promoviendo así
la vernacularización lingüística y las peculiaridades regionales que todavía hoy caracterizan a
numerosas comarcas españolas.
Como en otras ciudades europeas (para Londres, cf. Nevalainen y Raumolin-Brunberg 2003),
los intensos cambios demográficos experimentados por Madrid desde su capitalidad (1561)
pudieron convertir a esta ciudad en un verdadero crisol de variedades lingüísticas, que habría
favorecido esta clase de procesos y su difusión posterior a otras zonas del país (cap. 39). Penny
(2004), por ejemplo, interpreta fenómenos como la extensión general de la pérdida de /h-/ pro-
cedente de /f-/ latina como un ejemplo de simplificación ocasionado por la nueva koiné: la varia-
ble lingüística habría experimentado un proceso de reasignación (reallocation) de sus significados
sociales y estilísticos, con mantenimiento de la aspiración en determinados enclaves dialectales y
diastráticos. Con todo, en opinión de Tuten (2003), en la difusión generalizada de las elisiones
no hubo ninguna variedad protagonista, contrariamente a lo que habría sucedido en el orden de
las sibilantes: frente al sistema medieval de seis consonantes, quienes llegaron a Madrid desde el

67
José Luis Blas Arroyo

norte traían consigo otro en el que la oposición de sonoridad estaba ya neutralizada, lo que bien
pudo funcionar como modelo para la simplificación.
La koiné madrileña habría afectado también a la morfosintaxis, por ejemplo, en la reestruc-
turación parcial del sistema de clíticos. Los usos sancionados hoy por la normativa (‘A Pedro
le vimos el jueves’, ‘El libro lo guardo en la estantería’) se habrían extendido desde el crisol
madrileño como una solución de compromiso (interdialectalismo) ente el sistema etimológico
(‘A Pedro lo vimos el jueves’, ‘El libro lo guardo en la estantería’) y otro que utilizaba sistemáti-
camente el pronombre le(s) para todos los complementos contables (‘A Pedro le vimos el jueves’,
‘El libro le guardo en la estantería’). En opinión de Penny (2004), este sistema híbrido vendría a
sustituir a los fenómenos generalizados de leísmo y laísmo con esta clase de objetos, que llegaron
a ser dominantes en las variedades escritas castellanas del Siglo de Oro, y que aún hoy persisten
en numerosas variedades castellanas.
Otra etapa decisiva en la koineización del castellano fue la que tuvo lugar en América en
paralelo al proceso de colonización. Autores como Fontanella de Weinberg (1996) o Granda
(1994), entre otros, consideran que, durante las primeras décadas posteriores a la conquista, se
creó en el continente americano una koiné que más tarde se diversificaría regionalmente. En
esa koiné original habrían triunfado diversos fenómenos de simplificación en los que adquirió
un protagonismo destacado la variedad andaluza, la minoría lingüística más importante en ese
momento. Ello explica la presencia sistemática en el español americano de fenómenos como el
seseo, ausente, sin embargo, en las variedades norteñas y toledana del castellano. Por otro lado,
la llegada de otros contingentes andaluces (especialmente, sevillanos) al Caribe hispánico y a las
tierras bajas americanas pudo favorecer posteriormente otros procesos de rekoineización y la
introducción de fenómenos como la aspiración de /-s/ o la neutralización de /r/ y /1/, entre
otros. A juicio de Parodi (2001), el hecho de que estos fenómenos no hubieran formado parte
de la koiné original pudo deberse a razones de prestigio sociolingüístico, pues eran rasgos que ya
estaban presentes en el andaluz desde el siglo XV (Frago Gracia 1993).

3.3 Dimensiones generolectales


Tras décadas de estudios cuantitativos, la investigación sociolingüística ha demostrado la rele-
vancia de este factor en la explicación de la variación y el cambio lingüístico contemporáneos.
Numerosos estudios han comprobado, por ejemplo, que, en situaciones de estabilidad, las muje-
res tienden a utilizar más formas estándares y prestigiosas que los hombres. Ahora bien, una
cierta paradoja generolectal (Labov 2001) surge al constatar que, al mismo tiempo, las mujeres
desempeñan un papel importante en el cambio lingüístico, especialmente en el plano fonoló-
gico: suelen abanderan los cambios que apuntan hacia nuevas formas de prestigio, lo que no es
incompatible con el hecho de que algunos subgrupos femeninos —principalmente jóvenes y de
clases populares— lideren también ciertos cambios desde abajo.
La comprobación o refutación de estos resultados en el análisis de textos antiguos se ha visto
dificultada por la escasa representación de las mujeres en la mayoría de corpus disponibles. Aun
así, la investigación sociohistórica del inglés ha revelado una imagen mixta de las mujeres de
épocas pasadas, que se sitúan en la vanguardia de algunos cambios gramaticales, al tiempo que
aparecen claramente rezagadas en otros (Nevalainen y Raumolin-Brunberg 2003). Estos últimos
se han puesto en relación con el difícil acceso de las mujeres al estándar, como consecuencia de
su tradicional marginación en el sistema educativo, con un dominio de la lectoescritura defi-
ciente, incluso en los niveles sociales elevados.
Para el español, Fontanella (1996) comprobó que el seguimiento de las normas ortográficas
del estándar entre las clases acomodadas de Buenos Aires en el siglo XIX era significativamente

68
Sociolingüística histórica panhispánica

mayor entre los hombres que entre las mujeres. Por ejemplo, la correspondencia privada de una
mujer bonaerense de comienzos del XIX (Romana J. López de Anaya) presentaba abundantes
ejemplos de confusiones yeístas. Sin embargo, en las cartas de sus hijos, esas confusiones resulta-
ban mucho más ocasionales. En su estudio sobre la adversatividad en la Celestina, Dietrick (1992)
observa también que los personajes masculinos siguen las tendencias favorables de la época a la
extensión del enlace pero en detrimento del más tradicional mas. Asimismo, comprueba que los
personajes femeninos retienen el empleo aditivo de sino, en vías de desaparición ya a finales del
siglo XV.
Ahora bien, como recuerda Conde Silvestre (2007), esta disociación del comportamiento de
las mujeres en la propagación de los cambios desde arriba en situaciones históricas pasadas no se
puede generalizar, ya que no faltan ejemplos de lo contrario. Así, Martínez (2001) ha advertido
que, a comienzos del siglo XIX, en los territorios meridionales del actual estado de Texas, las
mujeres utilizaban mucho más frecuentemente que los hombres la variante por entonces más
prestigiosa entre las terminaciones del imperfecto de subjuntivo (-se). Por su parte, Blas Arroyo
y Velando Casanova (2022) han comprobado que, durante la primera mitad del siglo XVII, el
impulso a las variantes preposicionales frente a las tradicionales queístas en subordinadas comple-
tivas dependientes de sustantivos y adjetivos (‘estoy seguro de que’ vs. ‘estoy seguro que’) ofrece
un perfil de cambio desde arriba, impulsado por las clases dominantes, y en el que las mujeres
parece que tuvieron también un protagonismo destacado. De hecho, en ese estudio, un cruce
entre ambos factores revela que, con independencia del estatus social, en todos los grupos las
mujeres aventajan a los hombres en las inserciones preposicionales.
Dadas las dificultades reseñadas para el análisis cuantitativo, otros estudios han optado por
una aproximación más cualitativa a las diferencias generolectales. Así, en su análisis sobre diversa
documentación indiana, García Mouton (1996–1997) advierte indicios que singularizan a las
mujeres en la afectividad de los vocativos, la presencia de diminutivos, el uso de refranes y fór-
mulas coloquiales, etc. Por su parte, Enrique-Arias (2006) comenta diversos usos vernáculos
derivados del contacto entre el español y el catalán en la correspondencia privada de una aristó-
crata mallorquina (Cecilia de Zaforteza) a mediados del siglo XVIII.

3.4 Dimensiones diafásicas


Incluimos en este apartado las diferencias relacionadas con factores diversos, no siempre fáciles
de delimitar, pero que en su conjunto atienden al contexto comunicativo, antes que a las particu-
laridades sociales o geográficas de los participantes. Desde el estudio pionero de Romaine (1982)
acerca de la variación en los pronombres relativos del inglés antiguo, uno de los condicionantes
más atendidos por la sociolingüística histórica ha sido el referido a conceptos diversos, pero
relacionados íntimamente, como género textual o tradición discursiva. En una aplicación pionera al
español de estas nociones en la investigación sociolingüística, Gimeno Menéndez (1995) dibuja
un contínuum estilístico en cartularios alicantinos medievales (siglos X–XII), en el que (de
mayor a menor grado de formalidad) distingue entre textos cancillerescos, notariales y forales.
Lo interesante es que esta gradación se correlaciona significativamente con algunos fenómenos
de variación, como la ausencia de la preposición ad ante el objeto directo personal, una prueba
del afianzamiento progresivo del romance en detrimento del latín.
Suele suponerse que los textos más formales representan un locus adecuado para la extensión
de las variantes más prestigiosas y, por tanto, para la difusión de cambios desde arriba. De hecho,
la intersección entre la clase social y el estilo constituye uno de los principales hallazgos de la
sociolingüística: un rasgo más habitual entre los niveles socioculturales bajos se produce con
más frecuencia en el discurso informal; y viceversa, los rasgos más propios de las clases elevadas

69
José Luis Blas Arroyo

aparecen también más a menudo en los contextos formales. Pountain (1998), por ejemplo, ha
mostrado que las diferencias de registro suponen un factor persistente en la posición del adjetivo
calificativo a lo largo de la historia del español: la anteposición se asocia fuertemente en todas las
épocas con los registros más formales, mientras que se halla prácticamente ausente en el habla
más espontánea. Del Barrio de la Rosa (2017), por su parte, ha señalado que el adverbio medie-
val ansí (frente a así) tuvo especial fortuna en un periodo situado a caballo entre los siglos XVI
y XVII, como consecuencia de su empleo sistemático en documentos judiciales. Con todo, el
ejemplo de ansí demuestra también cómo el sino de una misma variante puede cambiar con el
paso del tiempo, aunque su estigmatización, debida a un progresivo arrinconamiento dialectal,
habría de esperar todavía al siglo XVIII. En ese mismo trabajo se muestra también cómo los
ámbitos de uso más formales pueden frenar la expansión de las innovaciones, incluso de aquellas
que acaban triunfando. Así ocurre en el XVI con la expansión de tener para la posesión léxica
en detrimento del tradicional haber, un verbo que, pese a todo, abunda todavía en gramáticas y
tratados hasta 1625, así como en los textos judiciales.
Ahora bien, no siempre un mismo tipo de texto se corresponde con un estilo determinado.
De hecho, algunos encierran en su seno ejemplos de variación estilística dignos de estudio.
Pountain (2006), por ejemplo, utiliza el concepto de registro para dar cuenta de las variaciones
situacionales que presentan textos literarios como el Corbacho, cuyo autor muestra una especial
sensibilidad hacia el contínuum socioestilístico. Por su parte, Martínez (2000) analiza la variación
sociolingüística en función del interlocutor al que van dirigidos los textos (audience design) en
su estudio sobre el uso de ciertas construcciones sintácticas complejas en textos decimonónicos
del sur de Texas, como las construcciones gerundivas absolutas. De los resultados de esa inves-
tigación se desprende que los relatos e informes dirigidos a una audiencia general utilizaban
esta construcción mucho más que los textos dirigidos a interlocutores particulares. En parecido
sentido, la distinción entre cartas dirigidas a destinatarios unidos al remitente por estrechos
lazos familiares y de solidaridad, por un lado, y la correspondencia menos personal, por otro, se
ha revelado significativa en diversos fenómenos de variación estudiados por Blas Arroyo et al.
(2019).

4. Conclusiones y direcciones futuras


En este capítulo hemos intentado mostrar cómo la comprensión de las dimensiones sociales
de la variación y el cambio proporciona una visión más completa de la historia del español, al
tiempo que puede arrojar luz acerca del modo en que estos procesos se configuran en la actuali-
dad. Aunque el cambio obedece también a mecanismos estructurales, la significación social que
adquieren las variantes alternativas desempeña a menudo un papel determinante en su desenlace.
Ahora bien, pese a los avances recogidos en estas páginas, y otros muchos de los que no
hemos podido ocuparnos por razones de espacio, son todavía numerosos los desafíos a los que
se enfrenta la sociolingüística histórica panhispánica. Algunos guardan relación con el proble-
ma de la transición (Weinreich et al. 1968) —el modo en que los cambios se propagan en la
comunidad— y la constatación de que muchos de esos cambios no son regulares, ya que se
difunden a través del tiempo y del espacio a ritmos diferentes. Muchas innovaciones se extienden
a lo largo de siglos, con frecuentes avances y retrocesos, como sucede con el devenir de algunas
construcciones queístas que, tras ser prácticamente categóricas en el español medieval y el primer
español clásico, experimentan un descenso significativo en las centurias siguientes, para remontar
de nuevo en tiempos recientes (Blas Arroyo y Velando Casanova 2022). Por el contrario, otros
cambios culminan en un plazo mucho más breve. Por ejemplo, Ramírez Luengo (2001) ha ras-
treado la alternancia entre las terminaciones -ra y -se para el imperfecto de subjuntivo en textos

70
Sociolingüística histórica panhispánica

uruguayos del siglo XIX en los que se aprecia un vuelco brusco (favorable a -ra) en las ocurrencias
de cada forma en un lapso temporal de apenas 60–70 años. Por su parte, Blas Arroyo y Velando
Casanova (2019) han comprobado que la sustitución del relativo quien para antecedentes plurales
por el analógico quienes (‘mis primos, a quien/quienes vimos’) experimentó también un cambio
abrupto en apenas unas décadas (1661–1740: 60 %) con respecto al periodo inmediatamente
anterior (1581–1660: 13 %). El estudio sobre la dirección y el grado de difusión histórica de los
cambios es, pues, una línea de investigación en la que queda todavía un largo camino por recorrer.
Al mismo tiempo, son necesarios estudios que analicen no solo cómo evolucionan las
frecuencias de uso de las variantes en cada periodo, sino también los cambios experimen-
tados tanto en la gramática interna como en el eje socioestilístico durante esas etapas.
Mediante la adopción de una perspectiva comparatista, Blas Arroyo et al. (2019) han estu-
diado esa cuestión a propósito de diversos fenómenos de variación sintáctica en textos cer-
canos al polo de la inmediatez comunicativa a lo largo de casi cinco siglos. De estos análisis
se desprende que, junto a no pocos patrones de persistencia, que revelan el mantenimiento
de idénticos condicionantes a lo largo de la historia —con independencia de las fluctua-
ciones frecuenciales—, otros exhiben un claro debilitamiento e, incluso, su neutralización
con el paso del tiempo.
Otro ámbito que merece una mayor atención en el futuro es la posibilidad de realizar
investigaciones en tiempo aparente, al modo en que la sociolingüística contemporánea aborda
mayoritariamente el estudio del cambio lingüístico. Ciertamente, se trata de una tarea difícil,
por la previsible falta de información acerca de la edad precisa de muchos informantes en
el momento de escribir sus textos. Sin embargo, cuando esa información está disponible, el
contraste entre diferentes generaciones puede arrojar resultados sugestivos. En combinación
con los datos del tiempo real, en los que se basa generalmente la sociolingüística histórica,
esta comparación podría desentrañar, por ejemplo, el carácter generacional o comunitario
de algunos cambios (Labov 2001), así como otros desenlaces genolectales como el age gra-
ding, esto es, la repetición de los mismos patrones de variación en los mismos grupos de edad
generación tras generación.
Del mismo modo, nuevas líneas de investigación deberían animar al estudio acerca del papel
que los individuos desempeñan en la difusión de los cambios y el modo en que ese papel puede
variar con el paso del tiempo. Frente a la teoría que sostiene que, al menos en los niveles más
profundos del análisis, el repertorio verbal se fosiliza en el tránsito entre la juventud y la primera
edad adulta, algunas investigaciones recientes han demostrado que ciertos individuos cambian
sus usos lingüísticos a lo largo de la vida (Blas Arroyo 2022). Asimismo, cobra interés determinar
el carácter conservador, contemporizador o innovador de esos individuos en relación con los
cambios en marcha con los que conviven.
Finalmente, el estado actual de la disciplina pone de manifiesto también la necesidad de pro-
fundizar en el aparato metodológico de las investigaciones. Aunque, como hemos visto, se ha
avanzado mucho en el problema de la representatividad de los corpus, todavía son necesarias
bases de datos extensas, que faciliten muestras de habla suficientes de ciertos grupos tradicional-
mente mal representados (como las mujeres), así como de variables lingüísticas lastradas por una
escasa recurrencia en el discurso. Al mismo tiempo, es necesaria la comparación entre géneros
y tradiciones discursivas diferentes, así como entre situaciones comunicativas distintas dentro de
un mismo género. Es también una asignatura pendiente la sofisticación de los análisis cuantita-
tivos, hasta tiempos muy recientes limitada a una estadística meramente descriptiva, en la que
no se consideraban las posibles relaciones de interacción o dependencia entre factores distintos.
Igualmente, en el análisis riguroso de la variación se echa en falta la consideración del llamado
principio de responsabilidad ante los datos (accountability) (Labov 1994), esto es, la atención a

71
José Luis Blas Arroyo

todas las variantes potencialmente alternantes en un mismo hueco funcional, y no solo a aquella
sobre la que se pone el foco.
Ni que decir tiene, por último, que la atención a otros aspectos sociolingüísticos, como los
apuntados al comienzo de estas páginas (actitudes lingüísticas, procesos de estandarización, etc.)
es necesaria también para completar un panorama que en este breve capítulo tan solo hemos
podido describir de manera (muy) parcial.

Nota
1 Para un resumen de otros corpus, editados conforme a normas filológicas rigurosas y distribuidos por
muy diferentes regiones, véase Calderón Campos (2018).

Lecturas recomendadas
Conde Silvestre (2007) es un excelente manual introductorio en el que se repasan las principales
cuestiones relacionadas con el análisis sociolingüístico de la variación y el cambio lingüístico
aplicado a textos antiguos. Aunque buena parte de las ejemplificaciones están referidas al inglés,
contiene también abundante información sobre el español.
Hernández-Campoy y Conde Silvestre (2012) es un manual de referencia internacional, en el que
participan destacados especialistas en las principales cuestiones teóricas y metodológicas rela-
cionadas con la sociolingüística histórica. Aunque atiende también principalmente al inglés, la
calidad y profundidad de sus contribuciones convierten sus estados de la cuestión en sumamente
útiles.
Blas Arroyo et al. (2019) reúne diversos estudios de sociolingüística variacionista centrados en fenó-
menos de variación sintáctica de los siglos XVI–XX, a partir de un corpus de textos cercanos a la
inmediatez comunicativa, fundamentalmente correspondencia privada. El uso de una metodolo-
gía comparativa permite analizar no solo las frecuencias de uso de las variantes en cada periodo,
sino también la evolución de la gramática interna de cada fenómeno y de sus condicionantes
socioestilísticos.

Bibliografía citada
Bergs, A. 2005. Social Network Analysis and Historical Sociolinguistics. Berlín: De Gruyter.
Blake, R. 1988. “Sound Change and Linguistic Residue: The Case of (f –) > (h –) > /(o)/”. En George-
town University Round Table on Languages and Linguistics, ed. T. Walsh, 53–62. Georgetown: Georgetown
University Press.
Blas Arroyo, J. L. 2016. “The Rise and Fall of a Change from Below in the Spanish Syntax of the Golden
Age Period: deber & deber de + Infinitive in Communicative Immediacy Texts”. Journal of Historical
Linguistics 6: 1–31.
Blas Arroyo, J. L. 2022. “Patterns of Individual Variation and Change in Golden Age Spanish. Analysis of
Three Linguistic Variables in a Private Correspondence Corpus”. Folia Linguistica Historica 43 [en línea].
[Link]
Blas Arroyo, J. L., M. Porcar, M. Velando y J. Vellón. 2019. Sociolingüística histórica del español. Tras las huellas
de la variación y el cambio lingüístico a través de textos de inmediatez comunicativa. Madrid y Fráncfort: Ibe-
roamericana Vervuert.
Blas Arroyo, J. L. y M. Velando Casanova. 2019. “Auge y caída de una forma moribunda: la evolu-
ción del relativo quien con antecedente plural en la historia del español”. Studia Neophilologica 91:
355–382.
Blas Arroyo, J. L. y M. Velando Casanova. 2022. El queísmo en la historia. Variación y cambio lingüístico en el
régimen preposicional del español (siglos XVI–XXI). Berlín: De Gruyter.
Calderón Campos, M. 2018. “Muestras de oralidad en el corpus diacrónico del español del Reino de Gra-
nada (siglo XVIII)”. Oralia 17: 117–145.

72
Sociolingüística histórica panhispánica

Cano Aguilar, R. 2005. “Cambios en la fonología del español durante los siglos XVI y XVII”. En Historia
de la lengua española, ed. R. Cano. 2ª ed., 825–857. Barcelona: Ariel.
Conde Silvestre, J. C. 2007. Sociolingüística histórica. Madrid: Gredos.
Del Barrio de la Rosa, F. 2017. “Piezas léxicas y variación morfosintáctica en la historia del español. Tres
casos en el español de los Siglos de Oro (1581–1620)”. En Palabras Vocabulario Léxico. La lexicología
aplicada a la didáctica y a la diacronía, ed. F. del Barrio de la Rosa, 251–266. Venecia: Edizioni Ca’
Foscari.
Dietrick, D. 1992. “Estudio sociolingüístico de la adversatividad en La Celestina”. En Actas del II Congreso
Internacional de Historia de la Lengua Española, ed. M. Ariza, R. Cano, J. M.ª Mendoza y A. Narbona,
359–371. Madrid: Pabellón de España.
Enrique-Arias, A. 2006. “Spanish/Catalan Contact in Historical Perspective: 18th Century Documents
from Majorca”. En New Perspectives in Iberian Dialectology/Nouvelles perspectives en dialectologie ibérique,
eds. D. Heap, E. Pato y C. Gurski. London (Canadá): University of Western Ontario. [Link]/
linguistics/methodsxii.
Fernández Alcaide, Marta. 2009. Cartas de particulares en Indias del siglo XVI: edición y estudio discursivo.
Madrid y Fráncfort: Iberoamericana Vervuert.
Fernández-Ordóñez, I. 2001. “Hacia una dialectología histórica. Reflexiones sobre la historia del leísmo,
el laísmo y el loísmo”. Boletín de la Real Academia Española 81: 389–464.
Fontanella de Weinberg, M. B. 1996. “El aporte de la sociolingüística histórica al estudio del español”.
International Journal of the Sociology of Language 117: 27–38.
Frago Gracia, J. A. 1993. Historia de las hablas andaluzas. Madrid: Arco Libros.
García Mouton, P. 1996–1997. “Las mujeres que escribieron cartas desde América (siglos XVI–XVII)”.
Anuario de Lingüística Hispánica 12–13: 319–326.
Giles, H. J. Coupland y N. Coupland (eds.). 1991. Contexts of Accommodation: Developments in Applied Socio-
linguistics. Cambridge: Cambridge University Press.
Gimeno Menéndez, F. 1995. Sociolingüística histórica. Madrid: Visor.
Granda, G. de. 1994. “El proceso de koineización en el período inicial de desarrollo del español de Amé-
rica”. En El español de América en el siglo XVI, ed. Jens Lüdtke, 87–108. Fráncfort y Madrid: Vervuert
e Iberoamericana.
Hernández-Campoy, J. M. y J. C. Conde-Silvestre, eds. 2012. The Handbook of Historical Sociolinguistics.
Malden, MA: Wiley-Blackwell.
Jodl, F. 2015. “Estigma y auge de prestigio: el cambio f > h en castellano y gascón visto desde la sociolin-
güística histórica y la lingüística variacional”. Revista de Filología Románica 32: 21–40.
Labov, W. 1994. Principles of Linguistic Change, vol. 1, Internal Factors. Philadelphia: Blackwell Publi-
shing Co.
Labov, W. 2001. Principles of Linguistic Change, vol. 2, Social Factors. Oxford: Blackwell.
Martínez, G. A. 2000. “A Sociohistorical Basis of Grammatical Simplification: The Absolute Cons-
truction in Nineteenth-century Tejano Narrative Discourse”. Language Variation and Change 12:
251–266.
Martínez, G. A. 2001. “Política lingüística y contacto social en el español mexico-tejano: la oposición -ra
y -se en Tejas durante el siglo XIX”. Hispania 84: 114–124.
Milroy, J. y L. Milroy. 1985. “Linguistic Change, Social Network, and Speaker Innovation”. Journal of
Linguistics 21: 339–384.
Moreno Fernández, F. 2005. Historia social de las lenguas de España. Barcelona: Ariel.
Nevalainen, T. y H. Raumolin-Brunberg. 2003. Historical Sociolinguistics: Language Change in Tudor and
Stuart England. Londres: Longman y Pearson Education.
Oesterreicher, W. 2005. “Textos entre inmediatez y distancia comunicativas. El problema de lo hablado
escrito en el Siglo de Oro”. En Historia de la lengua española, ed. R. Cano. 2ª ed., 729–769. Barcelona:
Ariel.
Parodi, C. 2001. “Contacto de dialectos y lenguas en el Nuevo Mundo: la vernacularización del español
en América”. Intemational Joumal of the Sociology of Language 149: 33–53.
Penny, R. 2004. Variación y cambio en español. Madrid: Gredos.
Pountain, C. J. 1998. “Nuevo enfoque de la posición del adjetivo atributivo”. En Atti del XXI Congresso
Internazionale di Linguistica e Filologia Romanza, vol. 2, ed. G. Rufino, 697–708. Tubinga: Niemeyer.
Pountain, C. J. 2006. “Towards a History of Register in Spanish”. Spanish in Context 3: 5–24.
Ramírez Luengo, J. L. 2001. “Alternancia de las formas ra/se en el español uruguayo del siglo XIX”. Estu-
dios Filológicos 36: 173–186.

73
José Luis Blas Arroyo

Romaine, S. 1982. Socio-historical Linguistics: Its Status and Methodology. Cambridge: Cambridge University
Press.
Trudgill, P. 1986. Dialects in Contact. Oxford: Basil Blackwell.
Tuten, D. N. 2003. Koineization in Medieval Spanish. Berlín: De Gruyter.
Weinreich, U., W. Labov y M. Herzog. 1968. “Empirical Foundations for a Theory of Language Change”.
En Directions for Historical Linguistics, eds. W. P. Lehman y Y. Malkiel, 95–189. Austin: University of
Texas Press.

74
7
Tradiciones discursivas e
historia lingüística
(Discursive traditions
and historical linguistics)
Araceli López Serena

1. Introducción
El concepto de tradición discursiva (TD) surgió, dentro de la romanística alemana, en el seno de
la lingüística de las variedades de filiación coseriana. Sus orígenes se remontan a los desarrollos
teóricos iniciados por las Escuelas de Tubinga (Coseriu, Schlieben-Lange, Kabatek) y Friburgo
(Oesterreicher, Koch) desde finales de los años 70. Acuñado por Peter Koch, el concepto de TD
ha resultado ser altamente rentable en el campo de la lingüística histórica cuando se trata de ana-
lizar en qué medida un determinado proceso de cambio lingüístico o un hecho lingüístico parti-
cular identificado en un texto podrían haberse visto propiciados o inhibidos por condicionantes
discursivo-tradicionales. En este capítulo, que pretende mostrar hasta qué punto la lingüística
histórica ha sabido sacar partido de la noción de TD, se hace un breve repaso histórico de los
orígenes y el desarrollo del concepto de TD en el marco de la romanística alemana y se remite a
algunos trabajos sobre la historia del español a fin de ilustrar en qué medida el paradigma de las
TD ha servido de inspiración para determinados tipos de investigación.
Palabras clave: tradiciones discursivas; tradicionalidad discursiva; lingüística de las variedades
de filiación coseriana; niveles y dominios del lenguaje; distancia/inmediatez comunicativas

The concept of discursive tradition (DT) was developed, within German Romance linguis-
tics, inside the framework of Coserian-inspired Varieties Linguistics. Its origins go back to the
theoretical developments carried out by the Schools of Tübingen (Coseriu, Schlieben-Lange,
Kabatek) and Freiburg (Oesterreicher, Koch) since the late 70s and the 80s. Coined by Peter
Koch, the concept of discursive tradition has proved to be extraordinarily fruitful in the field of
historical linguistics, when it comes to analyzing to what extent a particular linguistic change or
a particular linguistic fact witnessed in a past language state may have been favoured or inhibited
by discursive-traditional factors. Starting with a very brief historiographic review of the origins
and the development of the concept of discursive tradition within German Romance linguistics,
this chapter will show in which way historical linguistics has profited from this concept. For this
purpose, a few contributions dealing with the history of the Spanish language will be chosen

DOI: 10.4324/9781003035565-9 75
Araceli López Serena

in order to illustrate the extent to which the notion of discursive tradition has proved useful in
this kind of research.
Keywords: discursive traditions; discursive traditionality; Coserian-inspired Varieties Linguis-
tics; linguistic levels and domains; communicative immediacy/distance

2. La noción de tradición discursiva: cuestiones teóricas y metodológicas1

2.1 El concepto de tradición discursiva: génesis y definición


El concepto de TD fue acuñado por Peter Koch (1987) en su tesis de habilitación, que a día de
hoy continúa inédita. Esta monografía perseguía dos objetivos netamente descriptivos, relacio-
nados con lo que cabe denominar enfoque de materia (López Serena 2021a): “por un lado, el
análisis lingüístico del género dictamen a partir de textos prototípicos, redactados en latín y, por
primera vez, en volgare; por otro lado, el análisis lingüístico del primer empleo del volgare en el
género dictamen” (Koch 1987, 3);2 a ellos se sumaba un tercer objetivo de naturaleza teórica, aco-
metido, por tanto, desde un enfoque de objeto de estudio:3 proporcionar a la lingüística histórica
“un marco teórico lingüístico categorial, dentro del cual se pueden situar, delimitar e interrelacionar
con exactitud las diferentes preguntas de investigación que surjan en el abordaje de los dictamina”
(Koch 1987, 36; énfasis mío).
Para la construcción de este “marco teórico categorial”, Koch se basó en la concepción cose-
riana del lenguaje como “actividad humana universal que se realiza individualmente, pero siempre
según técnicas históricamente determinadas”, de acuerdo con la cual “[e]n el lenguaje se pueden
[...] distinguir tres niveles: uno universal, otro histórico y otro individual” (Coseriu 1957, 269).

NIVEL SABER saber hablar en general, de acuerdo con los principios


UNIVERSAL ELOCUCIONAL generales del pensar y con la experiencia general humana
acerca del mundo
NIVEL SABER saber hablar de acuerdo con las normas de la lengua que se
HISTÓRICO IDIOMÁTICO realiza
NIVEL SABER saber hablar en situaciones determinadas, saber estructurar
INDIVIDUAL/ EXPRESIVO los discursos de acuerdo con las normas de cada uno de sus
ACTUAL tipos

Figura 7.1 Los niveles universal, histórico y actual del lenguaje y los saberes elocucional,
idiomático y expresivo de acuerdo con la propuesta de Coseriu (2019, 32)

nivel dominio tipo de reglas


universal actividad del hablar reglas elocucionales
lengua histórica particular reglas idiomáticas
histórico
tradición discursiva reglas discursivas
actual/individual discurso

Figura 7.2 Niveles y dominios de lo lingüístico (apud Koch 1997, 45; cf. también Koch 2008, 54)

76
Tradiciones discursivas e historia lingüística

Mientras que en la propuesta originaria de Coseriu solo las lenguas y las modalidades de variación
diasistemática (diatópicas, diastráticas y diafásicas) que conforman el saber idiomático se ubicaban en
el nivel histórico del análisis lingüístico y de la competencia de los hablantes, Koch, tanto en su tesis
de habilitación como en trabajos posteriores (cf. Koch 1997, 2008), consideró necesario subdividir
este nivel en dos dominios diferenciados: el de las lenguas históricas particulares y el de las TD. Si
proyectamos sobre las dos figuras anteriores la distinción entre materia y objeto de estudio a la que se
ha hecho mención anteriormente, el nivel actual del discurso correspondería para Koch a la materia
de estudio, es decir, a la realidad de los testimonios discursivos y textuales, mientras que los niveles
histórico y universal constituirían abstracciones propias del objeto de estudio.4
Koch proponía, con ello, poner de relieve la falta de coincidencia entre (i) el saber histórico
que tiene que ver con la competencia idiomática y (ii) el producir textos según tradiciones y
modelos históricos, perteneciente también al saber sociohistóricamente determinado, pero inde-
pendiente de las tradiciones de las lenguas particulares. En esto último se mostraba de acuerdo
con el propio Coseriu en que “los textos tienen también sus tradiciones particulares, indepen-
dientes de las lenguas” (Coseriu 2007, 137–138). Por este motivo Coseriu entendía que se podía
aludir, dentro de las tradiciones del hablar (Traditionen des Sprechens, cf. Schlieben-Lange 1983), a
tradiciones textuales o TD, tanto en relación con “los textos incorporados a la tradición lingüística
misma” (Coseriu 2007, 138), p. ej., las formas históricamente establecidas en una comunidad
idiomática para el saludo o para las secuencias de cierre de una conversación, como en relación
con “los [tipos de] textos supraidiomáticos, [pues] debería resultar evidente que existe una con-
figuración tradicional enteramente independiente de la tradición del hablar según una técnica
transmitida históricamente (= independiente de las lenguas históricas)” (Coseriu 2007, 139).
Desde el punto de vista de su intensión, el concepto de TD está vinculado con la variación lingüís-
tica de naturaleza textual o discursiva. En este sentido, la definición que ha tenido mayor repercusión
es la de Kabatek (2005a, 159), para quien las TD no forman parte, sin embargo, del nivel histórico
del análisis, sino del individual,5 y en cuya opinión una TD consiste en “la repetición de un texto o
de una forma textual o de una manera particular de escribir o de hablar que adquiere valor de signo
propio” (cf. Kabatek 2018, cap. 8). Desde el punto de vista de su extensión, las reglas discursivas, que
proporcionan a los hablantes modelos para realizar de manera adecuada sus discursos, “remiten a tra-
diciones discursivas, es decir, a determinados estilos, géneros, clases de textos, universos discursivos,
actos de habla, etc., todos los cuales aprehenden clases de discursos” (Koch 1987, 31).
Algunos especialistas (p. ej., Sáez Rivera 2006; López Serena 2011) han manifestado su pre-
ocupación por la laxitud de la definición tanto intensiva como extensiva del término TD, que
ha conducido, de una parte, a su solapamiento con categorías tradicionalmente aplicadas a la
descripción de la variación lingüística como registro o estilo (cf. Company 2008), que para Koch
son TD (cf. su pasaje recién citado) y que, además, caben perfectamente dentro de la mencio-
nada definición de Kabatek, pues tanto los registros como los estilos se pueden interpretar como
“maneras particulares de escribir o de hablar que adquieren valor de signo propio”. Además, la
etiqueta TD ha confluido también con la noción, igualmente tradicional, de género (cf. Kabatek
2018, cap. 10), así como con conceptos procedentes de propuestas de teorización lingüística
más recientes, como los de clases de textos, tipos de textos o incluso actos de habla y funciones
expresivas (cf. cap. 21). Ahora bien, tal y como defiende López Serena (2021a) o señala Octavio
de Toledo (2018), justamente la holgura de esta concepción tan laxa de TD, “basada en la idea
de repetición evocadora y ampliable a elementos o secuencias inferiores al texto e incluso a la
oración”, es, probablemente, uno de los motivos por los que las TD se han convertido

en entidades extraordinariamente atractivas para quien investiga la historia de la len-


gua, por cuanto le proporcionan una herramienta previamente inexistente para conectar

77
Araceli López Serena

directamente la repetición de un elemento o construcción (su frecuencia, en suma) con


una distribución restringida (o, al menos, dominante) en un conjunto de textos interrela-
cionables según criterios varios (pero no necesariamente dependientes unos de otros, ni en
términos genéricos ni de rasgos de género).
(Octavio de Toledo 2018, 119)

2.2 La perspectiva de las tradiciones discursivas como enfoque metodológico


La citada reflexión de Octavio de Toledo entronca con la idea, defendida por Kabatek (2015),
de que el alcance completo del concepto de TD encuentra su razón de ser solo cuando no nos
acercamos a él desde la categorización y la consiguiente adscripción de productos textuales a clases
de TD preestablecidas —es decir, desde el punto de vista que hemos denominado de objeto—,
sino cuando nos interesa la descripción de todos los aspectos discursivo-tradicionales que seamos
capaces de identificar en cada texto particular, o, lo que es lo mismo, cuando nos aproximamos a
las TD desde un enfoque de materia (cf. § 3), en relación con el cual parece más adecuado hablar,
no de tradiciones, sino de tradicionalidad discursiva, y anteponer los principios en que se sostiene
la investigación de la tradicionalidad discursiva a la búsqueda, de momento infructuosa, de una
definición unívoca y de consenso del concepto TD.
Entre estos principios, destaca el rechazo a la conversión de la lingüística histórica en una
lingüística de corpus que no tenga en cuenta los factores discursivo-tradicionales que condicio-
nan la interpretación de cualquier dato lingüístico:6

El estudio diacrónico de una lengua particular que se basa empíricamente en textos (‘dis-
cursos’) no tiene que engañarse con la ilusión de que los datos extraídos de estos discursos
reflejen directamente reglas idiomáticas de la lengua en cuestión ni que los datos sacados
de discursos sucesivos en el tiempo reflejen directamente cambio de reglas idiomáticas.
Hay que tener en cuenta los “filtros” no solo de las variedades lingüísticas, sino también de
las tradiciones discursivas que intervienen en cada discurso individual. Esta consideración
conlleva consecuencias importantísimas para la metodología de una lingüística del corpus (cfr.
Oesterreicher 2001, 1569ss; Kabatek 2005a, 163ss., 172–174).
(Koch 2008, 80; cursiva original)

El corolario del rechazo a una lingüística de corpus derivada de una visión lineal de la evolución
de las lenguas es el propósito de

modificar [...] un monolitismo que parte del supuesto de la existencia de una —y una
sola— gramática representativa de cada lengua y cada época, monolitismo reanimado
por modelos actuales y por una lingüística de corpus en la que se supone que la varia-
ción textual no es más que un problema de cantidad y que, a partir de un cierto tamaño
de la muestra, la variación se esfuma en la nada del “ruido” estadísticamente irrelevante.
(Kabatek 2008, 8)7

A este respecto, no extraña que Kabatek vincule el “enorme eco” que tuvo su primer libro sobre
TD en el mundo hispánico (Jacob y Kabatek 2001) con el hecho de que apareció

en un momento adecuado: la teoría de la gramaticalización y los nuevos grandes cor-


pus habían dado un nuevo auge a la lingüística histórica, y en el ámbito de la lingüística

78
Tradiciones discursivas e historia lingüística

hispánica hubo una especie de oleada de estudios de sintaxis histórica. Entre la tradición
filológica española y una nueva lingüística de índole más bien teórica y basada en datos
masivos faltaba algo: una diferenciación de las tradiciones de los textos y una crítica a una
diacronía demasiado simplista que ignoraba la diversidad de las tradiciones textuales.
(Kabatek 2018, 22)

3. Historia de la lengua española y tradiciones discursivas


La excelente acogida que el paradigma de las TD ha encontrado, en las últimas décadas, en la
lingüística histórica española hunde sus raíces en el hecho de que “sabemos [...] que la variación
sintáctica depende en gran medida de la tradición textual, y eso tanto si consideramos el texto
en su totalidad como cuando lo diferenciamos internamente” (Kabatek 2012, 91; cf. ahora Kaba-
tek 2018, cap. 6). Estas convicciones, reflejadas en estudios anteriores al desarrollo de la noción
de TD —como los de Badia i Margarit o Bustos Tovar que menciona en este mismo volumen
Cano Aguilar (cf. cap. 21)—, han servido de caldo de cultivo a la exitosa implantación de esta
corriente, sobre todo en España, donde se contaba con el precedente de la Escuela de Filología
fundada por Menéndez Pidal y continuada por Rafael Lapesa, de quienes los hispanistas que han
tomado el testigo de la investigación sobre TD son, en gran medida, herederos.
Entre los historiadores de la lengua española, la adopción del concepto de TD ha estado
vinculada con la aceptación de dos de las principales reivindicaciones de este paradigma: la nece-
sidad de tener en cuenta, en la interpretación de cada dato lingüístico individual, la complejidad
del contexto discursivo-tradicional que lo envuelve y la oposición a las visiones lineales de la
evolución lingüística. Ambas convicciones ponen en entredicho la viabilidad de hacer historia
de la lengua a partir, exclusivamente, de corpus informatizados (cf. § 1.2 y Kabatek 2018, cap.
7). Pero, además, la predilección por el concepto de TD por encima de otros como género, clase
o tipo textual se debe también al rechazo hacia las categorizaciones apriorísticas y de vocación
universalista características de la tipología textual. Ajena, por lo general, a retos teóricos aún no
resueltos como la definición inequívoca del término TD, la cuestión de su ubicación en uno
u otro nivel del lenguaje (cf. § 1.1 y la nota 3) o su delimitación frente a categorías alternativas
como tipo, clase o género textual, lo que ha primado en la lingüística histórica hispánica ha sido
el valor de la noción de TD como herramienta heurística.
La desestimación de las categorizaciones in vitro de los enfoques tipologistas y la resistencia a
adscribir los productos textuales sometidos a examen por parte del historiador a clases preesta-
blecidas va acompañada, entre quienes abrazan la corriente de las TD, por la voluntad decidida
de partir de los textos y de describir, en cada testimonio particular, todos los aspectos discursi-
vo-tradicionales que sea posible identificar. Y es que, como señala Kabatek (2015, 52),
“[s]i abordamos un texto no a partir de una categorización preestablecida y sin querer adscribirlo
a una u otra categoría, sino pretendiendo determinar el alcance completo de las relaciones de tra-
dicionalidad que se manifiestan en ese texto partiendo del propio texto, encontraremos una larga
lista, en principio abierta, de aspectos tradicionales”. Tras la adopción firme de esta perspectiva de
materia que rehúye las categorías teóricas preestablecidas está también la idea de que es necesario
llevar a cabo una recontextualización (cf. Oesterreicher 2003) de todos los documentos que interese
estudiar, esto es, prestar atención a la complejidad del contexto histórico, social y cultural en
que fueron originados e interpretar en ese marco los datos lingüísticos que proporcionen. No en
vano, los textos son “formas prototípicas convencionalizadas en las que han cristalizado ciertos
valores de los parámetros de las condiciones de comunicación [...], así como, por un lado, requi-
sitos de verbalización más o menos estrictamente predefinidos, y, por otro lado, conocimientos

79
Araceli López Serena

socialmente determinados en cuanto a su contenido y temática” (Oesterreicher 1997, 24).


También para Jacob y Kabatek,

[a los] modos de comunicación, que se miden en categorías de pragmática universal y


que sirven para identificar los rasgos universales propios de cada constelación discursiva,
corresponden en el plano histórico las llamadas tradiciones discursivas. Se trata de mol-
des histórico-normativos, socialmente establecidos[,] que se respetan en la producción del
discurso. A través de estas categorías, cada discurso, y de ahí cada texto histórico, no sólo
forma parte de una lengua determinada (o de varias lenguas) sino que se sitúa dentro de una
filiación intertextual, constituida por una serie de elementos repetitivos, tanto en el plano
de los “entornos” (constelaciones situacionales, mediales o institucionales) como en el plano
de las formas detectables en la superficie del texto mismo (p. ej,. pasajes textuales concretos,
carácter formulario, construcción, lengua).
(Jacob y Kabatek 2001, viii)

En consonancia con esta definición está la postura que expresa Pons Rodríguez en las conclu-
siones de uno de sus primeros trabajos sobre TD, y que podemos hacer extensiva a todos los
hispanistas que aplican esta noción a sus investigaciones.8 De acuerdo con esta autora, desde la
perspectiva del historiador de la lengua (medieval, en su caso concreto),

[d]e nada sirve una clasificación histórica de los textos [...] que los descomponga en cate-
gorías herméticas o discretas; tampoco nos valen concepciones de los discursos como cons-
tructos monotípicos. Si queremos dar cuenta de la relación de la textualidad medieval con
el código que le da cuerpo, tenemos que buscar una teoría de la clasificación textual que
considere los rasgos lingüísticos y su relación con las condiciones de enunciación, que con-
temple los discursos como acontecimientos, como objetos sociohistóricos, que considere
la relación entre cambios en la historia social y cambios en los tipos de discursos. Esa es la
visión que está en la base de la teoría de las TD, que exige la puesta en marcha de mecanis-
mos de relación con otros componentes del discurso debidos también al modelo textual
elegido y determinados por la realidad social o institucional, y, en consecuencia, susceptibles
de ser modificados o alterados por cualquier cambio de esos parámetros.
(Pons Rodríguez 2006a, 78)

En este estudio, la autora ofrece también pistas sobre otros motivos adicionales que han condu-
cido a la extraordinaria difusión de la noción de TD entre los historiadores de la lengua española.
Por un lado, en su opinión, los trabajos pioneros sobre TD vinieron a cubrir el hueco, denun-
ciado por Marimón Llorca (2005, 1022), que suponía “la casi total ausencia de estudios histó-
ricos en la investigación sobre tipos de textos”: no extraña, pues, que cuando Pons Rodríguez
(2006a, 70) se refiere a la escasez de categorizaciones textuales aplicadas a la diacronía mencione
como excepción la clasificación de muestras de escrituralización en lenguas románicas hecha,
precisamente, por Koch (1993). Por otro lado, en la acogida del marbete TD como alternativa a
los de género textual o discursivo desempeñó un papel fundamental el hecho de que los lingüistas
han considerado, de manera general, el término género más bien propio de los estudios literarios.
De hecho, el propio Oesterreicher no tuvo reparos en aclarar que él prefería hablar de TD y no
de géneros textuales o tipos de textos, “[e]n primer lugar, para enfatizar la dinámica interna de
estos modelos discursivos históricos”, pero “en segundo lugar, para evitar la identificación con
una teoría literaria de los géneros” (Oesterreicher 2012, 231–232; cf. también Pons Rodríguez
2006a, 72–73).

80
Tradiciones discursivas e historia lingüística

4. Conclusiones y perspectivas futuras


Enfatizar la naturaleza histórica de las TD como patrones o moldes que los hablantes utilizan
para construir e interpretar discursos; oponerse a una concepción lineal del cambio lingüís-
tico cegada por la ilusión de que los datos extraídos de los corpus reflejen directamente reglas
idiomáticas ajenas a las condiciones discursivo-tradicionales de producción y recepción de los
textos de los que se toman tales datos, así como por la falacia de que los datos procedentes de
discursos cronológicamente sucesivos sean evidencia directa de algún cambio en cuanto a las
reglas idiomáticas; rehuir los “intereses y procedimientos puramente clasificatorios de la llamada
tipología textual” (Oesterreicher 2012, 232) o interpretar las TD como formas prototípicas con-
vencionalizadas en las que han cristalizado ciertos valores de los parámetros de las condiciones de
comunicación que definen la inmediatez y la distancia comunicativas (cf. Koch y Oesterreicher
2007) son los principios fundamentales en que se asienta la corriente de las TD (cf. también
López Serena 2021b). Metodológicamente, estamos ante un paradigma cuya “hipótesis fuerte”
podríamos establecer siguiendo la propuesta de Kabatek, quien sostiene

que la historia de una lengua no presenta solo variación a nivel de dialectos, sociolectos
o estilos sino que la lengua varía también de acuerdo con las tradiciones de los textos, es
decir, que estos no solo añaden sus elementos formales, sus características de género o las
marcas de un tipo determinado de estructuración a los productos de sistemas ya dados sino
que condicionan o pueden condicionar, a su vez, la selección de elementos procedentes de
diferentes sistemas (o de un sistema de sistemas).
(Kabatek 2008, 8–9)

La investigación lingüística histórica sobre TD ha dado sus principales frutos en el ámbito de la


sintaxis histórica,9 en el que se ha recurrido a ella (i) para examinar diferencias lingüísticas entre
textos que se han rehecho sobre algún modelo anterior y han modificado, al mismo tiempo,
la TD original (cf. Pons Rodríguez 2006b; Octavio de Toledo 2017), (ii) para analizar si algún
cambio lingüístico en particular, o bien la conservación de algún fenómeno pasado, están deter-
minados por aspectos discursivo-tradicionales (cf. Octavio de Toledo 2014) y (iii) para describir
los cambios experimentados por algunos tipos textuales (cf. también el cap. 21), como hace
Guzmán Riverón (2006) al estudiar ciertas TD documentales del español del Caribe o Pons
Rodríguez (2007) al apuntar que la paulatina implantación de el cual en castellano supuso

un ejemplo de progreso en la elaboración lingüística intensiva del idioma [...] a la búsqueda


de una mayor distancia comunicativa [...], un cambio desde arriba [...] cuyo factor agente
estuvo en el intento de elaboración en romance de una nueva lengua del derecho (fueros,
Partidas) y que traspasó la tradición discursiva que lo adoptó desde la esfera jurídica latina.
(Pons Rodríguez 2007, 297)10

Aunque no de forma tan sistemática como sobre sintaxis, también se ha investigado en algunas
ocasiones sobre TD y léxico (sobre todo en relación con la selección léxica que se opera en los
textos: cf. p. ej,. Dworkin 201). Es de esperar que en futuras investigaciones aumente la consi-
deración de los cambios léxicos desde la perspectiva de su carácter discursivo-tradicional.

Notas
1 Los contenidos de este epígrafe sintetizan parcialmente lo que se expone, de manera más extensa y
pormenorizada, en López Serena (2021a).

81
Araceli López Serena

2 Las traducciones de todas las citas cuyos textos originales no están en español son mías.
3 La oposición entre las aproximaciones a las TD que adoptan un enfoque de materia y las que abrazan,
más bien, un enfoque de objeto de estudio está basada en la distinción epistemológica entre materia y
objeto de estudio (cf. Fernández Pérez 1993; López Serena 2021a). Materia es la realidad fenoménica,
heterogénea y compleja, que se da en todas las manifestaciones lingüísticas, a partir de las cuales los
lingüistas delimitamos y perfilamos objetos de estudio específicos en virtud de determinados criterios e
intereses de investigación, sometiendo la materia de estudio a procesos de abstracción, modelización e
interpretación a través de los cuales esta deja de ser realidad fenoménica y se torna constructo teórico.
4 Nótese, sin embargo, que, como todas las distinciones terminológicas, la oposición entre materia y
objeto de estudio y su correlación con la teorización y la descripción lingüísticas, respectivamente,
incurren en una simplificación sobre la que es preciso advertir, toda vez que tampoco la descripción
existe al margen de categorías teóricas.
5 No es posible profundizar aquí en la falta de acuerdo, dentro de este paradigma teórico, sobre el lugar
que las TD deben ocupar en los tres niveles de abstracción del lenguaje presentados, pero conviene
advertir, al menos, sobre el hecho de que mientras Koch (1987, 1997, 2008) y Oesterreicher (1997) las
sitúan en el nivel histórico, Kabatek (2005b, 2015, 2018) y Lebsanft (2005, 2006) prefieren ubicarlas
en el nivel individual. En la postura de Koch y Oesterreicher es determinante el hecho de que, en la
lingüística de las variedades de filiación coseriana, el término histórico está relacionado con el carácter
universal de la historicidad del lenguaje (cf. Coseriu 1978); para Koch, así, “[a]tribuir al discurso, como
nivel genuinamente actual del lenguaje, [...] un saber acerca de reglas sería una contradicción intrínseca,
puesto que las reglas entrañan tipificaciones y no pueden ser empleadas una única vez” (Koch 1987, 31;
traducción mía), por lo que “[e]n la medida en que se trata de un saber profundamente impregnado
de historicidad, el saber expresivo pertenece al mismo nivel que el saber idiomático” (Koch 1987,
31; traducción mía). Para Kabatek, sin embargo, tiene más peso la distinción entre primera y segunda
historicidad: a su modo de ver, la historicidad propia de las lenguas (primera historicidad) es muy distinta
de la historicidad de segundo orden que caracteriza a las TD, pues “los fenómenos tradicionales [...] no se
relacionan entre sí como técnicas, sino como productos, como ocurrencias individuales” (Kabatek 2015,
59; traducción mía), de modo que “esta segunda historicidad es limitada, pues se refiere a los textos ya
producidos en una comunidad, al acervo cultural, la memoria textual o discursiva” (Kabatek 2008, 9; cf.
también Kabatek 2018, 15 y 24). Sobre esta distinción, cf. ahora López Serena (2023).
6 En efecto, como ya advertía Coseriu (2007, 133), “las reglas del nivel de las lenguas pueden quedar en
suspenso en el texto, es decir, pueden dejar de aplicarse por la configuración tradicional del texto o por
alguna motivación que se encuentre en el texto mismo”.
7 Cf. en el mismo sentido Oesterreicher (2008, 241).
8 En el rechazo de la consideración de constructos monotípicos insisten también Guzmán Riverón
(2006, 87) y Kabatek (2018, cap. 7).
9 Cf., p. ej., los trabajos contenidos en Kabatek (2008) o los mencionados por Cano Aguilar (cap. 21).
10 En una línea semejante, Pons Rodríguez (2010, 82) analiza “cómo varían el prestigio y la marcación
de los adverbios originalmente bajolatinos inclusive, exclusive y respective a partir de que trascienden sus
tradiciones discursivas y su lengua particular de partida”, concluyendo que “[e]l modelo lingüístico del
latín técnico-jurídico fue, sin duda, un estímulo para que se produjeran trasvases entre similares tradi-
ciones discursivas (TD) de lenguas distintas”.

Lecturas recomendadas
De los trabajos contenidos en Kabatek (2018), volumen compilatorio de contribuciones que el autor
había publicado en forma de artículos dispersos en varios sitios y lenguas distintas, se recomiendan
especialmente los capítulos 6 a 11, en los que se abordan, respectivamente, la rentabilidad de las
TD en los “nuevos rumbos” adoptados por la “sintaxis histórica”, el problema de cómo confec-
cionar corpus lingüísticos diacrónicos representativos (cap. 7), el papel que las TD desempeñan
en el estudio del cambio lingüístico (cap. 8), la delimitación entre TD y géneros (cap. 10) o la
categorización y tipología de las TD (cap. 11).
Los trabajos recogidos en Kabatek (2008) interesan, especialmente, por dos motivos (cf. también la
reseña de Narbona Jiménez 2009): porque ilustran el tipo de aproximación a la sintaxis histórica
que prima en el paradigma de las TD y porque contienen la única publicación originalmente en

82
Tradiciones discursivas e historia lingüística

español que dedicó Peter Koch a presentar su visión de las TD, que ejemplifica con la historia de
la forma de tratamiento vuestra merced.
Tres trabajos recientes de López Serena (2021a, 2021b y 2023) forman una tripla complementaria.
El primero aplica al estudio de las TD la diferencia entre el enfoque de materia y el de objeto de
estudio. Atendiendo a la definición de las TD desde su consideración como materia de estudio,
la autora se pregunta si es posible o necesario diferenciar las TD en sentido estrecho, concebidas
como objetos de estudio, de categorías como género, registro, estilo y perfil concepcional.
Finalmente, se denuncia cierto uso “inf lacionario” del término TD en los estudios de historia de
la lengua española de la última década. El segundo analiza la recepción del concepto de TD en la
investigación lingüística hispánica y brasileña. En sus páginas se ponen de relieve los principios,
métodos y orientaciones en que se han sustentado los acercamientos a este enfoque de análisis
que han tenido lugar en España, Hispanoamérica y Brasil. Su lectura puede ser de utilidad tanto
para quienes deseen informarse sobre las principales referencias que cabe destacar, en los ámbitos
geográficos señalados, en relación con el paradigma de las TD, como, sobre todo, para quienes
quieran formarse una idea acerca de los pilares metodológicos sobre los que se erige esta corriente
de la lingüística histórica. El tercer trabajo reconstruye el porqué de la necesaria adscripción de las
TD al nivel individual del lenguaje, tal y como lo concibe Coseriu.

Bibliografía citada
Company, C. 2008. “Gramaticalización, género discursivo y otras variables en la difusión del cambio sin-
táctico”. En Sintaxis histórica del español y cambio lingüístico: nuevas perspectivas desde las tradiciones discursivas,
ed. J. Kabatek, 17–51. Madrid y Fráncfort: Iberoamericana y Vervuert.
Coseriu, E. 1957 [1988]. Sincronía, diacronía e historia. El problema del cambio lingüístico. Madrid: Gredos.
Coseriu, E. 1978. Los universales lingüísticos y los otros, trad. C. Parodi. México: Instituto de Investigaciones
Filológicas. [Link].
Coseriu, E. 2007. Lingüística del texto. Introducción a la hermenéutica del sentido, ed. Ó. Loureda Lamas. Madrid:
Arco Libros.
Coseriu, E. 2019. Competencia lingüística y criterios de corrección, ed. A. Matus y J. L. Samaniego. Sevilla:
Editorial Universidad de Sevilla.
Dworkin, Steven N. 2011. “La variación y el cambio léxico: algunas consideraciones”. En Así se van las
lenguas variando: nuevas tendencias en la investigación del cambio lingüístico en español, eds. Mónica Castillo
Lluch y L. Pons, 155–169. Madrid y Fráncfort: Iberoamericana Vervuert.
Fernández Pérez, M. 1993. “Sociolingüística y lingüística”. Lingüística Española Actual 15: 149–248.
Frank, B., T. Haye y D. Tophinke, eds. 1997. Gattungen mittelalterlicher Schriftlichkeit. Tubinga: Narr.
Guzmán Riverón, M. 2006. “Tradiciones discursivas e historia de la lengua española en América”. En
Cuatrocientos años de la lengua del Quijote. Estudios de historiografía e historia de la lengua española, eds. M.
Fernández Alcaide y A. López Serena, 79–87. Sevilla: Universidad de Sevilla.
Jacob, D. y J. Kabatek, eds. 2001. Lengua medieval y tradiciones discursivas en la península Ibérica. Descripción
gramatical, pragmática histórica, metodología. Madrid y Fráncfort: Iberoamericana y Vervuert.
Kabatek, J. 2001. “¿Cómo investigar las tradiciones discursivas medievales? El ejemplo de los textos jurídi-
cos castellanos”. En Lengua medieval y tradiciones discursivas en la Península Ibérica. Descripción gramatical,
pragmática histórica, metodología, eds. D. Jacob y J. Kabatek, 97–132. Madrid y Fráncfort: Iberoamericana
y Vervuert.
Kabatek, J. 2005a. “Tradiciones discursivas y cambio lingüístico”. Lexis 29: 151–177.
Kabatek, J. 2005b. “Sobre a historicidade de textos”, trad. J. Simões. Linha d’Água 17: 159–170.
Kabatek, J. 2008. “Introducción”. En Sintaxis histórica del español y cambio lingüístico: Nuevas perspectivas desde
las tradiciones discursivas, ed. J. Kabatek, 7–16. Madrid y Fráncfort: Iberoamericana y Vervuert.
Kabatek, J. 2012. “Nuevos rumbos en la sintaxis histórica”. En Actas del VIII Congreso Internacional de
Historia de la Lengua Española, ed. E. Montero Cartelle, vol. 1, 77–100. Santiago de Compostela:
Meubook.
Kabatek, J. 2015. “Warum die ‘zweite Historizität’ eben doch die zweite ist – von der Bedeutung von
Diskurstraditionen für die Sprachbetrachtung”. En Diskurse, Texte, Traditionen: Modelle und Fachkulturen
in der Diskussion, eds. F. Lebsanft y A. Schrott, 49–62. Gotinga: Bonn University Press y Vandenhoeck
& Ruprecht.

83
Araceli López Serena

Kabatek, J. 2018. Lingüística coseriana, lingüística histórica, tradiciones discursivas. Madrid y Fráncfort: Iberoame-
ricana y Vervuert.
Koch, P. 1987. Distanz im Dictamen. Zur Schriftlichkeit und Pragmatik mittelalterlicher Brief- und Redemodelle in
Italien. Tesis de habilitación. Friburgo: Albert-Ludwigs-Universität Freiburg.
Koch, P. 1993. “Pour une typologie conceptionelle et médiale des plus anciens documents/monuments
des langues romanes”. En Le passage à l’écrit des langues romanes, eds. M. Selig, B. Frank y J. Hartmann,
39–81. Tubinga: Narr.
Koch, P. 1997. “Diskurstraditionen: zu ihrem sprachtheoretischen Status und ihrer Dynamik”. En Gattun-
gen mittelalterlicher Schriftlichkeit, eds. B. Frank, T. Haye y D. Tophinke, 43–79. Tubinga: Narr.
Koch, P. 2008. “Tradiciones discursivas y cambio lingüístico: el ejemplo del tratamiento vuestra merced en
español”. En Sintaxis histórica del español y cambio lingüístico: nuevas perspectivas desde las tradiciones discursi-
vas, ed. J. Kabatek, 53–87. Madrid y Fráncfort: Iberoamericana y Vervuert.
Koch, P. y W. Oesterreicher. 2007. Lengua hablada en la Romania: español, francés, italiano, trad. de A. López
Serena. Madrid: Gredos.
Lebsanft, F. 2005. “Kommunikationsprinzipien, Texttraditionen, Geschichte”. En Historische Pragmatik und
historische Varietätenlinguistik in den romanischen Sprachen, eds. A. Schrott y H. Völker, 25–43. Gotinga:
Universitätsverlag Göttingen.
Lebsanft, F. 2006. “Sprecher zwischen Tradition und Innovation: Zum Problem von ‘Diskurstraditionen’
und ‘Diskursgemeinschaften’ am Beispiel der Sprache der Politik”. Zeitschrift für Romanische Philologie
122: 531–548.
López Serena, A. 2011. “La doble determinación del nivel histórico en el saber expresivo. Hacia una nueva
delimitación del concepto de tradición discursiva”. Romanistisches Jahrbuch 62: 59–97.
López Serena, A. 2013. “Variación y variedades lingüísticas: un modelo teórico dinámico para abordar
el estatus de los fenómenos del español hablado en Andalucía”. En Conciencia y valoración del habla
andaluza, ed. A. Narbona, 73–127. Sevilla: UNIA.
López Serena, A. 2021a. “La tradicionalidad discursiva como materia y las tradiciones discursivas como objeto
de estudio”. Verba 48 [en línea]. [Link]
López Serena, A. 2021b. “Tradiciones discursivas, historia de la lengua española e historia del portugués brasileño.
Fundamentos teóricos, principios metodológicos y aproximaciones descriptivas”. Lexis 45: 483–553.
López Serena, A. 2023. “Entre lo individual y lo histórico. El lugar de las tradiciones discursivas en la
tripartición coseriana del lenguaje”, Boletín de Filología de la Universidad de Chile 58 (1), en prensa.
Marimón Llorca, C. 2005. “La investigación histórica sobre tipos de textos en español: problemáticas y
perspectivas”. En Actas del IV Congreso Internacional de la SEHL, ed. C. Corrales, 1021–1032. Madrid:
Arco Libros.
Narbona Jiménez, A. 2009. “Reseña de Johannes Kabatek, ed. Sintaxis histórica del español y cambio
lingüístico: nuevas perspectivas desde las tradiciones discursivas”. Revista de Historia de la Lengua Española
4: 79–87.
Octavio de Toledo, Á. 2014. “Entre gramaticalización, estructura informativa y tradiciones discursivas:
algo más sobre nada”. En Procesos de gramaticalización en la historia del español, eds. J. L. Girón y D. Sáez,
263–319. Madrid y Fráncfort: Iberoamericana Vervuert.
Octavio de Toledo, Á. 2017. “Juan de Mena como traductor: aspectos lingüísticos del Omero romançado”.
En Romanische Sprachgeschichte und Übersetzung, eds. H. Aschenberg y S. Dessì-Schmidt, 53–114. Hei-
delberg: Winter.
Octavio de Toledo, Á. 2018. “¿Tradiciones discursivas o tradicionalidad? ¿Gramaticalización o sintactización?
Difusión y declive de las construcciones modales con infinitivo antepuesto”. En Procesos de textualización
y gramaticalización en la historia del español, eds. J. L. Girón, F. J. Herrero y D. M. Sáez Rivera, 79–134.
Madrid y Fráncfort: Iberoamericana Vervuert.
Oesterreicher, W. 1997. “Zur Fundierung von Diskurstraditionen”. En Gattungen mittelalterlicher Schrift-
lichkeit, eds. B. Frank, T. Haye y D. Tophinke. Tubinga: Narr, 19–41.
Oesterreicher, W. 2001. “Historizität – Sprachvariation, Sprachverschiedenheit, Sprachwandel”. En Lan-
guage Typology and Language Universals, eds. M. Haspelmath et al., vol. 2, 1554–1595. Berlín y Nueva
York: De Gruyter.
Oesterreicher, W. 2003. “Autonomización del texto y recontextualización. Dos problemas fundamentales
en las ciencias del texto”. En Homenaje a Luis Jaime Cisneros, ed. E. Hopkins, 343–387. Lima: Pontificia
Universidad Católica del Perú.
Oesterreicher, W. 2008. “Dinámicas de estructuras actanciales en el Siglo de Oro: el ejemplo del verbo
encabalgar”. En Sintaxis histórica del español y cambio lingüístico: nuevas perspectivas desde las tradiciones discur-
sivas, ed. J. Kabatek, 225–248. Madrid y Fráncfort: Iberoamericana y Vervuert.

84
Tradiciones discursivas e historia lingüística

Oesterreicher, W. 2012. “Innovación y cambio gramatical: formulaciones ad hoc, difusión de innovaciones


y formas del cambio lingüístico”. En Actas del VIII Congreso Internacional de Historia de la Lengua Española,
ed. E. Montero, vol. 1, 228–246. Madrid: Meubook.
Pons Rodríguez, L. 2006a. “Retórica y tradiciones discursivas”. En Cuatrocientos años de la lengua del Qui-
jote. Estudios de historiografía e historia de la lengua española, eds. M. Fernández Alcaide y A. López Serena,
67–78. Sevilla: Universidad de Sevilla.
Pons Rodríguez, L. 2006b. “Una reflexión sobre el cambio lingüístico en el siglo XV”. En Actas del V
Congreso Andaluz de Lingüística General. Homenaje al profesor José Andrés de Molina Redondo, ed. J. de D.
Luque, vol. 3, 1563–1577. Granada: Granada Lingvistica.
Pons Rodríguez, L. 2007. “La qual çibdad: las relativas con antecedente adjunto del siglo XIII a hoy: evolu-
ción de un procedimiento cohesivo”. Romanistisches Jahrbuch 58: 275–305.
Pons Rodríguez, L. 2010. “La elaboración léxica desde modelos latinos: tres estudios de caso en el caste-
llano medieval (inclusive, exclusive, respective)”. En Modelos latinos en la Castilla medieval, eds. M. Castillo
Lluch y M. López Izquierdo, 81–111. Madrid y Fráncfort: Iberoamericana y Vervuert.
Sáez Rivera, D. M. 2006. “Tradiciones discursivas, historiografía lingüística e historia de la lengua”. En
Cuatrocientos años de la lengua del Quijote. Estudios de historiografía e historia de la lengua española, eds. M.
Fernández Alcaide y A. López Serena, 89–103. Sevilla: Universidad de Sevilla.
Schlieben-Lange, B. 1983. Traditionen des Sprechens: Elemente einer pragmatischen Sprachgeschichtsschreibung.
Stuttgart: W. Kohlhammer.

85
8
Oralidad y escrituralidad
(Orality and writing)
Silvia Iglesias Recuero y Eugenio Bustos Gisbert

1. Introducción
En este capítulo se analiza la importancia de la distinción entre oralidad y escritura en el estu-
dio de la evolución histórica del español. En primer lugar, se aborda la propia definición de tal
dicotomía, especialmente a raíz de la publicación de la obra de Koch y Oesterreicher (1990),
que define un espacio variacional de carácter gradual entre ambas categorías. En segundo lugar,
se examina su aplicación al estudio de nuestra lengua en tres grandes ámbitos: los textos de
impronta oral, la organización textual y los mecanismos de oralidad especialmente sintácti-
co-discursivos presentes en los testimonios escritos (teniendo en cuenta también el problema de
la “oralidad fingida”), y el desarrollo de los conectores discursivos y otros mecanismos de cone-
xión textual. Por último, se señalan las limitaciones y carencias de los estudios realizados, toda
vez que se sugieren nuevas perspectivas y aplicaciones del concepto de oralidad/escrituralidad,
en relación con los condicionamientos discursivos y retóricos de los textos, su interacción con
las diferentes tradiciones discursivas (TD), la existencia de otros mecanismos de expresión de la
oralidad y su papel en la configuración de las normas del español, especialmente en el caso de
las variedades americanas.
Palabras clave: oralidad; escrituralidad; lingüística histórica; historia del español; variación
lingüística

This chapter analyzes the importance of the distinction between speech and writing in the
study of the historical evolution of Spanish. It first deals with the definition of this dichotomy,
especially in the light of Koch and Oesterreicher’s (1990) work, which delimits a gradual space
of variation between both categories. Secondly, it studies the application to the study of our
language in three main areas: the texts with oral characteristics, the textual organization and the
mechanisms of orality, especially syntactic-discursive, present in written testimonies (also taking
into account the problem of “feigned orality”) and the development of discursive connectors
and other mechanisms of textual connection. Finally, it points out the limitations and shortco-
mings of current studies, while proposing at the same time new perspectives and applications
of the concept of orality/writing to the discursive and rhetorical conditioning of the texts,
their interaction with the different discursive traditions, the existence of other mechanisms of

86 DOI: 10.4324/9781003035565-10
Oralidad y escrituralidad

expression of orality and their role in the configuration of the norms of Spanish, especially in
the case of the American varieties.
Keywords: orality; writing; historical linguistics; history of Spanish language; historical variation

2. Aproximaciones teóricas
Son muy numerosos los estudios que se han hecho sobre las diferencias entre oralidad y escri-
turalidad y sus relaciones. Desde la perspectiva diacrónica, que es la que importa aquí, se han
planteado una serie de cuestiones:

1 ¿Podemos aplicar el principio sociolingüístico del uniformismo y suponer diferencias simi-


lares entre las variedades típicas de la interacción conversacional y de la escritura formal a lo
largo de la historia del español?
2 ¿Qué relaciones ha habido entre oralidad y escrituralidad a lo largo de la historia del espa-
ñol? ¿Hay épocas más permeables al reflejo de lo oral en lo escrito que otras?
3 ¿Es posible reconstruir al menos algunos elementos típicos de la oralidad de épocas pasadas?
Y, si es así, ¿qué elementos?
4 ¿Qué documentación podría ser más adecuada para esta búsqueda? ¿Cómo debe usarse: con
qué precauciones y teniendo en cuenta qué factores de su naturaleza discursiva?
5 ¿En qué forma se conecta la variación concepcional con la existencia de diferentes TD
desde su historicidad?
6 ¿Cómo cambiaría nuestra interpretación de la historia de nuestro idioma el reconocimiento
del espacio variacional?

Descartada la visión ingenua de la lengua escrita como mera representación de la lengua oral,
los primeros acercamientos al problema de la variación oralidad y escrituralidad en la investi-
gación diacrónica aceptaron la visión normativa habitual en las descripciones tradicionales (nor-
malmente centradas en el léxico y la fonética) de la variedad “coloquial”: la lengua hablada se
hacía corresponder con registros sociales bajos y estilísticamente descuidados. De esta manera,
los fenómenos típicamente adscritos a la oralidad eran aquellos “subnormativos”, alejados de
la “lengua ejemplar”, que se identificaba con la escritura preferentemente literaria, y se solían
atribuir al habla de personas incultas o de baja extracción social.
Esta concepción ha dado lugar a situaciones que pueden parecer paradójicas (Oesterreicher
1996): por un lado, sobre todo para los niveles fónico, (morfo)fonológico y léxico, los investi-
gadores recurrían a documentación no literaria (documentos jurídicos en su mayoría), puesto
que se consideraba que tales textos escapaban a las normas de la escritura cuidada, y, por tanto,
reflejaban mejor los usos orales vulgares que testimoniaban los cambios; ejemplos palmarios
de esta concepción son Orígenes del español de Menéndez Pidal (1926); por otro lado, una vez
pasadas las etapas iniciales de formación de las lenguas y variedades románicas, la historia de las
lenguas nacionales se “limitaba principalmente a la descripción de sus grandes obras literarias”
(Eberenz 1998, 243), y todas las demás variedades (con excepción de los dialectos “históricos”)
quedaban olvidadas (Menéndez Pidal 2005; Lapesa 1981). Esta tradición se continúa en obras
muy posteriores en las que lo que se busca es rastrear la pervivencia de variedades de los dialectos
primarios o secundarios en textos escritos en castellano (Sánchez Méndez 2012).
Posteriormente, desde supuestos teóricos aparentemente no normativos, teorías lingüísticas
como el estructuralismo, el generativismo e incluso el cognitivismo han mantenido una concep-
ción “escriptista” o “escriturista” de la lengua, lo que ha continuado el enfoque no variacionista

87
Silvia Iglesias Recuero y Eugenio Bustos Gisbert

en las descripciones de los cambios lingüísticos y en la elaboración de las historias externas e


internas de las lenguas (Oesterreicher 2006; Kabatek 2006; Garatea Grau 2016). Esta resistencia
de la lingüística histórica a adoptar una orientación decididamente variacional limita de manera
grave la comprensión global de los procesos de cambio, pues ignora aspectos funcionales, prag-
máticos y sociolingüísticos decisivos en tales procesos y distorsiona la realidad del funciona-
miento de la lengua a lo largo de la historia.
Sin embargo, en las últimas tres décadas el binomio oralidad-escrituralidad ha entrado de lleno
en los enfoques variacionales y se ha empleado en los estudios de lingüística —y de lingüística
histórica— de manera preferente para hacer referencia a diferencias discursivas y lingüísticas en
el uso de la lengua en distintas situaciones comunicativas. Estas diferencias en la organización y
la formulación lingüística de los enunciados se han catalogado de concepcionales en el enfoque de
Koch y Osterreicher (1990 [2007]), el más influyente en el ámbito del español; su concepción
está cercana, aunque no coincide exactamente, con la de modalidades lingüísticas o registros (Biber y
Conrad 2009), o la de variedades diafásicas o de estilos contextuales en la sociolingüística cuantitativa
(Labov 1994, 157).
No hay que confundir este modelo variacional de los términos oralidad (oral) y escrituralidad
con las distinciones puramente mediales, es decir, las que se establecen en función del medio o
canal de transmisión de un mensaje, y que dan lugar a una dicotomía estricta “escrito o gráfico”
vs. “hablado o fónico”, que no permite posibilidades intermedias.
La distinción concepcional, a diferencia de la medial, no es de naturaleza dicotómica, sino
gradual entre dos polos —oralidad y escrituralidad— que representan concepciones prototípicas
de variedades lingüísticas como sendos conjuntos de fenómenos caracterizadores de la actividad
y de los productos discursivos propios de situaciones de comunicación muy diferentes, también
descritas prototípicamente: la inmediatez y la distancia comunicativas (Koch y Oesterreicher 1990
[2007]), o la informalidad o la formalidad (Labov 1994) o lo coloquial o lo formal (Briz 2010) de la
situación.
Esta concepción socio-discursiva de la oralidad y la escrituralidad permite liberar a los fenó-
menos propios de las variedades o registros orales de la estigmatización normativa tradicional,
por una parte, y de las descripciones “im-/expresionistas” habituales, por otra, puesto que, en
tanto que recursos propios de ciertos géneros y situaciones comunicativas y adaptados a las nece-
sidades y condiciones de las mismas, entran a formar parte del espacio variacional del español
—junto con las variedades geográficas, sociales y de registro/estilo— y se convierten en objeto
de estudio sincrónico y diacrónico.
Por otra parte, es evidente que esta visión variacional de la oralidad-escrituralidad conecta natu-
ral y necesariamente con otra perspectiva recientemente introducida en los estudios diacróni-
cos: el de los géneros y las TD (López Serena 2012), dado que los géneros, en cuanto formas de
organización de la actividad discursiva asociadas a tipos de actividades o situaciones comunicativas,
pueden ser situados, prototípicamente también, a lo largo del continuo inmediatez-distancia y
vincularse con distintas variedades concepcionales.
Surge así un programa de investigación de la diacronía que se propone como objetivo ideal
incorporar a la historia del español, en sus dimensiones interna y externa, todas sus variedades:
geográficas, sociales, estilísticas o de registro y concepcionales. Asumir este enfoque conduce a
cambios radicales tanto en los objetos de investigación como en la manera de plantear esta. Con
respecto a lo primero, se da cabida a fenómenos excluidos previamente por “incorrectos”, fruto
de “errores de actuación” o de la incapacidad lingüística de los hablantes (anacolutos, repeti-
ciones, enunciados suspendidos, etc.); se traen a primer plano aspectos hasta ahora olvidados
de la construcción de enunciados y de textos por estar vinculados a la construcción discursiva:
estructura informativa, conexiones interoracionales, elipsis, etc.; en relación con esto último,

88
Oralidad y escrituralidad

se convierte en objeto de investigación (la historia de) la organización y el desarrollo textuales


en géneros pertenecientes tanto a la órbita de la oralidad como de la escrituralidad. En lo que
concierne al modo de plantear la investigación, se pretende la adscripción y descripción de los
procesos de cambio dentro del espacio variacional: dónde y cómo nace un determinado fenó-
meno, cómo y dónde se difunde, cómo cambia, si es que lo hace, su perfil variacional, etc.

3. Perspectivas actuales
A continuación, trataremos los dos aspectos más relevantes en la investigación histórica de la
oralidad y la escritura. El primero atañe a la selección de las fuentes documentales; el segundo, a
la determinación de fenómenos propios de la oralidad.

3.1 Fuentes documentales


La publicación del libro de Koch y Oesterreicher (1990 [2007]) supuso un cambio para los estu-
dios de historia de la lengua española (y también de las restantes lenguas románicas); si la tradi-
ción filológica española se había interesado especialmente por la época medieval, la investigación
ahora se centraba en los textos producidos a partir del quinientos, pues era en ellos en los que
mejor se podía rastrear la presencia de lo oral en lo escrito (Oesterreicher 1996, 2004), ya que
el aumento de la producción textual que implicó el establecimiento de la imprenta en España
permitía una comparación más ajustada de diferentes universos textuales. Llama la atención, sin
embargo, que el universo textual analizado se haya centrado esencialmente a los siglos XVI y
XVII y que sea mucho menos, comparativamente, lo que sabemos de épocas posteriores (García
Godoy (2012); López Serena et al. (2020); Octavio de Toledo y Sáez Rivera (2020), para el espa-
ñol moderno). Para ello se ha hecho necesario ampliar el tipo de documentación empleada; se
incorporan así cartas privadas, géneros no literarios de la vida cotidiana como manuales médicos,
o recetarios, etc.
Sin embargo, la documentación no facilita estas tareas, ya que solo contamos con textos
escritos, y, aunque se suele afirmar que la distinción concepcional oralidad-escrituralidad es
teóricamente independiente de la dicotomía medial fónico-gráfico, es obvio no solo que “la
inmediatez comunicativa presenta una afinidad con la realización fónica pasajera y lo escrito, o
la distancia comunicativa, a su vez con la realización gráfica perdurable” (Oesterreicher 1996,
319), sino que la presencia de buena parte de fenómenos característicos de cada uno de los
extremos de la escala —como, por ejemplo, los titubeos y repeticiones o la condensación
informativa en SSNN muy complejos— están condicionados por factores psicolingüísticos
(planificación-producción-recepción-interpretación cuasi-simultáneas y en tiempo real o
diferidas y distanciadas) y sociopragmáticos (interactividad, complicidad o connivencia, contexto
compartido) de las situaciones de inmediatez y distancia comunicativas.
No obstante, estas dificultades, y dado el carácter gradual de la distinción oralidad-inme-
diatez y escrituralidad-distancia, hay textos (e incluso géneros discursivos) que podrían ser más
proclives a admitir ese tipo de variación estilística o concepcional. Por ello, en esa búsqueda de
los disiecta membra de la oralidad pasada se suele acudir con preferencia a determinadas fuentes,
que siguiendo a Del Rey Quesada (En prensa), se pueden dividir, grosso modo, en dos grandes
categorías:
En primer lugar, textos “escritos de impronta oral” que “bien por el perfil sociolingüístico
del emisor, bien por la naturaleza discursiva del texto, son susceptibles de incorporar rasgos
(aparentemente) auténticos asociados a la inmediatez comunicativa” (Del Rey Quesada, En
prensa); así, contamos con crónicas y otras narraciones de autores “semicultos” (Oesterreicher

89
Silvia Iglesias Recuero y Eugenio Bustos Gisbert

1994, 1996, 2004; Stoll 1998; Schmidt-Riese 2003) que presentan una doble ventaja: están
escritos (o dictados) por personas que carecen de una formación que les permita dominar el
registro escrito, por lo que no se trata de una “oralidad fingida”. Por otro lado, la existencia de
textos de un contenido similar, pero escritos por autores de una mayor competencia escritural
(Bernal Díaz del Castillo, Fernández de Oviedo, López de Gómara, etc.), permite evaluar de
forma más objetiva y no circular la presencia de la oralidad en esas crónicas (Stoll 1998). Además,
disponemos de cartas escritas por personas con un nivel medio o incluso bajo de competencia
escrita (Cano Aguilar1996; Fernández Alcaide 2009), aunque estas plantean el problema de la
mediación de los escribanos en el proceso de redacción. Y de las actas de procesos judiciales
de diverso tipo (penales, civiles o inquisitoriales) en que haya quedado registrada con aparente
fiabilidad la producción oral de algunos de los implicados en las transcripciones de las respuestas
a los interrogatorios o los testimonios de testigos y acusados, si bien estos documentos son de
una fiabilidad discutible pues pertenecen a una TD eminentemente escrita (Cano Aguilar 1998;
Eberenz 1998; Calderón Campos y Vaamonde 2020, entre otros). Que sepamos, no se han
tenido tanto en cuenta otros tipos de documentos que pueden reflejar la oralidad, como son los
censos, encuestas y relaciones que se hicieron en América del siglo XVI al XVIII.
El segundo gran tipo de fuentes son las obras literarias pertenecientes a géneros y subgéneros
(diálogo, teatro, novela, etc.) en los que se produce una mímesis de la oralidad o una oralidad
simulada, esto es, una representación literaria de interacciones dialógicas entre varios personajes.
Ahora bien, es fundamental tener siempre presente que esta “mímesis de la oralidad” ofrece, en
realidad, “oralidades elaboradas” (Del Rey Quesada 2019), donde conviven elementos prove-
nientes de distintas variedades —la lengua de la escrituralidad, la lengua estándar o no marcada y
la lengua de la inmediatez comunicativa— en mayor o menor grado, según las normas retóricas
o estilísticas propias de cada época y de cada género o subgénero, que conciben de formas muy
diferentes la “naturalidad dialógica”; intervienen también de manera decisiva las capacidades,
preferencias e intenciones de los propios autores (Bustos Tovar 1998, 2006). De esta manera, no
podemos pensar encontrar la misma “mímesis de la oralidad” en las interacciones dialogales del
Poema del Cid, del Libro de Apolonio, del Quijote o de Fortunata y Jacinta.
A estas dos grandes fuentes debemos añadir los comentarios metalingüísticos —descriptivos
o evaluativos, siempre más parcos de lo que nos gustaría— que ofrecen obras gramaticales, lexi-
cográficas, manuales de pronunciación, etc.

3.2 Lo hablado escrito: los mecanismos


Justamente el segundo foco de interés de los estudios sobre la dicotomía oralidad/escrituralidad
está en determinar cuáles son los mecanismos lingüísticos propios de la oralidad y cómo evolu-
cionan a lo largo de la historia. Podemos distinguir, a este respecto, tres cuestiones diferentes.
En primer lugar, se ha puesto de manifiesto cómo la organización textual es diferente en los
textos orales y los escritos, algo que se corresponde, sin duda, con la menor planificación del
texto oral y, en ocasiones, con un cierto desconocimiento de los procedimientos de organización
de los textos escritos. Son de especial interés en este ámbito los trabajos sobre las crónicas india-
nas realizadas por semicultos en los que se observa cómo la organización de los capítulos resulta
en apariencia caótica y la secuenciación de los contenidos está mediada por la intervención del
narrador que unas veces se nos presenta en primera persona, mientras que en otras se distancia a
una tercera. También en las cartas de emigrantes a Indias (Fernández Alcaide 2009) se observa en
ocasiones una mayor oralidad concepcional, que se revela sobre todo en una menor planificación
de la que se emplearía en un texto más formal, si bien, en este caso, la pertenencia a una TD
típicamente escritural atenúa los rasgos de oralidad presentes en los textos.

90
Oralidad y escrituralidad

En segundo lugar, se han investigado algunos de los mecanismos lingüísticos que caracte-
rizarían los textos o fragmentos orales. Hay que decir, en este sentido, que, en ocasiones (y esto
ya sucede en el trabajo seminal de Koch y Oesterreicher 1990 [2007]), no se distingue bien
la variación concepcional de la diastrática o diafásica, y se tiende a considerar “oral” lo que es
diastráticamente bajo o diafásicamente informal, sin tener en cuenta que existirían tantas orali-
dades como variaciones posibles en cada uno de estos niveles. No tiene por qué ser la misma la
“oralidad” de una persona de grupo sociocultural alto que la de un grupo medio o bajo, que,
además, se pueden encontrar en situaciones comunicativas diferentes. Esa identificación es espe-
cialmente relevante en el caso de los mecanismos de carácter fonético, donde lo oral se identifica
sin duda con subestándar (diatópica o diastráticamente), sin que tal opinión esté, a nuestro juicio,
suficientemente fundada.
Fuera de este ámbito, los mecanismos de oralidad que se han señalado son de naturaleza
esencialmente sintáctica y, siguiendo a Cano Aguilar (2008), son de dos tipos diferentes. Por un
lado, unidades de la lengua general que resultan más habituales en los intercambios comunicati-
vos y el coloquio, como son, por ejemplo, los usos de formas deícticas (pronombres personales
de referencia no siempre clara, señalamientos adverbiales de baja densidad informativa, etc.),
la utilización de vocativos, imperativos e interrogativos, o las expresiones fáticas con que el
hablante condiciona la interpretación del mensaje. Por otro lado, mecanismos específicos de la
oralidad como la concordancia semántica, la configuración agregativa no planificada del discurso
basada en la yuxtaposición y el empleo de la conjunción copulativa; la multifuncionalidad de
determinados conectores, especialmente de que, y, sobre todo, las dislocaciones del orden ora-
cional canónico. A ellos se han añadido otros que tienen que ver con el uso de determinados
mecanismos sintácticos en contextos de variación dialectal como puede ser la alternancia entre
el perfecto simple y compuesto en el español americano (Álvarez 2020).
La distinción de oralidad y escritura ha sido también fructífera para el estudio de los mar-
cadores discursivos (MD), que, a su vez, ha enriquecido la reflexión sobre las relaciones entre
los dos polos o variedades. Se han multiplicado los estudios sobre la formación y evolución de
marcadores y operadores propios de las interacciones orales y del desarrollo de funciones típica-
mente conversacionales en determinados MD; pero también ha surgido la necesidad de refinar
y ampliar las hipótesis sobre los procesos de formación de tales unidades y tener en cuenta las
complejas relaciones entre escritura y oralidad —así como la ubicación de las distintas TD en
el espacio variacional— en el nacimiento y la vida de estas unidades (Iglesias Recuero 2000;
Herrero Ruiz de Loizaga 2020; Pons Rodríguez 2020).

4. Conclusiones y perspectivas futuras


La irrupción de las reflexiones sobre la oralidad y la escrituralidad en la lingüística histórica ha
renovado y difundido el interés de los investigadores por temas que habían quedado relegados
en el estudio histórico, especialmente los relativos a la construcción del discurso, dentro de los
cuales los marcadores han adquirido, como ya hemos señalado, una especial prominencia. Pero
también otros temas “tradicionales” de la investigación histórica están siendo repensados a partir
de esta distinción en conjunción con los géneros y TD: por mencionar solo algunos, podría-
mos hablar de la creación de los relativos compuestos (Girón Alconchel 2012), la duplicación
pronominal del dativo (Becerra Bascuñán 2006), el se “pseudorreflexivo” (Guzmán Riverón
2020), la formación de adverbios en -mente (Company Company 2012), los tratamientos (García
Godoy 2016), o las perífrasis verbales (Blas Arroyo y Porcar Miralles 2016). Aunque de manera
tímida aún, se va aceptando la necesidad de atender no solo a los procesos lingüísticos involu-
crados en el cambio, sino a las condiciones discursivas —textuales y sociopragmáticas: tipos de

91
Silvia Iglesias Recuero y Eugenio Bustos Gisbert

textos, géneros y registros o estilos— en que pudo producirse la innovación y se desplegó su


difusión, pues ambos factores (tradicionalmente llamados internos y externos) se perciben como
inexorablemente imbricados. Convergen así gramática, sociolingüística y pragmática históricas
en la descripción y explicación de los cambios, convergencia defendida, por otra parte, por teo-
rías lingüísticas de naturaleza funcional y cognitiva.
No obstante, no es fácil que la lingüística histórica adopte una perspectiva “macrosintáctica”
(Narbona Jiménez 2012, 2018, 2019) —o discursiva— sociolingüística, cuando los mode-
los teóricos de descripción lingüística no la favorecen, incluso aquellos que sostienen que
“el uso” es el origen de todos los cambios. Esta carencia es tanto más llamativa cuanto más
aparentemente responden los fenómenos objeto de descripción a los procesos de construc-
ción discursiva de los enunciados: temas como la estructura informativa se siguen abordando
mediante enunciados aislados, sin co-textualizarlos ni situarlos variacionalmente, a pesar de
que se utilizan conceptos como topicalidad, foco, informatividad o accesibilidad (p. ej., los
trabajos recogidos en Dufter y Octavio de Toledo 2014; aunque no siempre es así: Octavio de
Toledo 2014). Tampoco es mayoritaria la perspectiva onomasiológica, que permitiría obtener
perspectivas más globales sobre recursos lingüísticos y épocas; esto conduce, por continuar con
el mismo tema del orden de palabras, a seguir hablando de órdenes no canónicos. Quedan
también relegados en el estudio histórico otros temas de “macrosintaxis”, como la anáfora y la
correferencia textuales, los tipos de “elipsis”, etc., aunque algunos de ellos no son desde luego
nuevos y hay trabajos dispersos; asimismo, la expresión de las relaciones de conexión intero-
racional necesita ser colocada en la perspectiva de las TD y de la escala inmediatez-distancia
(p. ej., Cano Aguilar 2014).
Hay otros fenómenos —unidades y construcciones— vinculados prototípicamente a la natu-
raleza interaccional —y, por tanto, oral— del lenguaje que han recibido solo una atención
parcial y que, en nuestra opinión, pueden abrir caminos interesantes de investigación: hay estu-
dios aislados, pero está por hacer la historia de los distintos tipos de enunciados interrogativos
y exclamativos (Iglesias Recuero 2019), los enunciados suspendidos y las construcciones “insu-
bordinadas” (Gras 2010), las “prótasis independientes” o “subordinadas principales” (Garachana
Camarero 2004), la construcción de las respuestas (López Serena 2018), entre otros. Para ello es
necesario recurrir mayoritariamente como fuente documental a los diálogos literarios. Es verdad
que la presencia de “lo conversacional o coloquial” en el diálogo de la escritura será siempre
parcial (Bustos Tovar 2000, 198) y que esta mímesis “se traduce en importar de manera selectiva
formas organizativas del discurso conversacional al dialógico y configuraciones sintácticas sentidas
como relevantes para la obtención exitosa de dicha mímesis” (Cano Aguilar 2016, 143);1 es, asi-
mismo, verdad que la “naturalidad conversacional” reviste distintas formas en distintas épocas y
autores y que su relación con la lengua de la inmediatez es compleja). Pero es también cierto que
es casi con exclusividad en la mímesis literaria de la interacción conversacional donde podemos
encontrar datos para la elaboración de una historia de estas construcciones que no son propias
de la distancia comunicativa.
Hay que ser conscientes de que la reconstrucción total de la oralidad pasada es imposible.
Es más que probable que nunca podamos ofrecer una visión histórica completa de “la pecu-
liar técnica de construir y organizar enunciados” que caracteriza a las variedades empleadas en
la inmediatez comunicativa (Narbona Jiménez 2019, 139). Muchas de tales técnicas —sobre
todo, las categorizadas como “universales” o más estrechamente vinculadas a las condiciones
psicolingüísticas de la producción no planificada, que “se deja ver” según se va emitiendo el
enunciado (repeticiones, falsos comienzos, uso “excesivo” de marcadores como rellenadores de
pausas o estructuradores temáticos: López Serena 2008, § 4.2.1)— han estado estigmatizadas
como “incorrecciones” y expulsadas del reino de la escrituralidad —literaria y no literaria— hasta

92
Oralidad y escrituralidad

época muy reciente, y algunas lo siguen estando aún con excepciones. Sabemos que todo ello
existía por comentarios como el famosísimo de Juan de Valdés acerca de los “bordones”, que
nos descubre el uso de “palabrillas” en forma de marcadores discursivos para rellenar pausas de
búsqueda léxica o de organización sintáctica.
En otros casos, la documentación de los fenómenos es tardía y, aunque podamos sospechar un
origen y una difusión más tempranos en las variedades de la inmediatez, los datos con que con-
tamos solo permiten que permanezcamos en el terreno de las hipótesis sobre esas etapas previas.
Tomemos, por ejemplo, la construcción introductora de discurso directo típica de las narracio-
nes orales va y me dice (Garachana Camarero 2015): la encontramos a fines del XIX en Pereda
con su uso actual, pero ¿desde cuándo se utilizaba? Las normas retóricas que han pesado sobre la
escritura y, por tanto, también sobre la mímesis de la conversación explican por qué es frecuente
documentar solo a partir del XIX unidades o expresiones propias de la oralidad prototípica. Es
verdad que en la investigación no se debe abusar del recurso al “estado latente”, pero a veces es
plausible suponer un periodo de “oscuridad documental”.
Hemos hablado de cómo la nueva concepción variacional y discursiva de la distinción oralidad-
escrituralidad ha traído consigo una ampliación de la documentación empleada en la elabo-
ración de la historia del español: no solo se han introducido otro tipo de textos no literarios
más allá de los jurídicos (como las cartas), sino que se ha empezado a fijar la atención en “otras
partes” de los textos literarios y no literarios que recogen o recrean interacción oral —un buen
ejemplo es el corpus Oralia Diacrónica del Español (Calderón Campos y Vaamonde dos Santos
2020)—. Pero, lo que nos parece más relevante es que ha hecho nacer una nueva percepción
y acercamiento a todas las fuentes documentales: los textos ya no deberían ser tratados nunca
más como simples repositorios intercambiables de datos homogéneos, sino que se ha vuelto
necesario tomar conciencia de sus condiciones de producción y recepción, esto es recontex-
tualizarlos (Oesterreicher 2001) para poder calibrar dónde se sitúan los usos lingüísticos en el
espacio variacional del español. Este enfoque teórico y metodológico del corpus requiere de
un acercamiento cualitativo (y no simplemente cuantitativo) a los datos, porque no basta con
catalogar un género como potencialmente de “impronta oral”, sino que es fundamental tener
en cuenta sus condicionamientos discursivos y retóricos (Bustos Tovar 2000). Estudios como
Díaz Bravo y Fernández Alcaide (2018) han puesto de manifiesto diferencias importantes entre
géneros y textos cercanos a la inmediatez comunicativa; Octavio de Toledo (2011), la impor-
tancia de la(s) vida(s) textual(es), o Del Rey Quesada (En prensa), la gradualidad de la influencia
de los modelos o fuentes escritas.
Esa nueva visión de las fuentes ha supuesto asimismo un nuevo planteamiento del otro polo
de la escala: la escrituralidad, y, en consecuencia, las relaciones entre oralidad y escritura en el
origen y difusión de los cambios y en la pervivencia de las unidades “creadas” a lo largo de la
historia del español. Ya apuntados en Badía Margarit (1960), y desarrollados en trabajos sobre la
construcción de la prosa medieval y humanística (Cano Aguilar 1989), han cobrado un interés
renovado los procesos de elaboración extensiva e intensiva (Koch y Oesterreicher 1990 [2007])
en la historia de los distintos géneros y TD del español (Kabatek 2008; López Serena et al.
2020). Dentro de este campo, y siguiendo lo apuntado por Sornicola (1993), en los últimos
años se ha visto necesaria una reconsideración del influjo de las “escrituralidades” latinas: clásica,
medieval o humanística en la vida de las lenguas romances como fuente de unidades y construc-
ciones concretas a través de su valor como modelos de elaboración en distintos tipos discursivos.
Con ello, se han revitalizado —y complicado— los conceptos de préstamo, calco o transferencia.
Todo ello plantea el desafiante reto de ir trazando las relaciones entre oralidad y escritura a lo
largo de la historia del español, de tratar de descubrir si, como se ha propuesto, hay periodos o
no de mayor permeabilidad entre una y otra, en qué dirección(es) se produce esa permeabilidad

93
Silvia Iglesias Recuero y Eugenio Bustos Gisbert

y en qué géneros, y de intentar explicar, en ese marco, tanto la estabilidad como los cambios de
perfil concepcional de unidades y construcciones más amplias.
Por último, la relación entre oralidad(es) y escritura en la configuración de las normas del
español es también una cuestión que no se ha abordado como merece, especialmente en lo que
se refiere a la configuración de las normas de las variedades americanas del español. Es sabido
cómo la norma escrita española es modelo a lo largo del periodo colonial y parte del siglo XIX
(Garatea Grau 2009), pero no sabemos en qué momento se produce realmente la liberación de
las antiguas colonias de ese peaje al español peninsular y si se produce a la vez en las diferentes
áreas americanas. La norma española explica también determinados usos históricos americanos
contrarios a las normas americanas actuales como, por ejemplo, el leísmo e incluso el laísmo o
determinados usos del perfecto compuesto en zonas en las que hoy se ha generalizado el perfecto
simple hasta muy avanzado el siglo XIX (Álvarez 2020) También es probable que esa imitación
de lo español explique la latencia del voseo americano en no pocas zonas (Díaz Collazos 2015) y
su conversión en rasgo distintivo de la oralidad. Tampoco sabemos cuál es el papel de la oralidad
en la configuración de normas regionales subestándares en aquellas zonas donde la alfabetización
todavía está poco desarrollada.
Esperamos haber mostrado que es mucho el camino recorrido y también mucho el que
todavía falta. Sin duda, los próximos años ofrecerán nuevos estudios que enriquezcan, maticen
o superen lo que hoy sabemos sobre la oralidad y la escritura en la historia de nuestra lengua.

Nota
1 La cursiva es nuestra.

Lecturas recomendadas
En Koch y Oesterreicher (1990 [2007]), se establecen los fundamentos teóricos de la distinción con-
cepcional entre oralidad-inmediatez y escrituralidad-distancia comunicativas y de otros con-
ceptos como elaboración o cadena variacional (este último dentro del paradigma coseriano). En la
segunda parte se ofrece una visión de los principales fenómenos de la oralidad en las tres lenguas
románicas del título.
López Serena (2008) es el estudio más detallado en esp