Frites
Frites
Résumé
Le domaine de la linguistique de corpus est communément considéré comme une nouvelle approche de la linguistique.
linguistique qui s'est développée et est devenue populaire au cours des quarante dernières années -
depuis le développement des ordinateurs. Comme tous les nouveaux domaines, cependant, ses racines se trouvent dans
les formes antérieures de la discipline. Cet article traite de l'un des ancêtres de cela
champ, Charles C. Fries. Il se voyait simplement comme un linguiste (pas un corpus
linguiste); pourtant sa théorie et sa pratique ont beaucoup en commun avec le ver-
versions de la linguistique de corpus.
L'approche de Fries à la linguistique et à l'utilisation des corpus en linguistique a évolué
hors de son contexte, ainsi que les objectifs et les fonctions de la théorie qu'il
adopté pour sa linguistique. Ce parcours et ces objectifs l'ont conduit à adopter un
nombre de thèmes qui ont imprégné son œuvre tout au long de sa carrière :
1. Parce que ses intérêts pour la langue et la linguistique ont découlé de son travail précoce
enseigner le grec classique puis la composition anglaise, sa théorie avait une
très pratique car il est né des problèmes rencontrés dans la purification
poursuivre ces tâches pratiques (et similaires).
2. Il a valorisé les objectifs scientifiques de faire des prévisions sur des phénomènes disparates.
ena. En linguistique, il a pris comme objectif la description de la langue de manière à ce que
façon dont il pourrait identifier les signaux dans la langue qui conduiraient à écouter
ers d'interpréter la langue de la manière dont ils le font. C'est-à-dire qu'il a essayé d'identifier
les signaux qui lui permettraient de prédire les réponses des auditeurs.
3. Il a souligné les éléments en contraste - les relations paradigmiques entre les lin-
éléments linguistiques.
Il considérait que la langue parlée était primaire.
5. En science, toutes les analyses doivent être fiables et reproductibles. Si la linguistique était
Pour être scientifique, cela nécessitait que toutes les descriptions soient basées sur des éléments explicites.
corps de preuves – un corpus, ou un ensemble de langage utilisé par les gens pour
réels objectifs.
6. Les données collectées et analysées devraient représenter la langue de certains
communauté.
89
Journal ICAME n° 34
1 Introduction
Le domaine de la linguistique des corpus est désormais généralement considéré comme un sous-domaine de
la linguistique qui s'est développée en grande partie depuis le début des années 1960 lorsque Henry Kucera
v
90
Charles C. Fries, linguistique et linguistique de corpus
Ils étaient bien établis dans leur carrière lorsqu'ils ont commencé à travailler sur le Brown.
corpus. Randolph Quirk a commencé son travail sur l'enquête sur l'utilisation de l'anglais (un cor-
projet de pus, bien qu'il ne s'agisse pas d'un projet utilisant des ordinateurs au début) bien dans
sa carrière. En d'autres termes, les premiers linguistes de corpus étaient des linguistes qui avaient été
formé dans les anciennes approches de la linguistique et ensuite eu le statut professionnel
et l'indépendance et la vision de maintenir leurs croyances et leurs méthodes fondamentales
travailler face à une opposition considérable.
De nos jours, avec l'avènement des ordinateurs plus puissants et leur accessibilité, que
dans ces vieux jours, c'était souvent simplement un rassemblement informel d'exemples provenant de divers
les sources pratiques se sont transformées en une approche beaucoup plus prudente pour
de vastes corpus de millions de mots, et la discipline qui s'est développée alors que nous
Le traitement de ces corpus extrêmement vastes a été appelé « linguistique de corpus ».
Cependant, la taille du corpus et l'utilisation d'un outil particulier, l'ordinateur,
ne devrait pas définir une discipline.1Plutôt, il me semble que ce qui définit le dis-
la discipline de la linguistique de corpus devrait être les hypothèses concernant la nature de
langue, ce que l'on considère comme constitutif de preuve concernant la nature de la
la langue décrite, et les principes qui sous-tendent le rassemblement et
utilisation d'un corpus dans l'analyse linguistique. Bien sûr, la taille du corpus et le
Les outils utilisés affectent les types de résultats que l'on peut obtenir. (Dans ce cas, de grandes différences)
Les différences de taille entraînent une différence qualitative dans les types de résultats qui peuvent être obtenus.
91
Journal ICAME n° 34
La section 1.1 présente un peu de son histoire personnelle. 1.1.1 montre sa relation dans
âge à d'autres linguistes de sa génération. 1.1.2 répertorie certains événements, intérêts sélectionnés
et publications dans sa vie.
1.1 Histoire
1.1.1 Charles C. Fries et d'autres linguistes sélectionnés de sa génération :
Charles C. Fries 1887–1967
Leonard Bloomfield 1887–1949
J. R. Firth 1890–1960
Louis Hjelmslev 1899–1965
Roman Jakobson 1896–1980
Daniel Jones 1881–1967
Edward Sapir 1884–1939
1.1.2 Événements et publications sélectionnés dans la carrière de Fries3
(Les dates associées à des titres spécifiques indiquent les dates de publication de ceux-ci)
Les travaux. Les titres avec des astérisques impliquaient l'analyse d'un corpus de données spécifiques.
et ont été commencés plusieurs années avant la publication.)
92
Charles C. Fries, linguistique et linguistique de corpus
Les années 1920 et 1930, ses fonctions à l'Université du Michigan comprenaient l'enseignement
Composition anglaise et littérature au lycée universitaire
associé à l'école de l'éducation de l'Université du Michigan.
1927 l'expression du futur
L'enseignement de la langue anglaise
1928 Devenu éditeur du dictionnaire de l'anglais moderne précoce
93
Journal ICAME n° 34
94
Charles C. Fries, linguistique et linguistique de corpus
[structural] la grammaire n'a pas pour but des définitions et des classifications mais plutôt
une telle description des unités structurelles formellement marquées comme le fera
95
Journal ICAME n° 34
96
Charles C. Fries, linguistique et linguistique de corpus
Son accent sur le contraste et les relations paradigmiques sous-jacentes est évident dans
son traitement, dans La structure de l'anglais (1952 : 79), des mots qui appartenaient
aux principales classes :
Il ne suffit pas pour nos besoins de dire qu'un mot de classe I [~ nom] est
tout mot qui peut remplir certaines positions dans la structure de notre phrase,
même si nous énumérons toutes ces positions. Nous voulons savoir ce que le
les caractéristiques spéciales de ces mots sont qu'elles les rendent reconnaissables
différent des mots utilisés dans d'autres positions. Pour découvrir ces
caractéristiques que nous devons explorer ces autres positions et former com-
listes de mots paraboliques qui peuvent remplir ces postes. Formelle significative
les caractéristiques de chaque classe apparaîtront alors dans les contrastes d'une
classe avec une autre.
Comme moyen d’atteindre cet objectif, son Chapitre 7 de ce livre (La structure de
aborde les caractéristiques formelles des parties du discours. Alors que le chap-
ter commence par aborder un aspect de la structure morphologique des mots
97
Journal ICAME n° 34
Tableau 1 : Échantillon des listes de Fries montrant des contrastes dans les formes des mots qui
appartiennent aux classes majeures
D'autres implications de son accent sur le contraste seront rencontrées dans le dés-
cussion sous le point 2.7.
98
Charles C. Fries, linguistique et linguistique de corpus
En revanche, Fries, dans l'ensemble de son œuvre, a fait tout son possible pour découvrir le
caractéristiques de la langue parlée dans les communautés tandis que les locuteurs
étaient concentrés sur ce qu'ils communiquaient et non sur la façon dont ils communiquaient
le découpant. En d'autres termes, il cherchait les choix de vocabulaire et la gram-
modèles grammaticaux utilisés dans le langage parlé non édité. Sa discussion (1927 : 137)
L'enseignement de l'anglais aux locuteurs natifs impliquait un objectif typique :
La langue du drame est probablement plus proche de l'usage réel que celle de
d'autres types de littérature puisque le drame porte ses effets à travers le
parlant de l'acteur aux véritables auditeurs. Au minimum, la langue du
99
Journal ICAME n° 34
100
Charles C. Fries, linguistique et linguistique de corpus
Dans les discussions de ceux qui ont essayé de comprendre ces nouveaux
un certain nombre de questions fondamentales ont été soulevées pour
quelles réponses adéquates ne semblent pas être disponibles dans le publié
matières. Critères valides pour les jugements de « grammaticalité » comme
Les phrases appliquées sont essentiels pour une grammaire « générative ».
principes théoriques et pratiques sur lesquels reposent les critères actuellement utilisés
dépend semble difficile à trouver.
2.6 Les données utilisées pour l'analyse doivent constituer un échantillon représentatif.
de la langue de certaines communautés
Bien sûr, la notion d'« échantillon représentatif » est un concept épineux et ce qui est
être considéré comme représentatif dépend énormément de ce que l'on essaie de représenter
Il me semble que deux moyens de sampling de la langue ont généralement été
utilisé par les linguistes. L'une des approches est de prendre une approche décontractée. Ici, nous collectons simplement tout
101
Journal ICAME n° 34
des exemples qui attirent notre attention dans un certain endroit.9Ces exemples
peut-être des morceaux de conversation que nous avons entendus, des publicités entières ou des lettres
ou d'autres textes qui ont attiré notre attention, ou peut-être s'agit-il de quelques textes que nous
a l'intention d'utiliser comme exemple pour enseigner un sujet. Ensuite, lorsque nous arrivons à
cherchez des données de quelque type pour notre analyse, nous recherchons notre magasin d'exemples et
travailler avec eux. Je compare cette approche à celle d'une personne qui aime
coudre, et collecte toutes sortes de morceaux de tissu au cas où cela pourrait servir
pratique. Une telle approche de la collecte de données est quelque chose que tous les linguistes font, et est
assez précieux. Je pense, par exemple à Otto Jespersen, qui a rassemblé des milliers
d'exemples tirés d'un corpus non spécifié de littérature anglaise.10Nous ne pouvons pas répliquer
évaluer ou tester son travail, car nous ne connaissons pas les sources exactes qu'il a utilisées, et il
certainement n'a pas échantillonné ces sources de manière exhaustive. Cependant, les exemples qu'il
Tous les exemples valides de la langue en usage ont été collectés et il a pu les utiliser.
effectivement comme base pour ses descriptions emblématiques de la grammaire anglaise. Comment-
tous les exemples recueillis de manière informelle, comme il l'a fait, peuvent ne pas représenter l'éventail complet de
phénomènes disponibles, et ils sont très susceptibles de mal représenter les fréquences
avec lesquels certains traits de langue sont rencontrés.
Une approche alternative pour la collecte de données est de rassembler systématiquement un
échantillon représentatif de certains aspects de la langue, en prêtant une attention particulière à
ce que l'échantillon est censé représenter et aussi aux techniques utilisées pour
rassembler l'échantillon. Deux exemples d'échantillons soigneux sont le vieux Brown et le
Les corpus LOB qui prétendent être des échantillons aléatoires stratifiés de l'écrit britannique et
Anglais américain.
Permettez-moi de suivre Matthiessen (2006:107) en utilisant le terme archive pour représenter
la collecte informelle de données qui se révèle pratique, etcorpusto
se référer à un échantillonnage de la langue plus soigneux. Avec cette distinction à l'esprit, Fries
a essayé de rassembler des corpus. Bien que cela ait été son objectif, je soupçonne que la plupart des cor-
que lui a utilisés étaient des compromis.11J'ai déjà mentionné qu'il voulait
pour examiner le langage parlé, et pourtant il n'avait aucun moyen de le faire régulièrement jusqu'à
tard dans sa vie. Ainsi, son étude de 1925 sur shall et will était basée sur le drame, qui
il considérait une approximation de la langue parlée. Son étude de la croissance
de l'utilisation structurelle de l'ordre des mots exclu la poésie dans la croyance que, de l'écrit
la langue, la poésie s'est le plus éloignée de la langue parlée. Son étude comparant
Anglais vulgaire avec un anglais éduqué utilisé pour des lettres écrites au Département de la Guerre
ment pendant la Première Guerre mondiale car c'était une source pratique de minimement
données éditées produites avec des objectifs limités par des écrivains éduqués et non éduqués
des auteurs avec des antécédents connus. Ce n'est que lorsque nous parvenons à son étude qui a été publiée
La structure de l'anglais, nous le trouvons utiliser du matériel enregistré. Mais même
c'était un compromis en ce sens que, en raison de limitations pratiques, il devait limiter
102
Charles C. Fries, linguistique et linguistique de corpus
lui-même à l'enregistrement de conversations sur une seule ligne téléphonique. Le résultat était que
les données représentaient les pratiques linguistiques de seulement quelques personnes. Bien que je ne
croyez que ce fait a sérieusement compromis ses résultats, cela signifie que ces données
ne sont pas un véritable échantillon aléatoire de l'anglais américain parlé, ni même de la
L'anglais parlé à Ann Arbor à cette époque.
103
Journal ICAME n° 34
Afin d'éviter des erreurs de ce genre, nous avons dans l'étude de ceci
Le matériel a d'abord essayé d'enregistrer tous les faits dans chaque catégorie examinée.
Par exemple, chaque forme du prétérit et du participe passé a été copiée sur un
un morceau de papier séparé afin que nous puissions déterminer non seulement le
une sorte de variété qui existait dans l'usage réel, mais aussi quelque chose de
104
Charles C. Fries, linguistique et linguistique de corpus
Il a trouvé 2 561 exemples de questions par oui ou par non. Les colonnes 2 et 3 montrent qu'il y a plus de
60 pour cent des 2 561 questions oui-non dans ses données ont une intonation descendante.
Compter uniquement les intonations montantes ou uniquement les intonations descendantes n'aurait pas pro-
informations réduites qui pourraient être utilisées pour interpréter les résultats. Une telle partie
les informations ne feraient que répéter ce qui était déjà connu - que les questions par oui ou par non
parfois étaient exprimées avec des intonations montantes et d'autres fois avec des intonations descendantes
intonations. Ce n'est qu'en comptant l'incidence des deux intonations sur ces ques-
il pourrait établir les patterns de choix.
Des cas similaires de comptage des caractéristiques conflictuelles contrastives proviennent de son
travail historique (le premier endroit où il a utilisé cette approche pour l'analyse des données.)
En dehors de sa dissertation, c'est-à-dire son étude de shall et will, et du travail sur le
Dictionnaire de l'anglais moderne, son travail historique était axé sur le changement
105
Journal ICAME n° 34
Encore une fois, les chiffres bruts ne sont pas importants sauf pour garantir qu'un nombre suffisant de
des instances existent dans chaque cellule pour être fiables. Ce qui est pertinent, c'est le changement
modèles de fréquences relatives des diverses alternatives d'expression
utilisé. Dans les premières données, nous voyons que le génitif périphrastique est presque non-
existante et les génitifs pré-positifs et post-positifs sont utilisés de manière approximative
également. En 1300, nous voyons que le génitif post-positif a disparu de l'usage
et les moyens les plus fréquents utilisés pour exprimer la relation génitive est le péri-
génitif phrastique.
106
Charles C. Fries, linguistique et linguistique de corpus
3 Évaluation et implications
Permettez-moi maintenant de commenter quelques aspects du travail de Fries.
107
Journal ICAME n° 34
et suivaient une ligne de raisonnement auraient tendance à utiliser une intonation descendante,
bien qu'ils soient intrigués et n'aient pas vraiment d'idée sur la profession qu'ils pourraient
utilisez une intonation montante.
En rapport avec le fait que Fries n'avait pas de théorie de registre, il y a sa constante préoccupation
sur l'obtention d'échantillons de langage parlé (ou du moins aussi proche que possible du langage parlé
comme il pouvait gérer à l'époque). Les citations dans la Section 2.4 documentent adéquatement
ment son attitude selon laquelle la langue parlée est primaire et que la langue écrite
est un reflet de la langue parlée. De nos jours, nous avons une situation plus compliquée
approche de la variation linguistique. Avec le développement du cadre théorique con-
les concepts de registre (par exemple, Gregory 1967; Halliday 1985, 2007) et la quantitative
des analyses de personnes telles que Douglas Biber (1988) nous avons des preuves statistiques
cela démontre qu'une variété de facteurs affecte la nature de la langue utilisée
dans une interaction sociale particulière. La différence entre le langage parlé et écrit
la langue n'est qu'un de ces facteurs.
Il semble évident que les considérations probabilistes n'ont rien à voir avec
grammaire, par exemple, il ne s'agit sûrement pas d'une préoccupation pour la grammaire de
108
Charles C. Fries, linguistique et linguistique de corpus
109
Journal ICAME n° 34
Cependant, une analyse plus détaillée du contexte d'utilisation (même une simple note de
quel type d'intonation était le plus fréquent sur la première question posée à un
concours), et un compte complet de toutes les instances de questions répétées, et leur
les contextes auraient pu aider à déchiffrer la différence d'interprétation de la montée
et des intonations descendantes sur les questions oui-non.
3.5 Les résultats historiques de Fries et la notion d'un système unifié unique pour le
langue
Dans les années 1940 et 1950, lorsque Fries réalisait certains de ses travaux les plus importants,
la vue dominante au sein du structuralisme était de supposer l'existence d'un unique
système cohérent pour chaque langue. Certes, les linguistes de l'époque étaient
très conscient que des dialectes existaient, et, de plus, que deux individus n'utilisaient pas
exactement les mêmes schémas linguistiques. Pour la plupart, ces faits ont été ignorés dans
discussions théoriques ; cependant, dans quelques cas, certains linguistes ont tenté de traiter
avec eux en développant la notion d'idiolecte (le dialecte utilisé par un individu-
ual).
En raison de son travail historique sur le corpus, et surtout parce qu'il comptait
les fréquences relatives d'éléments en conflit contrastants, Fries a pris une très différente
On peut comprendre pourquoi d'après le modèle présenté dans le tableau 4. Chaque fois que
Fries a examiné les textes dans ses données historiques et a découvert des instances de vieux sys-
des éléments qui étaient en cours de déplacement, ainsi que des cas de nouveaux systèmes qui étaient dans
développement et sur le point de prendre le relais. Comme il l'a dit (1970:924) :
…il n'y a pas de moment où l'on peut faire une Coupe transversale du gramme-
formes grammaticales réellement en usage, dans un échantillon adéquat, sans trouver
les preuves d'une 'profondeur temporelle' extrêmement compliquée d'approximativement
environ 100 ans.15
110
Charles C. Fries, linguistique et linguistique de corpus
La conclusion qu'il tira de ces faits était qu'il n'y avait pas de temps dans le
histoire de l'anglais écrit quand il y avait un système grammatical cohérent unique
élément.16Plus tard, Fries et Pike (1949:29) exprimèrent une opinion similaire concernant le
la phonologie d'une langue en termes suivants :
Le discours des locuteurs natifs monolingues de certaines langues est com-
composé de plus d'un système phonémique ; les systèmes existant simultanément
les systèmes fonctionnent en partie en harmonie et en partie en conflit. Aucun rigide
une déclaration descriptive des faits concernant une telle langue rend compte de
toutes les données pertinentes sans conduire à des contradictions apparentes.
111
Journal ICAME n° 34
prédit par Halliday.17Dans la plupart des cas, nous avons toujours essentiellement deux systèmes de termes.
les fréquences varient de 30 à 68 pour cent, de 22 à 76 pour cent, de 12 à 82 pour cent
cent, et 31–69 pour cent. 18On soupçonne que si nous avions des chiffres séparés par 25
au lieu de 50 ou 100 ans, nous pourrions trouver des fréquences intermédiaires entre
ceux donnés dans le tableau. Pour ces périodes intermédiaires, la prédiction de Halliday
les actions ne fonctionnent pas très bien. On est tenté de poser deux sortes de systèmes : ceux
qui sont relativement stables (comme les étapes initiale et finale du tableau 4), comme
s'opposent à des systèmes qui subissent des changements relativement rapides. Halliday
la suggestion peut fonctionner pour les systèmes relativement stables mais pas pour ceux sous-
un changement rapide. Quoi qu'il en soit, les résultats de Fries clarifient que la suggestion de Halliday est
la gestion des fréquences doit être examinée avec soin à la lumière de
changement historique.
3.7 Corpus comme information sur la façon dont la langue est comprise
Enfin, permettez-moi de mentionner l'une des attitudes de Fries envers les corpus que je crois
assez important pour nous maintenant. En particulier, il a utilisé son corpus de conversation
des données non seulement comme preuve de la langue qui a été produite. Il les a également utilisées
comme preuve de la façon dont ce qui a été dit a été compris.
Les corpus, en particulier les corpus oraux, contiennent des exemples où les locuteurs
faire des erreurs (par exemple, des contresens), se corriger, ou faire une pause et changer dans
en cours de production, etc. Le linguiste n'a pas besoin d'inclure
ces cas particuliers sur un pied d'égalité avec d'autres données qui sont plus représentatives
des intentions des locuteurs.19Examinant les contextes dans lesquels le lan-
le langage est produit et en particulier le comportement des locuteurs et des auditeurs
(par exemple, noter quelles interventions sont associées à divers types de comportements de réparation)
ior) fournira une aide significative pour juger quelles portions du corpus sont plus
important à aborder en premier.
De plus, en notant des réponses telles que fournir des informations, se conformer à
les demandes, les réponses aux informations données, etc. fournissent aux linguistes des informations sur
les manières dont la langue produite était comprise dans son contexte.
En d'autres termes, aborder comment les auditeurs (ou lecteurs) réagissent et comprennent
la langue est tout aussi importante pour la linguistique de corpus que de regarder ce qui est pro-
admis, dans le cas des textes monologiques, il est difficile d'obtenir des participants
réactions de pantalon. Cependant, même dans le cas de données écrites, au moins le linguiste
lui-même / elle-même est disponible pour fournir des interprétations, (et il est toujours possible
rassembler des groupes de lecteurs et poser des questions concernant leurs interprétations de
Ces interprétations sont essentielles à l'utilisation du corpus.
112
Charles C. Fries, linguistique et linguistique de corpus
Permettez-moi de conclure en disant que, bien que Fries ait travaillé avec des corpus manuellement,
commençant il y a environ 90 ans et se terminant il y a environ 40 ans, une grande partie de ce qu'il
ses nombreuses hypothèses sont encore utilisées et sont pertinentes pour le
présent. Nous rencontrons beaucoup des mêmes problèmes qu'il a rencontrés. Nous utilisons beaucoup de
ses techniques d'analyse. Certainement, la linguistique de corpus moderne s'est développée
de manière significative depuis son époque - pas seulement dans les outils technologiques qui ont
a été développé, mais aussi dans la reconceptualisation de questions de base telles que exactement ce que
constitue un corpus et comment les corpora peuvent être utilisés avec perspicacité.
Il me semble qu'un des moyens que nous avons de découvrir où nous en sommes en tant que
la discipline consiste à regarder en arrière à nos premiers stades pour voir ce que c'était à cette époque.
Dans cette perspective, j'espère que vous croyez avec moi qu'il est utile d'examiner ce que C. C.
Fries a tenté, et les manières dont il a réussi ou non.
Tableau 2 : Les projets de Fries qui impliquaient directement la collecte et l'utilisation d'un spe-
corpus spécifique de données.20
1 Tôt ~2 000 000 bulletins rassemblés Découvrez les modèles changeants au début de l'époque moderne
Moderne pour OED (1928) plus Vocabulaire anglais.
Anglais ~300 000 bordereaux rassemblés à
dictionnaire : un U de M. Les lecteurs ont demandé à
trouver spécial ou nouveau ou
d'autres utilisations notables
de mots.
B. Analyse systématique
1. Collecter des données de manière systématique et analyser de manière exhaustive
[Link] ~700 000 reçus rassemblés Assurez-vous que toutes les utilisations de chaque mot sont prises en compte
Moderne d'une lecture 'intensive' pour. Développez des preuves pour décrire un
Anglais de 69 textes datés. mot utilisé comme d'habitude ou inhabituel. Aussi, le changement
dictionnaire : b Rassemblé essentiellement toutes les fréquences d'utilisation des mots pourrait fournir quelques
instance de tous les principaux preuves du changement en cours.
catégoriser les mots dans ceux-ci
textes.
b. La structure ~50 heures (= >250 000 Découvrez les caractéristiques linguistiques de l'anglais parlé.
113
Journal ICAME No. 34
2. Rassembler des données de manière systématique, analyse exhaustive et comptage des conflits coexistants.
signaux de signification
a. Périphrastique drame anglais : 50 pièces Examinez les usages actuels de shall et will
utilisation de shall de chaque décennie de L'anglais au cours de l'anglais moderne précoce
et cela période en vue d'évaluer l'exactitude
Littérature britannique, 1560–
1915. 18 pièces chacune de des règles trouvées dans les grammaires scolaires et leur
Américain et britannique utiliser dans l'enseignement de l'anglais.
Littérature de 1902–
1918. ~ 20 000 instances
de doit et va.
b. Histoire de Anglais du 10ème siècle Découvrez les étapes par lesquelles un grammatical
Anglais système caractérisé par l'utilisation d'inflexions
du début au milieu du 20e siècle.
20 000 mots de chaque changé en un système où l'ordre de
la période, les éléments d'échantillons prélevés étaient un signal majeur de la grammaire
approximativement tous les 50 ans. fonction.
400 000 mots au total.
Américain 2 000 lettres complètes, Comparer les habitudes linguistiques des personnes non éduquées
Anglais plus d'extraits de à propos de avec ceux des éduqués. (Premier contraste)
grammaire 1 000 lettres supplémentaires, toute analyse)
écrit à la guerre
département pendant la Première Guerre mondiale.
4. Intonation de 39 épisodes d'une émission de télévision Vérifiez l'exactitude des descriptions précédentes de
oui-non (‘Quelle est ma ligne ?'). 2,561 intonation des questions oui/non
questions questions par oui/non
Notes
* Une version antérieure de cet article a été présentée lors de la Dix-neuvième Euro-Interna-
Conférence et atelier de linguistique fonctionnelle systémique nationale, du 23 au 25 juillet
2007. Sarrebruck, Allemagne. Je voudrais en outre reconnaître le com-
les commentaires d'Elizabeth Berriman et Richard Forest qui ont commenté un précédent
version du document.
Cette vue contraste fortement avec l'état de Simpson et Swales (2001 : 1)
La linguistique de corpus est essentiellement une technologie….
2. Je ne veux pas prétendre que le travail de Fries était typique de son époque. En effet, je...
affirmerait que son travail différait considérablement de celui des autres linguistes
de sa génération, en particulier ceux aux États-Unis. Comme soutien partiel à mon
notez l'exclusion de toute discussion significative sur le travail de Fries
de l'histoire autrement vaste du structuralisme américain chez Hymes
et Fought (1981), malgré le fait qu'ils le considérassent comme un impor-
tant figure dans la linguistique de cette époque (communication personnelle de
Lutté).
114
Charles C. Fries, linguistique et linguistique de corpus
3. Voir R.W. Bailey (1985b) pour une discussion plus approfondie de la vie de Fries.
4. Dans les conversations, Fries se référait souvent à sa conversion à la linguistique. Cela
est la conversion qu'il voulait dire.
À un certain moment, Fries a été transféré au Département d'anglais et a obtenu son doctorat.
sous le professeur Samuel Moore, qui s'intéressait à l'histoire de l'anglais.
Scott est resté une figure influente dans la pensée de Fries.
6. Dans cette citation comme dans toutes les citations suivantes, les emphases par italique ou par
les parties soulignées étaient dans l'original. Si je [PHF] souhaite souligner une partie
d'une citation, j'utiliserai le gras.
7. Prendre la langue parlée comme primaire ne doit pas être confondu avec la considération
considérant les sons de la parole comme principaux. Plutôt, l'intérêt de Fries résidait de façon constante
dans les schémas grammaticaux utilisés. Il était très conscient que les mots
et la grammaire de la langue parlée différait grandement de la langue qui
a été écrit.
8. Bien que ses analyses soient basées sur des corpus explicites et bien définis, en ce qui concerne moi
sachez qu'il n'a jamais mis les corpus à la disposition d'autres linguistes en les plaçant par exemple
exemplaires dans une collection publique.
9. Tous les linguistes ont expérimenté, à un moment ou à un autre, la joie de la rencontre
dans un langage écrit ou parlé un exemple de quelque chose de prédit mais encore
une structure inédite (disons une forme verbale unique qui utilise tous les secondaires
temps possibles). Nous faisons ensuite un effort spécial pour enregistrer ou nous souvenir de ce que
ce qui a été dit et son contexte - parfois au détriment de prêter attention à
sur quoi nous devrions nous concentrer à ce moment-là.
10. Bien que Jespersen ait certainement eu un programme soigneusement planifié pour lire ses
corpus d'œuvres littéraires, sa définition de ce corpus était, à mon avis,
décontracté. Il n'a pas décrit les principes pour choisir ces œuvres, ni ainsi
pour autant que je sache, a-t-il listé le corpus total dont il a extrait son examen-
bien sûr, il a fourni des références pour la provenance de chacune de ses
exemples.)
11. Peut-être que tous les corpus sont des compromis entre les exigences de représentation.
l'efficacité, les exigences des procédures d'échantillonnage et le pratique
les exigences d'obtention de données utilisables (à la fois les exigences pratiques de simplement
rassembler les données, ainsi que les questions juridiques liées à l'utilisation des données
une fois rassemblés). Par exemple, le choix fait par les éditeurs du Brown
corpus à utiliser uniquement des échantillons de 2 000 mots de chaque texte inclus dans ce corpus
a augmenté la comparabilité des échantillons de texte en nombre de mots, mais à la
le même temps a diminué la comparabilité en ce sens qu'aucun contrôle n'a été imposé sur
quelles portions des structures de texte de chaque texte ont été choisies. Nous savons
que le langage des introductions diffère de celui des conclusions.
115
Journal ICAME No. 34
Compte tenu des choix faits par les éditeurs, le corpus Brown nous fournit une
outil médiocre pour examiner comment la langue de ces deux portions de texte diffère.
12. Un compte rendu plus soigneux et complet du travail de Fries sur l'EMED peut être
trouvé dans Bailey (1985a).
Fries (1945 : 55–56) aborde également la question des ensembles lexicaux bien que sans
en utilisant ce terme.
chaque
La construction signifie 'chacun des voisins'. Bien sûr, le post-positif-
la construction génitive ne peut pas être illustrée en utilisant l'anglais moderne puisque
il est devenu obsolète. Michael Cummings a fourni cet exemple de OE.
15. Les données particulières résumées dans le tableau 4 ne soutiennent pas la période de 100 ans.
ligne mentionnée dans cette citation ; cependant, la plupart des autres changements qu'il
les études ont été réalisées au cours de la période d'environ 100 ans mentionnée ici.
En plus de la chronologie de 100 ans pour les changements individuels, il a également noté
que beaucoup des changements individuels semblaient atteindre le même type de résultat
(par exemple, la réduction des terminaisons flexionnelles) dans différentes parties de la lan-
Il a utilisé le terme 'pente' pour décrire ces ensembles de changements liés.
16. Il est utile de remarquer qu'il ne se contentait pas d'aborder les différences de dialecte.
ici, ni 'mélange de dialectes'.
17. Une caractéristique intéressante de cet exemple est que, techniquement parlant, seul le
l'échantillon de données le plus récent, datant de 1300, illustre en fait un véritable système à deux termes. Tout
les autres contiennent des preuves d'une troisième option. Mais dans quatre des cinq échantillons
les périodes, la troisième option (quelle qu'elle soit) représente au maximum 1,2 pour cent de
les données, et il est donc raisonnable de considérer ces systèmes comme des systèmes à deux termes.
La seule exception est l'ensemble de données de 1200, où les deux options utilisées
les moins fréquents sont de 11,8 pour cent et 6,3 pour cent par rapport au dominant
option qui est utilisée à 81,9 pour cent.
18. Notez que ma discussion ici ignore en grande partie la différence de forme.
impliqué dans le système évolutif. Le problème est qu'il y a, dans certains strates,
un système qui a deux termes, les réalisations des termes peuvent différer comme
le temps passe mais le système lui-même est relativement stable.
19. Voir Sinclair et Mauranen (2006) pour un compte rendu récent d'une manière fondée.
pour aborder certaines des dysfluences mentionnées ci-dessus.
20. Un corpus rassemblé par Fries a été omis de ce tableau. À peu près le
le temps où il complétait sa grammaire anglaise américaine, Fries
s'est intéressé à explorer la variation dans la grammaire qui était corrélée avec
dialectes géographiques. Il a acheté plusieurs journaux locaux de
autour des États-Unis publiés au cours d'une semaine particulière. Malheureusement, il
a constaté que les histoires imprimées dans ces journaux contenaient peu de régionalismes.
En conséquence, il a abandonné ce projet.
116
Charles C. Fries, linguistique et linguistique de corpus
Références
Bailey, Richard W. 1985a. Charles C. Fries et le dictionnaire de l'anglais moderne précoce.
[Link].H. Fries et N. M. Fries (éds.), 171–204.
Bailey, Richard W. 1985b. Charles C. Fries : La vie d'un linguiste. Dans P.H. Fries
et N. M. Fries (éds.). 1985 : 1–15.
Biber, Douglas. 1988. Variation à travers la parole et l'écriture. Cambridge : Cam-
Cambridge University Press.
Biber, Douglas, Susan Conrad et Randi Reppen. 1998. Linguistique de corpus :
Enquête sur la structure et l'utilisation de la langue. Cambridge : Cambridge Université
sity Press.
Chomsky, Noam. 1957. Structures syntaxiques. La Haye : Mouton.
Chomsky, Noam. 1962. Une approche transformationnelle de la syntaxe. Dans A. A. Hill
(éd.). Troisième conférence du Texas sur les problèmes de l'analyse linguistique en anglais,
124–169. Austin, TX : L'Université du Texas.
Fries, Charles C. 1925. Le futur périphrastique avec shall et will en moderne
Anglais.PMLA40 (4): 963–1024.
Fries, Charles C. James Holly Hanford, et Harrison Ross Steeves. 1926.
enseignement de la littérature. New York : Silver Burdett et Cie.
Fries, Charles C. 1927. L'enseignement de la langue anglaise. New York : Tho-
mas Nelson & Sons.
Fries, Charles C. 1940a. Grammaire de l'anglais américain. New York : Appleton
tury Crofts.
Fries, Charles C. 1940b. Listes de mots anglais : Une étude de leur adaptabilité pour
instruction. Washington, DC : Conseil américain sur l'éducation.
Fries, Charles C. 1940c. Sur le développement de l'utilisation structurelle de l'ordre des mots
en anglais moderne. Langue16 (3) : 199–208.
Fries, Charles C. 1944a. Lettre à Albert Marckwardt. 26 avril 1944.
Fries, Charles C. 1944b. Lettre au Doyen Clarence S. Yoakum. 20 avril 1944.
Fries, Charles C. 1945. Enseigner et apprendre l'anglais comme langue étrangère.
Ann Arbor, Michigan : University of Michigan Press.
Fries, Charles C. 1952. La structure de l'anglais. New York : Harcourt Brace.
Fries, Charles C. 1954. Signification et analyse linguistique. Langue30 : 57–68.
Fries, Charles C. 1959. Lettre à Peter H. Fries, 15 novembre 1959.
Fries, Charles C. et Agnes C. Fries. 1961. Fondements de l'enseignement de l'anglais.
Tokyo, Japon : Kenkyusha Ltd.
117
Journal ICAME numéro 34
118
Charles C. Fries, linguistique et linguistique de corpus
119