Papers by Maria Clara Paixão de Sousa
CEUR Workshop Proceedings, ISSN 1613-0073, 2022
This paper presents the salient aspects of WaC-wiPT methodology, developed for the construction o... more This paper presents the salient aspects of WaC-wiPT methodology, developed for the construction of the Carolina Open Corpus for Linguistics and Artificial Intelligence, a large corpus for contemporary Brazilian Portuguese. Both the corpus and the methodology are under development at the Center for Artificial Intelligence of the University of São Paulo. This paper describes the paths we took this far into the making of the Carolina Corpus, presents its current state and discloses the future agenda of the project.

Revista Brasileira em Humanidades Digitais, 2022
[Disponível em http://abhd.org.br/ojs2/ojs-3.3.0-9/index.php/rbhd/article/view/10] No percurso da... more [Disponível em http://abhd.org.br/ojs2/ojs-3.3.0-9/index.php/rbhd/article/view/10] No percurso das pesquisas realizadas com corpora embasados na metodologia de anotação do Corpus Histórico do português Tycho Brahe, foram identificados problemas e desafios a serem transpostos no respectivo sistema de anotação. Tendo como parâmetro o princípio de fidedignidade aos documentos originais para corpora históricos que contribuem também com pesquisas filológicas, este trabalho mostra uma proposta inicial de alteração no esquema de anotação morfossintática e de edições do Corpus Tycho Brahe para solucionar por ora o problema encontrado nas representações da quebra de linha/página e das edições. A solução proposta atende ao requisito de fidedignidade ao mesmo tempo em que alcança maiores conformidade e interoperabilidade.

A Cor das Letras, 2022
[Disponível em http://ojs3.uefs.br/index.php/acordasletras/article/view/5862] Neste artigo aprese... more [Disponível em http://ojs3.uefs.br/index.php/acordasletras/article/view/5862] Neste artigo apresentamos um estudo filológico a partir da descrição breve, entretanto detalhada, de aspectos codicológicos e paleográficos de um conjunto composto por quatro manuscritos novecentistas escritos por baianos pouco hábeis, oriundos de cidades interioranas e de zonas rurais do estado da Bahia. Também propomos uma investigação acerca do modelo de escrita utilizado por tais redatores, partindo da hipótese de que esses indivíduos, pouco escolarizados, utilizaram os manuais popularmente conhecidos como Paleógrafos, adotados nas escolas de Primeiras Letras da Bahia e por professores que ofereciam aulas particulares.

DHQ Digital Humanities Quarterly, 2020
As tecnologias digitais de difusão da informação transformaram profundamente o trabalho das Human... more As tecnologias digitais de difusão da informação transformaram profundamente o trabalho das Humanidades, que está hoje inscrito na lógica digital de um modo muito mais profundo do que o rótulo Humanidades Digitais pode fazer crer – pois não estamos diante do surgimento de uma nova tendência, nem de uma nova linha de pesquisas, nem de um novo campo de estudo no interior das Humanidades: estamos de fato diante de outras Humanidades. Na raiz dessa transformação está uma nova materialidade do texto, que, como já discutiram Pédauque (2004, 2006, 2007), Crane et al. (2008), Gradmann & Meister (2008), Chaudiron et al. (2008), Baumann & Crane (2010), e Paixão de Sousa (2013), modifica a condição histórica do documento – e, assim, instaura novas formas de leitura e novas formas de ordenação da leitura. Nesse sentido, sendo tarefas das Humanidades a interpretação do texto e a organização da sua transmissão social, essa nova materialidade interpela diretamente os métodos, os horizontes epistemológicos, e a conformação discursiva do campo. Neste artigo discutirei alguns dos efeitos desse processo, fundada em uma abordagem conceitual da materialidade do texto digital já proposta em Paixão de Sousa (2013), e inspirada na reflexão de Pêcheux (1992[1982]) sobre a leitura do arquivo e nas ideias de Unsworth (2006) sobre as formas de atenção. [Disponível também em http://www.digitalhumanities.org/dhq/vol/14/2/000457/000457.html].

LANGUAGE, 2017
[Open access: https://www.linguisticsociety.org/sites/default/files/e2_93.3Galves.pdf] This artic... more [Open access: https://www.linguisticsociety.org/sites/default/files/e2_93.3Galves.pdf] This article analyzes the changes in subject position in Portuguese between the sixteenth and nineteenth centuries in terms of the loss of verb-second grammar properties and the rise of an SVO grammar. Our analysis is based on the survey of an unprecedented amount of data for sixteenthto nineteenth-century Portuguese in a syntactically annotated corpus. We argue that in Classical Portuguese (sixteenth to seventeenth centuries) the verb moves to C(omp), there is no preverbal position reserved for subjects, and all of the preverbal phrases are discourse-prominent constituents—which characterizes Classical Portuguese as a V2-type grammar. In Modern European Portuguese (from the eighteenth century on), in contrast, the verb does not move as high as C(omp), and there is a preverbal position reserved for subjects—in other words, this is an SVO grammar. We suggest that this change from a verb-movement, V2-type grammar to an SVO grammar derived from a prosodic change that happened in the seventeenth century, which also affected clitic placement.

REVISTA DA ABRALIN, 2017
[Disponível em https://doi.org/10.5380/rabl.v16i1.51938] Este artigo tem como objetivo discutir a... more [Disponível em https://doi.org/10.5380/rabl.v16i1.51938] Este artigo tem como objetivo discutir as reflexões teóricas e suas consequências práticas advindas do encontro de duas trajetórias de pesquisa: uma centrada na reflexão teórica sobre a natureza do texto digital e a contingência do trabalho filológico no meio digital. A outra no trabalho filológico centrado nas Atas da Câmara de São Paulo escritas entre 1562 e 1596. Busca-se amalgamar essas duas trajetórias no ponto que encontramos em comum: o objetivo de trabalhar o texto levando em conta sua época, sua língua, seus autores e leitores, e recriá-lo para o olhar de novos leitores, em uma nova época, sob uma nova luz. Sugerimos, neste artigo, o termo ‘edição filológica virtual’ para descrever o trabalho de edição iniciado com as Atas da Câmara de São Paulo, mostrado em detalhes neste artigo.

LaborHistórico, 2015
This paper presents a diachronic account of the syntax of subjects in Portuguese by comparing thr... more This paper presents a diachronic account of the syntax of subjects in Portuguese by comparing three different constructions – active, canonical passives and SE-constructions – relating the change in the position of subjects to the loss of V2. In the V2 grammar, in which the pre-verbal position is associated with fronted elements, and non-fronted subjects remain in post-verbal position, we see the same patterns of word order in SE-constructions as in active and canonical passive sentences; in the (X)SVO grammar, in which the subject is associated with the preverbal position and the fronted elements occupy the left periphery of the clause, active and canonical passives show a significant increase of pre-verbal subjects, whereas SE-constructions remain alike with respect to word order. We interpret this result as evidence for analyzing the internal argument of SE-constructions as a complement rather than a subject.

Filologia e Linguística Portuguesa, 2014
[Disponível em https://doi.org/10.11606/issn.2176-9419.v16ispep53-93] O processo de aproximação e... more [Disponível em https://doi.org/10.11606/issn.2176-9419.v16ispep53-93] O processo de aproximação entre o campo filológico e o campo computacional nos estudos históricos da língua portuguesa, observado desde os anos 1990, configura hoje um horizonte em franca expansão, tornando oportunas as reflexões sobre as transformações produzidas pelo o tratamento computacional na tradição do trabalho filológico e linguístico. Este artigo se propõe a uma reflexão nesse sentido, partindo da exploração detalhada da tecnologia de codificação de textos usada no Corpus Anotado do Português Histórico Tycho Brahe, buscando examinar as diferentes combinações de procedimentos filológicos, linguísticos e computacionais envolvidos em sua construção, e discutindo as implicações metodológicas desses procedimentos. Abordamos os corpora eletrônico anotados não como coleções ‘de’ textos, mas sim como bancos de dados ‘sobre’ textos, que englobam diferentes camadas de representação sobre sua linguagem e sobre sua materialidade. Essa abordagem nos permite vislumbrar as especificidades do trabalho em ambiente digital no campo da filologia e da linguística histórica, e sugerir alguns caminhos para o debate sobre os desafios e perspectivas que se abrem para esse campo a partir dos projetos pioneiros que descrevemos.
Revista ANPOLL (Associação Nacional de Pós–Graduação e Pesquisa em Letras e Lingüística), 2013
[Disponível em https://doi.org/10.18309/anp.v1i35.643] O artigo sugere que a difusão digital insc... more [Disponível em https://doi.org/10.18309/anp.v1i35.643] O artigo sugere que a difusão digital inscreve uma materialidade absolutamente nova para o texto, já que, nela, o texto se forma com a participação conjunta entre a lógica artificial e a lógica natural, formando um documento “descorporificado”. Defende-se a
“descorporificação” como propriedade conceitual fundante do texto digital, propondo-se uma reflexão quanto à produção e circulação do texto em função dessa propriedade descorporificada, e apontandose, na dimensão material completa do texto digital, a superfície tecnológica de uma revolução em nossa sociedade de saber.
In: Ana Paula Banza & Maria Filomena Gonçalves (coord.), Património textual e humanidades digitais: da antiga à nova Filologia. Évora: Centro Interdisciplinar de História, Culturas e Sociedades da Universidade de Évora (CIDEHUS)/ Fundação para a Ciência e a Tecnologia (FCT)., 2013

Estudos da Língua(gem), 2010
[Disponível em https://doi.org/10.22481/el.v8i1.1116] As primeiras obras de reflexão gramatical s... more [Disponível em https://doi.org/10.22481/el.v8i1.1116] As primeiras obras de reflexão gramatical sobre o português falado no Brasil estão permeadas por dois discursos fundamentais que se entrecruzam e se retroalimentam: de um lado, o discurso da identidade nacional brasileira, marcado pelo peso das relações simbólicas entre o Brasil “culto” e o Brasil “popular”; de outro, o discurso naturalista, marcado pelo peso da visão do percurso orgânico de nascimento, apogeu e decadência das línguas. Neste artigo, iremos explorar essas duas vertentes no texto de duas obras importantes da reflexão linguística do início do século XX (Melo, 1946; Silva Neto, 1950), concentrando-nos em suas exposições sobre o problema da “erosão do paradigma flexional”. Propomos que, na elaboração de descrições e teorias sobre este aspecto das falas brasileiras, tais obras expressam os dois discursos acima mencionados. Essa expressão se concretiza na composição do discurso sobre o paradigma flexional, pontuado por termos como “redução”, “falta”, “empobrecimento”. Iremos propor que esse discurso remete à incorporação do paradigma schleicheriano segundo o qual a “perda” da morfologia flexional é um dos fatos principais a revelar o destino de decadência e empobrecimento das línguas no tempo. Por fim, examinaremos as relações entre essa visão sobre o destino das línguas e o caso específico brasileiro, remetendo a interpretação da “perda” da morfologia de flexão à interpretação de um estágio de decadência da sociedade, relação que se explicita, sobretudo, pela remissão dos autores ao contato do português com populações de origem “primitiva”.
Twan Geerts; Ivo van Ginneken; Haike Jacobs. (Org.). Romance Languages and Linguistic Theory: selected papers from Going Romance 2003., Jan 1, 2005
Revista Portuguesa de Humanidades, v. 1, p. 67-92. , 2012
The aim of this paper is to propose that the 15 th century marks the emergence of Middle Portugue... more The aim of this paper is to propose that the 15 th century marks the emergence of Middle Portuguese, a language period that constitutes the origin of Brazilian Portuguese. Firstly, we discuss some recent studies that propose the idea of Middle Portuguese and its implications for the History of Brazilian Portuguese. Secondly, we present and analyse some data of verbs that have variable valency in texts of the 15 th century. Lastly, we raise some questions that contribute not only to the History of languages as a whole, but also particularly to the History of Brazilian Portuguese.
This paper brings the evolution of the position of arguments in three different constructionsinde... more This paper brings the evolution of the position of arguments in three different constructionsindefinite-SE, canonical passives and active sentences -in the history of Portuguese in order to show that the so-called "passive-SE" constructions should not be analysed as passives but as active sentences, based on data extracted from the Tycho Brahe Corpus. The attested change in the position of subjects from Classical Portuguese to European Portuguese does not affect indefinite-SE constructions, but affects passives and active sentences. The quantitative method is thus valid as a way of proving a theoretical analysis for sentence structure in Portuguese.
Schuchardt Contra os Neogramáticos. Organização, introdução, tradução e notas de Maria Clara Paixão de Sousa. Campinas: RG Editora, 2010
|i| Temos que nos embeber da ciência para transcendê-la. Temos que servir a ciência com o propósi... more |i| Temos que nos embeber da ciência para transcendê-la. Temos que servir a ciência com o propósito único de domá-la.

Revista Texto Digital, 2009
[Disponível em https://doi.org/10.5007/1807-9288.2009v5n2p159] A circulação da escrita no ambient... more [Disponível em https://doi.org/10.5007/1807-9288.2009v5n2p159] A circulação da escrita no ambiente digital renova arelevância de algumas das tarefas tradicionais da críticatextual – em particular, a tarefa de refletir conceitualmente sobre as cadeias de difusão dos textos. Este artigo explora os desafios assim colocados para o campo, partindo para isso de uma reflexão sobre a natureza material do texto digital. Irei sugerir que a característica diferenciadora do texto digital, nesta perspectiva puramente material, é a inclusão de uma etapa de processamento artificial da linguagem na sua cadeia de difusão. Esta etapa singulariza o texto digital e determina suas condições de produção e transmissão, tornando-o um objeto teóricosingular para a crítica textual.
Proceedings of the …, Jan 1, 2010
E-Dictor is a tool for encoding, applying levels of editions, and assigning part-ofspeech tags to... more E-Dictor is a tool for encoding, applying levels of editions, and assigning part-ofspeech tags to ancient texts. In short, it works as a WYSIWYG interface to encode text in XML format. It comes from the experience during the building of the Tycho Brahe Parsed Corpus of Historical Portuguese and from consortium activities with other research groups. Preliminary results show a decrease of at least 50% on the overall time taken on the editing process.
Claudia Pfeiffer; José Horta Nunes. (Org.). Introdução às Ciências das Linguagem: Língua, Sociedade e Conhecimento. , Jan 1, 2006

Journal of Portuguese Linguistics, Jan 1, 2005
[Available at https://doi.org/10.5334/jpl.166] In this paper we study the syntax of clitic-placem... more [Available at https://doi.org/10.5334/jpl.166] In this paper we study the syntax of clitic-placement in Portuguese authors born from 1542 to 1836, as regards their patterns of clitic pronouns placement. The motivation for the research was to enquire: what is the pattern of enclisis (V-cl) and proclisis (cl-V) variation in those texts; is it indicative of linguistic change; if so, when in the timeline can the change be located?
Drawing from the emprical results, we analyse the syntax of clitic placement in those texts as representative of a grammatical change which should be located in the first half of the 18th century. Our empirical arguments and structural analysis sustain that in texts up to the 18th century, enclisis is strictly a Verb-First phenomenon (even so, we will argue, in constructions that are supperficially non-verb initial). We sustain that the effects of this syntax in clitic placement ceases to be noticed for texts written by authors born after 1700.
Uploads
Papers by Maria Clara Paixão de Sousa
“descorporificação” como propriedade conceitual fundante do texto digital, propondo-se uma reflexão quanto à produção e circulação do texto em função dessa propriedade descorporificada, e apontandose, na dimensão material completa do texto digital, a superfície tecnológica de uma revolução em nossa sociedade de saber.
Drawing from the emprical results, we analyse the syntax of clitic placement in those texts as representative of a grammatical change which should be located in the first half of the 18th century. Our empirical arguments and structural analysis sustain that in texts up to the 18th century, enclisis is strictly a Verb-First phenomenon (even so, we will argue, in constructions that are supperficially non-verb initial). We sustain that the effects of this syntax in clitic placement ceases to be noticed for texts written by authors born after 1700.
“descorporificação” como propriedade conceitual fundante do texto digital, propondo-se uma reflexão quanto à produção e circulação do texto em função dessa propriedade descorporificada, e apontandose, na dimensão material completa do texto digital, a superfície tecnológica de uma revolução em nossa sociedade de saber.
Drawing from the emprical results, we analyse the syntax of clitic placement in those texts as representative of a grammatical change which should be located in the first half of the 18th century. Our empirical arguments and structural analysis sustain that in texts up to the 18th century, enclisis is strictly a Verb-First phenomenon (even so, we will argue, in constructions that are supperficially non-verb initial). We sustain that the effects of this syntax in clitic placement ceases to be noticed for texts written by authors born after 1700.
estudos em lingüística histórica atuais a partir do exame de textos fundamentais da
historiografia da língua portuguesa (compêndios gramaticais dos séculos XVI e XVII, obras selecionadas da linguística histórica do século XIX, e obras representativas das diferentes tendências teóricas do século XX até os dias correntes).
Resumo: Este artigo apresenta uma análise diacrônica para a sintaxe dos sujeitos em português através da comparação de três construções diferentes – ativas, passivas e construções com SE – relacionando a mudança na posição dos sujeitos à perda de V2. Na gramática V2, na qual a posição pré-verbal está associada a elementos topicalizados, e sujeitos não topicalizados permanecem na posição pós-verbal, encontramos os mesmos padrões de ordem nas construções com SE, nas ativas e nas passivas; na gramática (X)SVO, na qual a posição do sujeito está associada a uma posição pré-verbal e os elementos topicalizados ocupam a periferia à esquerda da sentença, as construções ativas e passivas apresentam um aumento significativo no percentual de sujeitos pré-verbais, ao passo que as construções com SE permanecem estáveis com relação à ordem. Interpretamos esse resultado como evidência para analisar o argumento interno das construções com SE como sendo um complemento e não um sujeito.