Acta Linguistica Petropolitana
Вестник Пермского университета. Российская и зарубежная филология, 2013
Объектом внимания в статье являются периферийные зоны лексикограмматической характеристики русско... more Объектом внимания в статье являются периферийные зоны лексикограмматической характеристики русского слова и те единицы, которые попадают в эти зоны, пройдя, как правило, путь грамматикализации и/или прагматикализации. В ряде случаев реально активные элементы нашей повседневной речи не находят себе места даже и в этой периферийной зоне, они полностью выходят за рамки лексикографической фиксации и могут быть описаны лишь как прагматические маркеры, важные, тем не менее, во всех прикладных аспектах лингвистики.

Lecture Notes in Computer Science, 2016
The research presented in this paper has been conducted in the framework of the large sociolingui... more The research presented in this paper has been conducted in the framework of the large sociolinguistic project aimed at describing everyday spoken Russian and analyzing the special characteristics of its usage by different social groups of speakers. The research is based on the material of the ORD corpus containing long-term audio recordings of everyday communication. The aim of the given exploratory study is to reveal the linguistic parameters, in terms of which the difference in speech between different social groups is the most evident. An exploratory subcorpus, consisting of audio fragments of spoken communication of 12 respondents (6 men and 6 women, 4 representatives for each age group, and representatives of different professional and status groups) with the total duration of 106 min and of similar communication settings, was created and fully annotated. The quantitative description of a number of linguistic parameters on phonetic, lexical, morphological, and syntax levels in each social group was made. The biggest difference between social groups was observed in speech rate, phonetic reduction, lexical preferences, and syntactic irregularities. The study has shown that the differences between age groups are more significant than between gender groups, and the speech of young people differs most strongly from the others.

Lecture Notes in Computer Science, 2016
The ORD corpus is one of the largest resources of contemporary spoken Russian. By 2014, its colle... more The ORD corpus is one of the largest resources of contemporary spoken Russian. By 2014, its collection numbered about 400 h of recordings made by a group of 40 respondents (20 men and 20 women, of different ages and professions), who volunteered to spend a whole day with a switched-on voice recorder, recording all their verbal communication. The corpus presents the unique linguistic material recorded in natural communicative situations, allowing spoken Russian and the everyday discourse to be studied in many aspects. However, the original sample of respondents was not sufficient enough to study a sociolinguistic variation of speech. Thus, it was decided to launch a large project aiming at the ORD sociolinguistic extension, which was supported by the Russian Science Foundation. The paper describes the general principles for the sociolinguistic extension of the corpus. It defines social groups which should be presented in the corpus in adequate numbers, sets criteria for selecting participants, describes the “recorder’s kit” for the respondents and involves the adaptation principles of the ORD annotation and structure. Now, the ORD collection exceeds 1200 h of recordings, presenting speech of 127 respondents and hundreds of their interlocutors. 2450 macro episodes of everyday spoken communication have been already annotated, and the speech transcripts add up to 1 mln words.

Lecture Notes in Computer Science, 2015
The studies described in the paper are made on the base of the ORD – “One day of speech” – corpus... more The studies described in the paper are made on the base of the ORD – “One day of speech” – corpus of Russian everyday speech which contains long-term audio recordings of daily communication. The ORD corpus provides rich authentic material for research in phonetics and syntax of spoken Russian, and may be used for adjustment and improvement of speech synthesis and recognition systems. Current phonetic investigations of the ORD corpus relate to temporal studies, study of speech reduction, phonetic realization of words and affixes, investigation of phonetic errors and mondegreens, studies of rhythm structures and hesitation phenomena. Syntactic studies primarily deal with linear word order of syntactic groups, syntactic complexity of spoken utterances, and specific syntactic phenomena of spontaneous speech. In this paper, we summarize main achievements in phonetic and syntactic studies made on the base of the ORD corpus and outline some directions for further investigations.
Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics), 2009
... Alexander Asinovsky, Natalia Bogdanova, Marina Rusakova, Anastassia Ryko, Svetlana Stepanova,... more ... Alexander Asinovsky, Natalia Bogdanova, Marina Rusakova, Anastassia Ryko, Svetlana Stepanova, and Tatiana Sherstinova St. ... eg, intentionally talking with other members of the family or inviting unusual guests) in order to enlarge the amount of speech mate-rial within the ...
Вестник Пермского университета. Российская и зарубежная филология, 2016
The paper examines one of the features of Russian spontaneous speech: its trend to structural iso... more The paper examines one of the features of Russian spontaneous speech: its trend to structural isochrony of its parts, which is especially evident in small phrases/utterances. The research data is taken from two blocks of the Russian Speech Corpus: the SAT balanced annotated corpus and the ORD corpus of Russian everyday communication. The SAT corpus contains monologue speech, whereas the ORD recordings consist of dialogues, polylogues, and isolated utterances. The aim of the given research is to find experimental proof for the hypothesis that the isochrony of spoken language in some cases is maintained by the addition of discourse particles like vot, nu, tam, koroche.
В статье обсуждается целесообразность создания словаря дискурсивных единиц (хезитативных конструк... more В статье обсуждается целесообразность создания словаря дискурсивных единиц (хезитативных конструкций) современной русской речи. Конкретным материалом для анализа стала одна из таких единиц, представленная в речи большим количеством вариантов: скажем, так скажем, скажем так, там скажем, ну скажем и проч. Автор приводит как количественные характеристики речевого материала, так и достаточно полный список функций этой единицы
Вестник Пермского университета. Российская и зарубежная филология

В статье рассматриваются специфические вопросительно-риторические конструкции русской повседневно... more В статье рассматриваются специфические вопросительно-риторические конструкции русской повседневной речи, такие как знаешь как? видишь какой? как его? как это? серьёзно, что ли?! что, трудно, что ли? что ещё (сказать)? и т. п. Подобные конструкции имеют ряд общих черт: они обращены (адресованы) говорящим либо к собеседнику, но без ожидания ответа (риторичность), либо к самому себе, также с желанием не получить ответ, а, скорее, продвинуться в построении реплики или поиске нужного слова/выражения (тоже своего рода риторичность). Все эти конструкции несомненно идиоматичны, так как не создаются говорящим в момент речи, а целиком извлекаются из ментального лексикона, воспроизводятся – на уровне речевых автоматизмов – и потому встречаются очень часто и в речи разных носителей языка. Многие из этих конструкций имеют восклицательный (серьёзно, что ли?!) или указательный (знаешь как?) оттенок, а многие обладают несомненным прагматическим значением, выступая в речи в роли прагматем разного типа: дискурсивов (знаешь что? что ещё?), вербальных хезитативов (как его? как это? что ещё?), метакоммуникативов (видишь как? что ещё сказать?) или рефлексивов (или как это? или что? так, что ли?). Видно, что порой одна единица выполняет в тексте сразу несколько функций (полифункциональность). В целом нет сомнения, что подобные конструкции создают лексико-стилистическую, прагматическую, а порой и грамматическую специфику устного дискурса и требуют своего отдельного описания.

The article is dedicated to the description of one of pragmatic items of Russian everyday speech,... more The article is dedicated to the description of one of pragmatic items of Russian everyday speech, chto li, all its structure and semantic variations including collocations (chto/chego (…) chto li?, s uma soshel chto li?, serjozno chto li?, ne vidish’ chto li!? etc.). The items mentioned are extremely frequent in Russian everyday speech, in fact, they are not produced but reproduced automatically; their functions are numerous and are not reflected in any type of dictionary or even glossary. The items of this kind are normally particularly difficult for speakers of other languages when they speak Russian, for teachers of Russian as a foreign language, and for translators and interpreters who try to localize Russian texts in foreign languages. The analysis was performed with usage of Russian speech corpus («One Speaker’s Day» module) that represents the most informal everyday speech of Russian speakers.
В статье предлагаются результаты пилотного исследования особенностей русского языка повседневного... more В статье предлагаются результаты пилотного исследования особенностей русского языка повседневного общения разных социальных групп (социолектов) современного российского города. Задачей исследования стал анализ функционирования прагматем разного типа в устной спонтанной речи (устной коммуникации) представителей разных социолектов, а также проверка диагностических возможностей данного лингвистического параметра для установления специфики того или иного социолекта. Материалом для исследования послужил подкорпус звукозаписей повседневной коммуникации из коллекции Звукового корпуса «Один речевой день», сбалансированно представляющий бытовую речь носителей языка из разных социальных слоев, мужчин и женщин разного возраста, занятых в разных сферах профессиональной деятельности. Анализ функционирования прагматем проведен и в целом по подкорпусу (12 информантов), и отдельно для трех возрастных (по 4 человека в группах молодежи, носителей языка среднего и старшего возраста) и двух гендерных групп (6 мужчин и 6 женщин). Исследование показало, что различия в речи между возрастными группами являются более значимыми, чем между мужчинами и женщинами, при этом наиболее явная специфика выявлена для младшей возрастной группы. Удалось установить также «излюбленные» единицы рассматриваемого класса для конкретных социолектов: короче – для молодежной речи в обеих гендерных группах, в общем – для женщин старшего возраста. Профессия, род занятий говорящего и связанный с этими характеристиками уровень его речевой компетенции, как показали наблюдения, не влияют на количество и характер прагматем, используемых человеком в устной коммуникации.
