Схемы маркировки частей речи и указания грамматических категорий даются по руководству Национального корпуса русского языка[3]. Каждая грамматическая категория указывается в отдельном слое программы ELAN (всего 13 слоев).

3.2. Деление на сегменты

3.2.1. ЭДЕ

В зависимости от подхода исследователи используют различные критерии при сегментации устных монологов. Они могут быть основаны на синтаксической структуре, семантике, просодии или на их сочетании. Деление происходит на «высказывания» (Marini et al., 2011), коммуникативные единицы (Armstrong et al., 2011), тематические единицы (Marini et al., 2005), вербализации (Glosser, Deser, 1990), элементарные дискурсивные единицы (ЭДЕ) (Carlson, Marcu, 2001; Kibrik, 1996; Mann, Thompson, 1988; Taboada, Mann, 2006), минимальные единицы дискурса (Degand, Simon, 2005), составляющие единицы дискурса (Polanyi, 1985). В нашем исследовании мы используем термин «элементарные дискурсивные единицы» (ЭДЕ) для обозначения минимального сегмента и термин «высказывание» для обозначения грамматически более сложной единицы.

Спонтанная речь часто содержит множество прерываний, речевых ошибок, неполных и грамматически неверных предложений, пауз, фальстартов, повторов, что затрудняет сегментацию устного дискурса. Кроме того, в отношении речи испытуемых с афазией и с повреждениями правого полушария сложно применять синтаксические и просодические критерии, так как синтаксис и просодия у таких людей могут быть нарушены (Alexander, Hillis, 2008; Heilman, Leon, Rosenbek, 2004; Seddoh, 2004).

Мы используем грамматический, а не просодический (Кибрик, Подлесская, 2013) принцип деления повествования на ЭДЕ. ЭДЕ – это часть предложения со сказуемым или опущенным сказуемым (например, «мальчик на велосипеде к дереву»/the boy on the bike to the tree). Каждый финитный и нефинитный предикат (включая причастия и деепричастия) относится к отдельной ЭДЕ, кроме случаев повтора и поиска слов. Если синтаксической информации недостаточно для суждения о границах ЭДЕ, используются данные просодии.

3.2.2. Высказывания

Высказывание определяется как главное предложение вместе со всеми придаточными (Glosser, Deser, 1990). Соотношение между количеством высказываний и количеством главных и придаточных предложений может рассматриваться в клинической лингвистике как мера грамматической сложности (Andreetta et al., 2012).

3.2.3. Станзы

Разделение на сцены основано на семантическом критерии. Сцена (scene, или stanza) – это термин, используемый в основном при анализе повествования и обозначающий группу строк (ЭДЕ), объединенных общей темой (Gee, 1985).

3.3. Особые слои

Смех указывается в особом слое (Laughter) и соотносится со звуковой волной. Указание на смех позволяет анализировать его как маркер когнитивных затруднений, связанных с неспособностью найти нужное слово, как реакцию на события фильма, предъявляемого в качестве стимула, либо как маркер неудовлетворенности рассказчика качеством своего повествования в целом (Khudyakova, Bergelson, 2015).

Грамматические, семантические и фонетические ошибки указываются в особом слое (Errors). Фонетические ошибки включают замену одного звука другим, например сапка (правильно шапка); пропуск фонемы или включение лишней фонемы, например поропал (правильно пропал), а также использование слова, фонетически близкого к искомому, но семантически отличающегося от него, например грустные вместо груши. Семантические ошибки включают использование слова, входящего в ту же семантическую категорию, что и искомое слово, например