Д. А. Чернова. Обработка синтаксически неоднозначных предложений в процессе восприятия речи
Презентация доклада Д. А. Черновой "Обработка синтаксически неоднозначных предложений в процессе восприятия речи" на семинаре "От вазы к лицам". Другие материалы семинара опубликованы на сайте Cogito ergo ... : http://cogitoergo.ru/
более одного значения Неоднозначность - наличие у языкового выражения одновременно нескольких различных смыслов Полисемия - наличие у слова нескольких значений, между которыми имеется связь (швейная игла, сосновая игла, патефонная игла, Адмиралтейская игла) Омонимия – звуковое и графическое совпадение различных языковых единиц, значения которых не связаны друг с другом(счастливый брак/заводской брак) Синтаксическая неоднозначность (синтаксическая омонимия) возможность построить несколько синтаксических структур на основе одной и той же последовательности языковых знаков (amor patris, flying planes can be dangerous; мать любит дочь)
1 вариант синтаксического членения. • Выбор этого варианта обусловлен заранее заданным правилом • На ранних этапах синтаксический анализатор работает без привлечения несинтаксической информации (модулярность). • На этапе разрешающего контекста избранный вариант либо подтверждается (тогда никаких затруднений нет), либо нет (тогда анализ начинается заново ) • Подтверждающие эксперименты (Frazier, Rayner 1982, Ferreira, Clifton 1986, Binder, Duffy, Rayner 2001 и др):увеличение времени обработки только в том случае, когда контекст склоняет к непредпочтительному варианту
cool. The car of the driver with moustache was cool. The driver of the car with moustache was cool. the driver with moustache the driver with... the car with... the driver with... the driver with... the driver with moustache the car with moustache ???
• они конкурируют между собой, в итоге один набирает больший вес, чем остальные • синтаксический анализатор не инкапсулирован (не модулярный подход): с самого начала обработки учитывается информация разных уровней (факторы, определяющие интепретацию) Эксперименты (McDonald 1993, Pearlmutter, Mendelsohn 1999, Mason, Just, Keller, Carpenter 2003, Clifton, Staub 2008): доп. нагрузка тогда есть при любой неоднозначности, а не только в случае реанализа, в связи с тем, что рабочая память загружена сразу несколькими вариантами интерпретаций одновременно
синтаксически неоднозначной конструкции The car of the driver with moustache / The driver of the car with moustache • предшествующий контекст (bias): актуализация одного из имен (Zagar 1997, Юдина 2006) The driver with his sons came.The son of the driver with moustache was cool. The drivers came with their children. The son of the driver with moustache was cool.
данным, в английском языке распределение 64% к 36% во французском языке распределение 34% к 66% • Тип конструкции Somebody shot the servant of the actress who was on the balcony. The son of the driver with moustache was cool. The spy saw the man with binoculars • Характеристики конкретного типа конструкции Например, при неоднозначных предложениях с придаточным – роль длины придаточного В раздевалке девушки заметили тренера гимнаста, который им нравился В раздевалке девушки заметили тренера гимнаста, который им нравился еще с прошлого чемпионата (Федорова, Янович 2004)
памяти (Mendelsohn & Pearlmutter 1999, Swets et al. 2004, Yanovich & Fedorova 2005, Драгой 2006 ) Испытуемые с низким объемом РП предпочитают присоединение к первой ИГ (80%) Испытуемые с высоким объемом РП предпочитают присоединение ко второй ИГ (62%) Низкий объем РП – присоединение к самому актуализированному (=первому) имени, т.к. не удержать всю цепочку Высокий объем РП – более крупное членение отсутствие паузы между вторым именем и присоединяемым компонентам
driver of the car with moustache was cool. The son of the driver with moustache was cool the car with... the driver with... the driver with moustache the son with moustache the driver with... обращение к внешним факторам the driver with moustache the car with moustache the son with... the car with... the driver with... the car with moustache the driver with moustache
пор, пока не поступит достаточно информации. •если она так и не появится – интерпретации и не будет, если только нет принуждения сделать выбор (в этом случае временнные затраты будут иметь место не при обработке неоднозначного предложения, а при ответе на вопрос). •В эксперименте такой тип обработки проявится в сокращении времени на неоднозначном фрагменте, ведь его обработка идет лишь поверхностно, а увеличение времени обработки – на разрешающем контексте (если он есть). Traxler et al 1998, van Gompel 2001, Swets et al 2008.
driver of the car with moustache was cool. The son of the driver with moustache was cool. ??? ??? ??? the driver with moustache the driver with moustache ???
Как соотносится универсальное и лингвоспецифичное? – в английском языке – предпочтительно присоединение к последнему существительному, аналогично – в норвежском, румынском, арабском – в испанском языке – к первому существительному (Cuetos&Mitchell 1988), аналогично в польском, немецком, японском – в русском языке – противоречивые данные (Sekeina 2003, Yanovich & Fedorova 2005) • Какова роль каждого из факторов и как они взаимодействуют между собой? • Каковы отличия в обработке неоднозначных конструкций разных типов
земле слепых исполинов – 9 прочтений Приглашение рабочих бригад вызвало осуждение товарища Иванова – 32 прочтения Письма знакомой из Киева не заменят фотографии милой и любимой дочери Марии – 512 прочтений
частотность синтаксически неоднозначных конструкций разных типов в текстах разных типов – оценить частотность каждого из прочтений неоднозначной конструкции Опосредованные (offline-методики) – тест на заканчивание фразы (сформулировать гипотезу о предпочтениях носителей языка при интерпретации неоднозначных синтаксических конструкций) Непосредственные (online-методики) – чтение с саморегулировкой скорости (время чтения каждого из фрагментов предложения; время, затраченное на выбор ответа на вопрос по содержанию предложения и число ошибок в этих ответах). – чтение с регистрацией движения глаз время чтения
затруднение по сравнению с однозначным? • Если неоднозначность снимается контекстом, есть ли разница в скорости обработки в зависимости от прочтения? • Как коррелирует скорость обработки с частотностью конструкции? с объемом рабочей памяти? • Как влияет предшествующий контекст? Показатели • Время, затраченное на чтение фразы в экспериментальном и контрольном условии • Количество возвратов при чтении фразы в экспериментальном и контрольном условии • Время, затраченное на выбор ответа в экспериментальном и контрольном условии • Тенденции выбора ответа для фраз разных типов многозначности