Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Д. А. Чернова. Обработка синтаксически неоднозначных предложений в процессе восприятия речи

Д. А. Чернова. Обработка синтаксически неоднозначных предложений в процессе восприятия речи

Презентация доклада Д. А. Черновой "Обработка синтаксически неоднозначных предложений в процессе восприятия речи" на семинаре "От вазы к лицам". Другие материалы семинара опубликованы на сайте Cogito ergo ... : http://cogitoergo.ru/

Cogito ergo ...

March 06, 2013
Tweet

More Decks by Cogito ergo ...

Other Decks in Science

Transcript

  1. Многозначность, неоднозначность, полисемия, омонимия Многозначность - существование у некоторой единицы

    более одного значения Неоднозначность - наличие у языкового выражения одновременно нескольких различных смыслов Полисемия - наличие у слова нескольких значений, между которыми имеется связь (швейная игла, сосновая игла, патефонная игла, Адмиралтейская игла) Омонимия – звуковое и графическое совпадение различных языковых единиц, значения которых не связаны друг с другом(счастливый брак/заводской брак) Синтаксическая неоднозначность (синтаксическая омонимия) возможность построить несколько синтаксических структур на основе одной и той же последовательности языковых знаков (amor patris, flying planes can be dangerous; мать любит дочь)
  2. Синтаксическая неоднозначность  Стрелочная Мы встретили сына художника, приехавшего из

    Парижа: /  Разметочная Преследование тигра закончилось неудачей  Конституентная Положи в портфель новые книги и тетради
  3. Синтаксическая неоднозначность: направления изучения  Теоретическое языкознание Chomsky 1965, Мельчук

    1999, Митренина 2010  Автоматическая обработка языка Иорданская 1967, Гладкий 1985, Дрейзин 1988, Богуславский 2003, Иомдин 2005  Психолингвистика Fodor et al. 1974, Frazier&Rayner 1982, Cuetos & Mitchell 1988, Mendelsohn & Pearlmutter 1999, Секерина 2003, Драгой 2006, Юдина 2010
  4. Стратегии парсинга: последовательная (serial) • Изначально при анализе принимается только

    1 вариант синтаксического членения. • Выбор этого варианта обусловлен заранее заданным правилом • На ранних этапах синтаксический анализатор работает без привлечения несинтаксической информации (модулярность). • На этапе разрешающего контекста избранный вариант либо подтверждается (тогда никаких затруднений нет), либо нет (тогда анализ начинается заново ) • Подтверждающие эксперименты (Frazier, Rayner 1982, Ferreira, Clifton 1986, Binder, Duffy, Rayner 2001 и др):увеличение времени обработки только в том случае, когда контекст склоняет к непредпочтительному варианту
  5. Последовательная стратегия The son of the driver with moustache was

    cool. The car of the driver with moustache was cool. The driver of the car with moustache was cool. the driver with moustache the driver with... the car with... the driver with... the driver with... the driver with moustache the car with moustache ???
  6. Стратегии парсинга: параллельная (parallel) • изначально рассматриваются все возможные варианты

    • они конкурируют между собой, в итоге один набирает больший вес, чем остальные • синтаксический анализатор не инкапсулирован (не модулярный подход): с самого начала обработки учитывается информация разных уровней (факторы, определяющие интепретацию) Эксперименты (McDonald 1993, Pearlmutter, Mendelsohn 1999, Mason, Just, Keller, Carpenter 2003, Clifton, Staub 2008): доп. нагрузка тогда есть при любой неоднозначности, а не только в случае реанализа, в связи с тем, что рабочая память загружена сразу несколькими вариантами интерпретаций одновременно
  7. Факторы: связанные с семантикой • вероятность (plausibility): семантика слов в

    синтаксически неоднозначной конструкции The car of the driver with moustache / The driver of the car with moustache • предшествующий контекст (bias): актуализация одного из имен (Zagar 1997, Юдина 2006) The driver with his sons came.The son of the driver with moustache was cool. The drivers came with their children. The son of the driver with moustache was cool.
  8. Факторы: связанные с особенностями конструкции • Частотность конструкции По корпусным

    данным, в английском языке распределение 64% к 36% во французском языке распределение 34% к 66% • Тип конструкции Somebody shot the servant of the actress who was on the balcony. The son of the driver with moustache was cool. The spy saw the man with binoculars • Характеристики конкретного типа конструкции Например, при неоднозначных предложениях с придаточным – роль длины придаточного В раздевалке девушки заметили тренера гимнаста, который им нравился В раздевалке девушки заметили тренера гимнаста, который им нравился еще с прошлого чемпионата (Федорова, Янович 2004)
  9. Факторы: связанные с индивидуальными особенностями носителя языка • Объем рабочей

    памяти (Mendelsohn & Pearlmutter 1999, Swets et al. 2004, Yanovich & Fedorova 2005, Драгой 2006 ) Испытуемые с низким объемом РП предпочитают присоединение к первой ИГ (80%) Испытуемые с высоким объемом РП предпочитают присоединение ко второй ИГ (62%) Низкий объем РП – присоединение к самому актуализированному (=первому) имени, т.к. не удержать всю цепочку Высокий объем РП – более крупное членение отсутствие паузы между вторым именем и присоединяемым компонентам
  10. The car of the driver with moustache was cool. The

    driver of the car with moustache was cool. The son of the driver with moustache was cool the car with... the driver with... the driver with moustache the son with moustache the driver with... обращение к внешним факторам the driver with moustache the car with moustache the son with... the car with... the driver with... the car with moustache the driver with moustache
  11. Стратегии парсинга: отложенная (delayed) •неоднозначный фрагмент не интерпретируется до тех

    пор, пока не поступит достаточно информации. •если она так и не появится – интерпретации и не будет, если только нет принуждения сделать выбор (в этом случае временнные затраты будут иметь место не при обработке неоднозначного предложения, а при ответе на вопрос). •В эксперименте такой тип обработки проявится в сокращении времени на неоднозначном фрагменте, ведь его обработка идет лишь поверхностно, а увеличение времени обработки – на разрешающем контексте (если он есть). Traxler et al 1998, van Gompel 2001, Swets et al 2008.
  12. The car of the driver with moustache was cool. The

    driver of the car with moustache was cool. The son of the driver with moustache was cool. ??? ??? ??? the driver with moustache the driver with moustache ???
  13. Психолингвистические проблемы синтаксического анализа • Какая из стратегий используется? •

    Как соотносится универсальное и лингвоспецифичное? – в английском языке – предпочтительно присоединение к последнему существительному, аналогично – в норвежском, румынском, арабском – в испанском языке – к первому существительному (Cuetos&Mitchell 1988), аналогично в польском, немецком, японском – в русском языке – противоречивые данные (Sekeina 2003, Yanovich & Fedorova 2005) • Какова роль каждого из факторов и как они взаимодействуют между собой? • Каковы отличия в обработке неоднозначных конструкций разных типов
  14. Синтаксическая неоднозначность в языке с богатым словоизменением Раскапывайте погребенных в

    земле слепых исполинов – 9 прочтений Приглашение рабочих бригад вызвало осуждение товарища Иванова – 32 прочтения Письма знакомой из Киева не заменят фотографии милой и любимой дочери Марии – 512 прочтений
  15. Методы изучения процесса обработки синтаксически неоднозначных предложений: Корпусный – оценить

    частотность синтаксически неоднозначных конструкций разных типов в текстах разных типов – оценить частотность каждого из прочтений неоднозначной конструкции Опосредованные (offline-методики) – тест на заканчивание фразы (сформулировать гипотезу о предпочтениях носителей языка при интерпретации неоднозначных синтаксических конструкций) Непосредственные (online-методики) – чтение с саморегулировкой скорости (время чтения каждого из фрагментов предложения; время, затраченное на выбор ответа на вопрос по содержанию предложения и число ошибок в этих ответах). – чтение с регистрацией движения глаз время чтения
  16. Планируется проверка в эксперименте • Вызывает ли обработка неоднозначного предложения

    затруднение по сравнению с однозначным? • Если неоднозначность снимается контекстом, есть ли разница в скорости обработки в зависимости от прочтения? • Как коррелирует скорость обработки с частотностью конструкции? с объемом рабочей памяти? • Как влияет предшествующий контекст? Показатели • Время, затраченное на чтение фразы в экспериментальном и контрольном условии • Количество возвратов при чтении фразы в экспериментальном и контрольном условии • Время, затраченное на выбор ответа в экспериментальном и контрольном условии • Тенденции выбора ответа для фраз разных типов многозначности