компьютерных программ и технологий организации и обработки данных для моделирования функционирования языка в тех или иных условиях, ситуациях, проблемных сферах и т.д., а также вся сфера применения компьютерных моделей языка в лингвистике и смежных дисциплинах. (А. Н. Баранов, Введение в прикладную лингвистику)
о всех языках мира как индивидуальных его представителях. Лингвистика изучает язык вообще, как явление, не данное в непосредственном наблюдении. Язык есть естественно (на определенной стадии развития человеческого общества) возникшая и закономерно развивающаяся семиотическая (знаковая) система, обладающая свойством социальной предназначенности. Это система, существующая прежде всего не для отдельного индивида, а для определенного социума. Кроме того, на эту знаковую систему наложены ограничения, связанные с ее функциями и используемым субстанциальным (звуковым) материалом (А. Е. Кибрик)
лингвистика, модели которой могут использоваться при создании программ для обработки текстов. Компьютерная лингвистика 1 Компьютерная лингвистика 2 Это технология и методология решения практических задач, компьютерного анализа и синтеза языка.
исследование языка с вычислительной точки зрения. Компьютерная лингвистика занимается созданием вычислительных моделей различных лингвистических феноменов. Natural language processing или Автоматическая обработка текста Преимущественно область Computer Science, искусственного интеллекта и лингвистики. Имеет отношение к человеко-компьютерному взаимодействию, и современные модели АОТ чаще строятся на машинном обучении и статистике, а не моделировании языка. Т.е. для решения своих задач АОТ может использовать формальные модели языка, разных уровней языка, создаваемые компьютерной лингвистикой.
Applications” “Intelligent natural language processing is based on the science called computational linguistics. Computational linguistics is closely connected with applied linguistics and linguistics in general.”
http://aot.ru/demo/synt.html — грамматика HPSG http://www.dictum.ru/ru/syntax/blog — правила http://nlp.stanford.edu/software/lex- parser.shtml — машинное обучение Проблемы АОТ
language understanding) АПТ с точки зрения лингвиста Н. Н. Леонтьевой (автор учебника «Автоматическое понимание текстов. Системы, модели, ресурсы») Естественный текст 1) тест перевода 2) реферат 3) ответы на вопросы 4) рисунок или таблица 1) сравнение (выявление общего и различного) 2) извлечение знаний Несколько текстов Проблемы АОТ
windscreens into giant computer displays that overlay the real world with useful information, such as directions or even social media feeds.» — «Cars turn to augmented reality», J. Stewart, BBC Проблемы АОТ
и не эквивалентны друг другу. • В некоторых языках проблема определения части речи тесно связана с разрешением многозначности, эти две задачи могут мешать друг другу. • Человеческий фактор. • Здравый смысл. «Jill and Mary are sisters.» — они являются сёстрами по отношению друг к другу. «Jill and Mary are mothers.» — каждая независимо является матерью. • Зависимость от задачи. • Дискретное представление значений слова.
«Зеленый» в сочетании с одуш. сущ. Обозначает «неопытный». В значении «имеющий отношение к зеленому цвету» только с неодуш. сущ. 2. «Поверхностный» подход (shallow approach) «The dogs bark at the tree» bark – гл. «лаять» и сущ. «кора»
methods); • методы обучения с учителем (supervised methods); • методы частичного обучения с учителем (semi-supervised learning); • методы обучения без учителя (unsupervised methods.
«Дан приказ ему на запад, /Ей — в другую сторону» — М. В. Исаковский); «Тане — 5, а Вале — 3» «Моя мать — врач» • Сложные средства референции «Неудобные» свойства языка
Language Processing, Computational Linguistics, and Speech Recognition. Daniel Jurafsky, James H. Martin • COMPUTATIONAL LINGUISTICS: Models, Resources, Applications. Igor A. Bolshakov, Alexander Gelbukh • Введение в прикладную лингвистику. А. Н. Баранов. • Автоматическое понимание текстов. Системы, модели, ресурсы. Н. Н. Леонтьева • Лекция В. П. Селегея «Компьютерная лингвистика сегодня» (9.10.2012)