computational linguistics

0

No comments posted yet

Comments

Slide 1

APPLIED LINGUISTICS КОМПЬЮТЕРНАЯ ЛИНГВИСТИКА. Ее объект, предмет, цели, задачи и методы исследования

Slide 2

Компьютерная лингвистика как часть научного направления «прикладная лингвистика» Теория знака, лежащая в основе компьютерной лингвистики Инструментарий компьютерной лингвистики Применение результатов компьютерной лингвистики на практике   РАССМАТРИВАЕМЫЕ ВОПРОСЫ

Slide 3

Изучает лингвистические основы информатики; аспекты связи языка и мышления; Осуществляет моделирование языка и мышления в компьютерной среде с помощью компьютерных программ КОМПЬЮТЕРНАЯ ЛИНГВИСТИКА направление в прикладной лингвистике, ориентированное на: - использование компьютерных инструментов: программ, компьютерных технологий; - организацию и обработку данных для моделирования языка и мышления в компьютерной среде в тех или иных условиях, ситуациях, проблемных сферах и т.д., - применение компьютерных моделей языка в лингвистике и смежных дисциплинах.

Slide 4

ИНТЕРЕСЫ КОМПЬЮТЕРНОЙ ЛИНГВИСТИКИ Создание: - общих языков для представления информации; - естественного языкового интерфейса для общения человека с машиной; создание и моделирование информационных систем; - усовершенствование языков для представления информации;

Slide 5

ОБЪЕКТ: Речевые произведения (текст и звучащая речь) и структурные языковые единицы (фонемы, морфемы, слова, словосочетания, предложения); ПРЕДМЕТ: Процессы и задачи, связанные с функционированием языковых единиц в коммуникации; Прикладные процессы, отвечающие определенному социальному запросу. МЕТОД: Метод моделирования (порождения). ОБЪЕКТ, ПРЕДМЕТ И МЕТОДЫ ИССЛЕДОВАНИЯ КОМПЬЮТЕРНОЙ ЛИНГВИСТИКИ

Slide 6

Моделирование языка и языковой деятельности: а) автоматическая обработка текста (индексирование, реферирование и классификация текстов; контент-анализ; авторизация текста; сетевые технологии представления текста на естественном языке; корпусная лингвистика, лингвистические основы информационного поиска); б) речевые технологии (распознавание и синтез речи); 2. Создание прикладных систем: а) автоматической обработки текстов; б) речевых технологий; в) машинный перевод; г) вопросно-ответные системы; д) разработка и использование искусственных языков, языков информационных систем; е) компьютерная лексикография и терминография; ж) компьютерная лингводидактика. ОСНОВНЫЕ РАЗДЕЛЫ КОМПЬЮТЕРНОЙ ЛИНГВИСТИКИ

Slide 7

ОТЦЫ-ОСНОВАТЕЛИ СЕМИОТИКИ Семиотика (от др.-гр. sema – знак) - наука, изучающая знаковые системы. Чарльз Сандерс Пирс (Pierce) (1839 - 1914) - американский философ, прославился работами в области логики и семиотики (теории знаков). Чарльз Уильям Моррис (Morris) (1901-1979)  - американский философ, один из основателей семиотики. Ввел термин «прагматика».

Slide 8

ЗНАК – ЭТО Ч. Пирс: Namely, a sign is something, A, which brings something, B, its interpretant sign determined or created by it, into the same sort of correspondence with something, C, its object, as that in which itself stands to C – «Знак ... это что-то, что стоит для кого-то вместо чего-то другого в том или ином плане или отношении В.А. Ефремов: Признак, примета, по которым узнается, распознается что-л. // Клеймо, метка. 2. То, что служит указанием на что-л., свидетельством чего-л., внешним обнаружением чего-л. // Чувственное выражение, внешнее проявление чего-л. // Предзнаменование, предвестие. 3. Предмет, являющийся признаком принадлежности к чему-л., символом чего-л. 4. Жест, выражающий волю, желание, приказание кого-л. 5. Предмет или действие в роли условного обозначения чего-л.; сигнал. 6. Изображение с известным условным значением. // Письменное изображение звука речи; буква.

Slide 9

СВОЙСТВА ЗНАКА ЗНАК ВЫРАЖАЕТ ОБОЗНАЧАЕТ СМЫСЛ ЗНАЧЕНИЕ

Slide 10

Морфемы, лексемы ЯЗЫКОВЫЕ ЗНАКИ Морфемы, лексемы Означающее (экспонент, план выражения, звуковая сторона) Означаемое (план содержания, значение слова) Денотат (обозначаемый предмет) Понятие (мысль, фиксирующая свойства и отношения предметов)

Slide 11

ЗНАКОВЫЕ ОТНОШЕНИЯ, ОПРЕДЕЛЯЮЩИЕ УСТРОЙСТВО ЯЗЫКОВОЙ ЗНАКОВОЙ СИСТЕМЫ Форма и содержание языкового знака – единство денотативного и сигнификативного отношений. Семантика (схема) языкового знака – денотативное и сигнификативное отношения; Прагматика – отношение знака к человеку-пользователю; Синтактика – отношения между знаками в процессе означивания.

Slide 12

ОТКРЫТАЯ СИСТЕМА (целостность, состоящая из взаимозависимых частей, каждая из которых вносит свой вклад в характеристику целого и взаимодействующая с окружающей средой в к.-л. аспекте) ЗАКРЫТЫХ ПОДСИСТЕМ (набора свойств или явлений, недоступных вне объекта) ЯЗЫК – ЭТО

Slide 13

МЕТОД МОДЕЛИРОВАНИЯ, КОМПЬЮТЕРНОЕ МОДЕЛИРОВАНИЕ МЕТОД МОДЕЛИРОВАНИЯ - выяснение свойств какого-либо предмета при помощи построения его модели; КОМПЬЮТЕРНОЕ МОДЕЛИРОВАНИЕ – метод решения задачи анализа или синтеза сложной системы на основе использования ее компьютерной модели; КОМПЬЮТЕРНАЯ МОДЕЛЬ – условный образ объекта или некоторой системы, описанный с помощью взаимосвязанных компьютерных таблиц, блок-схем, диаграмм, графиков, рисунков и т.д.

Slide 14

АЛГОРИТМ ПРОВЕДЕНИЯ СИСТЕМНОГО АНАЛИЗА И ЕГО РЕЗУЛЬТАТ графематический/ фонематический анализ языка; морфологический анализ; лексико-грамматический анализ языка; синтаксический анализ или парсинг; СОЧЕТАЕМОСТЬ ЯЗЫКОВЫХ ЕДИНИЦ НА ПРИМЕРЕ СЛОВА СВОБОДА (по И.Е. Ворониной и Я.Е. Львовичу): E→ Xi, i ∈ 1...n, где Е – множество объектов; Xi - множество значений переменной xi; i - индекс,нумерующий переменные, участвующие в эксперименте.

Slide 15

КОНЦЕПТУАЛЬНАЯ МОДЕЛЬ ИССЛЕДОВАНИЯ ЕСТЕСТВЕННОГО ЯЗЫКА Лицо, принимающее решение объект диагностика Результаты исследования Инструментальные средства, методы оптимизации принятия решения

Slide 16

ТЕОРИЯ ЗНАНИЙ Мышление - это процесс обработки и порождения знаний

Slide 17

ЗНАНИЯ ДЕКЛАРАТИВНЫЕ (ЗНАНИЕ «ЧТО») толкования слов в толковых словарях. например: чашка — небольшой сосуд для питья округлой формы, обычно с ручкой, из фарфора, фаянса ПРОЦЕДУРНЫЕ (ЗНАНИЕ «КАК») последовательность (список) операций, действий, которые следует выполнить например: 1. Не извлекайте SIM-карту во время передачи и получения данных, это может привести к потере данных и повреждению устройства; 2. Предохраняйте карту от сильных ударов, статического электричества и электрических помех других устройств. 3. Не прикасайтесь к позолоченным контактам карты памяти пальцами и металлическими предметами, т.д.

Slide 18

СТРУКТУРЫ ЗНАНИЙ 1. Фрейм (от англ. frame – рамка) структура данных, содержащих некую информацию (описание объекта в виде атрибутов и их значений – декларативное представление), представленную в виде таблицы, строки которой образуют слоты, связанные между собой определенными семантическими отношениями.

Slide 19

ФРЕЙМ «СТОЛ»

Slide 20

2. Сценарий – концептуальная структура для процедурного представления знаний о стереотипной ситуации или стереотипном поведении. Элементы сценария – шаги алгоритма или инструкции, например: «сценарий посещения ресторана» - «Вы входите в ресторан и находите свободный столик — иногда сами, а иногда ждете, чтобы вам его указали. Садитесь и ждете. Через некоторое время подходит официант и подает вам меню. Официант уходит, потом возвращается, чтобы принять заказ. Немного погодя он приносит кушанья, и вы едите. Затем официант вручает вам счет, и вы платите или ему самому, или в кассу. Оставляете чаевые, даже если еда вам не понравилась».

Slide 21

3. План - результат применения сценария к конкретной проблемной ситуации. План: - включает последовательность процедур, переводящих начальное состояние системы в конечное, и ведущих к достижению определенной подцели и цели. - связан с конкретной ситуацией, конкретным исполнителем и преследует достижение определенной цели. Выбор плана регулируется ресурсами исполнителя.

Slide 22

моделирование общения; моделирование структуры сюжета; гипертекстовые технологии представления текста. СФЕРЫ КОМПЬЮТЕРНОГО МОДЕЛИРОВАНИЯ

Slide 23

МОДЕЛИРОВАНИЕ СТРУКТУРЫ СЮЖЕТА Морфология сюжета Синтаксис сюжета Когнитивный подход

Slide 24

МОДЕЛЬ СТРУКТУРЫ СЮЖЕТА (когнитивный подход, где m – мотивация, a – актуализация, t – прекращение одного действия другим, e – эквивалентность аффективной каузальной связи между персонажами) Делла − {проблема подарка} ↓m M1 {осознание проблемы} ↓а М2 {намерение продать волосы} + {продажа волос, получение денег} ↓m M3 {намерение купить цепочку} ↓а + {покупает цепочки} ↓t +{делает Джиму подарок} − {получает гребни} ↓t − {видит ненужность цепочки} ↓t + {видит любовь Джима} Джим − {проблема подарка} ↓m M1 {осознание проблемы} ↓а М2 {намерение продать часы} + {продажа часов, получение денег} ↓m M3 {намерение купить гребни} ↓а + {покупает гребни} ↓t +{делает Делле подарок} − {получает цепочку} ↓t − {видит ненужность гребней} ↓t + {видит любовь Деллы}

Slide 25

КОМПЬЮТЕРНАЯ ЛИНГВИСТИКА НА ПРАКТИКЕ АВТОМАТИЧЕСТКАЯ ОБРАБОТКА ЯЗЫКА Natural Language Processing, ) разработка и использование искусственных языков, в т. ч. языков программирования, языков информационных систем; компьютерная лексикография и терминография. АВТОМАТИЧЕСКАЯ ОБРАБОТКА ТЕКСТА машинный перевод; распознавание и синтез речи; лингвистические основы информационного поиска; автоматическое индексирование, реферирование и классификация текстов; Автоматический контент-анализ текста; авторизация текстов; сетевые технологии представления текста и информации; корпусная лингвистика компьютерная лингводидактика .

Summary: the questions connected with the relationship between the language and the computer

URL: