computer-aided lexicography

0

No comments posted yet

Comments

Slide 1

КОМПЬЮТЕРНАЯ ЛЕКСИКОГРАФИЯ КАК НАПРАВЛЕНИЕ ПРИКЛАДНОЙ ЛИНГВИСТИКИ

Slide 2

РАССМАТРИВАЕМЫЕ ВОПРОСЫ Лексикография как одно из направлений традиционной и прикладной лингвистики Традиционная лексикография Типология словарей Строение словаря и словарной статьи Современные тенденции развития лексикографии Компьютерные словари и их классификация Особенности электронного словаря, существующего в среде многомерного гипертекста Электронные библиотеки

Slide 3

ЛЕКСИКОГРАФИЯ (греч. Lexicon +grapho = словарь пишу) собирание слов какого-либо языка, приведение их в систему в виде словаря, лексикона; словарное дело, составление словарей; совокупность печатных трудов словарного типа, словарная литература; раздел языкознания, занимающийся вопросами составления словарей и их изучения; наука, изучающая семантическую структуру слова, особенности слов, их толкование.

Slide 4

ИСТОРИЯ СТАНОВЛЕНИЯ ЛЕКСИКОГРАФИИ Глосса - (гр. glossa - устаревшее или малоупотребительное слово) перевод или толкование непонятного слова или выражения, преимущественно в древних памятниках письменности. Глоссарий ( лат. glossarium словарь глосс) – толковый словарь устаревших и малоупотребительных слов к какому-л. тексту, преимущественно древнему Шумерские глоссы - сер. III тыс. до н.э.; Китайские глоссы – рубеж III–II тыс. до н.э.; Глоссы Древней Греции - сер. I тыс. до н.э.; «Эпинальский кодекс» - VII в. Vocabulista – 1492; «A Compendious Dictionary of the English Language» («Краткий словарь английского языка») Ноа Уэбстера – 1806 г. ; «Немецкий словарь» братьев Я. и В. Гримм – 1854 г.; «Немецкий словарь» братьев Я. и В. Гримм – 1854 г.; «Словарь французского языка» Эмиля Литре - 1863—1872 гг.; «Оксфордский английский словарь» - 1884—1928 гг..

Slide 5

ИСТОРИЯ РОССИЙСКОЙ ЛЕКСИКОГРАФИИ Рукописный глоссарий (174 слова) - 1282 г. ; «Лексис, сиречь речения вкратце собранны и из словенского языка на просты русский диялект истолкованы» Лаврентия Зизания Тустановского - 1596 г.; «Лексикон славеноросский и имен толкование» Памвы Берынды – 1627 г.; «Лексикон вокабулам новым по алфавиту» - составлен в начале XVIII в., опубликован в 1910; «Русский Целлариус» этимологический словарь Ф. Гельтергофа – 1771 г.; «Опыт российского сословника» словарь синонимов Д. И. Фонвизина – 1783 г.; «Словарь Академии Российской» в 6 частях - 1789—1794 гг.; «Толковый словарь живого великорусского языка» В.И.Даля 1863-1866 гг.;

Slide 6

Л.В. ЩЕРБА (1880-1944) О ЛЕКСИКОГРАФИИ «Хотя человечество очень давно начало заниматься составлением словарей разных типов, однако какой-либо общей лексикографической теории, по-видимому, не существует еще и до сих пор. …Одним из первых вопросов лексикографии является, конечно, вопрос о различных типах словарей. В основе его лежит ряд теоретических противоположений, которые и необходимо вскрыть». «Опыт общей теории лексикографии»

Slide 7

ТРАДИЦИОННАЯ ЛЕКСИКОГРАФИЯ особая область языкознания, изучающая принципы составления словарей разных типов; практика составление словарей; совокупность словарей данного языка.

Slide 8

СЛОВАРЬ 1. Собрание слов (обычно в алфавитном порядке), устойчивых выражений с пояснениями, толкованиями (в которых описываются особенности их структуры и/или функционирования) или с переводом на другой язык. 2. Совокупность слов какого-нибудь языка, а также слов, употреблённых в к.-н. одном произведении, в произведениях к.-н. писателя или вообще употребляемых к.-н. 3. Справочная книга слов, расположенных в определенном порядке, дающая кому-либо информацию о том или ином слове. Основная задача словаря – представление или описание лексики языка и ее особенностей для решения конкретных задач.

Slide 9

Типы словарей СЛОВАРИ энциклопедические Филологические (лингвистические) Описываются предметы, явления, сообщаются сведения о различных событиях Толкуют значения слов одноязычные многоязычные Тезаурусы, современного литературного языка, исторические, этимологические, диалектов, синонимов, антонимов, фразеологизмов, иностранных слов, орфографические, орфоэпические, словообразовательные, сокращений, жаргонные, эпитетов, метафор, словари писателя, словари отдельных произведений, конкордансы и т.д.

Slide 10

КОНКОРДАНС решает следующие лингвистические задачи: создание списков слов; сопоставление разных использований одного слова; анализ ключевых слов; поиск перевода различных словосочетаний и слов; анализ частоты употребления к.-л. слова и словосочетания Конкорданс: список всех употреблений определенного языкового выражения в контексте и, возможно, со ссылкой на источник; Расположенный в алфавитном порядке перечень встречающихся в книге слов с минимальным контекстом; Особый тип словаря, в котором каждое слово приводится с минимальным контекстом.

Slide 11

СФЕРЫ ЛЕКСИКОГРАФИЧЕСКОГО ОПИСАНИЯ ЯЗЫКА

Slide 12

СТАТЬЯ - СТРУКТУРНАЯ ЕДИНИЦА СЛОВАРЯ лексический вход (вокабула или лемма); грамматическая информация; стилистические пометы; значение: - номер значения дополнительные грамматические и стилистические пометы; толкование; пример/иллюстрация; оттенки значения; фразеологизмы. В тезаурусе используется понятие таксона. таксон — это множество единиц описания, объединенных в группу по единым семантическим основаниям любого уровня абстракции. МАГИСТР м. глава и старшина некоторых военно-духовных орденов или братств. Получивший ученую степень магистра, среднюю между докторскою и кандидатскою. -ров, ему принадлежащ.; - рский, к нему относящ. Магистерство ср. звание, степень, сан магистра. Магистрат м. городское распорядительное и судебное место, заведующее горожанами. Магистратский, к нему относящ.

Slide 13

КОМПЬЮТЕРНАЯ ЛЕКСИКОГРАФИЯ (computer-aided lexicography/ e-lexicography) прикладная научная дисциплина в языкознании, изучающая методы использования компьютерной техники для составления словарей (Е.Ю. Чепик). Прикладная отрасль лексикографии, возникшая в последние десятилетия ХХ в. и 1. призванная осуществить переход от создания традиционных словарей к их электронным вариантам и модификациям с использованием информационных технологий; 2. вся совокупность словарей, доступных читателю в электронном виде (О.П. Фесенко). Особое направление в практической лексикографии со своими собственными подходами не только к отображению, но и к содержанию словаря (В.П. Селегей). временная дисциплина периода перехода от ручной и рукописной лексикографической практики к новым безбумажным информационным технологиям (Википедия).

Slide 14

НОВЫЕ ОБЛАСТИ КОМПЬЮТЕРНОЙ ЛЕКСИКОГРАФИИ Корпусная лексикография (corpus-based lexicography) – область изучения языка на основе текстовых или акустических корпусов, при использовании копьютера в определенных фазах хранения, извлечения или анализа данных (О.М. Карпова). Киберлексикография (cyberlexicography) – использование Интернета для составления или создания словаря (М. Карр).

Slide 15

ЗАДАЧИ И НАПРАВЛЕНИЯ КОМПЬЮТЕРНОЙ ЛЕКСИКОГРАФИИ Основная задача - разработка технологий составления электронных словарей и управления терминологией (Terminology Management); Основные направления : автоматическое получение из текста различных словарей (например, терминологических, частотных , конкордансов и др.); создание словарей, являющихся электронными версиями традиционных словарей (например, словарь Даля), или комплексных электронных лингвистических словарей для традиционных словарных работ; разработка теоретических и практических аспектов составления специальных компьютерных словарей для информационного поиска, машинного перевода.

Slide 16

ЭЛЕКТРОННЫЙ СЛОВАРЬ любой упорядоченный, относительно конечный массив лингвистической информации, представленный в виде списка, таблицы или перечня, удобного для размещения в памяти компьютера и снабженного программами автоматической обработки и пополнения (Л.П. Нелюбин). Действующий продукт, созданный в электронном виде, существующий на электронном носителе, предназначенный для электронного чтения и имеющий перспективы электронного развития (А.Я. Перванов). Электронный словарь: - сочетает большой объем информации с удобством пользования. - отвечает на запросы пользователя с различным языковым опытом; - в словарной статье каждый̆ элемент информации о слове может являться гиперссылкой̆ к другой̆ словарной̆ статье.

Slide 17

КОМПЬЮТЕРНЫЕ СЛОВАРИ: ИХ ПРИЗНАКИ И КЛАССИФИКАЦИИ По содержанию: использующие материалы существующий словарей; созданные с новым содержанием; По адресованности: адресованные человеку (автоматизированные) адресованные машине (автоматические) По количеству баз данных: - простые (одна база данных); - сложные (две и более базы данных); По способу загрузки: - нерезидентные словари (обладают подстрочной структурой); - резидентные словари (основаны на фоновом присутствии в оперативной памяти ПК); По режиму перевода: - автоматические пакетные - предназначаются для работы с отдельными текстами или группами текстовых файлов.; - интерактивные - обрабатывают фрагменты текстов или отдельные слова.

Slide 18

БУМАЖНЫЙ СЛОВАРЬ Чем больше объем словаря, чем полнее и доказательнее описание лексических значений, тем сложнее им пользоваться. Чем полнее и глубже описание лексических значений, тем в меньшей степени словарь соответствует текущей языковой и культурной ситуации Чем интереснее лексикографическая концепция словаря, интегральнее средства описания лексических значений, тем ýже его лексическая база. ЭЛЕКТРОННЫЙ СЛОВАРЬ Существенно более изощренные возможности показа содержания словарной статьи, включая возможность частичного показа по разным критериям (различные "проекции" словаря), разнообразные графические средства, которые не используются в обычных словарях. Использование для доступа к содержанию различных лингвистических технологий, таких как морфологический и синтаксический анализ, полнотекстовый поиск, распознавание и синтез звука и т.п. ЛЕКСИКОГРАФИЧЕСКАЯ ИНТЕРПРЕТАЦИЯ ЯЗЫКОВОЙ СЕМАНТИКИ

Slide 19

ПРЕИМУЩЕСТВА ЭЛЕКТРОННОГО СЛОВАРЯ ДЛЯ ПОЛЬЗОВАТЕЛЯ многократное увеличение скорости поиска; множество входов в словарь: словник, алфавитный индекс, ввод слова и словосочетания с клавиатуры, из текстового редактора; поиск слов с недостаточно точным правописанием; полнотекстовый поиск (не только в словнике, но и в текстах всех словарных статей); применение средств мультимедиа для семантизации лексики; наличие системы гиперссылок; наличие перекрестных ссылок ко всем словам, имеющимся в словаре; возможность хранения большого объема информации; в двуязычных словарях - возможность прямого и обратного перевода; включение в структуру компьютерного словаря нескольких словарей разных типов и жанров; одновременный поиск сразу в нескольких словарях; ограничение области поиска ключевыми словами, тематическими группами, частями речи и т.п.; пополнение словаря пользователем, или создание пользовательского словаря; сохранение последовательности поиска в течение сеанса работы (так называемая хронология / история поиска); сохранение «закладок» в словаре; совместимость с текстовыми редакторами, возможность копирования словарных статей и обращения к словарю из редактора; совместимость с программами машинного перевода; совместимость с веб-браузерами и другими типами программ (прикладными, обучающими, игровыми); предоставление дополнительной справочной информации по фонетике, грамматике, стилю и другим аспектам языка; возможность использования словарей в локальной и глобальной сетях и др.  

Slide 20

НЕРЕШЕННЫЕ ПРОБЛЕМЫ ЭЛЕКТРОННЫХ СЛОВАРЕЙ должно найти отражение понятие лексической функции, позволяющее описывать несвободную сочетаемость слов, например: «идет заседание»; не нашла отражение проблема описания семантики и практической реализации грамматического словоизменения и словообразования. не существует системы понятий, с помощью которой синтаксическая информация могла быть доведена до обычного читателя.

Slide 21

ЭЛЕКТРОННАЯ БИБЛИОТЕКА упорядоченные коллекции разнородных электронных документов, снабженные средствами навигации и поиска. появились в эпоху «информационного взрыва» в США (Project Gutenberg, 1971 г.).

Summary: about traditional and computer-aided lexicography, e-dictionaries and questions connected with the investigation in the sphere of e-lexicography

URL: