machine translation

0

No comments posted yet

Comments

Slide 1

МАШИННЫЙ И АВТОМАТИЗИРОВАННЫЙ ПЕРЕВОД

Slide 2

Принципы переводоведения как постановка задачи для машинного перевода Машинный перевод. История машинного перевода. Цели использования машинного перевода Алгоритм машинного перевода. Необходимые программные средства Классификация систем машинного перевода. Автоматизированный перевод. Он-лайн сервисы Основные технологии машинного перевода. Качество машинного перевода Основные недостатки и преимущества машинного перевода РАССМАТРИВАЕМЫЕ ВОПРОСЫ

Slide 3

ПЕРЕВОД С ПОЗИЦИЙ АНАЛИТИКО-СИНТЕТИЧЕСКОЙ ОБРАБОТКИ ИНФОРМАЦИИ перевод Перевод Понимание (анализ) текста Переработка текста Перевод – вид специализированной речевой деятельности, опирающийся на использование двух языков в целях воссоздания на одном языке речевых высказываний, эквивалентных по форме и содержанию высказываниям на другом языке (А.Ф. Ширяев). Производство (синтез) текста

Slide 4

ИСТОРИЯ МАШИННОГО ПЕРЕВОДА XVII в. - Г.В. Лейбниц, Р. Декарт : существует некий код, соединяющий между собой слова разных языков; 1830 г. - Ч. Бэббидж: проект первого компьютера; Серед. 30-х г. ХХ в. - Ж. Арцруни, П. Смирнов-Троянский: попытки создания «переводческой машины»; 1949 г. – Уоррен Уивер: меморандум «Перевод» текстового перевода; 1952 г. – Иегошуа Бар-Хиллел: организатор конференции, посвященной способам описания семантики, морфологических структур, структуры словарей для систем перевода;

Slide 5

ИСТОКИ МАШИННОГО ПЕРЕВОДА 7 января 1954 г. – Джорджтаунский университет: первая демонстрация системы машинного перевода (справа У. Уивер, Л. Достерт). KRAXMAL VIRABATIVAYETSYA MYEKHANYICHYESKYIM PUTYEM YIZ KARTOFYELYA. Starch is produced by mechanical methods from potatoes.

Slide 6

ЭТАПЫ РАЗВИТИЯ В ОБЛАСТИ ОТЕЧЕСТВЕННОГО МАШИННОГО ПЕРЕВОДА 1954 г. – создание группы МП (рук. А.А. Ляпунов) в Математическом институте (Институт прикладной математики им. М.В. Келдыша); 1955-1956 гг. – получены первые переводы с французского и английского языков; 1956 г. – создание Объединения по МП и издание журнала «Бюллетень объединения по проблемам машинного перевода»; 1957 г. – Совещание по комплексу вопросов, связанных с разработкой и построением информационных машин с большой долговременной памятью»; 1958 г. – 1-я Всесоюзная Конференция по машинному переводу; 1960 г. – появление сектора прикладной и структурной лингвистики с группой машинного перевода в Институте языкознания РАН; открытие отделения структурной и прикладной лингвистики в МГУ; 1960-70 гг. – создание систем машинного перевода ФР I, II, Т- системы , И-системы.

Slide 7

ПРОДОЛЖЕНИЕ ИССЛЕДОВАНИЙ В ОБЛАСТИ МАШИННОГО ПЕРЕВОДА 1966 г. – отчет ALPAC: приостановка исследований по проблеме машинного перевода в США; 70-е-80-е гг. ХХ в. – появление вычислительной техники, увеличение программ машинного перевода; 90-е г. ХХ в. – увеличение доли персональных компьютеров, распространение сети Интернет.

Slide 8

СТАДИИ РАЗВИТИЯ СИСТЕМ МАШИННОГО ПЕРЕВОДА Системы СПП (системы прямого перевода) – программно-аппаратные комплексы, анализировали «слово за словом»; Т-системы ( transfer «преобразование») – перевод на уровне синтаксических структур; МТ-программы (machine translation «машинный перевод») – используют определенные лингвистические алгоритмы, перевод осуществляется по предложениям; ТМ-комплексы (translation memory «память переводов») – базируется на сравнении документов, имеющихся во входной базе.

Slide 9

МАШИННЫЙ ПЕРЕВОД Технология связного перевода текстов компьютерной программой с одного естественного языка на другой Область научных исследований, находящаяся на стыке лингвистики, математики, кибернетики и имеющая целью построение систем, реализующих машинный перевод

Slide 10

ЦЕЛИ ИСПОЛЬЗОВАНИЯ МАШИННОГО ПЕРЕВОДА Ознакомление с информацией; МП как компонент информационных систем доступа; Профессиональные цели; Автоматизация процессов перевода. Локализация партнерских связей; Коммуникация с представителями разных стран;

Slide 11

АЛГОРИТМ МАШИННОГО ПЕРЕВОДА Получение предложения исходного текста из файла или из буфера обмена в памяти; Разбивка предложения на слова и определение границ предложения; Морфологический анализ исходного текста; Синтаксический анализ исходного текста; Семантический анализ исходного текста; Осуществление перевода построенного дерева; Осуществление согласования переведенного дерева; Запись переведенного предложения в файл или в буфер обмена. (Ю.Н. Марчук)

Slide 12

НЕОБХОДИМЫЕ ПРОГРАММНЫЕ СРЕДСТВА Конвертор; Преформатор; Программы взаимодействия с базами данных; Дружественный интерфейс; Лингвистическая база данных (лексико-грамматический классификатор; словари: двуязычный морфологический, сокращений и аббревиатур, идиом, терминологический, синтаксический, семантический; корпус параллельных текстов). Лингвистический процессор, содержащий программы: разбивки текста на предложения и слова; распознавания устойчивых словосочетаний; расшифровки сокращений и аббревиатур; морфологического аннотирования исходного текста; синтаксического анализа и построения дерева зависимостей; семантического анализа и построения семантического графа каждого предложения исходного текста; выбора переводного соответствия из двуязычного словаря или корпуса параллельных текстов; семантического синтеза текста на переводном языке и т.д.

Slide 13

ОСНОВНЫЕ ТИПЫ СИСТЕМ МАШИННОГО ПЕРЕВОДА АВТОМАТИЗИРОВАННЫЙ ПЕРЕВОД Системы: FAMT (Fully-Automated Machine Translation) — полностью автоматизированный машинный перевод; НАМТ (Human-Aided machine Translation) – машинный перевод с участием человека; MAHT (Machine-Assisted Human Translation) — перевод, осуществляемый человеком с использованием компьютера. Автоматизированный перевод Перевод текстов с одного языка на другой человеком с использованием специализированных программ, приложений, таких как: Отдельные или встроенные редакторы;  ПО, таблицы, текстовые редакторы, обеспечивающие управление терминологией (MultiTerm, Termex и т.д.); ПО, с помощью которого осуществляется менеджмент переводческих проектов; CAT-инструменты, использующие TM (Translation Memory ) - Trados, Déjà Vu, MemoQ, MemSource, Wordfast; Корпусы .

Slide 14

ТЕХНОЛОГИИ СИСТЕМ МАШИННОГО ПЕРЕВОДА. ОН-ЛАЙН СЕРВИСЫ Exampled-based Machine Translation (машинный перевод на базе готовых примеров); Statistical Machine Translation (статистический МП); Rule-based Machine Translation (машинный перевод на базе лингвистических правил) Translate.ru (онлайн-переводчик компании ПРОМТ) SYSTRANet (Systran) Google Trnslate (Google) Free Translation (SDL) Babel Fish (Systran) Worldlingo (Systran) InterTran (Translation Experts Limited) ImTransator (Smartlink Corp) Tranlslate Online.ua  Windows Life Translator (Microsoft)

Slide 15

СРАВНИТЕЛЬНАЯ ТАБЛИЦА ПРОГРАММ ДЛЯ АВТОМАТИЧЕСКОГО ПЕРЕВОДА ТЕКСТОВ

Slide 16

НЕДОСТАТКИ МАШИННОГО ПЕРЕВОДА Невысокое качество переводов (не решены проблемы многозначности, лексической и грамматической полисемии, передачи глагольно-именных трансформаций, идиом); Сложность технической реализации (системы сбора данных, удобства обслуживания, расширяемости).

Slide 17

ПРЕИМУЩЕСТВА МАШИННОГО ПЕРЕВОДА Высокая скорость перевода; Возможность глобального предварительного перевода всего текста; Универсальность; Исключение повторного перевода документации, в которую внесены изменения и дополнения; Обеспечение единообразие перевода; Перевод в режиме он-лайн и перевод содержания интернет-страниц; Низкая стоимость перевода; Конфиденциальность.

Summary: about history, development and achievements of machine translation

URL: