2019 год
Участникам конгресса, приглашенным на Форум в Сеуле, вручили странный маленький желтый предмет, формой и размерами напоминавший капсулу. Эту капсулу нужно было поместить в ухо, как ушные шарики, которые раньше использовали для приглушения внешних шумов. Заседание началось без опоздания. Один докладчик (без сомнения, актер) поднялся на трибуну и стал читать текст на совершенно неизвестном языке. Самые эрудированные посчитали, что это — диалект одной из многочисленных индонезийских провинций. Удивительно, несмотря на незначительную разбежку, похожую на эхо, участники сразу же услышали эту речь уже на своем родном языке!
Этот невероятный технологический прорыв мог бы привести к отмене изучения иностранных языков в школах. Можно представить себе последствия для преподавателей и переводчиков, зарабатывающих себе на жизнь этим ремеслом. Не нужно больше изучать иностранные языки, не нужно переводить доклады, хотя система, несмотря на свою революционность, позволяет делать только синхронный перевод устной речи, воспринимаемой на слух. Глаз переводчика или переводящую ручку разрабатывать придется еще долго. Если верить руководителю исследований предприятия, которое выпускает в продажу синхронный переводчик, названный «Ear You Ате», создание этой системы не было простым делом. Есть от чего терять дар речи, когда узнаешь, что большая часть существующих языков были запрограммированы в этом маленьком «ушном» микрочипе.
Технически речь идет об идеальном союзе двух совершенных технологий. Первой уже много лет, она широко применяется, это — система узнавания голоса, которая переводит акустический сигнал, полученный микрофоном или телефоном, в последовательность фонем. Лингвисты так называют самые маленькие звуковые единицы, из которых состоят слова. В английском языке их насчитывается около сорока, в некоторых индейских диалектах — десять, одиннадцать в ротокасе (языке коренных жителей Папуа —Новой Гвинеи) и тринадцать в гавайском. Однако в кзю — языке потомков бушменов из пустыни Калахари, живущих в Южной Африке, насчитывается 141 фонема!
- 58 -
Как только все фонемы идентифицированы, вторая техника переводит эту последовательность, листая со скоростью света банк данных, содержащий все существующие слова. Как только произнесенное слово идентифицировано, нужно найти его эквивалент в нужном языке. Далеко не простая операция, учитывая, что между письменной и устной речью есть весьма ощутимая разница. Письменная речь использует строгие правила пунктуации, которые далеко не всегда соблюдаются в устной речи. Чтобы система работала должным образом, необходимо, чтобы говорящий человек делал короткие паузы между словами. В отсутствие таких передышек сбитая с толку система-переводчик безрезультатно ищет значение слова, которое на самом деле является слиянием двух слов. Во вторых, письменный текст если не идеален, то, по крайней мере, очень понятен в смысле экспрессивности и содержит очень мало синтаксических ошибок. Устная речь позволяет себе много вольностей не только в синтаксическом, но и в словарном плане. Очень часты случаи слов и фраз, кажущихся идентичными, но имеющие разное контекстуальное значение. Все знают «ложных друзей» в английском языке, где слово «sympathy» означает не «симпатия», а «сострадание». Очень важны также и ритм речи, и окружающий шум, и эмоциональное (стресс) и физическое (охрипший голос, одышка) состояние говорящего человека. А сколько есть случаев плохо произнесенных слов, неологизмов, выражений, свойственных только говорящему: повторения, заикания, неуверенности или грамматически неправильных конструкций? Остается, наконец, и проблема интонаций, легко уловимых человеческим существом и непонятных компьютеру, неспособному сделать различие между восклицанием, удивлением, властным тоном и многими другими психологическими возможностями.
Эти многочисленные параметры требуют проведения целой серии сложных операций, которые должны делаться за одну долю секунды, не путаясь в различных смысловых значениях. Потому что во всех языках есть многозначные слова. В письменной речи проблем нет — разница в орфографии помогает избежать сомнений. Когда читаешь слово «грипп», то сразу отличаешь его от слова «гриб». А если два разных слова пишутся одинаково, то ударение или просто контекст помогают их различать. Таким образом, слово «бор» может означать и хвойный лес, и химический элемент, и зубоврачебный инструмент. В английском языке «John lies» может означать, что Джон — лжец или что он лежит... Чтобы передать смысловую целостность переводимого текста, переводчик должен интерпретировать и анализировать все конфигурации этого текста, что требует глубоких знаний не только грамматики, семантики, синтаксиса, идиом, но даже и культуры пишущего.
Некоторые из этих трудностей были обнаружены при первых же попытках автоматического перевода в середине 1950 годов. В то время речь шла просто об информатизированных «переводящих машинках». В старых журналах можно найти статьи о первой публичной демонстрации в Нью-Йорке, в офисе «IВМ», 7 января 1954 года такой машинки. Будучи практически рудиментарной, первая система способна была узнавать только 250 слов, переведенных с русского языка на английский, и то в очень специфичной специальной области, что сокращало словарный запас. Ее главным применением был анализ статей, опубликованных в советских журналах, этого, весь-
- 59 -
ма приблизительного, перевода было достаточно для понимания содержания статей. Если статьи казались интересными, то переводчики из плоти и крови принимались за их настоящий перевод.
Таким образом, машины для перевода существуют уже давно. Но устный перевод и письменный — это две разные вещи. Устный перевод (электронный или «живой») должен делаться почти синхронно. Эта разбежка во времени между первоисточником и целью и составляет всю разницу.
Поэтому программное обеспечение, даже самое совершенное, длительное время не могло сравниться в лингвистическом мастерстве с профессиональным переводчиком. Помогая друг другу в работе, лингвисты и программисты смогли, наконец, решить все эти проблемы, считавшиеся непреодолимыми, еще два года тому назад. Количество ошибок сокращалось наполовину каждые два года; компьютеры, становившиеся все быстрее и быстрее, очень сильно помогли создать жизнеспособную систему. Эта новая технология должна использоваться и в мобильных телефонах. Телефон-переводчик должен будет полностью обновить рынок существующих аппаратов. Можно представить себе области его применения: заказ билета на транспорт за границей, просмотр расписания, получение информации... Не говоря уже об интервью иностранных граждан по радио или телевидению, международные конгрессы или коллоквиумы, различные речи в высших международных инстанциях. Прощай, недопонимание, возникающее из-за неполного или неточного перевода! Корейский конструктор обещает всего 5% ошибок, и это уже замечательно! Хотя производитель предусмотрел дальнейшее усовершенствование своего продукта, чтобы через год добиться всего лишь 1% ошибок. Машина будет работать лучше, чем большинство профессионалов. Что касается руководителей различных предприятий, то они могут спать спокойно: эта система позволит наводить новые контакты в самых отдаленных районах, там, где языковой барьер раньше мешал общению!
Источники:
- Arnold D.J. et al„ An introductory guide to MT, 1994.
- European Association for Machine Translation (EAMT)
www. voicerecognition. com
- 60 -
Из книги: ИСТОЧНИК: Изобретения 21 века, что изменят нашу жизнь.
ЕЩЁ ПО ТЕМЕ:
- Искушенные киноманы вспомнят фильм "Автостопом по галактике"
Синхронный перевод выполняет распознаватель голоса, вставленный в ухо.
Невозможно поверить своим ушам! Пригласительные билеты, разосланные 2000 участникам Всемирного экономического форума в Сеуле, четко объясняли: переводчиков не будет, все переговоры будут проходить на родном языке участников. Нет, это не было шуткой, первый автоматический переводчик, расположенный в ухе, сработал хорошо!
Участникам конгресса, приглашенным на Форум в Сеуле, вручили странный маленький желтый предмет, формой и размерами напоминавший капсулу. Эту капсулу нужно было поместить в ухо, как ушные шарики, которые раньше использовали для приглушения внешних шумов. Заседание началось без опоздания. Один докладчик (без сомнения, актер) поднялся на трибуну и стал читать текст на совершенно неизвестном языке. Самые эрудированные посчитали, что это — диалект одной из многочисленных индонезийских провинций. Удивительно, несмотря на незначительную разбежку, похожую на эхо, участники сразу же услышали эту речь уже на своем родном языке!
Этот невероятный технологический прорыв мог бы привести к отмене изучения иностранных языков в школах. Можно представить себе последствия для преподавателей и переводчиков, зарабатывающих себе на жизнь этим ремеслом. Не нужно больше изучать иностранные языки, не нужно переводить доклады, хотя система, несмотря на свою революционность, позволяет делать только синхронный перевод устной речи, воспринимаемой на слух. Глаз переводчика или переводящую ручку разрабатывать придется еще долго. Если верить руководителю исследований предприятия, которое выпускает в продажу синхронный переводчик, названный «Ear You Ате», создание этой системы не было простым делом. Есть от чего терять дар речи, когда узнаешь, что большая часть существующих языков были запрограммированы в этом маленьком «ушном» микрочипе.
Технически речь идет об идеальном союзе двух совершенных технологий. Первой уже много лет, она широко применяется, это — система узнавания голоса, которая переводит акустический сигнал, полученный микрофоном или телефоном, в последовательность фонем. Лингвисты так называют самые маленькие звуковые единицы, из которых состоят слова. В английском языке их насчитывается около сорока, в некоторых индейских диалектах — десять, одиннадцать в ротокасе (языке коренных жителей Папуа —Новой Гвинеи) и тринадцать в гавайском. Однако в кзю — языке потомков бушменов из пустыни Калахари, живущих в Южной Африке, насчитывается 141 фонема!
- 58 -
Как только все фонемы идентифицированы, вторая техника переводит эту последовательность, листая со скоростью света банк данных, содержащий все существующие слова. Как только произнесенное слово идентифицировано, нужно найти его эквивалент в нужном языке. Далеко не простая операция, учитывая, что между письменной и устной речью есть весьма ощутимая разница. Письменная речь использует строгие правила пунктуации, которые далеко не всегда соблюдаются в устной речи. Чтобы система работала должным образом, необходимо, чтобы говорящий человек делал короткие паузы между словами. В отсутствие таких передышек сбитая с толку система-переводчик безрезультатно ищет значение слова, которое на самом деле является слиянием двух слов. Во вторых, письменный текст если не идеален, то, по крайней мере, очень понятен в смысле экспрессивности и содержит очень мало синтаксических ошибок. Устная речь позволяет себе много вольностей не только в синтаксическом, но и в словарном плане. Очень часты случаи слов и фраз, кажущихся идентичными, но имеющие разное контекстуальное значение. Все знают «ложных друзей» в английском языке, где слово «sympathy» означает не «симпатия», а «сострадание». Очень важны также и ритм речи, и окружающий шум, и эмоциональное (стресс) и физическое (охрипший голос, одышка) состояние говорящего человека. А сколько есть случаев плохо произнесенных слов, неологизмов, выражений, свойственных только говорящему: повторения, заикания, неуверенности или грамматически неправильных конструкций? Остается, наконец, и проблема интонаций, легко уловимых человеческим существом и непонятных компьютеру, неспособному сделать различие между восклицанием, удивлением, властным тоном и многими другими психологическими возможностями.
Эти многочисленные параметры требуют проведения целой серии сложных операций, которые должны делаться за одну долю секунды, не путаясь в различных смысловых значениях. Потому что во всех языках есть многозначные слова. В письменной речи проблем нет — разница в орфографии помогает избежать сомнений. Когда читаешь слово «грипп», то сразу отличаешь его от слова «гриб». А если два разных слова пишутся одинаково, то ударение или просто контекст помогают их различать. Таким образом, слово «бор» может означать и хвойный лес, и химический элемент, и зубоврачебный инструмент. В английском языке «John lies» может означать, что Джон — лжец или что он лежит... Чтобы передать смысловую целостность переводимого текста, переводчик должен интерпретировать и анализировать все конфигурации этого текста, что требует глубоких знаний не только грамматики, семантики, синтаксиса, идиом, но даже и культуры пишущего.
Некоторые из этих трудностей были обнаружены при первых же попытках автоматического перевода в середине 1950 годов. В то время речь шла просто об информатизированных «переводящих машинках». В старых журналах можно найти статьи о первой публичной демонстрации в Нью-Йорке, в офисе «IВМ», 7 января 1954 года такой машинки. Будучи практически рудиментарной, первая система способна была узнавать только 250 слов, переведенных с русского языка на английский, и то в очень специфичной специальной области, что сокращало словарный запас. Ее главным применением был анализ статей, опубликованных в советских журналах, этого, весь-
- 59 -
ма приблизительного, перевода было достаточно для понимания содержания статей. Если статьи казались интересными, то переводчики из плоти и крови принимались за их настоящий перевод.
Таким образом, машины для перевода существуют уже давно. Но устный перевод и письменный — это две разные вещи. Устный перевод (электронный или «живой») должен делаться почти синхронно. Эта разбежка во времени между первоисточником и целью и составляет всю разницу.
Поэтому программное обеспечение, даже самое совершенное, длительное время не могло сравниться в лингвистическом мастерстве с профессиональным переводчиком. Помогая друг другу в работе, лингвисты и программисты смогли, наконец, решить все эти проблемы, считавшиеся непреодолимыми, еще два года тому назад. Количество ошибок сокращалось наполовину каждые два года; компьютеры, становившиеся все быстрее и быстрее, очень сильно помогли создать жизнеспособную систему. Эта новая технология должна использоваться и в мобильных телефонах. Телефон-переводчик должен будет полностью обновить рынок существующих аппаратов. Можно представить себе области его применения: заказ билета на транспорт за границей, просмотр расписания, получение информации... Не говоря уже об интервью иностранных граждан по радио или телевидению, международные конгрессы или коллоквиумы, различные речи в высших международных инстанциях. Прощай, недопонимание, возникающее из-за неполного или неточного перевода! Корейский конструктор обещает всего 5% ошибок, и это уже замечательно! Хотя производитель предусмотрел дальнейшее усовершенствование своего продукта, чтобы через год добиться всего лишь 1% ошибок. Машина будет работать лучше, чем большинство профессионалов. Что касается руководителей различных предприятий, то они могут спать спокойно: эта система позволит наводить новые контакты в самых отдаленных районах, там, где языковой барьер раньше мешал общению!
Источники:
- Arnold D.J. et al„ An introductory guide to MT, 1994.
- European Association for Machine Translation (EAMT)
www. voicerecognition. com
- 60 -
Из книги: ИСТОЧНИК: Изобретения 21 века, что изменят нашу жизнь.
ЕЩЁ ПО ТЕМЕ:
- Искушенные киноманы вспомнят фильм "Автостопом по галактике"
Комментариев нет:
Отправить комментарий