Каталог статей
Меню сайта


Поиск


Категории сайта
Безопасность [76]
Бизнес [20]
Другое [255]
Законодательство [10]
Игры [82]
Мультимедиа [94]
Новые технологии [0]
Обновление ПО [0]
Оборудование [4]
Программное обеспечение [23]
Связь [1]
События [0]
Фото-Видео [253]


Облако тегов


Информер
[03.02.2010][От админа!]
WELCOME! PHP.do.am - все для веб-мастера! (914)
[09.12.2009][Форумы]
vBulletin 3.8.2 Final Nulled by FintMax RUS (402)
[04.02.2010][IPB]
IPB скины (102)
[09.12.2009][Форумы]
MBoard PHP message board 1.22 (81)
[04.02.2010][vBulletin]
Curves - Light Professional Style (86)


Друзья сайта


Статистика
Каталоги и порталы Украина
Нашли.com - тематический каталог сайтов, поиск


Реклама


Приветствую Вас, Гость · RSS 27.04.2024, 04:29
Главная » Статьи » Другое

"Кто виноват?". Ошибка в Переводчике Google
Недавно была обнаружена ошибка в Переводчике Google, из-за которой однотипные фразы "is to blame" переводились одним из трех случайных вариантов: "виноват", "в этом виноват" и "не виноват".

Эту ошибку, в частности, можно было заметить при переводе следующих фраз:
"USA is to blame" - "США не виновата"
"Russia is to blame" - "Россия виновата
"Google is to blame" - "Google не виноват"
"Italy is to blame" - "Италия виновата"
Для того чтобы объяснить, откуда могла появиться эта ошибка, следует коротко рассказать о том, как работает Переводчик Google и в чем его принципиальное отличие от других средств. Обычные переводчики, как правило, преобразуют грамматические конструкции из одного языка в другой исходя из жестко прописанных правил. Примером такого правила может быть "если в оригинале использовалась временная форма present perfect, то в русском переводе нужно использовать соответствующую форму для этого глагола". Эти правила могут быть сложнее или проще. Могут использоваться правила, распознающие сложные конструкции и меняющие порядок слов в конечном тексте. Но в любом случае в традиционных переводчиках их пишут вручную. У этого подхода есть свои преимущества и недостатки, к которым, в частности, можно отнести нечеловеческую сложность работы, требующейся для того, чтобы покрыть такими правилами все разнообразие языка.

Переводчик Google устроен принципиально иначе. Тут есть набор статистических эвристик, например, "эта последовательность слов обычно переводится так", который дополнен рядом вспомогательных правил, обобщающих группы слов. Этих правил больше, чем можно найти в традиционных словарях, поэтому они не проходят ручную обработку, а генерируются автоматически. Изначально для обучения Переводчика Google был подобран набор текстов, переведенных максимально близко к оригиналу. В дальнейшем для усовершенствования правил пользователи могли присылать переводы тех фраз, которые Переводчик перевел некорректно.

Откуда появились правила, по которым осуществлялся перевод "США не виновата", пока еще до конца не ясно, но, возможно, из предложений пользователей. На текущий момент ошибка уже устранена.
Категория: Другое | Добавил: komodor (06.02.2010)
Просмотров: 490 | Рейтинг: 0.0/0
Всего комментариев: 0
Имя *:
Email *:
Код *: