quote:Originally posted by alex9635:
Можно долго смеяться над их беспомощностью, но в действительности, если раньше не видел подобной грамматической конструкции, то не имея полного литературного перевода всей фразы догадаться о смысле невозможно. Причем на weblio есть полный литературный перевод всей фразы, что это никак не помогает их же собственному автоматическому переводчику.
я приблизительно представляю как можно сделать хороший переводчик, который сможет работать и с такими предложениями, но это очень дорогой и ресурсоёмкий получится перводчик. Там придётся городить огород из классического парсера, который будет стороить полное множество деревьев разбора, марковского предиктора и/или обучаемой вероятностной системы типа байесовской которая будет принимать и корпусной лингвистики с хорошими объёмными корпусами. Он не будет идеальным, но на этой базе можно будет сделать очень эффективную систему для поддержки переводчиков.
Стат. методами для почти автоматической сегментации ( токенизации ) японского уже занимаются http://www.cs.cornell.edu/cour...egmentation.pdf
и Микрософт, кстати, тоже этим направлением занимается:
http://research.microsoft.com/en-us/projects/japanesenlp/
и переводчик у них тоже свой есть: http://www.bing.com/translator/
На сегодня самое интересное и полезное --- это http://tatoeba.org
Это не переводчик, это сайт для обмена примерами реальных фраз с одинаковым смыслом на разных языках.
Причем это открытый проект, можно добавлять свои.
Очень помогает почувствовать японскую грамматику.
Must have для обучения.