Приложения для перевода текста сделали жизнь многих людей проще, позволяя им общаться с жителями других стран и читать информацию на разных языках без необходимости их изучения. Но не секрет, что качество такого перевода зачастую оставляет желать лучшего. Поэтому компания «Яндекс» запустила в фирменном сервисе «Яндекс.Переводчик» гибридную систему перевода. К статистическому переводчику была добавлена технология перевода на основе нейронной сети. Таким образом, перевод выполняется сразу двумя системами, а затем алгоритм на основе метода машинного обучения CatBoost сравнивает результаты и предлагает лучший.
Статистический переводчик переводит каждое слово и фразы по отдельности, поэтому в результате получается несвязанный текст. Нейросети же наоборот обрабатывают целые предложения. За счёт этого переведённый текст более точен и понятен. Статистический переводчик так не умеет, но зато он хорошо запоминает и переводит редкие и сложные слова и фразы. Работая вместе, обе системы компенсируют недостатки друг друга.
Статистический перевод
Сотрудники «Яндекс» отмечают, что существует много способов обучить машину переводу с одного языка на другой. Например, можно дать ей словари, из которых она освоит правила. Также можно показать ей много параллельных текстов. Сравнивая их, машина научится находить соответствия — например, так она поймёт что слова «dog» и «собака» являются вероятными переводами друг друга. В основе такого подхода лежат не правила, а статистика, откуда и пошло название этого метода.
С момента запуска «Яндекс.Переводчик» использовал только статистическую систему. При переводе она разделяет предложения на отдельные части и для каждой подбирает все возможные переводы с указанием их вероятности. Затем система составляет из переведённых фрагментов разные варианты нового предложения. Пользователю выводится тот, который содержит переводы с высокими вероятностями и в котором фрагменты хорошо сочетаются друг с другом.
Нейросетевой перевод
Как и статистический переводчик, нейронная сеть анализирует массив параллельных текстов и учится находить в них закономерности. При этом процесс самого перевода устроен несколько по-другому. Нейросеть работает не со словами и фразами, а сразу с целыми предложениями. Она получает на вход предложение на одном языке, а на выходе выдаёт предложение на другом языке. Такой подход позволяет учесть смысловые связи внутри предложения. Нейросеть улавливает суть предложения даже в том случае, когда слова, которые её передают, находятся в разных частях предложения.
Гибридная система
У нейросетевого перевода также есть ряд недостатков. Если нейронная сеть не может по какой-то причине перевести то или иное предложение, то она попросту начнёт предлагать что-то максимально подходящее, пытаясь угадать правильный ответ. Также нейросетевой перевод не всегда хорошо справляется с переводом мало распространённых имён, топонимов и других редких слов.
Комбинация преимуществ статистического нейросетевого методов позволяет существенно повысить качество перевода.
Источник:
Так Яндекс всегда с Гугла дерет
В России добьется. Главное чтобы гугл заблокировали, вот тогда будет хорошо, все начнут Яндексом и Рамблером пользоваться.
> Good morning kids — Хорошие морники
Good morning kids — редкие слова? Что за? :))
Вообще тупо перевела нейросеть. Там нет и близко слова морники. Правильно переводится так:
"Гоод морнинг кидс"
гуд
Можно и так. У этого слова несколько переводов.
Вам дали пример перевода не обученной модели
даже самый простой переводчик без особых там нейросетей переведет это правильно, не говоря уже про гугл, который давно уже отлично переводит текст с английского
з.ы. а кто такие морники?
(Комментарий удален)
(Комментарий удален)
(Комментарий удален)
(Комментарий удален)
(Комментарий удален)
Лучше бы яндекс не развивал свою систему перевода, а оставил все как есть? Или заново изобретал велосипед?
Иногда ваш маразм по поводу уникальности приводит к мысли почему мы пользуемся колесом, ведь не мы изобрели то самое колесо
Хоть гугл так давно умеет, но при переводе были больше несвязанных слов чем в яндексе без этой технологии.
А я думаю че он в последнии 2 дня переводит ужасно... херь какую то...
Раньше я спокойно общался с иностранцами и мне говорили откуда я так хорошо знаю язык... теперь вообше не понимаю что они мне говорят... и они меня не понимают... инновации прям
Только русско-английский перевод ему даётся хуже.
как пользователь переводчиков, скажу что гугл хлам, а Яндекс реально крутой.
Сейчас сравнил перевод одного и того же текста. Яндекс перевёл точнее и человечнее.
и всё равно часто переводит ужасно. Как минимум с немецкого.
учи немецкий.... ©"Хочешь сделать хорошо: делай лично"
глупый коммент. И не в тему.
©"Хочешь сделать приятно: делай лично"
Nein.
Гугл проще)
Главное преимущество Гугла в том, что там гораздо больше языков
но он ужасно переводит, а Яндекс реально круто переводит. И у яндекса программа круче.
Когда вы в последний раз им пользовались? Яндекс не может переводить большие тексты, тк ограничения по символам стоят. До нейросетей пользовался переводчик translate.ru, хорошо переводит небольшие фразы
Я до вчерашнего дня пользовался гуглом и ловил переодически неадекватные переводы. Сегодня ввел в Яндекс пару фраз типа Don't give a shit и прочих разговорных. Сравни неадекватный перевод в гугле и перевод в Яндексе.
Что касается перевода текстов в гугле, то ты их проверял потом? Или так использовал? Они же не адекватные.
гугл на службе пиндосов
Гугл его подавит)
Муха не задавит Слона
(Комментарий удален)
(Комментарий удален)
(Комментарий удален)
(Комментарий удален)
Ну там Гугл вообще запрещен, а во всем мире пользуются только Гуглом, только дикие страны его не признают.
Или только Россия дикая страна из-за того, что Гугл тут не популярен?
1. Это не их вина. Это их беда, что благодаря политике своих властей они ограничены в выборе.
2. Я то не говорил, что Россия — дикая страна. Я говорил что Китай — не дикая.
3. Касательно несколько каментов выше. Вот это вот дикость. При современном уровне развития связей между людьми и относительной свободы перемещения техники и технологий, науки и прогресса кивать на локальные местечковые явления и плевать на достижения остальных.
В моей деревне популярен дакдакго. Ну ок. Живи дальше в своей деревне.
Я про свои-ваши деревни и не говорил.
Просто это все из разряда сравнения зарплат с другими странами, но при этом тишина по налоги и цены.
И попахивает навязыванием своего мнения другим.
гугл служит пиндосам
Что же вы тогда делаете на ресурсе "дикой страны"? Ступайте на ресурсы "цивилизованного мира". :)))))
Сравнивать одну страну с целым миром это опять сравнение мухи и слона, я вижу ты фанат насекомых :)
я сравниваю страну где живу! и мне главное что тут а не что в мире! я живу в России и что там популярно за бугром мне мало интиресно а точней вобще не интиресно! а в нашей стране слон Яндекс а гугл муха
Почему столько Я Я Я Я, ты прям центр вселенной?, родители в детстве с тобой много сюсюкались и баловали ? Так и вырос, разбалованным дитем? :)
Ну есди я Россия , как написоно в тексте , то да :D
А какое конечному пользователю дело до того, как сервисы работают в других странах? В конкретной стране один сервис удобнее и функциональнее другого и это повод им пользоваться. Во всем мире, других странах один сервис удобнее и функциональнее, но это не повод им пользоваться в данной стране. При выезде "в мир" - да, а так не вижу смысла кушать кактус. В контексте гугла перевод и карты работают хуже, чем у яндекса, поиск +/-. Что-то легко ищется в одном, а что-то хрен найдешь и идешь в другой.
Изоляционизм — верный путь к деградации.
Очень печально, что людям, которые живут в мире приходится жить рядом с людьми, которые живут только в России/Муходрищинске/Ленинском районе/улице Кирова или ещё в какой более узкой заднице.
Вообще то нет, Я. теряет стабильно долю поиска на внутреннем рынке.
слово дави не правильно расположено, оно должно быть первым
А как же погода с картой? Я у них подписку на яндекс.музыку оформил еще, так как у них есть то, чего нет у других совершенно.
А как же погода - на моей местности она врет безбожно, пользуюсь acuweather или гисметео, они более менее точно предсказывают погоду на два дня
виртуальные карты - у меня теперь есть не виртуальная вторая карта VISA, для покупок в интернете (ибо зарплата с недавних пор идет на карту МИР)
яндекс музыка - я подписан на торенты, т.к. не хочу кормить копирастов посредников
а если есть возможность купить трек на прямую у музыканта - делаю это
Где в комментарии выше хоть одна отсылка к Тинькофф банку?
И что не так с этим банком?
Он очевидно из дурачков, которые кредит не платят несколько месяцев и жалуются что банк их не прощает за это.
Ну или очередной диванный аналитик "Сам не пробовал, но знаю" :)
я послал в пешее эротическое их звонилок которые предлагали карту
Зато звук в Яндекс-музыке ужасный...
У меня не hi-fi аппаратура и разницы не заметно по сравнению с тем же itunes, что юзал ранее
Кстати в яндекс.деньги бесплатное создание виртуальных карт (для оплаты непонятно где самое то). На нынешнем моём банке, к сожалению, данной функции встроенной нет, посему сейчас яндекс.деньги спасает.
Маркет давно стал Г
Вот с этим соглашусь. Мои отзывы все потерли. Писал в техподдержку, сказали - да это роообот, ща ращзбереееемся. Ну и не разобрались в общем.
маркет я использую лишь для того чтобы смотреть примерные цены на что либо
Вот это реально факт, Яндекс с лёгкой руки взял и убил свой некогда отличный Маркет.
Теперь это вообще редкостное унылое гэ, глючное и абсолютно бесполезное))
Всегда когда вынужденно приходится там чего-то искать, как серпом по яйцам...
И каждый раз задаёшься вопросом, неужели в руководстве Яндекса этого не совершенно не осознают?!
там вроде свой перевод, не яндекс
Никто не запрещал копипастой их английское описание (очень надеюсь оно адекватное) перевести через яндекс-переводчик.
а зачем это мне?
я и без описаний понимаю что там
глядя на фотографии и краткие характеристики
Да там вон сами все офигели, аж заскринили
такое известное выражение наверняка железобетонно забито в алгоритм поиска
Кстати, на удивление он перевел правильно.
Это дело очень нескорое. Про силу сленга или "местечкового" говора один забавный фильмец есть (Франция, кстати). "Бобро поржаловать".
Санкции? Смешно. Торренты вроде как везде заблокированы (основные трекеры), но дляч большинства это не проблема даже без зеркал.
Я к тому, что блокировка обходится легко и непринужденно. Было бы желание просто, причем без всяких торов.
Но в чем это удобство заключается, я конечно рассказывать не буду. :)
(Комментарий удален)
(Комментарий удален)
(Комментарий удален)
(Комментарий удален)
Чтобы было с виду типа как у гугла. Карго-культ.
Блокчейн блэт
Гугл:
чума может распространяться в воздухе, путем прямого контакта или очень редко с помощью зараженной недоваренной пищи. Симптомы чумы зависят от концентрированных областей инфекции у каждого человека: бубонная чума в лимфатических узлах, септицемическая чума в кровеносных сосудах, пневмоническая чума в легких.
Яндекс:
чума может распространяться в воздухе, при непосредственном контакте или очень редко зараженной недостаточной пищей. Симптомы чумы зависит от сосредоточенных зон заражения в каждом человеке: бубонная чума в лимфатических узлах, септической чумы в кровеносные сосуды, легочная чума в легких.
"хорошие утренние дети"