«Яндекс» рядом не стоит с нашим переводчиком»

«Яндекс» рядом не стоит с нашим переводчиком»

Казанцы презентовали лучший в своем роде русско-татарский переводчик, но его развитие под вопросом.

В Казани презентовали новый русско-татарский переводчик Tatsoft, – сообщает сайт «KazanFirst». Он умеет переводить большие тексты до 800 знаков и отдельные слова с одинаковым успехом как с русского, так и с татарского. Сейчас в его памяти по 15 миллионов слов на каждом языке и около 1 миллиона пар предложений. Кроме того, он умеет озвучивать результаты своей работы.

Tatsoft разработали ученые из Института прикладной семиотики Академии наук РТ. Айдар Хусаинов – один из тех, кто вошел в эту команду. Он говорит, что, по отзывам и автоматическим измерениям, их переводчик для русско-татарского является лучшим из того, что можно сейчас найти в интернете.

– По качеству перевода «Яндекс» даже рядом не стоит с нашей версией. Есть специальные методы оценки работы переводчиков. По ним наш переводчик где-то на 10 позиций выше, чем «Яндекс». Поэтому с уверенностью можно сказать, что среди русско-татарской языковой пары это самый продвинутый продукт, – заверил еще один из его разработчиков – заместитель директора Института прикладной семиотики Ринат Гильманов.

KazanFirst решил протестировать работу переводчика, чтобы убедиться во всем лично. Оказалось, сервис действительно достоин похвалы. Двуязычный интерфейс, высокая скорость загрузки и, что самое важное, — качественный перевод текстов без потери смысла исходника. Определенным достоинством нового переводчика считается и то, что он способен воспроизводить предложения в максимально правильном смысле, несмотря на грамматические ошибки в первом варианте. Стихи Пушкина, роман Абсалямова и новости с сайта президента Татарстана Tatsoft переводит идеально.

Все это возможно благодаря тому, что сервис работает на основе нейросетевого подхода. Хусаинов объяснил его суть как можно проще, чтобы поняли все: это определенная программа, которая обучается на тех данных, что ей задают ученые. Она осваивает любую информацию и способна переучиваться. Если говорить очень примитивно, то нейросетевой подход почти как человеческий мозг.

Нужно отметить, что это уже не первый продукт, разработанный институтом. В марте этого года ученые из Академии презентовали свой первый русско-татарский переводчик Smartcat. В большей степени он предназначен для работы с официальными документами в госучреждениях.

– Это может быть полезно при подготовке новостей на сайтах министерств, ведомств республики, при переводе на русский или татарский язык законодательных актов, указов, распоряжений и при подготовке любых текстовых выступлений, докладов и так далее, – рассказывал тогда Гильмуллин.

Не откладывая в долгий ящик новую идею, группа ученых взялась за проект Tatsoft , предназначенный для широкого круга пользователей. К 2018 году проект был уже готов. И вот, наконец, его презентовали пользователям.

Обе работы были проделаны в рамках республиканской программы по сохранению и развитию государственных языков Татарстана. По словам Гильмуллина, на создание двух продуктов было выделено около 100 миллионов рублей. Конкретизировать, сколько денег ушло на реализацию первой и второй идеи, наш собеседник не стал. Отметил лишь, что деньги из выделенного бюджета на переводчик TatSoft стали использоваться лишь в 2018 году.

– В рамках госпрограммы было запланировано выделить нам на проекты около 100 миллионов рублей, но мы получили лишь 38. И более 90% из этих денег было направлено на реализацию Smartcat. Денег на второй проект практически не осталось, – отметил Гильмуллин.

Другой разработчик – Айдар Хусаинов добавляет, что ученым даже пришлось вкладывать в проект средства из личного кармана. Говорить о каком-либо денежном вознаграждении ученых за проделанную работу не приходится.

В ближайших планах учёных популяризация сервиса среди пользователей, запуск мобильного приложения, установка функции голосового набора, конечно же, работы над скоростью ответа сервиса, качеством перевода и, что самое важное, — увеличение пар предложений от 1 миллиона до 10.

– То, что у нас есть сейчас, – 1 миллион пар предложений по современным меркам – это даже не минимум из того, что позволяют построить технологии. Наша цель – набрать 10 миллионов пар предложений. Нет проблем организовать переводчиков, вся работа у нас выстроена. Тут вопрос в финансировании. Мы автоматизируем этот процесс насколько можем, но многое зависит от финансовой поддержки, – подчёркивает Хусаинов.

Остроту проблеме добавляет и то, что государственная программа по сохранению и развитию национальных языков Татарстана, по которой и реализовывался проект, завершается в 2021 году.

– Не встанет ли после этого работа переводчика? – поинтересовались мы у куратора проекта Гильманова.

– Надеюсь, нет. Теперь все зависит от власти. Мы постоянно держим их в курсе всего, что происходит с нашим проектом. Я думаю, что в последующие годы будет необходимо по 1 миллиону рублей для поддержки работы сервиса, – ответил он.

– А кто-нибудь занимается продвижением продукта в массы? Реклама у вас есть? – спрашиваем у собеседника.

– Мы же ученые, поэтому эта сторона немного страдает. Можно считать, что сегодняшняя презентация – одно из рекламных мероприятий, – добавляет создатель переводчика.

Ученый надеется, что высокое качество перевода и удобство сервиса возьмут свое и выведут его на топовые позиции, что не даст проекту остановиться.

Корреспондент

Добавить комментарий