«Яндексу» далеко до нашого перекладача

«Яндексу» далеко до нашого перекладача

Казанці презентували найкращий серед подібних російсько-татарський перекладач, але його розвиток під сумнівом.

У Казані презентували новий російсько-татарський перекладач Татсофт (Tatsoft), повідомляє “KazanFirst”. Він вміє перекладати великі тексти до 800 знаків і окремі слова з однаковим успіхом з російської і з татарської. Зараз в його пам’яті по 15 мільйонів слів кожною мовою і близько 1 мільйона пар пропозицій. Крім того, він уміє озвучувати результати своєї роботи.

Tatsoft розробили вчені з Інституту прикладної семіотики Академії наук Республіки Татарстан. Айдар Хусаїнов – один з учасників команди. Він каже, що за відгуками і автоматичним вимірюванням, їхній російсько-татарський перекладач є найкращим з того, що можна зараз знайти в інтернеті.

– За якістю перекладу «Яндекс» навіть не наближається до нашої версії. Є спеціальні методи оцінки роботи перекладачів. За ними наш перекладач десь на 10 позицій вище, ніж «Яндекс». Тому з упевненістю можна сказати, що серед російсько-татарської мовної пари це найбільш просунутий продукт, – запевнив ще один з його розробників – заступник директора Інституту прикладної семіотики Рінат Гільманов.

Сервіс дійсно гідний похвали. Двомовний інтерфейс, висока швидкість завантаження і, найважливіше, – якісний переклад текстів без втрати сенсу оригіналу. Перевагою нового перекладача вважається здатність відтворювати пропозиції в максимально правильному розумінні, незважаючи на граматичні помилки в початковому тексті. Вірші Пушкіна, роман Абсалямова і новини з сайту президента Татарстану Tatsoft перекладає ідеально.

Все це можливо завдяки роботі на основі нейромережевого підходу. Хусаїнов пояснив його суть якомога простіше, щоб зрозуміли всі – це певна програма, яка навчається на даних, заданих вченими. Вона освоює будь-яку інформацію і здатна перенавчатися. Якщо говорити дуже примітивно, то нейромережевий підхід працює майже як людський мозок.

Слід зазначити, що це не перший продукт, розроблений інститутом. У березні цього року вчені з Академії представили свій перший російсько-татарський перекладач Смарткет (Smartcat). Він призначений переважно для роботи з офіційними документами в держустановах.

– Це може бути корисно при підготовці новин на сайтах міністерств, відомств республіки, при перекладі російською або татарською мовою законодавчих актів, указів, розпоряджень і при підготовці будь-яких текстових виступів, доповідей тощо, – розповідав тоді Гільмуллін.

Не відкладаючи надовго нову ідею, група вчених взялася за проєкт Tatsoft, призначений для широкого кола користувачів. До 2018 року проєкт був готовий. І нарешті його представили користувачам.

Обидві роботи були виконані в рамках республіканської програми зі збереження і розвитку державних мов Татарстану. За словами Гільмулліна, на створення двох продуктів було виділено близько 100 мільйонів рублів. Наш співрозмовник не конкретизував обсяг грошей на реалізацію першої і другої ідей. Зазначив лише, що гроші з виділеного бюджету на перекладач TatSoft почали використовуватися лише в 2018 році.

– В рамках держпрограми було заплановано виділити нам на проєкти близько 100 мільйонів рублів, але ми отримали лише 38. І понад 90% з цих грошей було направлено на реалізацію Smartcat. Грошей на другий проєкт практично не залишилося, – зазначив Гільмуллін.

Інший розробник – Айдар Хусаїнов – додає, що вченим навіть довелося вкладати в проєкт кошти з власної кишені. Говорити про будь-яку грошову винагороду вчених за виконану роботу не доводиться.

У найближчих планах вчених популяризація сервісу поміж користувачів, запуск мобільного додатку, установка функції голосового набору, безумовно робота над швидкістю відповіді сервісу, якістю перекладу і,  найважливіше, – збільшення пар пропозицій від 1 мільйона до 10.

– Те, що ми маємо зараз, – 1 мільйон пар пропозицій – за сучасними мірками навіть не мінімум з того, що дозволяють побудувати технології. Наша мета – набрати 10 мільйонів пар пропозицій. Немає проблем організувати перекладачів, вся робота у нас вибудована. Тут питання в фінансуванні. Ми автоматизуємо цей процес наскільки можемо, але багато що залежить від фінансової підтримки, – підкреслює Хусаїнов.

Гостроти додає закінчення в 2021 році державної програми зі збереження і розвитку національних мов Татарстану, за якою реалізовувався проєкт.

– Чи не зупиниться після цього робота перекладача? – поцікавилися ми у куратора проєкту Гільманова.

– Сподіваюся ні. Тепер все залежить від влади. Ми постійно тримаємо їх в курсі всього, що відбувається з нашим проєктом. Я гадаю, що в наступні роки буде необхідно по 1 мільйону рублів для підтримки роботи сервісу, – відповів він.

– А хто просуває продукт у маси? Рекламу маєте? – запитуємо у співрозмовника.  

– Ми ж науковці, тому цей напрямок пригальмовує. Можна вважати, що сьогоднішня презентація – один з рекламних заходів, – додає автор перекладача.

Вчений сподівається, що висока якість перекладу і зручність сервісу спрацюють і виведуть його на передові позиції, що не дасть проєкту зупинитися.

Корреспондент

Напишіть відгук