Запуск будь-якого токенайзера з єдиного файла

This post in English


Ситуація

Стягнув із інтернету і встановив токенайзери, щоб OmegaT краще шукала відповідності з урахуванням словоформ. У файлі Readme сказано, що можна створити декілька скриптів для тих мов, з яких перекладаєш (і для яких токенайзери є), і навіть наведені приклади. Зробив, усе запускається і працює, але хочеться більшої життєвої гармонії і меншої мороки.

Проблема

Потрібна можливість вибирати, з якої мови перекладаєш і яким саме токенайзером будеш користуватись, маючи єдиний скрипт — а відтак всього одну іконку для запуску на стільниці/панелі/стартовому меню чи єдину для всіх команду десь у $PATH (чи %PATH%).

Continue reading

Advertisements

Авто-пам’ять та пам’ять зі штрафом

Ситуація

На руках маєш файли пам’яті TMX з попередніх проектів, у них є 100% відповідності, однак точність перекладу залишає бажати кращого. Така ситуація може бути, наприклад, при наявності файлів пам’яті після машинного перекладу, або при отриманні проекту, в якому значна частина матеріалів перекладалась колись кимось іншим, а відтак була змінена тощо.
Крім того, маєш інші файли пам’яті, у яких теж присутні 100% відповідності, проте в цих файлах якість перекладу тебе задовольняє і ти хотів би при 100% відповідностях автоматично отримувати переклад сегментів без зайвих рухів.
Звісно, щоб OmegaT могла ці файли TMX використовувати, маєш їх помістити у теку /tm всередині проекту (чи у іншу теку, але у властивостях проекту вказати, куди саме OmegaT повинна дивитися по пам’ять).

Проблема

У OmegaT є можливість автоматично вставляти відповідності, що мають певний відсоток подібності. В залежності від проекту і якості додаткової пам’яті цей відсоток може бути різним (тобі вирішувати, який саме), але він не повинен бути низьким (70% — це дуже низький). Крім того, при автоматичній вставці OmegaT може додавати ще й префікс до вставлених таким чином сегментів, щоб потім їх потім можна було швидко знайти і підправити. Активується це через меню «Options» → «Editing Behaviour», прапорець на «Insert the best fuzzy match».
Коли така можливість активована, з’являється проблема — «якісні» відповідності вставляються із «зайвим» префіксом, вимагаючи додаткового редагування. Якщо ж префікс забрати, то «неякісні» відповідності вставляються, нічим свою низьку якість тобі не показуючи. Можна, звісно, відключити цю опцію зовсім, однак тоді треба буде дивитись за кожною відповідністю та по кожній приймати рішення. Втім, OmegaT дозволяє цю проблему елегантно вирішити.

Continue reading

Пошук перекладу слова або фрази

Ситуація:

Під час роботи у програмі OmegaT над великим проектом натрапляєш на слово або фразу, і стає зрозуміло, що слово це чи фраза мають перекладатись у цьому проекті скрізь однаково. Аби цього досягти, вносиш потрібне слово чи фразу разом із перекладом у користувацький глосарій, і далі маєш щастя. Однак, якщо точно знаєш, що вже таке слово траплялось і вже ти його перекладав, от тільки згадати не можеш, як саме, що тоді? Правильно — пошук.

Проблема:

Пошук потрібних слова або фрази серед сегментів оригіналу [In source] видає сегменти і з перекладом, і без нього, не підсвічуючи результати різними кольорами, як у панелі редагування. Якщо проект великий, то пошук серед великої кількості результатів може бути доволі марудним. Звісно, можна пошукати серед перекладених сегментів [In translation] за ключовими словами, однак що робити, якщо не можеш згадати, якими саме словами перекладав це слово, або якщо хочеш подивитись, як його переклав інший перекладач з команди? Отож, наша проблема — знайти лише ті сегменти мовою оригіналу з потрібним нам словом, які мають переклад, і не показувати сегменти без перекладу.

Continue reading