УЗБЕКСКО-РУССКАЯ И РУССКО-УЗБЕКСКАЯ ПОТОКОВАЯ АУДИОПЕРЕВОДЧЕСКАЯ СИСТЕМА НОВОГО ПОКОЛЕНИЯ
Keywords:
Ключевые слова: потоковый перевод, узбекский язык, русский язык, синхронный машинный перевод, распознавание речи (ASR), синтез речи (TTS), average lagging, код-свитчинг.Abstract
Аннотация. В данной статье представлена система потокового узбекско-русского и русско-узбекского речевого перевода нового поколения, объединяющая устойчивое распознавание речи (ASR), перевод с управляемой задержкой (MT) и нейронный синтез речи (TTS). В архитектуру интегрированы стратегия декодирования wait-k, монотонное кусочно-шаговое внимание, самосупервизорное акустическое предобучение, а также токенизация, учитывающая орфографию и морфологию. На данных с код-свитчингом система демонстрирует улучшение показателей BLEU и chrF при фиксированной средней задержке и сохраняет стабильность в условиях шума.
References
1. Ma M. et al. STACL: Simultaneous translation with implicit anticipation and controllable latency using prefix-to-prefix framework //arXiv preprint arXiv:1810.08398. – 2018.
2. Raffel C. et al. Online and linear-time attention by enforcing monotonic alignments //International conference on machine learning. – PMLR, 2017. – С. 2837-2846.
3. Baevski A. et al. wav2vec 2.0: A framework for self-supervised learning of speech representations //Advances in neural information processing systems. – 2020. – Т. 33. – С. 12449-12460.
4. Radford A. et al. Robust speech recognition via large-scale weak supervision //International conference on machine learning. – PMLR, 2023. – С. 28492-28518.
5. Авезов С. КОРПУСНАЯ ЛИНГВИСТИКА: НОВЫЕ ПОДХОДЫ К АНАЛИЗУ ЯЗЫКА И ИХ ПРИЛОЖЕНИЯ В ОБУЧЕНИИ ИНОСТРАННЫМ ЯЗЫКАМ //International Bulletin of Applied Science and Technology. – 2023. – Т. 3. – №. 7. – С. 177-181.