Разработка сервиса коротких мультиязычных переводов на основе распределенной системы обработки аннотированной информации
К. Ф. Край, А. З. Энес
Загрузить полный текст
Аннотация: . Разработка сервиса коротких двуязычных переводов представляет собой актуальную задачу создания систем автоматического перевода текстов для средних и малых языков, для которых не существуют аннотированные базы данных, необходимые для обучения. В рамках данной работы реализуется система для автоматического перевода коротких текстов с одного языка на другой, особенностью которой является использование распределенной архитектуры для сбора, обработки, хранения и использования информации, предоставляемой пользователями системы на основе оригинальной модели мотивации, что позволяет значительно увеличить скорость создания обучающей выборки и качество обработки переводов.
Ключевые слова: машинное обучение, распределенная система, обработка естественного языка, сбор данных, веб-сервис, краудсорсинг, машинный перевод, искусственный интеллект, аннотирование информации, анализ текстов, перевод, текст, обработка информации.
Для цитирования. Край К. Ф., Энес А. З. Разработка сервиса коротких мультиязычных переводов на основе распределенной системы обработки аннотированной информации // Известия Кабардино-Балкарского научного центра РАН. 2024. Т. 26. № 3. С. 21–31. DOI: 10.35330/1991-6639-2024-26-3-21-31