Исследование основных методов автоматической обработки, группировки и аннотирования информации
Д. В. Тихонов
Загрузить полный текст
Аннотация: В статье исследованы основные методы автоматической обработки, группировки и аннотирования информации. Показано, что методы автоматического анализа Data Mining базируются на использовании определенных статистических закономерностей (классификация, регрессия), поиске ключевых слов, однако не используют алгоритмы лингвистической обработки текстов. Таким образом, автоматический анализ текстовой информации, осуществляемый современными средствами аналитической обработки, не способен прорабатывать содержание текстов. Для сравнения двух простых предложений по содержанию был использован метод резолюций. Как показали исследования, при применении алгоритма унификации содержание предложений не учитывается. Поэтому как решение проблемы сравнительного анализа текстовой информации по содержанию были предложены новые алгоритмы работы с логико-лингвистическими моделями. Научная новизна полученных результатов состоит в методе быстрого извлечения набора локальных дескрипторов, описывающих все части изображения, что позволяет существенно ускорить процесс аннотирования и формировать более полный глобальный визуальный дескриптор изображения.
Ключевые слова: методы, автоматическая обработка, группировка, аннотирование, информация, Data Mining, метод резолюций.
Для цитирования. Тихонов Д. В. Исследование основных методов автоматической обработки, группировки и аннотирования информации // Известия Кабардино-Балкарского научного центра РАН. 2025. Т. 27. № 1. С. 111–119. DOI: 10.35330/1991-6639-2025-27-1-111-119