Просмотр новости

Найдите то, что Вас интересует

В МГУ предложили способ точной оценки качества автоматической сортировки писем

Дата публикации: 16-06-2026 10:45:35

Исследователи факультета вычислительной математики и кибернетики (ВМК) МГУ разработали подход, позволяющий точнее оценивать качество систем автоматической сортировки электронных писем. Работа посвящена методам более корректной оценки эффективности таких алгоритмов.
В работе исследовались структурные признаки переписки, которые в наибольшей степени влияют на точность рекомендаций по сортировке входящих сообщений.
Сегодня объём корпоративной электронной почты постоянно растёт, и ручная сортировка сообщений становится всё более трудоёмкой. Поэтому используются алгоритмы, автоматически предлагающие папку для входящего письма. Такие системы учитывают содержание сообщения, историю переписки и поведение пользователя — например, куда он ранее перемещал похожие письма.
В работе рассматривается задача выбора наиболее подходящей папки: система формирует список возможных вариантов и располагает их в порядке предполагаемой релевантности. Качество таких рекомендаций оценивается с помощью метрик, которые учитывают не только правильность выбора папки, но и её место в итоговом списке.
Одной из ключевых проблем оказалось то, что письма тесно связаны между собой: они группируются по цепочкам переписки, проектам или отправителям. Поэтому данные нельзя рассматривать как полностью независимые, а стандартные методы оценки качества моделей могут давать завышенные результаты.
Чтобы получить более корректную оценку, исследователи предложили использовать «кластерный бутстрэп» — метод, при котором анализ выполняется не на уровне отдельных писем, а на уровне групп связанных сообщений. Такой подход позволяет учитывать зависимость данных и получать более надёжные оценки качества моделей. 
«При анализе почтовых данных важно учитывать, что письма связаны между собой и не являются независимыми. Использование кластерных методов позволяет более точно оценивать качество моделей», — отметила доцент кафедры математической статистики факультета ВМК МГУ Татьяна Захарова.
«Мы стремились проверить, насколько эффективно можно использовать структурные свойства переписки без анализа текста и сложных алгоритмов машинного обучения. Результаты показали, что даже минимальные признаки принадлежности письма к цепочке могут давать сильный классификационный сигнал», — отметил Кирилл Кодряну.
Полученные результаты могут использоваться при разработке корпоративных почтовых систем и сервисов автоматической обработки писем.
Работа была представлена на научной конференции «Ломоносовские чтения» на факультете вычислительной математики и кибернетики МГУ.

Схожие новости

#Наименование новостиТональностьИнформативностьДата публикации
1На ВМК МГУ исследовали методы классификации зашифрованного мобильного трафика0704-06-2026
2В МГУ предложили метод распознавания 3D–объектов с меньшими затратами памяти5724-06-2026
3В МГУ прошла одна из старейших конференций России по компьютерной лингвистике0526-06-2026
4В МГУ предложили метод ускорения статического анализа программ5708-06-2026
5X. Главное происходит здесь.0827-06-2026
6Этика и академическая честность в эпоху нейросетей: где грань между умным помощником и плагиатом?0801-01-1970
7В МГУ создают цифровую коллекцию утраченных книг библиотеки МОИП0715-06-2026
8SuperJob и Госкорпорация «Роскосмос» впервые представили совместный рейтинг вузов России ...2627-06-2026
9 Нейросетевой алгоритм сибирских ученых поможет психиатрам определять депрессию 5726-06-2026
10«Форк ИТ» обучил в облаке Cloud.ru ИИ-систему для контроля качества горнодобычи0526-06-2026

Классификация: . Схожих патентов: 0. Схожих новостей: 10. Тональность: 0. Информативность: 5. Источник: cs.msu.ru.