"

Технологии «Ростелекома» признаны лучшими в конкурсе морфологического анализа

Фото:
721
2 минуты
Самообучаемый алгоритм морфологического анализа и нормализации русскоязычных текстов, разработанный специалистами АО «Айкумен ИБС» (входит в группу компаний «Ростелеком»), признан лучшим в конкурсе MorphoRuEval, прошедшем в рамках XXIII Международной конференции «Диалог – 2017» в Москве, сообщили РИА «Дагестан» в пресс-службе компании.

По словам источника, метод «Айкумен ИБС» признан победителем по точности нормализации русских слов, достигающей 92,22%. Кроме того, он занял 2-е место по восстановлению морфологических признаков с достоверностью свыше 93%.

«Морфологический анализ выполняется на начальных этапах автоматической обработки текста и является одной из наиболее важных операций, влияющих на финальное качество анализа документов. К его задачам относится определение части речи и морфологических признаков (падеж, род, число, время, лицо и пр.) каждого слова предложения, а также нормализация – корректное восстановление начальной формы этих слов.

Представленная технология лингвистической обработки позволяет более качественно и с минимальным участием человека анализировать большие объемы текстовой информации на естественных языках.  «Айкумен ИБС» разработала свой алгоритм, объединяющий достоинства классических способов с методами машинного обучения в виде двухступенчатой фильтрации словарного разбора», – пояснил источник.

По словам директора Департамента разработки АО «Айкумен ИБС» Андрея Ярового, независимая экспертиза подтвердила отличное качество морфологического анализа текстов, используемого в компании.

«Мы продолжаем двигаться вперед, постоянно совершенствуем алгоритмы и разрабатываем инновационные методы в своей работе, предоставляя возможность нашим заказчикам максимально использовать преимущества IQPLATFORM® – современного отечественного продукта в области BigData, по ряду функционала не имеющего аналогов на российском и мировом рынках», – прокомментировала генеральный директор АО «Айкумен ИБС» Ирина Касаткина.

Отметим, что научно-практический форум «Диалог» ежегодно собирает ведущих ученых, мировых экспертов и отраслевых вендоров для обсуждения передовых методов компьютерной лингвистики и обмена опытом создания прикладных решений по интеллектуальному анализу текстов на естественных языках.

Наибольшим интересом в программе конференции – 2017 пользовался конкурс MorphoRuEval, организованный лабораторией «DialogueEvaluation» для тестирования инструментов морфологического анализа русскоязычных текстов из сети Интернет. В этом году в нем приняли участие 15 команд.
Источники
РИА «Дагестан»

Новости раздела