Добро пожаловать!

Проект ParaPhraser.ru посвящен созданию русскоязычного корпуса для перефразирования

Приглашаем к участию в дорожке по определению парафраза для русского языка! Дорожка проводится на основе данных корпуса ParaPhraser.

Привет, Гость!

Мы планируем собрать корпус для перефразирования и построить с его помощью систему, распознающую похожие по смыслу предложения. В данный момент предложения автоматически извлекаются из заголовков новостей, которые ежедневно публикуются в интернете, но чтобы собрать качественный корпус, необходимо правильно обучить систему.

Имея такой корпус, можно строить статистические модели для автоматического перефразирования. Это, в свою очередь, упростило бы решение таких задач в области автоматической обработки текста как извлечение информации, машинный перевод, информационный поиск, синонимизация текста и т.д.

Примеры »

Перефразирование

Мы разрабатываем систему, распознающую похожие по смыслу предложения. Для этого нужно собрать качественный корпус перефразирования и обучить систему. Нам нужна ваша помощь!

Синонимизация

Мы хотим создать онлайн систему перефразирования текста статистическими методами. Пока система умеет подбирать синонимы на уровне слов, но в будущем она будет заменять целые фразы.

Пробовать!

Новостная лента

Мы создали новостную ленту, в которой похожие новости группируются по их заголовкам. Сгруппированные заголовки отражают основные, наиболее часто упоминаемые в СМИ события дня.

Смотреть!