Лингвистика

> Технология

Лингвистика

Лингвистические технологии позволяют сервису «понимать» смысл сообщений, написанных на естественном языке.

Крибрум автоматически определяет эмоциональное отношение автора к объекту высказывания с точностью от 80% до 95%.

При этом сервис «понимает» контекст сообщения и семантику — он учитывает случаи, когда одно и то же слово применительно к разным объектам означает прямо противоположную оценку. Например, «тонкий» телефон — это хорошо, а «тонкие» стены в гостинице — плохо.

Крибрум использует технологии лингвистического анализа для автоматического определения тематики постов, выявления и группировки дублей, объединения нечетких дублей в «темы» (сюжеты), фильтрации спама, а также для географической привязки контента. Это позволяет системе проводить полный и быстрый мониторинг сообщений в Интернете. Охват поиска — 98% всех упоминаний, скорость сбора — от 15 секунд с момента публикации.

Возможности лингвистических технологий Крибрум:

Определение оригиналов и перепечаток

Установление первоисточника сообщения, оценка масштаба резонанса и степени его влияния в Сети: перепосты, дублирующие публикации и т.п.

Выявление фактов

Технология позволяет находить в тексте заранее неизвестные объекты заданного типа, например, «персона» или «организация»

Учет отраслевой специфики

Оценочные термины могут нести разный смысл, будучи примененными к объектам из разных отраслей

Оценка характеристик объекта по отдельности

Vodafone дорогой, но связь хорошая — оценка «плохо» по категории «тарифы» и оценка «хорошо» для услуги «голосовая связь»

«Понимание» сравнений

Vodafone лучше чем bell / bell хуже всех

Различение усилений

Понимание разницы между выражениями «не самый хороший» и «самый не хороший»

Правильная обработка отрицания

Точное определение интонации в конструкциях: «думал, что он хороший, а оказалось все наоборот»

Автоматическое определение географии

Определение местоположения авторов публикаций

Большие Данные

Интернет-Поиск