При этом сервис «понимает» контекст сообщения и семантику — он учитывает случаи, когда одно и то же слово применительно к разным объектам означает прямо противоположную оценку. Например, «тонкий» телефон — это хорошо, а «тонкие» стены в гостинице — плохо.
Крибрум использует технологии лингвистического анализа для автоматического определения тематики постов, выявления и группировки дублей, объединения нечетких дублей в «темы» (сюжеты), фильтрации спама, а также для географической привязки контента. Это позволяет системе проводить полный и быстрый мониторинг сообщений в Интернете. Охват поиска — 98% всех упоминаний, скорость сбора — от 15 секунд с момента публикации.
Установление первоисточника сообщения, оценка масштаба резонанса и степени его влияния в Сети: перепосты, дублирующие публикации и т.п.
Технология позволяет находить в тексте заранее неизвестные объекты заданного типа, например, «персона» или «организация»
Оценочные термины могут нести разный смысл, будучи примененными к объектам из разных отраслей
Vodafone дорогой, но связь хорошая — оценка «плохо» по категории «тарифы» и оценка «хорошо» для услуги «голосовая связь»
Vodafone лучше чем bell / bell хуже всех
Понимание разницы между выражениями «не самый хороший» и «самый не хороший»
Точное определение интонации в конструкциях: «думал, что он хороший, а оказалось все наоборот»
Определение местоположения авторов публикаций