Яндекс посилює боротьбу з рерайтом?
Опубліковано: 30 Січня, 2010 о 10:11
Яндекс купив у раніше широко невідомої компанії Cognitive Technologies програмний продукт для синтаксичного аналізу тексту.
Якщо не помиляюся, компанія Cognitive Technologies співпрацює з МФТІ - мабуть, найкращим IT ВНЗ країни.
Пишуть про те, що софт дозволяє визначати тематику тексту на основі смислового навантаження не окремих слів, а їх синтаксичного зв`язку в пропозиціях. Це потрібно, наприклад, для визначення значення омонімів - різних за значенням, але однакових за написанням і звучанням слів (приклад - в скелях забив ключ і ключ від будинку).
Аналіз повторюваних конструкцій і зв`язків слів також дозволяє порівнювати тексти на предмет схожості. Відзначається, що на основі проданого комплексу створено кілька продуктів, в тому числі і за визначенням авторства документа.
Дозволю собі припустити, що це повинно дати можливість знайти рерайт заданого тексту, і на основі інформації про стилістику і авторських особливості інших документів визначити першоджерело. Підозрюю, що постраждають сінонімайзери і неякісний рерайт, але це - ІМХО.