Multicriterial Text Analysis

Výsledkem MTA projektu je jeden komplexní systém seskupující více drobnějších aplikací pro analýzu textů zapsaných v přirozeném jazyce. Výsledek je součástí řešení projektu OPPIK Aplikace Ministerstva průmyslu a obchodu, jehož řešení probíhalo v letech 2018 až 2020.


Analýza recenzí

Jeho nejdůležitější součástí je aplikace pro získávání a analýzu názorů uživatelů vybraných segmentů produktů nazvaný Analýza recenzí. Cílem této aplikace je usnadnit uživatelům proces rozhodování při výběru různých produktů. Uživatel specifikuje název produktu, který jej zajímá, a výstupem je zobecněný sumarizovaný pohled na daný produkt.

Aplikace se snaží pomoci uživatelům zorientovat se ve velkém množství názorů publikovaných na internetu na konkrétní zboží, které by si chtěli zakoupit. Tyto uživatelské recenze jsou rozesety na nejrůznějších diskusních fórech, webech pro hodnocení produktů či tematických portálech zabývajících se konkrétní problematikou. Recenze jsou samozřejmě publikovány v různých jazycích. Pro běžného uživatele je pak obtížné tyto informace vyhledat, zorientovat se v nich a udělat si na jejich základě vlastní názor.

Chatbot

Samostatnou aplikací, která navazuje na aplikaci pro hodnocení produktů, je chatbot. Jeho cílem je formou dialogu pomoci uživateli s výběrem vhodného produktu vybraných produktových kategorií – například mobilního telefonu. Jde tedy o formu bližší běžnému uživateli, který může mít pocit, jako by se bavil s odborníkem nebo svým známým.

Opinio

Relativně samostatnou aplikací je i mobilní aplikace opinio, která využívá výsledky analýzy recenzí, ale doplňuje další zajímavé funkce. Mezi ně patří například možnost skenování produktových štítků (cenovek) přímo v obchodě, tak aby uživatel nemusel zadávat názvy produktů ručně. Vyhledané produkty lze snadno porovnávat a přidávat si je mezi oblíbené a opět se k nim po čase vracet.

Nástroje

Další částí výsledného software jsou nástroje, které demonstrují dílčí funkční prvky aplikace pro hodnocení produktů nebo prvky na ni navazující a lze je využít i jako samostatné nástroje pro zpracování či analýzu textu. Mezi dílčí nástroje patří například:

  • odstraňování nevýznamných slov (stop-slov)
  • převod slov do základního tvaru (lemmatizace)
  • identifikace slovních druhů (POS tagger)
  • identifikace sentimentu

Jejich použití je jednoduché. Uživatel do textového pole napíše text, který chce analyzovat a po stisknutí tlačítka je mu zobrazen výsledek. Každý nástroj nabízí možnost vyplnění vzorovým příkladem, na kterém lze demonstrovat jeho fungování. Mezi nástroji je prezentován i vyhledávač článků k produktům, které jsou analyzovány v rámci aplikace Analýza recenzí. Zde uživatel uvede název hledaného produktu a následně je mu zobrazen seznam článků, které se jej týkají.

V nástrojích, které vytváříme a používáme, se zaměřujeme zejména na analýzu textů v českém jazyce. Důvodem je zejména to, že pro český jazyk neexistuje takové množství hotových modelů a nástrojů, jako pro češtinu. Neznamená to ale, že je výsledek využitelný pouze pro uživatele v České republice. Dle zpětné vazby od klientů využívajích naše nástroje víme, že názory českých zákazníků jsou důležité i pro zahraniční firmy. Navíc výsledky analýz jsou obecně použitelné a informace o preferencích zákazníků mohou být snadno transformovány do jiných jazyků. Naše natrénované modely také zpřístupňujeme zahraničním výzkumníkům, kteří mají zájem porovnat výsledky svých experimentů s modely natrénovanými v jiných jazycích. Dopad řešení projektu tak není pouze lokální, ale mezinárodní.