Přejít na menu

Czech stemming and lemmatisation in Lucene

Správa článků

Vyhledávání Vyhledávání
7.12.2015 22:51
,
Počet přečtení: 723
Czech stemming and lemmatisation alternatives in Apache Lucene.

Stemming = simple reducing the words, does not guarantee that the result will be the linguistic root of the word.

Lemmatisation = exact linguistic deriving the root of the word

CzechAnalyzer in Lucene - org.apache.lucene.analysis.cz.CzechAnalyzer

Diploma Thesis from MUNI - Vyhledávání v českých dokumentech pomocí Apache Solr

Vytvořil 7. prosince 2015 ve 23:01:29 mira. Upravováno 1x, naposledy 7. prosince 2015 ve 23:02:30, mira


Diskuze ke článku

Vložení nového komentáře
*
*
*