Please use this identifier to cite or link to this item:
https://research.matf.bg.ac.rs/handle/123456789/2580
Title: | Класификација текста заснована на српском wordnet-у | Other Titles: | Wordnet-based text categorization technique | Authors: | Graovac, Jelena | Affiliations: | Informatics and Computer Science | Issue Date: | 2013 | Rank: | M53 | Publisher: | Beograd : Filološki fakultet | Journal: | Infoteka | Abstract: | У овом раду је приказана метода за класификацију текста на српском језику заснована на српском wordnet-у. Метода је вођена хипотезом да се укључивањем морфолошких, синтаксичких и семантичких информација садржаних у лексичким ресурсима може унапредити процес класификације текстова на српском језику, као једном од морфолошки богатијих језика. Коришћен је Ебарт-3 корпус који представља скуп новинских члана ка на српском језику подељених у три класе: економија, политика и спорт. Метода користи паметан одабир концепата из српског wordnet-a као представника сваке од класа, а сам одабир се врши на основу вредности уведене мере за тежину која квантификује значај концепта за дату класу. Проблем флексије у српском језику је решен коришћењем морфолошког речника за српски језик. Ради евалуације приказане методе коришћени су микропросечни и макропросечни показатељи прецизност, одзив и ф-мера.Добијени резултати су показали да се паметним избором концепата добијају бољи резултати него оришћењем свих концепата придружених доменима који одговарају класама, мада су домени дефинисани у wordnet-у, поред осталог, и због његове успешнијепримене на задатке класификације текста. |
URI: | https://research.matf.bg.ac.rs/handle/123456789/2580 |
Appears in Collections: | Research outputs |
Show full item record
Google ScholarTM
Check
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.