Please use this identifier to cite or link to this item: https://research.matf.bg.ac.rs/handle/123456789/2580
Title: Класификација текста заснована на српском wordnet-у
Other Titles: Wordnet-based text categorization technique
Authors: Graovac, Jelena 
Affiliations: Informatics and Computer Science 
Issue Date: 2013
Rank: M53
Publisher: Beograd : Filološki fakultet
Journal: Infoteka
Abstract: 
У овом раду је приказана метода за класификацију текста на српском језику заснована на српском wordnet-у. Метода је вођена хипотезом да се укључивањем морфолошких, синтаксичких и семантичких информација садржаних у лексичким ресурсима може унапредити процес класификације текстова на српском језику, као једном од морфолошки богатијих језика. Коришћен је Ебарт-3 корпус који представља скуп новинских члана ка на српском језику подељених у три класе: економија, политика и спорт. Метода користи паметан одабир концепата из српског wordnet-a као представника сваке од класа, а сам одабир се врши на основу вредности уведене мере за тежину која квантификује значај концепта за дату класу. Проблем флексије у српском језику је решен коришћењем морфолошког речника за српски језик. Ради евалуације приказане методе коришћени су микропросечни и макропросечни показатељи прецизност, одзив и ф-мера.Добијени резултати су показали да се паметним избором концепата добијају бољи резултати него оришћењем свих концепата придружених доменима који одговарају класама, мада су домени дефинисани у wordnet-у, поред осталог, и због његове успешнијепримене на задатке класификације текста.
URI: https://research.matf.bg.ac.rs/handle/123456789/2580
Appears in Collections:Research outputs

Show full item record

Google ScholarTM

Check


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.