Otkrijte vrste riječi.beta

Što je croapi?

Croapi verzije beta 1 je matematički model koji automatski određuje vrste riječi u rečenici na hrvatskom jeziku.

Gramatika hrvatskog jezika definira deset vrsta riječi koje se prema sastavu ili obliku dijele na promjenjive i nepromjenjive (Težak i Babić, 2005.).

Promjenjive vrste riječi

  • IMENICE su riječi kojima imenujemo bića stvari i pojave, mijenjaju se po padežima i imaju stalan rod (čovjek, biljka, riba, staklo, kuća, grad, voda, vatra, jezik, riječ...)
  • GLAGOLI su riječi koje izriču radnju, stanje i zbivanje te se sprežu ili konjugiraju izričući osobu i vrijeme ili način radnje, stanja ili zbivanja (plesati, čitati, stvarati, stajati, sjediti, cvjetati, kišiti...)
  • PRIDJEVI su riječi koje pobliže označuju imenice, izriču različita obilježja bića, stvari i pojava te odgovaraju na pitanja koji?, čiji?, kakav? (zelen, crven, malen, debeo, blizak, složen, susjedov, novi, hrvatski, zlatan...)
  • ZAMJENICE su riječi koje zamjenjuju druge riječi, najčešće imenice i pridjeve (ja, ti, moj, njezin, sebe, sebi, svoj, tko, što, nitko, nešto...)
  • BROJEVI izriču koliko je čega (glavni brojevi) ili koje je što po redu (redni brojevi) i dolaze uz imenice (jedan, dva, devet, dvanaest, sto, prvi, drugi, četrnaesti...)

Nepromjenjive vrste riječi

  • PRILOZI su nepromjenjive riječi koje se najčešće dodaju glagolima za oznaku mjesta, vremena, načina, uzroka, i drugih okolnosti (gdje, kamo, ovdje, onamo, svuda, sada, sutra, jučer, ljetos, kako, zašto, stoga...)
  • PRIJEDLOZI su nepromjenjive pomoćne riječi koje izriču međusobne odnose među stvarima i radnjama u rečenici (u, na, od, do, iz, iza, o, po, pod, nad, uz, kod, oko, zbog, radi...)
  • VEZNICI su nepromjenjive pomoćne gramatičke riječi kojima se povezuju riječi u rečenici ili surečenice u složenim rečenicama (i, pa, te, ni, niti, a, ali, nego, no, već, ili, čim, da, dakle...)
  • USKLICI su nepromjenjive riječi koje služe za izricanje osjećaja, duševnih raspoloženja, za dozive i poticaje ili za oponašanje prirodnih zvukova (ah, eh, ih, oh, uh, hej, oho, jao, iš, šic, hop...)
  • ČESTICE su nepromjenjive riječi koje služe za oblikovanje ili preoblikovanje rečeničnoga ustrojstva, za davanje drugačijega značenja pojedinim riječima ili za isticanje govornikova stava prema rečeničnom sadržaju (zar, li, da, ne, evo, eto, eno, neka, na...)

Osim standardnih vrsta riječi, croapi označava kratice i interpunkcijske znakove. Riječi koje nisu uspjele biti prepoznate svrstava u kategoriju ostalo.

Komu i čemu je croapi namijenjen?

Croapi je zamišljen kao pomoć tijekom učenja i vježbanja vrsta riječi u svim razredima osnovnih pa i srednjih škola te svima koji žele provjeriti zadatke takve vrste. Aplikacija može služiti kao vježba s rješenjima, no treba imati na umu da ni računala nisu savršena pa je moguće da ponekad pogriješe.

Ukoliko će postojati interes, croapi će biti dalje usavršavan kako bi što točnije prepoznavao i podvrste riječi (npr. opće i vlastite imenice, opisne i gradivne pridjeve, nesvršene i svršene glagole, osobne, posvojne, neodređene zamjenice itd.), ali i određivao rod, broj, padež, lice i druge gramatičke kategorije.

Kolika je točnost modela?

Croapi u prosjeku točno otkriva vrste riječi u 97,45% slučajeva. Točnost modela nad riječima koje nikad nije vidio tijekom učenja trenutno iznosi 92%. U budućnosti će se model poboljšavati kako bi točnost bila veća. Detaljnije performanse za svaku pojedinu vrstu riječi dostupne su ovdje.

Koristi li model neku vrstu rječnika?

Ne u klasičnom smislu. Model je tijekom faze učenja "vidio" razne riječi iz ograničenog skupa tekstova u kojima su vrste riječi unaprijed označene pa u tom smislu možemo govoriti o rječniku. Međutim, broj jedinstvenih oblika riječi koje je model tijekom učenja imao na raspolaganju mnogo je manji od ukupnog broja i oblika riječi u hrvatskom standardnom jeziku. Unatoč tome, model je sposoban određivati vrstu i za riječi koje nikad nije vidio. Vanjske baze označenih riječi i tvorbi nisu korištene.

Riječi nisu bile jedine ulazne značajke iz kojih je model učio. Ono što je model naučio algoritmom strojnog učenja su matematička pravila pomoću kojih pokušava predvidjeti vrstu riječi neovisno o tome nalazi li se ona u tekstovima iz kojih je učio ili ne.