Dobrodošli na MultiDis
Digitalni alat za analizu dječjeg govorenog jezika
MultiDis je web-aplikacija namijenjena automatskoj analizi spontanog i potaknutog govorenog jezika. Primarno je razvijena za logopede, no mogu je koristiti i svi drugi stručnjaci koji žele pratiti i razumjeti jezične sposobnosti djece i odraslih govornika hrvatskoga jezika.
O nama
MultiDis je razvijen u okviru nekoliko znanstvenih projekata* kako bi suvremene spoznaje o obradi, procjeni i označavanju jezika postale praktičan alat u logopedskoj kliničkoj praksi.
Aplikacija omogućuje automatsku transkripciju dječjeg govora.
Aplikacija omogućuje pretvorbu govora u tekst s visokom razinom točnosti. Nakon toga slijedi izračun niza jezičnih mjera - od jezične produktivnosti, preko rječničke raznolikosti i sintaktičke složenosti, do pokazatelja kohezije. Ako već imate transkript, možete za njega izračunati mjere.
Mjere kasnije možete usporediti s prosječnim mjerama iz naše baze i dobiti usporedne vrijednosti. Sve se odvija brzo, pouzdano i uz minimalno tehničko predznanje.
*Projekti su provođeni na Odsjeku za logopediju Sveučilišta u Zagrebu Edukacijsko- rehabilitacijskog fakulteta, u suradnji s kolegama s drugih institucija
- 2018. - 2023. Višerazinski pristup govornom diskursu u jezičnom razvoju (Hrvatska zaklada za znanost, UIP-2017-05-6603, voditeljica Gordana Hržica)
- 2020. - 2024. Feast and Famine: Confronting overabundance and defectivity in language (Arts and Humanities Research Council UK, AH/T002859/1, voditelj Neil Bermel, voditeljice za Hrvatsku Tomislava Bošnjak Botica i Gordana Hržica)
- 2025. - 2026. Inflection Points: Designing Language Tools for Practitioners (Arts and Humanities Research Council UK, voditelj Neil Bermel, voditeljice za Hrvatsku Tomislava Bošnjak Botica i Gordana Hržica)
Happy Clients consequuntur quae
Projects adipisci atque cum quia aut
Hours Of Support aut commodi quaerat
Hard Workers rerum asperiores dolor
Projektni tim
Autori
Gordana Hržica
Izvanredna profesorica, Edukacijsko-rehabilitacijski fakultet, Sveučilište u ZagrebuGordana Hržica izvanredna je profesorica na Odsjeku za logopediju Edukacijsko-rehabilitacijskog fakulteta Sveučilišta u Zagrebu. Njezino se istraživanje nalazi na sjecištu jezikoslovlja, logopedije i jezičnih tehnologija te je usmjereno na razvoj jezika u jednojezične i dvojezične djece, kao i na jezične teškoće. Poseban naglasak stavlja na analizu spontanog govora i razvoj korpusa dječjega jezika za hrvatski jezik.
Sudjelovala je u nizu međunarodnih istraživačkih projekata posvećenih jezičnom razvoju i dvojezičnosti te aktivno sudjeluje u razvoju digitalnih alata za analizu jezika. Njezini radovi objavljeni su u međunarodnim časopisima iz područja usvajanja jezika i razvojne psiholingvistike.
U projektu MultiDis vodi razvoj alata za automatsku analizu spontanog govora djece, s ciljem približavanja naprednih jezičnih tehnologija istraživačima i kliničarima u području logopedije.
Dario Karl
Računalni lingvist i doktorandDario Karl računalni je lingvist i doktorand na poslijediplomskom doktorskom studiju lingvistike. Njegov rad usmjeren je na obradu prirodnoga jezika, razvoj sustava za automatsko označavanje jezičnih podataka te izradu digitalnih alata za analizu jezičnih korpusa.
Profesionalno djeluje u tehnološkom okruženju, gdje se bavi razvojem jezičnih tehnologija i primjenom suvremenih metoda obrade prirodnoga jezika u sklopu šireg područja umjetne inteligencije. Poseban interes usmjerava na povezivanje računalne lingvistike s potrebama istraživača i stručnjaka koji rade s jezičnim podacima.
U projektu MultiDis sudjeluje u razvoju i implementaciji sustava za automatsku jezičnu analizu, osobito u području označavanja i analize spontanoga govora.
Suradnici
Sara Košutar
Poslijedoktorska istraživačica, UiT – The Arctic University of Norway (Marie Curie fellow)Bavi se istraživanjima jezičnog usvajanja i dvojezičnosti.
Matea Kramarić
Docentica, Pravni fakultet Sveučilišta u Zagrebu, Studijski centar socijalnog radaSudjeluje u nastavi i istraživanjima u području metodologije istraživanja u socijalnom radu.
Sudjelovale su u ranoj fazi razvoja aplikacije MultiDis, osobito u pripremi jezičnih podataka koji su poslužili kao temelj za razvoj i testiranje sustava za automatsku analizu. Također su sudjelovale u konceptualnim raspravama o svrsi i mogućim primjenama alata u istraživačkom i kliničkom kontekstu.
Zahvaljujemo i svim ostalim suradnicama koje su savjetima, prijedlozima ili na bilo kakav drugi način pridonijele nastanku aplikacije: dr. sc. Tomislava Bošnjak Botica, izv. prof. dr. sc. Ana Leko, izv. prof. dr. sc. Katarina Aladrović Slovaček, doc. dr. sc. Gordana Dobravac, izv. prof. dr. sc. Ivana Trtanj i izv. prof. dr. sc. Maja Roch. Zahvaljujemo i bivšim i sadašnjim studentima logopedije koji kontinuirano sudjeluju u pripremi podataka potrebnih za razvoj aplikacije.
Populacijski podatci
Aplikacija MultiDis omogućuje usporedbu rezultata analize transkripata s populacijskim mjerama dobivenima na temelju baze postojećih transkripata djece koja pripovijedaju priče. Te mjere predstavljaju referentne vrijednosti izračunate iz jezičnih uzoraka djece različite dobi i za različite vrste pripovjednih zadataka.
Korisnici mogu odabrati s kojom skupinom djece žele usporediti svoje rezultate, primjerice prema dobi ili vrsti priče. Za neke skupine trenutačno raspolažemo većim brojem uzoraka, dok je za druge baza manja, no kontinuirano radimo na njezinu proširivanju.
Mogućnosti aplikacije
MultiDis pruža sveobuhvatan set alata za analizu jezičnih uzoraka u hrvatskom jeziku
Automatska transkripcija
Pretvorba audio zapisa govora u tekst. Podržani formati uključuju MP3, WAV, FLAC, OGG, M4A i druge. Transkript možete pregledati i urediti.
Obrada transkripata
Prijenos gotovih transkripata u formatima DOCX, TXT, CEX ili CHA. Sustav automatski priprema tekst za jezičnu analizu kroz faze čišćenja i označavanja.
NLP analiza za hrvatski
Automatska tokenizacija, lematizacija, POS označavanje i morfološka analiza korištenjem modela Classla i BERTić prilagođenih hrvatskom jeziku.
Detekcija C-jedinica
Automatsko prepoznavanje komunikacijskih jedinica (C-units) u tekstu korištenjem specijaliziranog modela, s ocjenom složenosti svake jedinice.
Mjere jezične produktivnosti
Izračun jezične produktivnosti (C-jedinice, ukupan broj riječi), rječničke raznolikosti (NDW, TTR, VocD) i sintaktičke složenosti (MLCU, klauzalna gustoća).
Populacijske norme
Usporedba rezultata analize s populacijskim normama prema dobi, spolu i županiji. Vizualni prikaz pozicije ispitanika u odnosu na referentne vrijednosti.
Često postavljana pitanja
Odgovori na najčešća pitanja o korištenju MultiDis aplikacije. Ako ne pronađete odgovor, obratite nam se na projectmultidis@gmail.com.
1. Tko može koristiti MultiDis aplikaciju?
Aplikacija je otvorena za sve korisnike. Potrebno je kreirati korisnički račun i potvrditi adresu e-pošte. MultiDis je namijenjen logopedima, istraživačima i svima koji rade s jezičnim uzorcima hrvatskog jezika.
2. Koje formate datoteka mogu prenijeti u sustav?
Za tekstualne transkripte podržani su formati: DOCX, DOC, TXT, CEX i CHA (CLAN format). Za audio zapise podržani su: MP3, WAV, FLAC, OGG, M4A, AAC, WMA i Opus. Moguće je prenijeti samo tekst, samo audio ili oboje istovremeno (upareni prijenos).
3. Jesu li moji dokumenti vidljivi drugim korisnicima?
Ne. Svi dokumenti koje prenesete u aplikaciju vidljivi su isključivo vama. Drugi korisnici nemaju pristup vašim dokumentima niti rezultatima analiza.
4. Kako funkcionira automatska transkripcija?
Audio zapis se šalje na obradu putem servisa za pretvorbu govora u tekst. Transkripcija se odvija automatski u pozadini, a nakon završetka možete pregledati i urediti dobiveni tekst prije daljnje analize. Točnost transkripcije ovisi o kvaliteti audio zapisa.
5. Koje jezične mjere aplikacija izračunava?
Aplikacija izračunava mjere u tri kategorije: jezična produktivnost (broj C-jedinica, ukupan broj riječi, trajanje govora), rječnička raznolikost (broj različitih riječi, omjer tipa i tokena, VocD) i sintaktička složenost (prosječna duljina C-jedinice, klauzalna gustoća, prosječna duljina klauzule). Rezultate možete usporediti s populacijskim normama.
6. Koriste li se moji podaci u istraživačke svrhe?
Ne. Vaši podaci neće biti korišteni u istraživačke ili bilo koje druge svrhe bez vašeg izričitog prethodnog pristanka. Eventualno korištenje podataka moguće je isključivo uz vaše izravno i dokumentirano dopuštenje.