MultiDis Web App

Dobrodošli na MultiDis

Digitalni alat za analizu dječjeg govorenog jezika

MultiDis je web-aplikacija namijenjena automatskoj analizi spontanog i potaknutog govorenog jezika. Primarno je razvijena za logopede, no mogu je koristiti i svi drugi stručnjaci koji žele pratiti i razumjeti jezične sposobnosti djece i odraslih govornika hrvatskoga jezika.

Počni odmah: učitaj snimku govora i saznaj što ti MultiDis može reći o jeziku tvojih govornika.

Upload dokumenta

Mjere jezične proizvodnje

Populacijski podaci

Vidi sve dokumente

O nama

MultiDis je razvijen u okviru nekoliko znanstvenih projekata* kako bi suvremene spoznaje o obradi, procjeni i označavanju jezika postale praktičan alat u logopedskoj kliničkoj praksi.

Aplikacija omogućuje automatsku transkripciju dječjeg govora.

Aplikacija omogućuje pretvorbu govora u tekst s visokom razinom točnosti. Nakon toga slijedi izračun niza jezičnih mjera - od jezične produktivnosti, preko rječničke raznolikosti i sintaktičke složenosti, do pokazatelja kohezije. Ako već imate transkript, možete za njega izračunati mjere.

Mjere kasnije možete usporediti s prosječnim mjerama iz naše baze i dobiti usporedne vrijednosti. Sve se odvija brzo, pouzdano i uz minimalno tehničko predznanje.

*Projekti su provođeni na Odsjeku za logopediju Sveučilišta u Zagrebu Edukacijsko- rehabilitacijskog fakulteta, u suradnji s kolegama s drugih institucija

2018. - 2023. Višerazinski pristup govornom diskursu u jezičnom razvoju (Hrvatska zaklada za znanost, UIP-2017-05-6603, voditeljica Gordana Hržica)
2020. - 2024. Feast and Famine: Confronting overabundance and defectivity in language (Arts and Humanities Research Council UK, AH/T002859/1, voditelj Neil Bermel, voditeljice za Hrvatsku Tomislava Bošnjak Botica i Gordana Hržica)
2025. - 2026. Inflection Points: Designing Language Tools for Practitioners (Arts and Humanities Research Council UK, voditelj Neil Bermel, voditeljice za Hrvatsku Tomislava Bošnjak Botica i Gordana Hržica)

Happy Clients consequuntur quae

Projects adipisci atque cum quia aut

Hours Of Support aut commodi quaerat

Hard Workers rerum asperiores dolor

Projektni tim

Autori

Gordana Hržica

Izvanredna profesorica, Edukacijsko-rehabilitacijski fakultet, Sveučilište u Zagrebu

Gordana Hržica izvanredna je profesorica na Odsjeku za logopediju Edukacijsko-rehabilitacijskog fakulteta Sveučilišta u Zagrebu. Njezino se istraživanje nalazi na sjecištu jezikoslovlja, logopedije i jezičnih tehnologija te je usmjereno na razvoj jezika u jednojezične i dvojezične djece, kao i na jezične teškoće. Poseban naglasak stavlja na analizu spontanog govora i razvoj korpusa dječjega jezika za hrvatski jezik.

Sudjelovala je u nizu međunarodnih istraživačkih projekata posvećenih jezičnom razvoju i dvojezičnosti te aktivno sudjeluje u razvoju digitalnih alata za analizu jezika. Njezini radovi objavljeni su u međunarodnim časopisima iz područja usvajanja jezika i razvojne psiholingvistike.

U projektu MultiDis vodi razvoj alata za automatsku analizu spontanog govora djece, s ciljem približavanja naprednih jezičnih tehnologija istraživačima i kliničarima u području logopedije.

Dario Karl

Računalni lingvist i doktorand

Dario Karl računalni je lingvist i doktorand na poslijediplomskom doktorskom studiju lingvistike. Njegov rad usmjeren je na obradu prirodnoga jezika, razvoj sustava za automatsko označavanje jezičnih podataka te izradu digitalnih alata za analizu jezičnih korpusa.

Profesionalno djeluje u tehnološkom okruženju, gdje se bavi razvojem jezičnih tehnologija i primjenom suvremenih metoda obrade prirodnoga jezika u sklopu šireg područja umjetne inteligencije. Poseban interes usmjerava na povezivanje računalne lingvistike s potrebama istraživača i stručnjaka koji rade s jezičnim podacima.

U projektu MultiDis sudjeluje u razvoju i implementaciji sustava za automatsku jezičnu analizu, osobito u području označavanja i analize spontanoga govora.

Suradnici

Sara Košutar

Poslijedoktorska istraživačica, UiT – The Arctic University of Norway (Marie Curie fellow)

Bavi se istraživanjima jezičnog usvajanja i dvojezičnosti.

Matea Kramarić

Docentica, Pravni fakultet Sveučilišta u Zagrebu, Studijski centar socijalnog rada

Sudjeluje u nastavi i istraživanjima u području metodologije istraživanja u socijalnom radu.

Sudjelovale su u ranoj fazi razvoja aplikacije MultiDis, osobito u pripremi jezičnih podataka koji su poslužili kao temelj za razvoj i testiranje sustava za automatsku analizu. Također su sudjelovale u konceptualnim raspravama o svrsi i mogućim primjenama alata u istraživačkom i kliničkom kontekstu.

Zahvaljujemo i svim ostalim suradnicama koje su savjetima, prijedlozima ili na bilo kakav drugi način pridonijele nastanku aplikacije: dr. sc. Tomislava Bošnjak Botica, izv. prof. dr. sc. Ana Leko, izv. prof. dr. sc. Katarina Aladrović Slovaček, doc. dr. sc. Gordana Dobravac, izv. prof. dr. sc. Ivana Trtanj i izv. prof. dr. sc. Maja Roch. Zahvaljujemo i bivšim i sadašnjim studentima logopedije koji kontinuirano sudjeluju u pripremi podataka potrebnih za razvoj aplikacije.

Populacijski podatci

Aplikacija MultiDis omogućuje usporedbu rezultata analize transkripata s populacijskim mjerama dobivenima na temelju baze postojećih transkripata djece koja pripovijedaju priče. Te mjere predstavljaju referentne vrijednosti izračunate iz jezičnih uzoraka djece različite dobi i za različite vrste pripovjednih zadataka.

Korisnici mogu odabrati s kojom skupinom djece žele usporediti svoje rezultate, primjerice prema dobi ili vrsti priče. Za neke skupine trenutačno raspolažemo većim brojem uzoraka, dok je za druge baza manja, no kontinuirano radimo na njezinu proširivanju.

Mogućnosti aplikacije

MultiDis pruža sveobuhvatan set alata za analizu jezičnih uzoraka u hrvatskom jeziku

Automatska transkripcija

Pretvorba audio zapisa govora u tekst. Podržani formati uključuju MP3, WAV, FLAC, OGG, M4A i druge. Transkript možete pregledati i urediti.

Obrada transkripata

Prijenos gotovih transkripata u formatima DOCX, TXT, CEX ili CHA. Sustav automatski priprema tekst za jezičnu analizu kroz faze čišćenja i označavanja.

NLP analiza za hrvatski

Automatska tokenizacija, lematizacija, POS označavanje i morfološka analiza korištenjem modela Classla i BERTić prilagođenih hrvatskom jeziku.

Detekcija C-jedinica

Automatsko prepoznavanje komunikacijskih jedinica (C-units) u tekstu korištenjem specijaliziranog modela, s ocjenom složenosti svake jedinice.

Mjere jezične produktivnosti

Izračun jezične produktivnosti (C-jedinice, ukupan broj riječi), rječničke raznolikosti (NDW, TTR, VocD) i sintaktičke složenosti (MLCU, klauzalna gustoća).

Populacijske norme

Usporedba rezultata analize s populacijskim normama prema dobi, spolu i županiji. Vizualni prikaz pozicije ispitanika u odnosu na referentne vrijednosti.

Često postavljana pitanja

Odgovori na najčešća pitanja o korištenju MultiDis aplikacije. Ako ne pronađete odgovor, obratite nam se na projectmultidis@gmail.com.

1. Tko može koristiti MultiDis aplikaciju?

Aplikacija je otvorena za sve korisnike. Potrebno je kreirati korisnički račun i potvrditi adresu e-pošte. MultiDis je namijenjen logopedima, istraživačima i svima koji rade s jezičnim uzorcima hrvatskog jezika.

2. Koje formate datoteka mogu prenijeti u sustav?

Za tekstualne transkripte podržani su formati: DOCX, DOC, TXT, CEX i CHA (CLAN format). Za audio zapise podržani su: MP3, WAV, FLAC, OGG, M4A, AAC, WMA i Opus. Moguće je prenijeti samo tekst, samo audio ili oboje istovremeno (upareni prijenos).

3. Jesu li moji dokumenti vidljivi drugim korisnicima?

Ne. Svi dokumenti koje prenesete u aplikaciju vidljivi su isključivo vama. Drugi korisnici nemaju pristup vašim dokumentima niti rezultatima analiza.

4. Kako funkcionira automatska transkripcija?

Audio zapis se šalje na obradu putem servisa za pretvorbu govora u tekst. Transkripcija se odvija automatski u pozadini, a nakon završetka možete pregledati i urediti dobiveni tekst prije daljnje analize. Točnost transkripcije ovisi o kvaliteti audio zapisa.

5. Koje jezične mjere aplikacija izračunava?

Aplikacija izračunava mjere u tri kategorije: jezična produktivnost (broj C-jedinica, ukupan broj riječi, trajanje govora), rječnička raznolikost (broj različitih riječi, omjer tipa i tokena, VocD) i sintaktička složenost (prosječna duljina C-jedinice, klauzalna gustoća, prosječna duljina klauzule). Rezultate možete usporediti s populacijskim normama.

6. Koriste li se moji podaci u istraživačke svrhe?

Ne. Vaši podaci neće biti korišteni u istraživačke ili bilo koje druge svrhe bez vašeg izričitog prethodnog pristanka. Eventualno korištenje podataka moguće je isključivo uz vaše izravno i dokumentirano dopuštenje.