Dokumentacija korištenja

Vodič kroz sve funkcionalnosti MultiDis aplikacije — od prijenosa dokumenta do usporedbe s populacijskim normama.

Sadržaj

Početni koraci
Prijenos dokumenata
Faze obrade
Razumijevanje rezultata
Populacijske norme
Česta pitanja

1 Početni koraci

Registracija

Kreirajte korisnički račun unosom korisničkog imena, e-pošte, imena, prezimena i lozinke. Na unesenu adresu e-pošte primit ćete verifikacijsku poruku.

Prijava

Prijavite se korisničkim imenom i lozinkom. Ako ste zaboravili lozinku, koristite opciju „Zaboravljena lozinka" za resetiranje putem e-pošte.

Prijenos dokumenta

Nakon prijave, kliknite „Dodaj dokument" u navigaciji i prenesite tekstualnu datoteku, audio zapis ili oboje istovremeno.

2 Prijenos dokumenata

MultiDis podržava tri načina prijenosa dokumenata. Prilikom prijenosa unosite i metapodatke o ispitaniku (ime/alias, dob, spol, županija, vrsta zadatka) koji se koriste za usporedbu s populacijskim normama.

Ako već imate gotov transkript, prenesite ga izravno u sustav.

Podržani formati:

.docx / .doc — Microsoft Word dokumenti
.txt — obični tekstualni dokumenti
.cex — lingvistički format
.cha — CLAN (CHILDES) format — sustav automatski prepoznaje i obrađuje CLAN anotacije

Nakon prijenosa, transkript prolazi kroz faze čišćenja i pripreme za analizu.

Prenesite audio zapis govora, a sustav će ga automatski transkribirati.

Podržani formati: MP3, WAV, FLAC, OGG, M4A, AAC, WMA, Opus

Transkripcija se odvija automatski u pozadini. Nakon završetka, dobit ćete transkript koji možete pregledati i urediti prije daljnje analize. Točnost transkripcije ovisi o kvaliteti audio zapisa, pozadinskoj buci i jasnoći govora.

Prenesite audio zapis i pripadajući tekstualni transkript istovremeno. Audio zapis bit će pohranjen uz dokument, a tekstualni transkript koristi se kao polazna osnova za jezičnu analizu.

Ovo je korisno kada imate i zapis i transkript, a želite ih držati povezanima u sustavu.

3 Faze obrade

Svaki dokument prolazi kroz četiri faze obrade. Napredovanje kroz faze prikazano je vizualno na stranici dokumenta.

Faza 1 Neobrađeni transkript

Originalni tekst (prijenesen ili transkribiran iz audio zapisa). U ovoj fazi možete pregledati i urediti transkript — ispraviti pogreške transkripcije, dodati oznake ili obrisati neželjene dijelove.

Faza 2 Očišćeni tekst

Tekst pripremljen za jezičnu analizu — uklonjene su anotacije, oznake govornika i nerelevantni sadržaj. I u ovoj fazi možete pregledati i ručno urediti tekst ako automatsko čišćenje nije dalo zadovoljavajuće rezultate.

Faza 3 NLP analiza

Automatska jezična analiza. Sustav koristi NLP modele (Classla i BERTić) prilagođene hrvatskom jeziku za tokenizaciju, lematizaciju, POS označavanje, morfološku analizu i detekciju komunikacijskih jedinica (C-units).

Ova faza se pokreće automatski i traje nekoliko sekundi.

Faza 4 Mjere jezične produktivnosti

Konačni rezultati analize. Izračunavaju se mjere jezične produktivnosti, rječničke raznolikosti i sintaktičke složenosti. Rezultate možete usporediti s populacijskim normama prema dobi, spolu i drugim demografskim obilježjima.

Savjet: Ako nakon uređivanja teksta u Fazi 1 ili 2 želite ponoviti analizu, sustav će automatski pokrenuti reprocessing (Faza 3) s ažuriranim tekstom.

4 Razumijevanje rezultata

Na stranici produktivnosti prikazane su mjere u tri kategorije. Detaljnije objašnjenje svake mjere možete pronaći na stranici Mjere jezične proizvodnje.

Produktivnost

NCU — broj komunikacijskih jedinica
NTW — ukupan broj riječi (pojavnica)
NDW — broj različitih riječi

Rječnička raznolikost

TTR — omjer različitih i ukupnih riječi
MATTR — pomični prosječni TTR
VocD — D-indeks raznolikosti rječnika

Sintaktička složenost

MLCU — prosječna duljina C-jedinice
Klauzalna gustoća — omjer klauzula po C-jedinici
MLC — prosječna duljina klauzule

Kako čitati usporedbu s normama

Svaka mjera uspoređuje se s populacijskim normama za dob i demografska obilježja ispitanika. Rezultat usporedbe prikazan je kroz:

Pojam	Objašnjenje	Primjer
Z-score	Pokazuje koliko je rezultat udaljen od prosjeka (u standardnim devijacijama)	Z = +0.5 znači da je rezultat pola SD iznad prosjeka
Percentil	Postotak populacije čiji je rezultat niži od mjerenog	61. percentil = rezultat je bolji od 61% populacije
Oznake	Vizualna interpretacija rezultata	Ispod prosjeka Prosječno Iznad prosjeka

5 Populacijske norme

Sustav populacijskih normi omogućuje usporedbu rezultata ispitanika s referentnim vrijednostima za djecu i mlade (2–18 godina) koji govore hrvatskim jezikom.

Filtriranje normi

Na stranici produktivnosti možete filtrirati norme prema:

dobnoj skupini (u mjesecima)
spolu
županiji
nazivu priče
vrsti zadatka (pripovijedanje / prepričavanje)

Filtriranje se odvija u stvarnom vremenu, bez ponovnog učitavanja stranice.

Interaktivni grafikoni

Za svaku mjeru prikazan je interaktivni grafikon normalne distribucije (zvonolika krivulja) koji prikazuje:

plava krivulja — raspodjela populacijskih normi
crvena isprekidana linija — pozicija ispitanika

Grafikoni se automatski ažuriraju kada primijenite filtere.

Populacijske norme možete pregledati i kao zaseban popis na stranici Populacijske norme.

6 Česta pitanja

Da. U Fazi 1 (neobrađeni transkript) i Fazi 2 (očišćeni tekst) možete ručno uređivati tekst. Nakon uređivanja, sustav će automatski ponoviti NLP analizu (Faza 3) s novim tekstom.

Transkripcija se odvija u pozadini i obično traje od nekoliko sekundi do jedne minute, ovisno o duljini audio zapisa. Status transkripcije vidljiv je na stranici dokumenta.

Da. Na popisu dokumenata ili na stranici pojedinog dokumenta dostupna je opcija brisanja. Obrisani dokumenti više neće biti vidljivi u vašem popisu.

Da. Na stranici produktivnosti (Faza 4) postoji gumb „Ponovi izračun mjera" koji pokreće ponovni izračun na temelju postojeće NLP analize.

Automatska transkripcija ovisi o kvaliteti audio zapisa. Možete ručno urediti transkript u Fazi 1 ili Fazi 2 kako biste ispravili pogreške prije pokretanja jezične analize. Preporuka je koristiti audio zapise s minimalnom pozadinskom bukom i jasnim govorom.

Ako imate dodatna pitanja, obratite nam se na projectmultidis@gmail.com.