5P: Big data

28.01.2018

Zadání:

Zkuste najít nebo vymyslet projekt, který by využíval big data pro vzdělávání nebo vzdělávací politiku. (Stačí krátce) Jaké jsou limity daty řízeného vzdělávání? Co naopak mohou přinést? Přidat komentář ke kurzu...

Položil jsem si otázku, jaký projekt by v prostředí českého školství měl smysl. Po chvíli přemýšlení mi má mysl nabídla odpověď v zásadě megalomanskou. Ale u big data projektu se mi to jeví jako přístup skoro zdravý. :)

Projekt se týká státních maturit a forem testování. V čistě obecné rovině nastává problém tehdy, když proti sobě postavíme kompetenčně vystavěné RVP a znalostně zaměřené testy produkované Cermatem.

Myslím si, že cestou sběru dat charakteru, který se hned pokusím popsat, a dobře nastaveného dana miningu by se dalo vytvořit model, který by i přes veškerou obtížnost testování kompetencí ve velkém, mohl o některých kompetencích dost vypovědět.

Program stojí na myšlence, že maturanti by několik posledních měsíců plnily určité úkoly formou elektronického vzdělávání. To by generovalo vedle data jak o jejich znalostech, tak i o tom, jak jsou schopni kooperovat, pracovat samostatně, jak si rozvrhnout práci, jak pracují se zdroji atd.

Je jasné, že i přes možnost tato data nasbírat, zůstává otázka, jak s nimi naložit (nehledě na etickou otázku spojenou s intenzivním monitoringem výsledků studentů). Stále jsme nuceni se ptát, na základě jakých kritérií dát studentovi hodnocení o tom, že je v nějaké oblasti kompetentní.

V rámci práce s big data bych na to šel ne cestou ověřování jednotlivých dosažených výsledků, ale cestou hledání odchylek od normy. Normou by v tomto případě bylo určité rozmezí, v rámci celé škály výsledků prací studentů by bylo dost široké. Pouze příliš velké výchylky by bylo třeba podrobit bližšímu pohledu.

Jinak řečeno, kompetence bych hodnotil cestou srovnávání studentů a vycházel bych z průměru výsledků odevzdávaných prací, pracovních a uživatelských návyků studentů apod. Data mining by mi umožnil z velkého vzorku formálně různých dat (různé obory a školní předměty, multimediální charakter výstupů...) vytáhnout největší odchylky od normy. Ti co se do normy vešli, požadavky na danou kompetenci splňují. Množina výstupů s velkou odchylkou by se skládala z nadprůměrných a nedostačujících výsledků. První skupina by nám pomáhala kontrolovat celkovou úroveň výstupů, druhá skupina by představovala skupinu studentů, kteří požadavky k formálnímu uznání kompetence nesplnily.

Podobně koncipovaný projekt byvyžadoval určité základní technické vybavení dostupné všem školám, dostatečnou úroveň informační a digitální gramotnosti ze strany učitelů, určitou míru formální standarizace dat. Pro nastavení hranic toho, co je v normě a toho, co je mimo, bychom se nevyhnuli rovině rozdílu mezi kompetenčním a znalostním přístupem k evaluaci.

Nevím, zda se mi podařilo nastínit, o co mi v tomto modelu šlo...

Limity daty řízeného vzdělávání vidím v nastavení správných kritérií pro smysluplný data mining. Vedle toho se u každého projektu budeme vždy potýkat s technickými a finanćními hranicemi - příklad obojího - otázka zda si pro rozsáklý projekt pořídit vlastní servery ( levnější, ale ne tak bezpečné, nebo zvolím cestu spolehlivého cloudového úložiště.

Co může daty řízené vzdělávání přinést? Třeba právě nový způsob hodnocení studijních výsledků.