MOC · eksperymenty
experiment
- Diagnoza: „przegrana” na CBD/DYK/GSM8K to bug harnessu, nie modelu
- EntiGraph — korpusy wiedzy 2×10M tok (wiki PL-focus + ZPE)
- Stawianie modded-nanogpt na polskim od zera: pięć rzeczy, które się wywaliły (i czemu)
- V4 Faza 0 — pomiar (likelihood) + kalibracja λ (cal-l030)
- Własny polski BPE koduje polski 1.58× gęściej niż Llama-3
- graf encji — wiedza kompozycyjna (pilot 2-hop)
- knowledge_probe_v1 — długi ogon wiedzy o Polsce (smoke)
- slayer-style (ep1/2/3)
- slayer-v2-klej
- slayer-v3 — trening + pierwszy wynik LLMzSzŁ
- train_v3 — czysty miks SFT
- weryfikacja zewn. destylacji 10k (model PL 11B)