EVAL
Related
mentions: PolNative v1 — natywność polszczyzny, Slayer v3 — Scenariusz: destylacja + wiedza z podręczników (CZYSTO), Slayer — jawny manifest danych (V4), Belebele (EN), ARC-Challenge, FLORES-200 (PL), MMLU, Slayer — Data Lineage (v1 / v2 / v3), INCLUDE-44 (PL), Polish EQ-Bench, Prywatny held-out, Slayer v3 — Data Pipeline Audit (2026-06-12), Slayer v3 — Clean Data Plan, Plan: Slayer style-tuning v2 — anti-forgetting protocol — 2026-06-09, Belebele (PL), Prywatny held-out — świeże arkusze (anty-benchmaxxing), CPTUB, PLCC, LLMzSzŁ, PoQuAD, GSM8K, PES, Slayer v3 — Plan (CPT-first: wiedza → umiejętności → preferencje)
Local graph
EVAL
- → mentions PolNative v1 — natywność polszczyzny
- → mentions Slayer v3 — Scenariusz: destylacja + wiedza z podręczników (CZYSTO)
- → mentions Slayer — jawny manifest danych (V4)
- → mentions Belebele (EN)
- → mentions ARC-Challenge
- → mentions FLORES-200 (PL)
- → mentions MMLU
- → mentions Slayer — Data Lineage (v1 / v2 / v3)
- → mentions INCLUDE-44 (PL)
- → mentions Polish EQ-Bench
- → mentions Prywatny held-out
- → mentions Slayer v3 — Data Pipeline Audit (2026-06-12)
- → mentions Slayer v3 — Clean Data Plan
- → mentions Plan: Slayer style-tuning v2 — anti-forgetting protocol — 2026-06-09
- → mentions Belebele (PL)
- → mentions Prywatny held-out — świeże arkusze (anty-benchmaxxing)
- → mentions CPTUB
- → mentions PLCC
- → mentions LLMzSzŁ
- → mentions PoQuAD
- → mentions GSM8K
- → mentions PES
- → mentions Slayer v3 — Plan (CPT-first: wiedza → umiejętności → preferencje)
Provenance
slayer@882fb52:bench/POLNATIVE.mdslayer@882fb52:V3_DISTILL_SCENARIO.mdslayer@882fb52:DATASET_MANIFEST.mdslayer@882fb52:public/data/datasety.json#belebele_enslayer@882fb52:public/data/datasety.json#arcslayer@882fb52:public/data/datasety.json#floresslayer@882fb52:public/data/datasety.json#mmluslayer@882fb52:DATA_LINEAGE.md