Prophet
concept draft glosariusz

BPE

mentions: Stawianie modded-nanogpt na polskim od zera: pięć rzeczy, które się wywaliły (i czemu), Własny polski BPE koduje polski 1.58× gęściej niż Llama-3, SOTA 2026 Baseline Matrix, Polish Morphological Boundary Benchmark v0.1.0, MorphBPE/SKMT-Style Tokenizer Smoke, Polish Morpheme Boundary Benchmark Protocol
defined-by: Własny polski BPE koduje polski 1.58× gęściej niż Llama-3

Local graph

Provenance