BPE
Related
mentions: Stawianie modded-nanogpt na polskim od zera: pięć rzeczy, które się wywaliły (i czemu), Własny polski BPE koduje polski 1.58× gęściej niż Llama-3, SOTA 2026 Baseline Matrix, Polish Morphological Boundary Benchmark v0.1.0, MorphBPE/SKMT-Style Tokenizer Smoke, Polish Morpheme Boundary Benchmark Protocol
defined-by: Własny polski BPE koduje polski 1.58× gęściej niż Llama-3
Local graph
BPE
- → mentions Stawianie modded-nanogpt na polskim od zera: pięć rzeczy, które się wywaliły (i czemu)
- → mentions Własny polski BPE koduje polski 1.58× gęściej niż Llama-3
- → mentions SOTA 2026 Baseline Matrix
- → mentions Polish Morphological Boundary Benchmark v0.1.0
- → mentions MorphBPE/SKMT-Style Tokenizer Smoke
- → mentions Polish Morpheme Boundary Benchmark Protocol
- → defined-by Własny polski BPE koduje polski 1.58× gęściej niż Llama-3
Provenance
slayer@882fb52:public/results/experiments.json#polish-bpe-fertilityslayer@882fb52:public/results/experiments.json#modded-nanogpt-polish-bringupslayer@882fb52:public/data/chomsky-sota2026/docs/sota_2026_matrix.mdslayer@882fb52:public/data/chomsky-sota2026/reports/morph_benchmark_report.mdslayer@882fb52:public/data/chomsky-sota2026/reports/morph_bpe_report.mdslayer@882fb52:public/data/chomsky-sota2026/docs/polish_morpheme_benchmark_protocol.md