En söndag med svenska översättningar — 2902 paket, ML, espeak och Visio

En extraordinärt produktiv dag. Här är allt som åstadkoms.

DDTSS — 2902 Debian-paketbeskrivningar

2902 paketbeskrivningar översatta till DDTSS med 84% matchningsgrad mot vår Ubuntu TM (149K strängar). Boten fixad och filtrerar nu korrekt mot DDTSS-kön.

review-po-v3 — Från 1.6 till 6.0/10

Massiv false-positive-rensning i granskningsverktyget:

  • Brand-checker: 6800 → ~200 false positives
  • Nya checks: dubbelmellanslag, HTML-mismatch, kapitalisering
  • Domänprofiler: fontforge, gnome, docs, debian
  • 3 nya kvalitetsmoduler: back-translation, LIX-läsbarhet, cross-project consistency

TR Intelligence — ML-system tränat på 244K strängar

Fyra ML-komponenter byggda med 244K granskade strängar som träningsdata:

  • N-gram språkmodell (58K ord) — flaggar onaturlig svenska
  • Termextraktion — 3893 automatiskt godkända termer från 164 projekt
  • DeepL-bias-detektor — hittar systematiska fel (0.8% påverkade)
  • Quality predictor — ML-classifier med 21 features
  • Active learning pipeline — systemet lär sig av varje manuell granskning

TR Vision-plan: från 0% till 95% auto-approve genom kalibrerade checks + ML-classifier.

Open source — 7 PR:ar, 1 redan mergad

600+ strängar till projekt med 200K+ kombinerade stjärnor:

  • react-i18next #1912 — MERGAD 🎉
  • vue-element-admin #4338 (90K ⭐), FormatJS #6200 (14.7K ⭐)
  • Ncase/trust #143, MetSys #122, OHF-Voice #124, Laravel-Lang #8275

espeak-ng — Komplett försvenskning

PR #2391 med omfattande svenska uttalsförbättringar:

Kategori Före Efter
sj-ljud (skj/sch) ɕ/ʃ (fel) ɧ (korrekt) ✅
Retroflexer rd, rn (inga) ɽ, ɽn, ɽl, ɽt ✅
Vardagsuttal de=deː, mig=miːɡ dom, mej, å ✅
Intonation Platt Fråga↗ Påstående↘ ✅
Lånord garage=ɡarɑːʃ ɡaɹɑːɧ ✅

50+ ordliste-entries, tonaccent-grund, svenska intonationstuner.

Piper TTS — Axel v2 och Alma v2 under träning

Båda rösterna tränas om med den förbättrade espeak-ng:

  • Axel v2: Fine-tune från Almas checkpoint (studio-kvalitet) + 18K LibriVox-utterances + fixad fonetik. 3000 epochs.
  • Alma v2: Fräsch träning med 3300 NST studio-utterances + fixad fonetik. 10000 epochs.

Klara imorgon. Korrekt sj-ljud, retroflexer och vardagsuttal i båda rösterna.

Visio Viewer Chrome Extension v2.0.0

Helt ombyggd från Python/Pyodide till ren JavaScript:

  • 50 MB → 66 KB (750x mindre)
  • Fungerar på Windows (Pyodide-versionen kraschade)
  • 12/16 testfiler 100% match med Python-referensen
  • pondzod-network.vsdx: 1441 element perfekt renderade
  • Skuggor, gradienter, pilar, auto text-kontrast, i18n (en+sv)

Redo för Chrome Web Store.

Forgejo — 3348 strängar granskade

100% översatt, 330 strängar fixade, 100 uppladdade till Codeberg Weblate.

Moodle — 155K strängar redo

Komplett pipeline byggd: batch-DeepL + platshållarskydd + AMOS-konvertering. Körning 1 april.

Infrastruktur

  • Glossary-sync — terminology.md → Weblate/Transifex/Crowdin
  • Quality-gate GitHub Action — blockerar merge om score < 7
  • FTL-stöd — Mozilla Fluent i TR
  • 5 nya verktyg: auto-review-pr, deepl-postprocess, contrib-finder, po-memory auto-import, review-po-v3 –fix

Siffror

Metric Värde
DDTSS paket översatta 2902
Open source PR:ar 7 (1 mergad)
TR strängar granskade 244K
ML-termer extraherade 3893
espeak-ng ordliste-entries 50+
Visio testfiler 100% match 12/16
Nya verktyg/moduler 15+

Kommentarer

Lämna ett svar

Din e-postadress kommer inte publiceras. Obligatoriska fält är märkta *

Denna webbplats använder Akismet för att minska skräppost. Lär dig om hur din kommentarsdata bearbetas.