Etikett: i18n

Internationalization

  • Zabbix, Wazuh, Zrythm och pipeline-fixes — en dag med infra och i18n

    En fullspäckad dag med allt från infrastruktur till översättningar. Här är sammanfattningen.

    Zabbix — Fullständig monitoreringsinfrastruktur

    Distribuerade Zabbix 7.4 till 10 hostar — allt från Proxmox-noder och LXC-containrar till Mac Mini och WSL-maskiner.

    • 10 hostar registrerade med agent2/agentd:
    • Fixade: PHP 8.4 pgsql-modul, Admin-lockout, NVIDIA GPU-plugin-krasch
    • Dashboard

    Wazuh — Uppgradering och i18n

    Dessutom: första svenska översättningen av Wazuh Dashboard.

    • PR #8260 — 350 strängar i sv-SE.json
    • 78 React-komponenter internationaliserade med @osd/i18n
    • 0 kvarvarande hårdkodade strängar
    • Första icke-engelska locale-bidraget till Wazuh

    Zrythm — Från 63% till 99.9%

    Zrythm (digital audio workstation) gick från 63% till 99.9% svenska på en eftermiddag.

    Komponent Före Efter Strängar
    zrythm (app) 63% 99.9% 569 nya
    web 13% 77% 178 nya
    accounts 50% 81% 26 nya
    user-manual 8% 89% 1 408 nya

    Totalt: 2 181 strängar översatta och uppladdade till Weblate.

    Hittade också en segfault-bugg i Zrythm — appen kraschar vid svenska locale pga en trasig format-sträng i den medföljande .mo-filen (4 av 5 %s-platshållare → g_strdup_printf segfaultar).

    review-po-v3 — Pipeline-förbättringar

    Fem uppdateringar baserade på dagens arbete:

    • ts2po-artefakter — filtrerar bort false positives från Qt TS → PO-konvertering (317 → 38 FAIL)
    • Översatta platshållare — detekterar när sub-agenter översätter {endref}{slutref}
    • ”Vänligen” auto-fix — automatisk borttagning av DeepL:s bokstavliga ”Please”-översättning
    • DAW/musik-termer i brand-skip — plugin, fader, mixer, channel etc. flaggas inte längre som egennamn
    • DevOps/security-termer — dashboard, agent, endpoint, compliance etc. i whitelisten

    parallel-worker — Filformat-validering

    Patchade TR:s parallel-worker med validering som fångar felaktiga filer innan de kraschar review-po-v3:

    • ZIP-arkiv, JSON, XML/Qt TS, binärfiler — alla avvisas med tydligt felmeddelande
    • 30 error-jobb i kön → 23 återhämtade efter omstart

    Siffror

    Kategori Antal
    Strängar översatta (Zrythm) 2 181
    Strängar översatta (Wazuh) 350
    React-komponenter i18n (Wazuh) 78
    Zabbix-hostar deployade 10
    Wazuh uppgraderad 4.11.2 → 4.14.4
    Buggar rapporterade 1 (Zrythm segfault)
    Pipeline-förbättringar 5
    PR:ar 1 (Wazuh #8260)
  • TR Intelligence — datadriven kvalitetsplattform för svenska FOSS-översättningar

    Efter år av att granska svenska FOSS-översättningar har en sak blivit kristallklar: vi behöver bättre verktyg. När samma engelska ord som ”Apply” har nio olika svenska översättningar i olika projekt, när 69 000 Debian-paket saknar svenska beskrivningar, och när DeepL-råöversättningar innehåller systematiska fel — då är det dags för en förändring.

    Problembilden

    Svenska FOSS-översättningar lider av tre huvudproblem:

    • Inkonsistens mellan projekt — samma term översätts på otaliga sätt
    • Ofullständig täckning — mängder av mjukvara saknar svenska strängar
    • Kvalitetsbrister — automatiska översättningar med återkommande fel

    Men vad om vi kunde använda all den data vi redan har samlat under åren? Vad om vi kunde bygga intelligenta system som lär sig av tidigare granskningsarbete?

    TR Intelligence Platform

    Det är här TR Intelligence Platform kommer in. Detta är inte bara ett verktyg — det är en komplett ekosystem byggd på 5,2 miljoner granskade svenska strängar och 1,2 miljoner Translation Memory-poster från över 3299 FOSS-projekt.

    Plattformen består av tio sammankopplade komponenter:

    1. Kanonisk terminologibank med viktad konsensus
    2. Ensemble auto-approve med sju kvalitetssignaler
    3. ML-klassificerare för översättningskvalitet
    4. N-gram-modell för språklig korrekthet
    5. DeepL auto-fixer för vanliga systematiska fel
    6. Konsistensradar för avvikelsedetektering
    7. Regressionsdetektor för kvalitetsnedgång
    8. Goldstandard TM-export för återanvändning
    9. False positive mining för kontinuerlig förbättring
    10. DeepL glossar-feedback för bättre maskinöversättning

    Kanonisk terminologibank

    Hjärtat i systemet är den kanoniska terminologibanken med 326 000 svenska termer extraherade från 3299 projekt. Varje term har en viktad konsensuspoäng baserad på hur ofta den använts i granskade översättningar, med möjlighet för domänspecifika overrides när kontext kräver det.

    Detta är inte bara en ordlista — det är kollektiv kunskap från svenska översättargemenskapen, destillerad till användbara rekommendationer.

    Ensemble Auto-Approve

    Den mest spännande komponenten är ensemble auto-approve-systemet. Det kombinerar sju olika kvalitetssignaler för att automatiskt godkänna översättningar med över 99% säkerhet:

    • Terminologikonformitet mot kanonisk bank
    • Translation Memory-träffar från verifierade källor
    • ML-klassificerare för språklig kvalitet
    • N-gram-sannolikhet för naturlighet
    • Konsistenskontroll mot projekthistorik
    • Formatverifiering för specialtecken och variabler
    • Domänspecifik validering

    Redan vid första körningen kunde systemet automatiskt godkänna 6267 strängar — översättningar som normalt skulle kräva manuell granskning.

    Öppna resurser för alla

    All denna data görs tillgänglig som öppna resurser:

    Eftersom allt är öppet kan andra utvecklare integrera dessa resurser i sina egna verktyg och processer.

    Vad betyder detta?

    TR Intelligence Platform representerar ett paradigmskifte från 100% manuell granskning till över 90% automation med bibehållen eller förbättrad kvalitet. Det innebär:

    • Konsistenta termer tvärs alla 3299 projekt i databasen
    • Snabbare genomströmning av översättningsuppdrag
    • Högre kvalitet genom systematisk kunskapsanvändning
    • Bättre DeepL-översättningar via glossar-feedback
    • Friggjord tid för översättare att fokusera på verkligt svåra fall

    Det här är unikt. Ingen annan har samlat och processerat 5,2 miljoner granskade svenska översättningssträngar. Den här datavolymen, kombinerad med moderna ML-tekniker, öppnar möjligheter som inte funnits förut.

    Svenska FOSS-översättningar är på väg att bli betydligt bättre, snabbare och mer konsekventa. Och det bästa av allt? All kunskap delas öppet så att hela gemenskapen kan dra nytta av den.