<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>NLP | Daniel Nylander.se</title>
	<atom:link href="https://www.danielnylander.se/tag/nlp/feed/" rel="self" type="application/rss+xml" />
	<link>https://www.danielnylander.se</link>
	<description>Svenska översättningar av öppen källkod, Ubuntu, Debian, Translation Project, GNU, Linux, UNIX, VoIP, IT-Säkerhet, emulatorer, tv-spel, experiment, väl valda ord och delvis sinnesnärvaro</description>
	<lastBuildDate>Sat, 28 Mar 2026 08:21:22 +0000</lastBuildDate>
	<language>sv-SE</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	<generator>https://wordpress.org/?v=6.9.4</generator>

<image>
	<url>https://i0.wp.com/www.danielnylander.se/wp-content/cropped-danne.jpg?fit=32%2C32&#038;ssl=1</url>
	<title>NLP | Daniel Nylander.se</title>
	<link>https://www.danielnylander.se</link>
	<width>32</width>
	<height>32</height>
</image> 
<site xmlns="com-wordpress:feed-additions:1">87370683</site>	<item>
		<title>TR Intelligence — datadriven kvalitetsplattform för svenska FOSS-översättningar</title>
		<link>https://www.danielnylander.se/2026/03/28/tr-intelligence-datadriven-kvalitetsplattform-for-svenska-foss-oversattningar/?utm_source=rss&#038;utm_medium=rss&#038;utm_campaign=tr-intelligence-datadriven-kvalitetsplattform-for-svenska-foss-oversattningar</link>
					<comments>https://www.danielnylander.se/2026/03/28/tr-intelligence-datadriven-kvalitetsplattform-for-svenska-foss-oversattningar/#respond</comments>
		
		<dc:creator><![CDATA[Daniel Nylander]]></dc:creator>
		<pubDate>Sat, 28 Mar 2026 08:20:46 +0000</pubDate>
				<category><![CDATA[Översättningar]]></category>
		<category><![CDATA[Verktyg]]></category>
		<category><![CDATA[översättning]]></category>
		<category><![CDATA[FOSS]]></category>
		<category><![CDATA[i18n]]></category>
		<category><![CDATA[l10n]]></category>
		<category><![CDATA[machine learning]]></category>
		<category><![CDATA[NLP]]></category>
		<category><![CDATA[svenska]]></category>
		<guid isPermaLink="false">https://www.danielnylander.se/2026/03/28/tr-intelligence-datadriven-kvalitetsplattform-for-svenska-foss-oversattningar/</guid>

					<description><![CDATA[<p>Efter år av att granska svenska FOSS-översättningar har en sak blivit kristallklar: vi behöver bättre verktyg. När samma engelska ord som &#8221;Apply&#8221; har nio olika svenska översättningar i olika projekt, när 69 000 Debian-paket saknar svenska beskrivningar, och när DeepL-råöversättningar innehåller systematiska fel — då är det dags för en förändring. Problembilden Svenska FOSS-översättningar lider [&#8230;]</p>
<p>The post <a href="https://www.danielnylander.se/2026/03/28/tr-intelligence-datadriven-kvalitetsplattform-for-svenska-foss-oversattningar/">TR Intelligence — datadriven kvalitetsplattform för svenska FOSS-översättningar</a> first appeared on <a href="https://www.danielnylander.se">Daniel Nylander.se</a>.</p>]]></description>
										<content:encoded><![CDATA[<p>Efter år av att granska svenska FOSS-översättningar har en sak blivit kristallklar: vi behöver bättre verktyg. När samma engelska ord som &#8221;Apply&#8221; har <strong>nio olika svenska översättningar</strong> i olika projekt, när 69 000 Debian-paket saknar svenska beskrivningar, och när DeepL-råöversättningar innehåller systematiska fel — då är det dags för en förändring.</p>
<h2>Problembilden</h2>
<p>Svenska FOSS-översättningar lider av tre huvudproblem:</p>
<ul>
<li><strong>Inkonsistens mellan projekt</strong> — samma term översätts på otaliga sätt</li>
<li><strong>Ofullständig täckning</strong> — mängder av mjukvara saknar svenska strängar</li>
<li><strong>Kvalitetsbrister</strong> — automatiska översättningar med återkommande fel</li>
</ul>
<p>Men vad om vi kunde använda all den data vi redan har samlat under åren? Vad om vi kunde bygga intelligenta system som lär sig av tidigare granskningsarbete?</p>
<h2>TR Intelligence Platform</h2>
<p>Det är här <strong>TR Intelligence Platform</strong> kommer in. Detta är inte bara ett verktyg — det är en komplett ekosystem byggd på <strong>5,2 miljoner granskade svenska strängar</strong> och <strong>1,2 miljoner Translation Memory-poster</strong> från över 3299 FOSS-projekt.</p>
<p>Plattformen består av tio sammankopplade komponenter:</p>
<ol>
<li><strong>Kanonisk terminologibank</strong> med viktad konsensus</li>
<li><strong>Ensemble auto-approve</strong> med sju kvalitetssignaler</li>
<li><strong>ML-klassificerare</strong> för översättningskvalitet</li>
<li><strong>N-gram-modell</strong> för språklig korrekthet</li>
<li><strong>DeepL auto-fixer</strong> för vanliga systematiska fel</li>
<li><strong>Konsistensradar</strong> för avvikelsedetektering</li>
<li><strong>Regressionsdetektor</strong> för kvalitetsnedgång</li>
<li><strong>Goldstandard TM-export</strong> för återanvändning</li>
<li><strong>False positive mining</strong> för kontinuerlig förbättring</li>
<li><strong>DeepL glossar-feedback</strong> för bättre maskinöversättning</li>
</ol>
<h2>Kanonisk terminologibank</h2>
<p>Hjärtat i systemet är den <strong>kanoniska terminologibanken</strong> med <strong>326 000 svenska termer</strong> extraherade från 3299 projekt. Varje term har en viktad konsensuspoäng baserad på hur ofta den använts i granskade översättningar, med möjlighet för domänspecifika overrides när kontext kräver det.</p>
<p>Detta är inte bara en ordlista — det är kollektiv kunskap från svenska översättargemenskapen, destillerad till användbara rekommendationer.</p>
<h2>Ensemble Auto-Approve</h2>
<p>Den mest spännande komponenten är <strong>ensemble auto-approve-systemet</strong>. Det kombinerar sju olika kvalitetssignaler för att automatiskt godkänna översättningar med över 99% säkerhet:</p>
<ul>
<li>Terminologikonformitet mot kanonisk bank</li>
<li>Translation Memory-träffar från verifierade källor</li>
<li>ML-klassificerare för språklig kvalitet</li>
<li>N-gram-sannolikhet för naturlighet</li>
<li>Konsistenskontroll mot projekthistorik</li>
<li>Formatverifiering för specialtecken och variabler</li>
<li>Domänspecifik validering</li>
</ul>
<p>Redan vid första körningen kunde systemet automatiskt godkänna <strong>6267 strängar</strong> — översättningar som normalt skulle kräva manuell granskning.</p>
<h2>Öppna resurser för alla</h2>
<p>All denna data görs tillgänglig som öppna resurser:</p>
<ul>
<li><strong>Terminologi:</strong> <a href="https://github.com/yeager/swedish-foss-terminology">github.com/yeager/swedish-foss-terminology</a> (326K termer)</li>
<li><strong>Translation Memory:</strong> <a href="https://github.com/yeager/swedish-tm">github.com/yeager/swedish-tm</a> (777K översättningspar)</li>
<li><strong>Hunspell-ordlista:</strong> <a href="https://github.com/yeager/hunspell-sv">github.com/yeager/hunspell-sv</a> (279K svenska ord)</li>
<li><strong>Kvalitetsdashboard:</strong> <a href="https://danielnylander.se/sv-quality/">danielnylander.se/sv-quality/</a></li>
</ul>
<p>Eftersom allt är öppet kan andra utvecklare integrera dessa resurser i sina egna verktyg och processer.</p>
<h2>Vad betyder detta?</h2>
<p>TR Intelligence Platform representerar ett paradigmskifte från <strong>100% manuell granskning</strong> till <strong>över 90% automation</strong> med bibehållen eller förbättrad kvalitet. Det innebär:</p>
<ul>
<li><strong>Konsistenta termer</strong> tvärs alla 3299 projekt i databasen</li>
<li><strong>Snabbare genomströmning</strong> av översättningsuppdrag</li>
<li><strong>Högre kvalitet</strong> genom systematisk kunskapsanvändning</li>
<li><strong>Bättre DeepL-översättningar</strong> via glossar-feedback</li>
<li><strong>Friggjord tid</strong> för översättare att fokusera på verkligt svåra fall</li>
</ul>
<p>Det här är unikt. Ingen annan har samlat och processerat <strong>5,2 miljoner granskade svenska översättningssträngar</strong>. Den här datavolymen, kombinerad med moderna ML-tekniker, öppnar möjligheter som inte funnits förut.</p>
<p>Svenska FOSS-översättningar är på väg att bli betydligt bättre, snabbare och mer konsekventa. Och det bästa av allt? All kunskap delas öppet så att hela gemenskapen kan dra nytta av den.</p><p>The post <a href="https://www.danielnylander.se/2026/03/28/tr-intelligence-datadriven-kvalitetsplattform-for-svenska-foss-oversattningar/">TR Intelligence — datadriven kvalitetsplattform för svenska FOSS-översättningar</a> first appeared on <a href="https://www.danielnylander.se">Daniel Nylander.se</a>.</p>]]></content:encoded>
					
					<wfw:commentRss>https://www.danielnylander.se/2026/03/28/tr-intelligence-datadriven-kvalitetsplattform-for-svenska-foss-oversattningar/feed/</wfw:commentRss>
			<slash:comments>0</slash:comments>
		
		
		<post-id xmlns="com-wordpress:feed-additions:1">1952</post-id>	</item>
	</channel>
</rss>
