Die Nutzung der Leistungsfähigkeit von Large Language Models (LLMs) in der Übersetzung
Bei tolingo sind wir stets auf der Suche nach aufstrebenden Technologien, die die Übersetzungsqualität und -effizienz verbessern können. Eine der spannendsten Entwicklungen der letzten Jahre war der Aufstieg der Large Language Models (LLMs). Diese KI-gesteuerten Systeme haben bereits in verschiedenen Anwendungen ihr Potenzial gezeigt, und wir erforschen aktiv, wie sie in der Übersetzung eingesetzt werden können.
Was sind Large Language Models (LLMs)?
Large Language Models sind fortschrittliche KI-Systeme, die mit enormen Mengen an Textdaten trainiert wurden. Sie nutzen Deep-Learning-Techniken, insbesondere neuronale Netze, um Texte zu analysieren, zu generieren und zu verfeinern. LLMs, wie OpenAIs GPT-Serie oder Claude von Anthropic, können Kontext analysieren, Muster erkennen und kohärente Antworten auf textbasierte Eingaben generieren. Dies macht sie unglaublich leistungsfähig für eine Reihe von Aufgaben, einschließlich Übersetzung, Textzusammenfassung und linguistische Analyse.
Einige derzeit in der Übersetzungsbranche erforschte Anwendungsfälle
-
Anpassung maschineller Übersetzung (MT)
Rohe MT-Ausgaben erfordern oft eine Nachbearbeitung, um Genauigkeit und natürlichen Sprachfluss sicherzustellen. LLMs können bei der Verfeinerung von MT-Ergebnissen helfen, indem sie spezifische Aspekte der Sprache korrigieren. Mit der richtigen Prompt-Expertise und einem Verständnis sowohl der Ausgangs- als auch der Zielsprache kann man beispielsweise den Formalitätsgrad gegenüber den Lesern anpassen, geschlechtsneutrale Sprachkorrekturen implementieren oder Datums- und Zahlenformate entsprechend der Konvention der Zielländer anpassen.
-
Qualitätssicherungsprüfungen
Konsistenz und Genauigkeit sind in der Übersetzung von entscheidender Bedeutung, besonders in technischen oder regulierten Branchen. LLMs können für automatisierte Prüfungen eingesetzt werden und Probleme wie Auslassungen, Ergänzungen oder falsche Terminologie im Zieltext identifizieren. Sie können potenzielle Fehler vor der endgültigen Überprüfung markieren, was Zeit spart und die Gesamtqualität der Übersetzung verbessert.
-
Terminologieextraktion
LLMs werden auch – zusammen mit anderen Werkzeugen der natürlichen Sprachverarbeitung - erforscht, um Schlüsselbegriffe aus Dokumenten zu extrahieren und domänenspezifische Glossare zu erstellen. Man kann beispielsweise ein LLM auffordern, alle Begriffe im Zusammenhang mit Diabetes aus einer Sammlung medizinischer Texte zu extrahieren und diese dann zur Erstellung einer Terminologiedatenbank zu verwenden.
Die Rolle von Prompts bei der LLM-Leistung
Ein Schlüsselfaktor für die effektive Nutzung von LLMs ist der Einsatz gut strukturierter Prompts. Ein Prompt ist die Anweisung, die dem LLM gegeben wird, um seine Antwort zu steuern. Die Klarheit und Spezifität eines Prompts kann die Qualität der Ausgabe erheblich beeinflussen. Zum Beispiel könnte die bloße Anweisung an ein LLM, „eine Übersetzung zu verbessern“, ohne konkrete Hinweise oder Beispiele, dem LLM zu viel Interpretationsspielraum lassen und zu Halluzinationen oder falschen Anpassungen führen.
Praktische Beispiele
Um zu veranschaulichen, wie LLMs in der Übersetzung und Nachbearbeitung eingesetzt werden können, betrachten wir einige praktische Fälle:
1. Anpassung des Formalitätsgrades
In diesen Beispielen haben wir das LLM aufgefordert, die MT-Ausgabe anzupassen, indem wir die Höflichkeitsform im Spanischen (dritte Person Singular) bei der Ansprache der Leser verwenden. Wie Sie sehen können, wurden sowohl Personalpronomen als auch Verben angepasst:
Beispiel 1:
Ausgangstext | MT-Ausgabe | LLM-Anpassung |
---|---|---|
So individuell wie Sie | Tan individual como tú | Tan individual como usted |
Beispiel 2:
Ausgangstext | MT-Ausgabe | LLM-Anpassung |
---|---|---|
Wenn Sie einen Wunsch oder ein Anliegen haben, sind wir natürlich immer mit einem offenen Ohr für Sie da. | Si tienes alguna petición o preocupación, por supuesto siempre estamos ahí para escucharte. | Si tiene alguna petición o preocupación, por supuesto siempre estamos ahí para escucharlo. |
2. Anpassung des Datumsformats
Verschiedene Sprachen und Kulturen folgen unterschiedlichen Datumsformaten. In diesem Beispiel einer maschinellen Übersetzung vom Englischen ins Deutsche haben wir das LLM aufgefordert, die MT-Ausgabe in Deutsch anzupassen, indem wir das Datumsformat TT.MM.JJJJ verwenden und ein Beispiel dafür gegeben haben, wie dies zu erreichen ist. Wie Sie sehen können, wurde das Datumsformat konsequent angepasst:
Ausgangstext | MT-Ausgabe | LLM-Anpassung |
---|---|---|
26/05/2020 – The German Institute for Medical Documentation and Information was officially merged into the BfArM. | 26/05/2020 - Das Deutsche Institut für Medizinische Dokumentation und Information wurde offiziell in das BfArM eingegliedert. | 26.05.2020 - Das Deutsche Institut für Medizinische Dokumentation und Information wurde offiziell in das BfArM eingegliedert. |
3. Anpassung von aktiver und passiver Stimme
Trotz des eindeutigen Potenzials von Large Language Models (LLMs) hängt ihre Effektivität stark von gut formulierten Prompts ab. Dies wird deutlich, wenn man den folgenden Fall betrachtet, bei dem ein Prompt verwendet wurde, um die maschinelle Übersetzung einer Bedienungsanleitung zu verbessern, indem passive Formulierungen durch aktive ersetzt wurden, um die Klarheit zu erhöhen.
Ausgangstext | MT-Ausgabe | LLM-Anpassung |
---|---|---|
Holzplatten sind nicht begehbar! | Wooden sheets cannot be walked on! | Wooden sheets are not walkable! |
Allerdings hätte ein präziserer Prompt möglicherweise noch bessere Ergebnisse geliefert, wie zum Beispiel die explizite Empfehlung zur Verwendung von Imperativformen (d. h. „Do not walk on wooden sheets!“).
Die Zukunft von LLMs in der Übersetzung: Potenzial und Herausforderungen
Das Potenzial von LLMs in der Übersetzung ist enorm. Ihre erfolgreiche Implementierung erfordert jedoch sorgfältige Tests, Expertise im Prompt-Engineering und ein klares Verständnis des beabsichtigten Anwendungsfalls. Bei tolingo haben wir uns verpflichtet, diese Technologien zu erforschen und dabei eine strenge Qualitätskontrolle aufrechtzuerhalten, um bestmögliche Übersetzungen zu gewährleisten.
Durch kontinuierliches Testen und Verfeinern unserer LLM-Nutzung streben wir danach, die richtige Balance zwischen Innovation und Zuverlässigkeit zu finden – indem wir die Leistungsfähigkeit der KI nutzen und gleichzeitig durch menschliche Überwachung Präzision und Genauigkeit sicherstellen. Die Zukunft der Übersetzung entwickelt sich weiter, und wir sind begeistert, an der Spitze dieser Entwicklungen zu stehen!