Forschung & Entwicklung — Wir bringen Maschinen das Gebärden bei — Migam
Zum Inhalt springen
Migam
Forschung & Entwicklung

Wir bringen Maschinen das Gebärden bei.
Seit 2012.

Unser erstes neuronales Netz für Gebärdensprache bauten wir 2012 — lange bevor KI in Mode kam. Heute verfolgen wir eine größere Vision: einen Hub, der Gebärdensprache mit Kommunikation, Business, Wissenschaft und Technologie verbindet — ein Ort, an dem sich Dolmetscher, Forschende, Gehörlosen-Organisationen und Unternehmen treffen.

Bei migam.ai entwickeln wir automatische Übersetzung in Gebärdensprachen: Text wird zur Äußerung eines fotorealistischen 3D-Avatars — und gehörlose Native Signer und Linguisten wachen über die Qualität jeder Stufe.

Human-in-the-Loop: KI beschleunigt, der Mensch garantiert.

Worauf unser Modell steht

Eigenes Modell, eigene Daten

Jahre der Arbeit der Migam-Dolmetscher sind ein einzigartiges Fundament: Hunderte Stunden Aufnahmen, ein eigenes Studio und ein über ein Jahrzehnt aufgebauter PJM-Korpus. Das Modell wächst im NVIDIA-Inception-Programm; die Methodik haben wir in einem bezahlten Pilotprojekt mit einem globalen Technologiekonzern validiert.

Grammatiken von 9 Gebärdensprachen

Jedes Land gebärdet anders. Wir besitzen grammatische Beschreibungen von neun Gebärdensprachen — von der polnischen bis zur amerikanischen — und eine Architektur, die von Anfang an für viele Sprachen entworfen wurde, nicht für eine.

Wissenschaft in der DNA

Das Projekt wird von einem wissenschaftlichen Beirat aus Gebärdensprachforschern aus Europa, den USA und Israel begleitet; das Sprachteam leitet ein Chief Linguist, ausgebildet an der weltweit führenden Deaf-Universität.

Aus unserem Labor

Die Evolution des Avatars

Von der Punktwolke zur fotorealistischen Figur — diesen Weg geht wirklich jede Äußerung in Gebärdensprache. Echte Screenshots aus unserer Pipeline, Pannen inklusive.

{{ s.alt }}
{{ s.nr }}
{{ s.title }}
{{ s.desc }}
Die Stufen 3–4 zeigen wir bewusst — ehrlich, denn so sieht echte F&E aus. Jeder Rigging-Glitch lehrt das Modell, bevor ein Nutzer ihn je sieht.
Unter der Haube

Repräsentation, nicht „Text plus Gesten"

Gebärdensprachen sind vollwertige visuell-räumliche Sprachen — man kann sie nicht einfach an Text „anflanschen". Deshalb bauen wir eine Repräsentationsschicht: von der Grammatik über Motion Tokens bis zum fotorealistischen Rendering.

Vom Text zur Äußerung in Gebärdensprache
EINGABE
Text
Dokument, Untertitel, Skript
LINGUISTIK
Gebärden-Grammatikschicht
Bedeutung und Gebärdenfolge, keine Kopie der Lautsprache
BEWEGUNG
Bewegungsrepräsentation
Motion Tokens für Körper, Hände und Mimik
RENDER
Fotorealistischer Avatar
Unreal Engine 5 / MetaHuman → fertiges Video
QUALITÄTSTOR
Deaf QC
Gehörlose Native Signer entscheiden über die Freigabe — kein Algorithmus
Qualität zuerst, nicht Echtzeit: Wir rendern offline, synthetische Checks filtern nur — die Entscheidung trifft der Mensch.

Eine Gebärde = 5 gleichzeitige Kanäle

Deshalb reichen Untertitel oder „winkende Hände" nicht — das Modell muss alle Kanäle zugleich beherrschen.

HändeHandform · Ort · Bewegung
GesichtBrauen · Blinzeln · Mundbild
Körper & Raumräumliche Rollen · Klassifikatoren
RhythmusProsodie · fließende Übergänge
Grammatiknicht-manuelle Marker — Fragen, Verneinung, Modus

Modelle wechseln. Die Repräsentation bleibt.

Die Architektur ist unabhängig von einem einzelnen KI-Modell — austauschbare Teile lassen sich mit dem Fortschritt der Technologie ersetzen, unser Kern arbeitet weiter.

Transformer / LLMAUSTAUSCHBAR
Gebärden-GrammatikschichtUNSER KERN
Sign Motion TokensUNSER KERN
Motion-BackboneAUSTAUSCHBAR
UE5- / MetaHuman-AvatarAUSGABE
Dazu ein Daten-Schwungrad: Inhalt → Annotation → Bewegungsdaten → Generierung → Deaf QC → bessere Daten. Jeder Zyklus hebt die Qualität des nächsten.
Leitprinzip: Wir ersetzen keine Dolmetscher. Wir skalieren Zugang dort, wo menschliches Dolmetschen das Volumen moderner Inhalte wirtschaftlich nicht abdecken kann.
Wir produzieren Wissen

Nicht nur ein Produkt. Wir lernen, Sprachen und Kommunikation besser zu verstehen.

Jede Stufe dokumentieren wir wie eine Forschungsarbeit — mit Annahmen, Literatur und messbaren Qualitätsschwellen. Dieses Wissen bleibt: Grammatikbeschreibungen, Sinn-Lexika und eine Methodik, auf der die nächsten Gebärdensprachen aufbauen.

Ein Beispiel aus unserer Dokumentation

Woher weiß der Avatar, welche Bedeutung einer Gebärde er wählen soll?

Eine Gebärde kann viele Bedeutungen tragen — wie das Wort „Schloss" im Deutschen. Word Sense Disambiguation (WSD) ist die Wahl der richtigen Bedeutung im Kontext. Drei Schichten übernehmen das: das Lexikon (welche Bedeutungen existieren — eine linguistische Entscheidung), der Korpus (wie sie verwendet werden — eine Korpusentscheidung) und die WSD-Regeln (wie aus dem Ausgangstext gewählt wird — eine Ingenieursentscheidung).

Nur „Double-Stage"-Metaphern erzeugen Mehrdeutigkeit, die aufgelöst werden muss.
Stark ikonische Gebärden „halten" ihre Bedeutung — visuelle Motivation blockiert die Metapher.
Homonymie vs. Polysemie: 5 Kriterien + Zustimmung von ≥ 2/3 gehörlosen Native Signern.
Qualität messen wir vor der Produktion: Beurteilerübereinstimmung κ ≥ 0,70, Regelpräzision ≥ 0,80, null Regressionen.
Fenlon · Schembri · Cormier 2018 Rutkowski 2010 · 2011 Johnston 2010 Meir 2010 Schwarzenberg · Kollien · Herrmann 2024 Landis & Koch 1977

Zwei Sprachpfade, eine Werkstatt

ASL (USA) — Linguisten der weltweit führenden Deaf-Universität, ein gehörloses Expertenteam mit „Deaf-Seal"-Qualitätstor und die Text-zu-Bewegung-Pipeline.
PJM (Polen) — Bedeutungsschema und Typklassifikation, der PJM-Korpus, akademische Beratung (Universität Warschau) und 8 Migam-Dolmetscher (Native Signer), die Formen per Mehrheitsvotum verifizieren.
Beide Pfade teilen ein Bedeutungsschema und eine Avatar-Pipeline — jede weitere Sprache startet mit fertigem Werkzeug.

Machen Sie mit

Sie forschen zu Gebärdensprachen? Betreiben einen Korpus, ein Lexikon oder lehren Gebärdensprachlinguistik? Kommen Sie in die Werkstatt — gemeinsame Publikationen, Förderanträge und eine Methodik, die sich auf Ihre Sprache übertragen lässt.

kontakt@migam.org →

Seit wann und mit wem

Starke Partner und harte Belege — keine leeren Versprechen.

2012
Erstes neuronales Netz für Gebärdensprache
Frühe Experimente zur Gebärdenerkennung — u. a. Prototypen auf Microsoft Kinect.
2013–22
Dreimal gelernt, wie man es NICHT macht
…und es tat weh. Mehrere Anläufe — von Gestenerkennung bis zu frühen Avataren — endeten mit Erkenntnissen statt einem Produkt. Jeder Fehlschlag verengte den Weg zu der Architektur, die schließlich funktionierte. Auch diese Lektionen gehören zu unserem Wissen.
2023
Die Arbeit an migam.ai beginnt
Das Modelltraining startet mit Max Salamonowicz, der das Trainings-Know-how einbrachte, und Tomek, Autor des ersten Datensatzes: An einem Wochenende erstellte er mehr Daten, als in den zwei Jahren zuvor entstanden waren. Als Migam arbeiteten wir damals bereits u. a. mit WHO, UNHCR, Samsung, ING und Orange.
2024
Technologiepartner
Microsoft for Startups (Azure) und eine Partnerschaft mit Oracle Cloud Infrastructure; Mitgliedschaft im NVIDIA-Inception-Programm. Die Avatar-Entwicklung beschleunigt.
2025
Die globale Bühne
1. Platz bei der Web Summit Pitch Night · Präsentation im Europäischen Parlament · DeepTech Startup Award (French Tech Connect) · doppeltes VivaTech-Podium · NVIDIA GTC in Paris und CSUN.
2026
Vom Labor in die Produktion
ASL in Produktion, PJM im Pilotprojekt mit dem Polnischen Bankenverband. Teams wachsen in Polen und den USA.

Das sind keine Pläne. Wir unterzeichnen Absichtserklärungen.

Der Hub wächst bereits: Wir haben Absichtserklärungen mit Partnern aus fünf europäischen Ländern — vom Benelux bis zum Balkan — die ihre Gebärdensprachen mit uns entwickeln wollen. Das Kooperationsmodell ist einfach: Wir bringen Technologie, KI-Pipeline und erprobte Methodik ein — der Partner bringt Linguisten, gehörlose Native Signer und Marktkenntnis. Gemeinsam gehen wir den Weg von Aufnahmen und Annotation bis zur funktionierenden Übersetzung. Wir arbeiten mit Gehörlosen-Organisationen, Unternehmen und Hochschulen — auch bei gemeinsamen Förderanträgen.

Ihre Gebärdensprache könnte die nächste sein.
Immer unter Beteiligung der Gehörlosen-Community und mit Forschungsethik an erster Stelle.
Dolmetscher anrufen