Badania i rozwój — Uczymy maszyny migać — Migam
Przejdź do treści
Migam
Badania i rozwój

Uczymy maszyny migać.
Od 2012 roku.

Pierwszą sieć neuronową do języka migowego zbudowaliśmy w 2012 roku — na długo zanim AI stało się modne. Dziś realizujemy większą wizję: hub, który łączy język migowy z komunikacją, biznesem, nauką i technologią — jedno miejsce, w którym spotykają się tłumacze, badacze, organizacje Głuchych i firmy.

W migam.ai rozwijamy automatyczne tłumaczenie na języki migowe: tekst zamienia się w wypowiedź fotorealistycznego awatara 3D, a nad jakością każdego etapu czuwają Głusi native signerzy i lingwiści.

Human-in-the-loop: AI przyspiesza, człowiek gwarantuje.

Na czym stoi nasz model

Własny model, własne dane

Lata pracy tłumaczy Migam to unikalny fundament: setki godzin nagrań, własne studio i korpus polskiego języka migowego budowany od dekady. Model rozwijamy w programie NVIDIA Inception, a metodologię zwalidowaliśmy w płatnym pilotażu z globalną firmą technologiczną.

Gramatyki 9 języków migowych

Każdy kraj miga inaczej. Mamy gotowe opisy gramatyczne dziewięciu języków migowych — od polskiego po amerykański — i architekturę zaprojektowaną od początku pod wiele języków, nie jeden.

Nauka w DNA

Projekt wspiera rada naukowa złożona z badaczy języków migowych z Europy, USA i Izraela, a zespołem językowym kieruje Chief Linguist wykształcony na czołowej uczelni Deaf na świecie.

Z naszego laboratorium

Ewolucja awatara

Od chmury punktów do fotorealistycznej postaci — tak naprawdę wygląda droga, którą przechodzi każda wypowiedź w języku migowym. Prawdziwe zrzuty z naszego pipeline'u, łącznie z wpadkami.

{{ s.alt }}
{{ s.nr }}
{{ s.title }}
{{ s.desc }}
Etapy 3–4 pokazujemy celowo: uczciwie, bo tak wygląda prawdziwe R&D. Każdy błąd riggingu i każda „złamana" poza uczą model, zanim zobaczy go użytkownik.
Pod maską

Reprezentacja, nie „tekst plus gesty"

Języki migowe to pełne języki wizualno-przestrzenne — nie da się ich „dokleić" do tekstu. Dlatego budujemy warstwę reprezentacji: od gramatyki, przez tokeny ruchu, po fotorealistyczny render.

Od tekstu do wypowiedzi w języku migowym
WEJŚCIE
Tekst
dokument, napisy, scenariusz
LINGWISTYKA
Warstwa gramatyki migowej
znaczenie i szyk znaków, nie kalka z polszczyzny
RUCH
Reprezentacja ruchu
tokeny ruchu opisujące ciało, dłonie i mimikę
RENDER
Fotorealistyczny awatar
Unreal Engine 5 / MetaHuman → gotowe wideo
BRAMKA JAKOŚCI
Deaf QC
o publikacji decydują Głusi native signerzy — nie automat
Najpierw jakość, nie czas rzeczywisty: renderujemy offline, a syntetyczne testy tylko filtrują — decyduje człowiek.

Jeden znak = 5 równoczesnych kanałów

Dlatego napisy ani „machające ręce" nie wystarczą — model musi panować nad wszystkimi naraz.

Dłoniekształt · lokacja · ruch
Twarzbrwi · mrużenie oczu · układ ust
Ciało i przestrzeńrole przestrzenne · klasyfikatory
Rytmprozodia · płynne przejścia między znakami
Gramatykamarkery niemanualne — pytania, przeczenia, tryby

Model się zmienia. Reprezentacja zostaje.

Architektura jest niezależna od konkretnego modelu AI — wymienne elementy można podmieniać w miarę postępu technologii, a nasz rdzeń pracuje dalej.

Transformer / LLMWYMIENNY
Warstwa gramatyki migowejNASZ RDZEŃ
Tokeny ruchu migowegoNASZ RDZEŃ
Model ruchu (motion backbone)WYMIENNY
Awatar UE5 / MetaHumanWYJŚCIE
Do tego koło zamachowe danych: treść → anotacja → dane ruchu → generacja → Deaf QC → lepsze dane. Każdy cykl podnosi jakość kolejnego.
Zasada nadrzędna: nie zastępujemy tłumaczy. Skalujemy dostęp tam, gdzie ludzka interpretacja nie jest w stanie ekonomicznie pokryć wolumenu współczesnych treści.
Wytwarzamy wiedzę

Nie tylko produkt. Uczymy się lepiej rozumieć języki i komunikację.

Każdy etap dokumentujemy jak pracę badawczą — z założeniami, literaturą i mierzalnymi progami jakości. Ta wiedza zostaje: opisy gramatyk, leksykony sensów i metodologia, z której skorzystają kolejne języki migowe.

Przykład z naszej dokumentacji

Skąd awatar wie, które znaczenie znaku wybrać?

Jeden znak może mieć wiele sensów — jak słowo „zamek" po polsku. Word Sense Disambiguation (WSD) to wybór właściwego znaczenia w kontekście. Odpowiadają za to trzy warstwy: Leksykon (jakie sensy istnieją — decyzja lingwistyczna), Korpus (jak są używane — decyzja korpusowa) i Reguły WSD (jak wybrać z polskiego — decyzja inżynierska).

Tylko metafory „double-stage" tworzą wieloznaczność wymagającą rozstrzygnięcia.
Silnie ikoniczne znaki „trzymają" znaczenie — motywacja wizualna blokuje metaforę.
Homonimię od polisemii odróżnia 5 kryteriów + zgoda ≥ 2/3 Głuchych native signerów.
Jakość mierzymy przed produkcją: zgodność oceniających κ ≥ 0,70, precyzja reguł ≥ 0,80, zero regresji.
Fenlon · Schembri · Cormier 2018 Rutkowski 2010 · 2011 Johnston 2010 Meir 2010 Schwarzenberg · Kollien · Herrmann 2024 Landis & Koch 1977

Dwie ścieżki językowe, jeden warsztat

ASL (USA) — lingwiści wykształceni na czołowej uczelni Deaf, zespół ekspertów Głuchych z bramką jakości „Deaf-seal" i pipeline modelu tekst → ruch.
PJM (Polska) — schemat sensów i klasyfikacja typów, korpus PJM, konsultacja akademicka (Uniwersytet Warszawski) i 8 tłumaczy-native signerów Migam weryfikujących formy w głosowaniu większościowym.
Obie ścieżki dzielą jeden schemat sensów i pipeline awatara — każdy kolejny język korzysta z gotowego warsztatu.

Przyłączcie się

Badasz języki migowe? Prowadzisz korpus, leksykon albo zajęcia z lingwistyki migowej? Dołącz do warsztatu — wspólne publikacje, wnioski grantowe i metodologia do zaadaptowania dla Twojego języka.

kontakt@migam.org →

Od kiedy i z kim

Mocni partnerzy i twarde dowody — bez obietnic na wyrost.

2012
Pierwsza sieć neuronowa do języka migowego
Wczesne eksperymenty z rozpoznawaniem migania, m.in. prototypy na Microsoft Kinect.
2013–22
Trzy razy dowiedzieliśmy się, jak tego NIE robić
…bolało. Kolejne podejścia — od rozpoznawania gestów po pierwsze awatary — kończyły się wnioskami zamiast produktu. Każda porażka zawężała drogę do architektury, która w końcu zadziałała. Te lekcje też są częścią naszej wiedzy.
2023
Startują prace nad migam.ai
Rusza trening modeli tłumaczenia języka migowego — z Maxem Salamonowiczem, który wniósł know-how trenowania modeli, i Tomkiem, autorem pierwszego datasetu: w jeden weekend przygotował więcej danych, niż powstało przez dwa wcześniejsze lata. Jako Migam współpracowaliśmy już wtedy m.in. z WHO, UNHCR, Samsung, ING i Orange.
2024
Partnerzy technologiczni
Microsoft for Startups (Azure) i partnerstwo Oracle Cloud Infrastructure; członkostwo w programie NVIDIA Inception. Przyspieszamy rozwój awatara.
2025
Globalna scena
1. miejsce Web Summit Pitch Night · prezentacja w Parlamencie Europejskim · DeepTech Startup Award (French Tech Connect) · podwójne podium VivaTech · NVIDIA GTC w Paryżu i CSUN.
2026
Z laboratorium do produkcji
ASL w produkcji, PJM w pilotażu ze Związkiem Banków Polskich. Zespoły rozwijane w Polsce i USA.

To nie plany. Podpisujemy listy intencyjne.

Hub już rośnie: mamy podpisane listy intencyjne z partnerami z pięciu krajów Europy — od Beneluksu po Bałkany — którzy chcą rozwijać z nami swoje języki migowe. Model współpracy jest prosty: my wnosimy technologię, pipeline AI i sprawdzoną metodologię — partner wnosi lingwistów, Głuchych native signerów i znajomość swojego rynku. Razem przechodzimy drogę od nagrań i anotacji po działające tłumaczenie. Współpracujemy z organizacjami Głuchych, firmami i uczelniami — także przy wspólnych wnioskach grantowych.

Twój język migowy może być następny.
Zawsze z udziałem społeczności Głuchych i z etyką badawczą na pierwszym miejscu.
Połącz z tłumaczem