Výzkum a vývoj — Učíme stroje znakovat — Migam
Přejít k obsahu
Migam
Výzkum a vývoj

Učíme stroje znakovat.
Od roku 2012.

První neuronovou síť pro znakový jazyk jsme postavili v roce 2012 — dávno předtím, než byla AI v módě. Dnes sledujeme větší vizi: hub propojující znakový jazyk s komunikací, byznysem, vědou a technologií — místo, kde se setkávají tlumočníci, výzkumníci, organizace Neslyšících a firmy.

V migam.ai vyvíjíme automatický překlad do znakových jazyků: text se mění v promluvu fotorealistického 3D avatara — a nad kvalitou každé fáze bdí neslyšící native signeři a lingvisté.

Human-in-the-loop: AI zrychluje, člověk garantuje.

Na čem stojí náš model

Vlastní model, vlastní data

Roky práce tlumočníků Migam jsou jedinečný základ: stovky hodin nahrávek, vlastní studio a korpus PJM budovaný přes deset let. Model roste v programu NVIDIA Inception; metodiku jsme ověřili v placeném pilotu s globálním technologickým koncernem.

Gramatiky 9 znakových jazyků

Každá země znakuje jinak. Máme gramatické popisy devíti znakových jazyků — od polského po americký — a architekturu navrženou od prvního dne pro mnoho jazyků, ne jen pro jeden.

Věda v DNA

Projekt provází vědecká rada výzkumníků znakových jazyků z Evropy, USA a Izraele; jazykový tým vede Chief Linguist vzdělaný na světově přední univerzitě pro Neslyšící.

Z naší laboratoře

Evoluce avatara

Od mračna bodů k fotorealistické postavě — touto cestou opravdu prochází každá promluva ve znakovém jazyce. Skutečné snímky z našeho pipeline, včetně přešlapů.

{{ s.alt }}
{{ s.nr }}
{{ s.title }}
{{ s.desc }}
Fáze 3–4 ukazujeme záměrně — upřímně, protože tak vypadá skutečný V&V. Každý rigging-glitch učí model dřív, než ho kdy uvidí uživatel.
Pod kapotou

Reprezentace, ne „text plus gesta"

Znakové jazyky jsou plnohodnotné vizuálně-prostorové jazyky — nelze je jen „přilepit" k textu. Proto stavíme reprezentační vrstvu: od gramatiky přes motion tokeny po fotorealistický rendering.

Od textu k promluvě ve znakovém jazyce
VSTUP
Text
dokument, titulky, scénář
LINGVISTIKA
Gramatická vrstva znaků
význam a pořadí znaků, ne kopie mluvené řeči
POHYB
Reprezentace pohybu
motion tokeny pro tělo, ruce a mimiku
RENDER
Fotorealistický avatar
Unreal Engine 5 / MetaHuman → hotové video
BRÁNA KVALITY
Deaf QC
o vydání rozhodují neslyšící native signeři — ne algoritmus
Nejdřív kvalita, ne reálný čas: renderujeme offline, syntetické kontroly jen filtrují — rozhoduje člověk.

Jeden znak = 5 souběžných kanálů

Proto titulky ani „mávající ruce" nestačí — model musí zvládat všechny kanály naráz.

Rucetvar · umístění · pohyb
Obličejobočí · mhouření · mluvní obraz
Tělo a prostorprostorové role · klasifikátory
Rytmusprozodie · plynulé přechody
Gramatikanemanuální markery — otázky, negace, způsob

Modely se mění. Reprezentace zůstává.

Architektura je nezávislá na konkrétním AI modelu — vyměnitelné části lze nahrazovat s pokrokem technologie, zatímco naše jádro pracuje dál.

Transformer / LLMVYMĚNITELNÝ
Gramatická vrstva znakůNAŠE JÁDRO
Sign Motion TokensNAŠE JÁDRO
Motion-backboneVYMĚNITELNÝ
Avatar UE5 / MetaHumanVÝSTUP
K tomu datový setrvačník: obsah → anotace → pohybová data → generování → Deaf QC → lepší data. Každý cyklus zvyšuje kvalitu toho dalšího.
Hlavní zásada: nenahrazujeme tlumočníky. Škálujeme přístup tam, kde lidské tlumočení nedokáže ekonomicky pokrýt objem současného obsahu.
Vytváříme znalosti

Nejen produkt. Učíme se lépe rozumět jazykům a komunikaci.

Každou fázi dokumentujeme jako výzkumnou práci — s předpoklady, literaturou a měřitelnými prahy kvality. Tyto znalosti zůstávají: popisy gramatik, lexika významů a metodika, na které staví další znakové jazyky.

Příklad z naší dokumentace

Jak avatar pozná, který význam znaku zvolit?

Jeden znak může nést mnoho významů — jako slovo „zámek" v češtině. Word Sense Disambiguation (WSD) je volba správného významu v kontextu. Zajišťují to tři vrstvy: Lexikon (jaké významy existují — lingvistické rozhodnutí), Korpus (jak se používají — korpusové rozhodnutí) a pravidla WSD (jak vybrat ze zdrojového textu — inženýrské rozhodnutí).

Pouze „double-stage" metafory vytvářejí mnohoznačnost, kterou je třeba rozhodnout.
Silně ikonické znaky „drží" význam — vizuální motivace blokuje metaforu.
Homonymii od polysémie odlišuje 5 kritérií + souhlas ≥ 2/3 neslyšících native signerů.
Kvalitu měříme před produkcí: shoda hodnotitelů κ ≥ 0,70, přesnost pravidel ≥ 0,80, nula regresí.
Fenlon · Schembri · Cormier 2018 Rutkowski 2010 · 2011 Johnston 2010 Meir 2010 Schwarzenberg · Kollien · Herrmann 2024 Landis & Koch 1977

Dvě jazykové cesty, jedna dílna

ASL (USA) — lingvisté ze světově přední univerzity pro Neslyšící, tým neslyšících expertů s bránou kvality „Deaf-seal" a pipeline text → pohyb.
PJM (Polsko) — schéma významů a klasifikace typů, korpus PJM, akademická konzultace (Varšavská univerzita) a 8 tlumočníků-native signerů Migam, kteří ověřují formy většinovým hlasováním.
Obě cesty sdílejí jedno schéma významů a jeden pipeline avatara — každý další jazyk startuje s hotovým nástrojem.

Přidejte se

Zkoumáte znakové jazyky? Vedete korpus, lexikon nebo učíte lingvistiku znakového jazyka? Přijďte do dílny — společné publikace, grantové žádosti a metodika připravená k převzetí pro váš jazyk.

kontakt@migam.org →

Od kdy a s kým

Silní partneři a tvrdé důkazy — žádné prázdné sliby.

2012
První neuronová síť pro znakový jazyk
Rané experimenty s rozpoznáváním znakování — mj. prototypy na Microsoft Kinect.
2013–22
Třikrát jsme se naučili, jak to NEdělat
…a bolelo to. Několik pokusů — od rozpoznávání gest po rané avatary — skončilo poznatky místo produktu. Každý neúspěch zúžil cestu k architektuře, která nakonec fungovala. I tyto lekce patří k našim znalostem.
2023
Začíná práce na migam.ai
Trénink modelu startuje s Maxem Salamonowiczem, který přinesl know-how trénování modelů, a Tomkem, autorem prvního datasetu: za jeden víkend připravil více dat, než vzniklo za dva předchozí roky. Jako Migam jsme tehdy už spolupracovali mj. s WHO, UNHCR, Samsung, ING a Orange.
2024
Technologičtí partneři
Microsoft for Startups (Azure) a partnerství s Oracle Cloud Infrastructure; členství v programu NVIDIA Inception. Vývoj avatara se zrychluje.
2025
Globální scéna
1. místo na Web Summit Pitch Night · prezentace v Evropském parlamentu · DeepTech Startup Award (French Tech Connect) · dvojí pódium na VivaTech · NVIDIA GTC v Paříži a CSUN.
2026
Z laboratoře do produkce
ASL v produkci, PJM v pilotu s Polským bankovním svazem. Týmy rostou v Polsku a USA.

To nejsou plány. Podepisujeme prohlášení o záměru.

Hub už roste: podepsali jsme prohlášení o záměru s partnery z pěti evropských zemí — od Beneluxu po Balkán — kteří chtějí své znakové jazyky rozvíjet s námi. Model spolupráce je jednoduchý: my přinášíme technologii, AI pipeline a ověřenou metodiku — partner přináší lingvisty, neslyšící native signery a znalost svého trhu. Společně jdeme cestou od nahrávek a anotace po fungující překlad. Spolupracujeme s organizacemi Neslyšících, firmami a univerzitami — i na společných grantových žádostech.

Váš znakový jazyk může být další.
Vždy se zapojením komunity Neslyšících a s výzkumnou etikou na prvním místě.
Zavolat tlumočníka