PL EN DE CS

Výzkum a vývoj

Učíme stroje znakovat.
Od roku 2012.

První neuronovou síť pro znakový jazyk jsme postavili v roce 2012 - dávno předtím, než byla AI v módě. Dnes sledujeme větší vizi: hub propojující znakový jazyk s komunikací, byznysem, vědou a technologií - místo, kde se setkávají tlumočníci, výzkumníci, organizace Neslyšících a firmy.

Promluvme si o vašem znakovém jazyce → Navštívit migam.ai ↗

V migam.ai vyvíjíme automatický překlad do znakových jazyků: text se mění v promluvu fotorealistického 3D avatara - a nad kvalitou každé fáze bdí neslyšící native signeři a lingvisté.

Human-in-the-loop: AI zrychluje, člověk garantuje.

Na čem stojí náš model

Vlastní model, vlastní data

Roky práce tlumočníků Migam jsou jedinečný základ: stovky hodin nahrávek, vlastní studio a korpus PJM budovaný přes deset let. Model roste v programu NVIDIA Inception; metodiku jsme ověřili v placeném pilotu s globálním technologickým koncernem.

Gramatiky 9 znakových jazyků

Každá země znakuje jinak. Máme gramatické popisy devíti znakových jazyků - od polského po americký - a architekturu navrženou od prvního dne pro mnoho jazyků, ne jen pro jeden.

Věda v DNA

Projekt provází vědecká rada výzkumníků znakových jazyků z Evropy, USA a Izraele; jazykový tým vede Chief Linguist vzdělaný na světově přední univerzitě pro Neslyšící.

Z naší laboratoře

Evoluce avatara

Od mračna bodů k fotorealistické postavě - touto cestou opravdu prochází každá promluva ve znakovém jazyce. Skutečné snímky z našeho pipeline, včetně přešlapů.

{{ s.alt }} — {{ s.title }}

{{ s.desc }}

Fáze 3–4 ukazujeme záměrně - upřímně, protože tak vypadá skutečný V&V. Každý rigging-glitch učí model dřív, než ho kdy uvidí uživatel.

Pod kapotou

Reprezentace, ne „text plus gesta”

Znakové jazyky jsou plnohodnotné vizuálně-prostorové jazyky - nelze je jen „přilepit” k textu. Proto stavíme reprezentační vrstvu: od gramatiky přes motion tokeny po fotorealistický rendering.

Od textu k promluvě ve znakovém jazyce

VSTUP

Text

dokument, titulky, scénář

LINGVISTIKA

Gramatická vrstva znaků

význam a pořadí znaků, ne kopie mluvené řeči

POHYB

Reprezentace pohybu

motion tokeny pro tělo, ruce a mimiku

RENDER

Fotorealistický avatar

Unreal Engine 5 / MetaHuman → hotové video

BRÁNA KVALITY

Deaf QC

o vydání rozhodují neslyšící native signeři - ne algoritmus

Nejdřív kvalita, ne reálný čas: renderujeme offline, syntetické kontroly jen filtrují - rozhoduje člověk.

Jeden znak = 5 souběžných kanálů

Proto titulky ani „mávající ruce” nestačí - model musí zvládat všechny kanály naráz.

Rucetvar · umístění · pohyb

Obličejobočí · mhouření · mluvní obraz

Tělo a prostorprostorové role · klasifikátory

Rytmusprozodie · plynulé přechody

Gramatikanemanuální markery - otázky, negace, způsob

Modely se mění. Reprezentace zůstává.

Architektura je nezávislá na konkrétním AI modelu - vyměnitelné části lze nahrazovat s pokrokem technologie, zatímco naše jádro pracuje dál.

Transformer / LLMVYMĚNITELNÝ

Gramatická vrstva znakůNAŠE JÁDRO

Sign Motion TokensNAŠE JÁDRO

Motion-backboneVYMĚNITELNÝ

Avatar UE5 / MetaHumanVÝSTUP

K tomu datový setrvačník: obsah → anotace → pohybová data → generování → Deaf QC → lepší data. Každý cyklus zvyšuje kvalitu toho dalšího.

Hlavní zásada: nenahrazujeme tlumočníky. Škálujeme přístup tam, kde lidské tlumočení nedokáže ekonomicky pokrýt objem současného obsahu.

Vytváříme znalosti

Nejen produkt. Učíme se lépe rozumět jazykům a komunikaci.

Každou fázi dokumentujeme jako výzkumnou práci - s předpoklady, literaturou a měřitelnými prahy kvality. Tyto znalosti zůstávají: popisy gramatik, lexika významů a metodika, na které staví další znakové jazyky.

Příklad z naší dokumentace

Jak avatar pozná, který význam znaku zvolit?

Jeden znak může nést mnoho významů - jako slovo „zámek” v češtině. Word Sense Disambiguation (WSD) je volba správného významu v kontextu. Zajišťují to tři vrstvy: Lexikon (jaké významy existují - lingvistické rozhodnutí), Korpus (jak se používají - korpusové rozhodnutí) a pravidla WSD (jak vybrat ze zdrojového textu - inženýrské rozhodnutí).

→Pouze „double-stage” metafory vytvářejí mnohoznačnost, kterou je třeba rozhodnout.

→Silně ikonické znaky „drží” význam - vizuální motivace blokuje metaforu.

→Homonymii od polysémie odlišuje 5 kritérií + souhlas ≥ 2/3 neslyšících native signerů.

→Kvalitu měříme před produkcí: shoda hodnotitelů κ ≥ 0,70, přesnost pravidel ≥ 0,80, nula regresí.

Fenlon · Schembri · Cormier 2018 Rutkowski 2010 · 2011 Johnston 2010 Meir 2010 Schwarzenberg · Kollien · Herrmann 2024 Landis & Koch 1977

Dvě jazykové cesty, jedna dílna

ASL (USA) - lingvisté ze světově přední univerzity pro Neslyšící, tým neslyšících expertů s bránou kvality „Deaf-seal” a pipeline text → pohyb.

PJM (Polsko) - schéma významů a klasifikace typů, korpus PJM, akademická konzultace (Varšavská univerzita) a 8 tlumočníků-native signerů Migam, kteří ověřují formy většinovým hlasováním.

Obě cesty sdílejí jedno schéma významů a jeden pipeline avatara - každý další jazyk startuje s hotovým nástrojem.

Přidejte se

Zkoumáte znakové jazyky? Vedete korpus, lexikon nebo učíte lingvistiku znakového jazyka? Přijďte do dílny - společné publikace, grantové žádosti a metodika připravená k převzetí pro váš jazyk.

kontakt@migam.org →

Od kdy a s kým

Silní partneři a tvrdé důkazy - žádné prázdné sliby.

2012

První neuronová síť pro znakový jazyk

Rané experimenty s rozpoznáváním znakování - mj. prototypy na Microsoft Kinect.

2013–22

Třikrát jsme se naučili, jak to NEdělat

…a bolelo to. Několik pokusů - od rozpoznávání gest po rané avatary - skončilo poznatky místo produktu. Každý neúspěch zúžil cestu k architektuře, která nakonec fungovala. I tyto lekce patří k našim znalostem.

2023

Začíná práce na migam.ai

Trénink modelu startuje s Maxem Salamonowiczem, který přinesl know-how trénování modelů, a Tomkem, autorem prvního datasetu: za jeden víkend připravil více dat, než vzniklo za dva předchozí roky. Jako Migam jsme tehdy už spolupracovali mj. s WHO, UNHCR, Samsung, ING a Orange.

2024

Technologičtí partneři

Microsoft for Startups (Azure) a partnerství s Oracle Cloud Infrastructure; členství v programu NVIDIA Inception. Vývoj avatara se zrychluje.

2025

Globální scéna

1. místo na Web Summit Pitch Night · prezentace v Evropském parlamentu · DeepTech Startup Award (French Tech Connect) · dvojí pódium na VivaTech · NVIDIA GTC v Paříži a CSUN.

2026

Z laboratoře do produkce

ASL v produkci, PJM v pilotu s Polským bankovním svazem. Týmy rostou v Polsku a USA.

To nejsou plány. Podepisujeme prohlášení o záměru.

Hub už roste: podepsali jsme prohlášení o záměru s partnery z pěti evropských zemí - od Beneluxu po Balkán - kteří chtějí své znakové jazyky rozvíjet s námi. Model spolupráce je jednoduchý: my přinášíme technologii, AI pipeline a ověřenou metodiku - partner přináší lingvisty, neslyšící native signery a znalost svého trhu. Společně jdeme cestou od nahrávek a anotace po fungující překlad. Spolupracujeme s organizacemi Neslyšících, firmami a univerzitami - i na společných grantových žádostech.

Váš znakový jazyk může být další.

Promluvme si o vašem znakovém jazyce → Podívat se na platformu migam.ommi →

Vždy se zapojením komunity Neslyšících a s výzkumnou etikou na prvním místě.

Zavolat tlumočníka

Učíme stroje znakovat.Od roku 2012.