TechCrunch informuje, že Meta chce využít vlastní zaměstnance jako zdroj trénovacích dat pro své AI modely tím, že bude sbírat signály z jejich práce na počítači – zejména pohyby myší a úhozy kláves. Záměrem je z těchto interakcí vytvořit dataset, který pomůže Metě zlepšovat modely pro tzv. AI „agenty“, tedy systémy, které umí vykonávat úkoly v aplikacích podobně jako člověk (klikání, výběry v menu, navigace v uživatelském rozhraní).
Meta sbírá data, protože potřebuje natrénovat „motoriku“
Velké jazykové modely jsou skvělé při práci s textem, ale když mají „dělat práci“ v aplikacích, narážejí na překvapivě přízemní limity. Meta (podle Reuters) chce data použít ke zlepšení AI agentů – systémů, které zvládnou provést kroky v rozhraní podobně jako člověk: kliknout na správné tlačítko, vybrat položku z menu, vyplnit pole, přepnout záložku apod.
Reuters zmiňuje konkrétní typy potíží, kde modely často chybují:
- třeba výběr z rozbalovacích nabídek (dropdown)
- nebo práce s klávesovými zkratkami.
To jsou úkony, které člověk dělá automaticky, ale pro model je to složitá navigace v prostředí, které je plné různých stavů, kontextu a vizuálních signálů.
Meta to rámuje jako nutnost: pokud mají AI agenti pomáhat s „každodenními úkoly na počítači“, potřebují tréninková data z reálného používání – nejen textové instrukce, ale i to, jak lidé pohybují myší, na co a jak klikají, jak procházejí různá menu. TechCrunch cituje vyjádření firmy Meta přesně v tomto duchu.
Co přesně se má sbírat a jak
Podle Reuters se interní nástroj jmenuje Model Capability Initiative (MCI) a má běžet na pracovních aplikacích a webech. Meta uvádí též zavedení ochranných opatření pro citlivý obsah při sběru dat. Zajímavý detail doplnila CNBC: podle interních dokumentů, které redakce viděla, se řeší i to, na jakých webech a službách může nástroj MCI sbírat interakce. CNBC zmiňuje, že mezi sledovanými místy mají být i široce používané služby typu Google, LinkedIn či Wikipedia – vedle řady dalších nástrojů a interních platforem.
To však budí silné emoce
Meta (podle Reuters) zaměstnance ujišťuje, že sběr dat nebude použit pro performance reviews a má sloužit pouze pro trénink modelů, nikoli pro manažerský dohled. Podobně to parafrázuje i TechCrunch.
Jenže i když se data formálně nepoužijí na hodnocení, samotný fakt, že „něco“ zaznamenává každý klik myši a úhoz na klávesnici, mění to atmosféru na pracovišti. CNBC uvádí, že někteří zaměstnanci interně popisovali projekt jako „dystopický“ a upozorňovali na riziko zachycení citlivých informací (např. osobní údaje).
CNET k tomu přidává širší komentář: odborníci na digitální práva označují podobný typ monitoringu za jednu z nejinvazivnějších forem zaměstnaneckého sledování a upozorňují na potřebu jasnějších pravidel a „guardrails“, zejména pokud mají být tato data navíc využita pro trénování AI.
Právní a kulturní třecí plocha: USA vs. Evropa
Z reportu Reuters vyplývá, že iniciativa se týká především zaměstnanců v USA a že obdobné monitorování by v Evropě naráželo na podstatně přísnější právní rámce. Reuters cituje experty, podle nichž by v některých zemích mohly být podobné praktiky buď zásadně omezené, nebo povolené jen ve výjimečných situacích – a potenciálně v rozporu s GDPR.
Ars Technica k tomu doplňuje pragmatickou poznámku: právě evropská regulace a pracovněprávní tradice často znamenají, že to, co je v USA „snadno proveditelné“ uvnitř firem, může být v EU mnohem těžší nasadit bez souhlasu, transparentnosti a přísně vymezeného účelu.
AI průmysl má hlad po „pracovních“ datech
TechCrunch zasazuje zprávu do širšího trendu: AI firmy hledají nové zdroje trénovacích dat a narážejí na to, že veřejný internet už pro některé úlohy nestačí – zvlášť pro agentní AI, která má vykonávat reálné pracovní postupy.
Forbes tenhle trend ilustruje ještě ostřeji: popisuje případy, kdy zanikající firmy prodávají své Slack archivy, e-maily a Jira tickety jako tréninková data, protože zachycují „operační realitu“ práce. Současně ale upozorňuje na zásadní otázky soukromí – i anonymizovaná data mohou být znovu identifikovatelná a modely mohou některé sekvence nechtěně „memorovat“.
Z tohoto pohledu se může jevit krok Mety jako logický: pokud je nejcennější komoditou pro agentní AI „jak se práce skutečně dělá“, pak jsou interní interakční data z kancelářských nástrojů téměř ideálním zdrojem. Zároveň je to ale i kulturní test: kde končí produkt a začíná zásah do soukromí zaměstnance?
Tři otázky, které rozhodnou, zda to bude „nový standard“
- Bude jasné, jaké aplikace se sledují, jak dlouho se data uchovávají a kdo k nim má přístup? Právě rozsah a „context capture“ (např. záznam obrazovky) jsou nejcitlivější části celého nápadu Meta.
- I když firma slibuje, že sbíraná data nebudou použita pro hodnocení výkonu, budou tomu zaměstnanci věřit? Interní reakce popisované médii naznačují, že souhlas a důvěra zaměstnanců nebudou automatické.
- Podaří se podobné postupy přenést do EU? Pokud má Meta globální ambice, bude muset řešit, jak podobné sběry dat sladit s evropskou regulací a pracovním právem, případně jak systém přestavět tak, aby byl zákonný a přijatelný.
Agenti se učí pracovat – ale za jakou cenu?
Sledování kliknutí myší a úhozů kláves kvůli tréninku AI je jasný signál, kam se posouvá další fáze závodu v oblasti vývoje umělé inteligence: od „generování obsahu“ k automatizaci práce v nástrojích. Meta tím zároveň otevírá debatu, kterou bude muset řešit celý obor: jak získat realistická tréninková data pro agenty, aniž by se z kanceláře stal permanentně monitorovaný prostor.
Jestli se z toho stane běžná praxe, rozhodne kombinace technologického tlaku (agentní AI potřebuje data) a společenského tlaku (zaměstnanci a regulace budou chtít jasné hranice). Jedno je jisté už teď: boj o data se přesouvá z internetu do pracovních procesů.
Poznámka: ke sběru stejných dat je možné najmout si dobrovolníky z celého světa a ty za jejich práci řádně zaplatit nebo jim nabídnout jinou adekvátní formu odměny. Jenže i zde jsou pro Meta a další podobně bohaté a velké hráče na trhu „peníze vždy až na prvním místě“ a tak hledají všemožné způsoby a důvody, jak nikomu neplatit. A to by si měli všichni uvědomit a podle toho se vůči nim zachovat.
Použité zdroje informací
TechCrunch: Meta will record employees’ keystrokes and use it to train its AI models [techcrunch.com]
Reuters (převzato U.S. News): Exclusive—Meta to start capturing employee mouse movements, keystrokes for AI training data [money.usnews.com]
CNBC: Meta is tracking employee keystrokes on Google, LinkedIn, Wikipedia as part of AI training initiative [cnbc.com]
CNET: Meta Will Track Employees‘ Keystrokes, Clicks and Mousing to Train AI [cnet.com]
Ars Technica: Meta will use employee-tracking software to help train AI agents (report) [arstechnica.com]
Forbes: AI’s New Training Data: Your Old Work Slacks And Emails [forbes.com]
Fast Company (k trendu prodeje firemních archivů): Shuttered startups are selling old Slack chats and emails to AI companies [fastcompany.com]
⚠️ Důležité upozornění: Tento článek byl vytvořen za pomoci AI COPILOT