Meta hodlá využít vlastní zaměstnance jako zdroj trénovacích dat pro své AI modely

TechCrunch informuje, že Meta chce využít vlastní zaměstnance jako zdroj trénovacích dat pro své AI modely tím, že bude sbírat signály z jejich práce na počítači – zejména pohyby myší a úhozy kláves. Záměrem je z těchto interakcí vytvořit dataset, který pomůže Metě zlepšovat modely pro tzv. AI „agenty“, tedy systémy, které umí vykonávat úkoly v aplikacích podobně jako člověk (klikání, výběry v menu, navigace v uživatelském rozhraní).

Meta sbírá data, protože potřebuje natrénovat „motoriku“

Velké jazykové modely jsou skvělé při práci s textem, ale když mají „dělat práci“ v aplikacích, narážejí na překvapivě přízemní limity. Meta (podle Reuters) chce data použít ke zlepšení AI agentů – systémů, které zvládnou provést kroky v rozhraní podobně jako člověk: kliknout na správné tlačítko, vybrat položku z menu, vyplnit pole, přepnout záložku apod.

Reuters zmiňuje konkrétní typy potíží, kde modely často chybují:

třeba výběr z rozbalovacích nabídek (dropdown)
nebo práce s klávesovými zkratkami.

To jsou úkony, které člověk dělá automaticky, ale pro model je to složitá navigace v prostředí, které je plné různých stavů, kontextu a vizuálních signálů.

Meta to rámuje jako nutnost: pokud mají AI agenti pomáhat s „každodenními úkoly na počítači“, potřebují tréninková data z reálného používání – nejen textové instrukce, ale i to, jak lidé pohybují myší, na co a jak klikají, jak procházejí různá menu. TechCrunch cituje vyjádření firmy Meta přesně v tomto duchu.

Co přesně se má sbírat a jak

Podle Reuters se interní nástroj jmenuje Model Capability Initiative (MCI) a má běžet na pracovních aplikacích a webech. Meta uvádí též zavedení ochranných opatření pro citlivý obsah při sběru dat. Zajímavý detail doplnila CNBC: podle interních dokumentů, které redakce viděla, se řeší i to, na jakých webech a službách může nástroj MCI sbírat interakce. CNBC zmiňuje, že mezi sledovanými místy mají být i široce používané služby typu Google, LinkedIn či Wikipedia – vedle řady dalších nástrojů a interních platforem.

To však budí silné emoce

Meta (podle Reuters) zaměstnance ujišťuje, že sběr dat nebude použit pro performance reviews a má sloužit pouze pro trénink modelů, nikoli pro manažerský dohled. Podobně to parafrázuje i TechCrunch.

Jenže i když se data formálně nepoužijí na hodnocení, samotný fakt, že „něco“ zaznamenává každý klik myši a úhoz na klávesnici, mění to atmosféru na pracovišti. CNBC uvádí, že někteří zaměstnanci interně popisovali projekt jako „dystopický“ a upozorňovali na riziko zachycení citlivých informací (např. osobní údaje).

CNET k tomu přidává širší komentář: odborníci na digitální práva označují podobný typ monitoringu za jednu z nejinvazivnějších forem zaměstnaneckého sledování a upozorňují na potřebu jasnějších pravidel a „guardrails“, zejména pokud mají být tato data navíc využita pro trénování AI.

Právní a kulturní třecí plocha: USA vs. Evropa

Z reportu Reuters vyplývá, že iniciativa se týká především zaměstnanců v USA a že obdobné monitorování by v Evropě naráželo na podstatně přísnější právní rámce. Reuters cituje experty, podle nichž by v některých zemích mohly být podobné praktiky buď zásadně omezené, nebo povolené jen ve výjimečných situacích – a potenciálně v rozporu s GDPR.

Ars Technica k tomu doplňuje pragmatickou poznámku: právě evropská regulace a pracovněprávní tradice často znamenají, že to, co je v USA „snadno proveditelné“ uvnitř firem, může být v EU mnohem těžší nasadit bez souhlasu, transparentnosti a přísně vymezeného účelu.

AI průmysl má hlad po „pracovních“ datech

TechCrunch zasazuje zprávu do širšího trendu: AI firmy hledají nové zdroje trénovacích dat a narážejí na to, že veřejný internet už pro některé úlohy nestačí – zvlášť pro agentní AI, která má vykonávat reálné pracovní postupy.

Forbes tenhle trend ilustruje ještě ostřeji: popisuje případy, kdy zanikající firmy prodávají své Slack archivy, e-maily a Jira tickety jako tréninková data, protože zachycují „operační realitu“ práce. Současně ale upozorňuje na zásadní otázky soukromí – i anonymizovaná data mohou být znovu identifikovatelná a modely mohou některé sekvence nechtěně „memorovat“.

Z tohoto pohledu se může jevit krok Mety jako logický: pokud je nejcennější komoditou pro agentní AI „jak se práce skutečně dělá“, pak jsou interní interakční data z kancelářských nástrojů téměř ideálním zdrojem. Zároveň je to ale i kulturní test: kde končí produkt a začíná zásah do soukromí zaměstnance?

Tři otázky, které rozhodnou, zda to bude „nový standard“

Bude jasné, jaké aplikace se sledují, jak dlouho se data uchovávají a kdo k nim má přístup? Právě rozsah a „context capture“ (např. záznam obrazovky) jsou nejcitlivější části celého nápadu Meta.
I když firma slibuje, že sbíraná data nebudou použita pro hodnocení výkonu, budou tomu zaměstnanci věřit? Interní reakce popisované médii naznačují, že souhlas a důvěra zaměstnanců nebudou automatické.
Podaří se podobné postupy přenést do EU? Pokud má Meta globální ambice, bude muset řešit, jak podobné sběry dat sladit s evropskou regulací a pracovním právem, případně jak systém přestavět tak, aby byl zákonný a přijatelný.

Agenti se učí pracovat – ale za jakou cenu?

Sledování kliknutí myší a úhozů kláves kvůli tréninku AI je jasný signál, kam se posouvá další fáze závodu v oblasti vývoje umělé inteligence: od „generování obsahu“ k automatizaci práce v nástrojích. Meta tím zároveň otevírá debatu, kterou bude muset řešit celý obor: jak získat realistická tréninková data pro agenty, aniž by se z kanceláře stal permanentně monitorovaný prostor.

Jestli se z toho stane běžná praxe, rozhodne kombinace technologického tlaku (agentní AI potřebuje data) a společenského tlaku (zaměstnanci a regulace budou chtít jasné hranice). Jedno je jisté už teď: boj o data se přesouvá z internetu do pracovních procesů.

Poznámka: ke sběru stejných dat je možné najmout si dobrovolníky z celého světa a ty za jejich práci řádně zaplatit nebo jim nabídnout jinou adekvátní formu odměny. Jenže i zde jsou pro Meta a další podobně bohaté a velké hráče na trhu „peníze vždy až na prvním místě“ a tak hledají všemožné způsoby a důvody, jak nikomu neplatit. A to by si měli všichni uvědomit a podle toho se vůči nim zachovat.

Použité zdroje informací

TechCrunch: Meta will record employees’ keystrokes and use it to train its AI models [techcrunch.com]

Reuters (převzato U.S. News): Exclusive—Meta to start capturing employee mouse movements, keystrokes for AI training data [money.usnews.com]

CNBC: Meta is tracking employee keystrokes on Google, LinkedIn, Wikipedia as part of AI training initiative [cnbc.com]

CNET: Meta Will Track Employees‘ Keystrokes, Clicks and Mousing to Train AI [cnet.com]

Ars Technica: Meta will use employee-tracking software to help train AI agents (report) [arstechnica.com]

Forbes: AI’s New Training Data: Your Old Work Slacks And Emails [forbes.com]

Fast Company (k trendu prodeje firemních archivů): Shuttered startups are selling old Slack chats and emails to AI companies [fastcompany.com]

			
⚠️ Důležité upozornění: Tento článek byl vytvořen za pomoci AI COPILOT

Informační technologie, Mediální výchova, Právo, Technologie, Umělá inteligence

AI, AI agenti, etika, GDPR, META, práva zaměstnanců, prodej dat, sběr dat

Meta sbírá data, protože potřebuje natrénovat „motoriku“

Co přesně se má sbírat a jak

To však budí silné emoce

Právní a kulturní třecí plocha: USA vs. Evropa

AI průmysl má hlad po „pracovních“ datech

Tři otázky, které rozhodnou, zda to bude „nový standard“

Agenti se učí pracovat – ale za jakou cenu?

Použité zdroje informací

Sdílejte:

Související

Publikoval Pepik Hipik

Napsat komentář Zrušit odpověď na komentář