Én örülnénk, ha nem kellene gépelni, (nem hiányozna) és erre a Google egérmutatója szállíthatja valszeg az első működő megoldást.

Hányszor futottál már neki egy-egy bonyolult prompt megírásának, mire az patent lett? Másolgatás, pontosítás, szavak ki-be, próbálkozás… Ténzleg mint a DOS-ban. (Aki emlékszik) Néha több munka elmagyarázni az AI-nak a feladatot, mint megcsinálni. A Google legújabb tesztje viszont ezt próbálná megoldani.: érkezik az okos egérkurzor, amivel végre nem gépelni, hanem csak „mutogatni” kell – és esetleg beszédben kiadni a hangutasításokat. (!)

 

A kurzor, ami végre látja, mit csinálsz

A legtöbb mai AI-eszköz olyan, mint egy vak géniusz: hihetetlen dolgokat tud, de fogalma sincs, mi van előtted a képernyőn, amíg be nem másolod neki. A Google belső köreiben tesztelt cucc ezen változtat. A Gemini beköltözik az egérmutatód hegyére, és onnantól kezdve a kurzor lesz a „szeme”.

Ez a gyakorlatban annyit tesz, hogy a szoftver tudni fogja a kontextust. Tudja, hogy éppen egy PDF-et böngészel, egy kódsoron állsz, vagy egy Excel-en ügyködsz.

A jövőben nem kell majd elmagyaráznod, melyik fájl melyik bekezdéséről van szó. Elég lesz rámutatnod valamire, és egyszerűen megmondanod neki (akár szóban is), mit szeretnél:

 

„Ezt a három bekezdést írd át barátságosabb stílusra!”

„Ezekből az adatokból dobj össze egy kördiagramot!”

„Ezt a képet vágd körbe és tedd át a prezentációmba!”

 

Ez a fajta „mutass és mondd” módszer sokkal közelebb áll ahhoz, ahogy két ember együttműködik. Nem parancssorokat gyártunk, hanem egyszerűen együtt dolgozünk a géppel.

 

Miért tartjuk majd ezt fontosnak?

Mert ez a megoldás kényelmes. Gyors. Hang és “szem” egyszerre működik. Ráadásul a technológia akkor a legjobb, ha észrevétlen, és ez közeleg.

A jelenlegi chatbotok még mindig „egy extra feladatot” jelentenek: megnyitni, beírni, bemásolni, elolvasni, megnézni, moddolni, satöbbi. Ha viszont az AI ott van a kurzorodban, akkor a kurzor lesz a szemed.

Ha rámutatsz egy térképre és annyit mondasz:

“Tervezz ide egy útvonalat”, az AI tudni fogja, mit kell tennie.”

 

Merre tovább?

Ez a fejlesztés még kísérleti fázisban van, és persze rengeteg kérdést felvet – főleg az adatvédelem kapcsán, hiszen az AI-nak folyamatosan „néznie” kell, mi történik a monitorunkon. (GDPR likes it) De ha sikerül biztonságosan megvalósítani, az legalább akkora ugrás lesz, mint amikor az írógépszerű parancssorokat (DOS) felváltotta az egérrel kattintható grafikus felület (Windows).

Lehet, hogy pár év múlva már, a promptolásban tisztességben megőszült fejünkkel, nosztalgiával gondolunk vissza arra, amikor még “mondatokat gépeltünk” egy fehér ablakba. Ez egy logikus lépésnek tűnik.

A közeli jövőben pedig elég lesz csak rámutatni a dolgokra.

Attila