Szédületes, mire képes az új hangvezérelt mesterséges intelligencia

Habár egy ideig úgy tűnt, véget ért a ChatGPT nevű mesterségesintelligencia-fejlesztés körüli hype, most ismét olyan újítást jelentettek be a fejlesztők, hogy aligha lehet majd hűteni a kedélyeket körülötte. A hangalapú vezérlés egészen elképesztő, új távlatokat nyit meg a nyelvi modell használatában.

openai.jpg

Hosszú hónapokkal ezelőtt szinte a fél világ ChatGPT-lázban égett. Mindenki ámult és bámult azon, hogy mi mindenre lehet hasznos a csevegő-alkalmazásként funckiónáló mesterséges intelligenciát alkalmazó nyelvi modell. Akkor még többnyire csak szövegesen lehetett alkalmazni a fejlesztést, de már akkor is bőségesen lehetett használi egy sor feladatra: a leleményesebb diákok házi feladatot irattak vele, a programozók lerövidítették a kódolási folyamataiakat, a mezei felhasználók meg egyfajta felturbózott keresőmotorként tekintettek rá. 

Most viszont a modellt fejlesztő OpenAI bejelentette a GPT-4o nevű nyelvi modelljét, amely tulajdonképpen a korábbi verzió egy sokkal gyorsabb és komplexebb változata: mind a szöveges, mind a látási és hangos képességeiben is. Ráadásul ezt is ingyenesen elérhetővé teszik - a fizetős verzió annyi előnyt ad csupán, hogy ötször nagyobb kapacitást biztosít a felhasználóknak. 

A felhasználók persze nyomban rá is ugrottak az új modellre, hogy mindenfélét kisérletezzenek vele. Az mára már alapfunkcióvá vált, hogy a modell simán tud élő szinkrontolmácsolást biztosítani két különböző nyelven beszélő ember között - folyékonyan és pontosan. Az egyik user egy állásinterjúhoz kért tanácsokat a GPT-től, amelynek a modellje értve az iróniát, humorosan jegyezte meg, hogy elaludt hajjal nem célszerű komoly interjún részt venni. 

Egy másik teszt során a modell felismerte a videóhívás keretében, hogy valakinek születésnapja van, és el is énekelte neki a Boldog szülinapot! c. dalt. De volt olyan próba is, amelyben élőben tartott idegenvezetést egy turistának attól függően, hogy a kameráját melyik épületre irányította a városban sétálva. 

Ugyanúgy oktatási jelleggel is igénybe vehető: például egy helyzetben a látszólag furcsa tevékenységet végző kacsákról tudta megállapítani, hogy pontosan mi célból is merülnek le egymás után egy tóban a víz alá a kamera képén látható állatok. A hasonló funkciók a végtelenségig sorolhatóak: a hűtőszekrényt befotózva például simán ajánl személyre szabott receptet csak a látott hozzávalók alapján. 

Olyan szintű fejlesztés került most piacra, amely tényleg forradalmasíthatja az élet számos területét és úgy tűnik, csak az emberi képzelőerő szab határt annak, hogy mi mindenre lehet majd felhasználni.