Szédületes, mire képes az új hangvezérelt mesterséges intelligencia
Habár egy ideig úgy tűnt, véget ért a ChatGPT nevű mesterségesintelligencia-fejlesztés körüli hype, most ismét olyan újítást jelentettek be a fejlesztők, hogy aligha lehet majd hűteni a kedélyeket körülötte. A hangalapú vezérlés egészen elképesztő, új távlatokat nyit meg a nyelvi modell használatában.
Hosszú hónapokkal ezelőtt szinte a fél világ ChatGPT-lázban égett. Mindenki ámult és bámult azon, hogy mi mindenre lehet hasznos a csevegő-alkalmazásként funckiónáló mesterséges intelligenciát alkalmazó nyelvi modell. Akkor még többnyire csak szövegesen lehetett alkalmazni a fejlesztést, de már akkor is bőségesen lehetett használi egy sor feladatra: a leleményesebb diákok házi feladatot irattak vele, a programozók lerövidítették a kódolási folyamataiakat, a mezei felhasználók meg egyfajta felturbózott keresőmotorként tekintettek rá.
Most viszont a modellt fejlesztő OpenAI bejelentette a GPT-4o nevű nyelvi modelljét, amely tulajdonképpen a korábbi verzió egy sokkal gyorsabb és komplexebb változata: mind a szöveges, mind a látási és hangos képességeiben is. Ráadásul ezt is ingyenesen elérhetővé teszik - a fizetős verzió annyi előnyt ad csupán, hogy ötször nagyobb kapacitást biztosít a felhasználóknak.
5. Happy Birthday pic.twitter.com/j6LdWjiQL0
— Madni Aghadi (@hey_madni) May 13, 2024
A felhasználók persze nyomban rá is ugrottak az új modellre, hogy mindenfélét kisérletezzenek vele. Az mára már alapfunkcióvá vált, hogy a modell simán tud élő szinkrontolmácsolást biztosítani két különböző nyelven beszélő ember között - folyékonyan és pontosan. Az egyik user egy állásinterjúhoz kért tanácsokat a GPT-től, amelynek a modellje értve az iróniát, humorosan jegyezte meg, hogy elaludt hajjal nem célszerű komoly interjún részt venni.
Less than 3 hours since OpenAI announced GPT-4o, and the hype is unreal.
— Madni Aghadi (@hey_madni) May 13, 2024
Here are 16 wild examples you don't want to miss:
1. Interview preparation pic.twitter.com/y5DjgJ9NbH
Egy másik teszt során a modell felismerte a videóhívás keretében, hogy valakinek születésnapja van, és el is énekelte neki a Boldog szülinapot! c. dalt. De volt olyan próba is, amelyben élőben tartott idegenvezetést egy turistának attól függően, hogy a kameráját melyik épületre irányította a városban sétálva.
15. GPT-4o with Andy, from BeMyEyes in London pic.twitter.com/EZbfWU7CaB
— Madni Aghadi (@hey_madni) May 13, 2024
Ugyanúgy oktatási jelleggel is igénybe vehető: például egy helyzetben a látszólag furcsa tevékenységet végző kacsákról tudta megállapítani, hogy pontosan mi célból is merülnek le egymás után egy tóban a víz alá a kamera képén látható állatok. A hasonló funkciók a végtelenségig sorolhatóak: a hűtőszekrényt befotózva például simán ajánl személyre szabott receptet csak a látott hozzávalók alapján.
2. Real-time translation pic.twitter.com/uEN1nImkTK
— Madni Aghadi (@hey_madni) May 13, 2024
Olyan szintű fejlesztés került most piacra, amely tényleg forradalmasíthatja az élet számos területét és úgy tűnik, csak az emberi képzelőerő szab határt annak, hogy mi mindenre lehet majd felhasználni.
This demo is insane.
— Mckay Wrigley (@mckaywrigley) May 13, 2024
A student shares their iPad screen with the new ChatGPT + GPT-4o, and the AI speaks with them and helps them learn in *realtime*.
Imagine giving this to every student in the world.
The future is so, so bright. pic.twitter.com/t14M4fDjwV