Nézzük meg, melyik AI a leghasznosabb, legpontosabb és úgy alles zusammen a legjobb tanuláshoz egy mérnökhallgatónak.
Alávetem az általam használt 3 AI-modellt egy tesztnek, ahol különböző, az elmúlt évek során velem szembejött problémát kell majd megoldaniuk. Az egyszerű matematikai egyenletektől egészen az alapos kutatómunkán át a képgenerálásig. Nem fogom a chatbotok minden funkcióját, módját bemutatni és végignézni, illetve mindig feltüntetem, ha nem az alap/gyors módot használom, például amikor egy-egy összetettebb kérdésre keresik majd a választ „deep research”-csel.
Mielőtt ebbe belevágnánk, egy nagyon gyors áttekintést adnék, hogy egyébként mik a világon és Európában leginkább használt mesterséges intelligenciák1.
A világon jelenleg leginkább használt 10 AI chatbot/eszköz a következő:
- ChatGPT
- Gemini
- DeepSeek
- MS Copilot
- Doubao
- Perplexity
- Claude
- Character.ai
- Canva AI
- Nova
A DeepSeek, Doubao kínai fejlesztésű, a Nova török, míg a Canva AI ausztráliai. A többi pedig nem meglepő módon amerikai.
Európában jelenleg leginkább használt 10 AI chatbot/eszköz:
- ChatGPT
- DeepL
- Gemini
- MS Copilot
- Mistral AI
- Perplexity
- Claude
- Remini
- Canva AI
- Hugging Face
A DeepL német, kölni LLM, a Hugging Face és Mistral AI francia cégek, a Remini olasz fejlesztésű.
A 3 AI – a cikkben felcserélve fogom használni az AI és LLM szavakat –, amiket én használok napi szinten, azok a ChatGPT, a Gemini és a Grok. Egyikhez sincs előfizetésem, mindegyiknél az ingyenes, nagyközönség számára elérhető modelleket fogom használni, ugyanazokkal a magyar nyelvű utasításokkal, azt kiegészítve, ha valamilyen oknál fogva ez indokolt lenne. Mindegyiknél bejelentkezve Chrome böngészőt veszek igénybe.
Kezdjük az elsőéves mérnökhallgatókat országszerte érintő feladatokkal: deriválás és integrálás. Nemcsak azt nézzük, hogy helyesen oldják-e meg a feladatot, hanem hogy mennyire vezetik le, magyarázzák el – azaz mennyire segítenek ténylegesen a tanulásban.
Egy-egy egyszerűbb deriválási és integrálási feladattal kezdtem:

A ChatGPT eredményei:

A Gemini eredményei:

A Grok eredményei:

Mint látható, mindegyik chatbot hibátlanul oldotta meg az egyenleteket, nyilván nem voltak túl nehezek, de elsőéves mérnökként én is ilyen feladatokat kaptam órákon, zárthelyiken egyaránt. A deriválási feladat utolsó részénél akadnak jelölésbeli eltérések, de azok mind ugyanazt jelentik. Mindegyik szépen tagonként derivált és integrált, ezzel szerintem könnyen követhető és érthető is a levezetés.
A chateket elérhetővé teszem, így mindenki megnézheti, tényleg ugyanazokkal a paraméterekkel dolgozott mindegyik AI:
https://chatgpt.com/share/69971893-515c-8002-97b0-703e92279407
https://gemini.google.com/share/e3d608c293b8
https://grok.com/share/bGVnYWN5_8cc71a5a-2e23-433a-b862-51a2e567b916
Mindegyik feladathoz új beszélgetést fogok indítani, hogy a különböző kihívások ne zavarják össze a nyelvi modelleket.
A szcenáriónk a következő: formatervezőként minden termékünk véglegesítésénél rendereket készítünk, esetlegesen plakátot, amin bemutatjuk a fejlesztési folyamatot. Most azt fogom tesztelni, hogy az üres hátterű PNG renderekhez mennyire tudnak megfelelő minőségű hátteret adni ezek a programok, így megspórolva nekünk a Photoshop vagy egyéb grafikai programok használatát.
Kétfajta képet kértem a programoktól: egy olyat, amiben az állatszobrot belehelyezik az eredeti élőhelyébe és egy olyat, amiben elhelyezik egy otthonban mint dísztárgyat.
ChatGPT:


Gemini:


Grok:




Az eredeti renderek 8K felbontásúak voltak és egyedül a Groknak kellett alacsonyabb felbontásút beadnom, mert nem tudta kezelni az eredeti, nagy felbontású képeket. Ezenkívül a Grok az egyetlen, amely JPEG formátumban generált képeket PNG helyett, így rontott a minőségen. Igaz mindig 2-2 képet generált, ezzel változatosságot adva, de mint a második próbálkozásánál láthatjuk, teljesen megváltoztatta a szobrom anatómiáját és „leültette” a gnút egy asztalra.
A ChatGPT képei 1536*1024 pixelesek, amivel a 1080p minőség alá esnek, ami a FullHD-t jelenti. Ezenfelül nem is lettek jók a képei, főleg a második, ahol nem veszi figyelembe a polcok mélységét. Nyilván éles helyzetben az ember nem csak 1-1 képet generál ezekkel a modellekkel, de kíváncsi vagyok, minimális energiával és első próbálkozásra mi hozható ki belőlük.
A Gemini képeinek felbontása 1184*864, ami még a ChatGPT-nél is rosszabb, de összeségében sokkal jobban sikerültek. A Google Nano Banana képgeneráló modellje eszméletlen jól működik és fejlődik. A szavannai kép kifejezetten jól sikerült szerintem, a dohányzóasztaloson lenne még mit csiszolni, de kis utómunkával az is felhasználható.
A Grok képei 1216*848 pixelesek, amivel körülbelül pariban vannak a Geminivel, de itt eléggé érződik rajtuk, hogy AI-generáltak. Bár a szavannás képek és a második beltéri is egész jók, magán a háttéren nagyon látszik, hogy mesterkélt, lerí róla, hogy mű.
A chatlogok:
https://chatgpt.com/share/69989511-88a4-8002-b8f8-7f255c8305db
https://gemini.google.com/share/66ca810addff
https://grok.com/share/bGVnYWN5_70a654cb-656a-46fe-82d1-e07f23d3456c
Lépjünk tovább, és lássuk, mihez kezdenek ezek, ha egy kis elektrotechnikával állítjuk szembe őket. Hozok egy feladatot, amit még 2024-ben kaptam én magam elektrotechnika órán.
Az alábbi áramkörre kellett a vonali áramok nagyságát kiszámolniuk:

Itt észre kell venni elsőre, hogy a generátor szimmetrikus, másodjára pedig, hogy minden fázison azonos az impedancia, ebből kifolyólag a terhelés is szimmetrikus. Nos ennél a feladatnál szinte mindegyik AI megbukott, ráadásul mindegyik más-más számokat kapott. Egyedül a Gemini oldotta meg helyesen a feladatot és jött ki neki az I = 14,375 Amper.
A ChatGPT nem sokkal számolta el: 11,5 A-t kapott, de ez messze nem hibahatáron belüli egy mérnöknek. A Grok teljesen vakvágányra tévedt és 64,5 Ampert kapott. Persze, aki éppen tanulja ezt az egészet, annak gyanúsak lehetnek ezek a számok, és rákérdezhet, biztos-e benne az adott AI-programunk. Így is tettem, visszakérdeztem mind az OpenAI, mind az xAI nyelvi modelljeinél. A ChatGPT másodjára újraszámolva helyesen vezette le a számolást. A Grok többszöri vita ellenére is ragaszkodik az igazához, pedig még a Gemini válaszát is bemásoltam neki, de nem érdekelte. Nagy mínusz pont a makacsságért – ezért is érdemes egyszerre több AI-jal dolgozni, mert ha nagyon más eredmények jönnek ki náluk, valamelyik biztosan benézett valamit.
Az biztos, ezt a kört a Gemini nyerte, ami elsőre, pontosan számolt és egyszerűen, érthetően vitte végig a „gondolatmenetét” – már amennyire ezeknek az egyesekből és nullákból álló programoknak lehet gondolatuk.
Itt is belinkelem a beszélgetéseket, hogy mindenki maga láthassa, hogyan viselkedtek a chatbotok:
https://chatgpt.com/share/699b1b05-3f00-8002-ac92-94ad5aa9faf8
https://gemini.google.com/share/fa72371d5676
https://grok.com/share/bGVnYWN5_984b8d14-8924-4ae5-a1e0-be68e5d97c6d
Utolsó feladatnak meg fogok adni egy-egy PDF-et, és arra kérem az LLM-eket, hogy keressenek ki specifikus információkat a szövegből. Lássuk, mennyire lesznek pontosak és mennyire jó a szövegértésük. Egy tavalyi feladatom PDF-verzióját kapták meg, és abból kértem le, hogy a szerkezetem milyen anyagú és mekkora terhelésnek kell ellenállnia.
Mindegyik modell gond nélkül találta meg az alumínium típusát és a maximális Newtonméter értékét, le is hivatkozták, a PDF-nek melyik pontjában találták. Nyilván ez nem egy többszáz oldalas dokumentum, amiben összefüggő egymásra hivatkozó, előre- és visszautaló részek vannak. De semmilyen minimálisan is jogsértő dokumentumot nem akartam felhasználni, úgyhogy maradtam egy 100%-ban általam készítettnél. Szerintem ezt a feladatot objektíven mindegyik AI gond nélkül ugrotta meg.
Chatlogok:
https://chatgpt.com/share/699b2858-c72c-8002-839a-c002b5aa6d74
https://gemini.google.com/share/1b29bc8fc021
https://grok.com/share/bGVnYWN5_873ec513-b935-4743-80e9-c575835333b0
Verdiktet nem igazán tudnék mondani, hogy ezt vagy éppen azt az egy chatbotot használjátok. De talán a cikkből látszik, melyiknek jelenleg mi az erőssége és mi a gyengesége. Azért írom így, mert ezek körülbelül félévente változhatnak, amikor mindig egymásra licitálnak a különböző cégek, hogy most éppen ki hozta ki a legerősebb, legjobban kódoló stb. modellt. Érdemes ezeket együtt, párhuzamosan használni. Illetve nyilván, aki megteheti és érdekli/ki is használja, annak megérheti egy-egy előfizetés is valamelyikre.
Zárásként hadd ajánljak pár egyéb AI-eszközt, amit érdemes lehet kipróbálni. A chatbotok közül még említésre méltó a Perplexity és a Claude, utóbbi főleg kódoláshoz. Ezeket személy szerint nem használtam, de összességében jókat hallani róluk. Szintén hasznos a NotebookLM, ami a Google fejlesztése. Ide PDF-ek és egyéb források betöltésével lehet rövid podcasteket, kvízeket, tanulókártyákat generálni és csak azokból az anyagokból dolgozik, amiket mi feltöltünk neki – tehát ha kizárólag csak a saját jegyzetünkből akarunk tanulni, mert „abban az van, amit a tanár mondott, úgy ahogy ő mondta”, akkor annak sincsen semmilyen akadálya.
Eredetileg az egész cikket úgy terveztem, AI fogja írni, egymást fogják bírálni, hogy ne legyen elfogultság, és itt a végén jött volna a nagy leleplezés. De ezt elvetettem, mert én kifejezetten szeretek írni, négyszer is átfogalmazni valamit, mire úgy hangzik, ahogy szeretném. És talán ez is lehet a legfontosabb üzenete az egész cikknek – ne a kreatív feladatokat adjuk át az AI-nak, hanem használjuk ott, ahol szükséges, tanuljunk meg vele együtt élni/dolgozni, nem kell se utálni, se imádni. Ez egy eszköz és tudni kell használni. Vessétek bele magatokat, próbálgassátok, ki tudja, milyen hasznos programokra leltek!
- Gemini „Gondolkodó” mód kutatása ↩︎

