PTE MIK

Nézzük meg, melyik AI a leghasznosabb, legpontosabb és úgy alles zusammen a legjobb tanuláshoz egy mérnökhallgatónak.

Alávetem az általam használt 3 AI-modellt egy tesztnek, ahol különböző, az elmúlt évek során velem szembejött problémát kell majd megoldaniuk. Az egyszerű matematikai egyenletektől egészen az alapos kutatómunkán át a képgenerálásig. Nem fogom a chatbotok minden funkcióját, módját bemutatni és végignézni, illetve mindig feltüntetem, ha nem az alap/gyors módot használom, például amikor egy-egy összetettebb kérdésre keresik majd a választ „deep research”-csel.

Mielőtt ebbe belevágnánk, egy nagyon gyors áttekintést adnék, hogy egyébként mik a világon és Európában leginkább használt mesterséges intelligenciák1.

A világon jelenleg leginkább használt 10 AI chatbot/eszköz a következő:

  1. ChatGPT
  2. Gemini
  3. DeepSeek
  4. MS Copilot
  5. Doubao
  6. Perplexity
  7. Claude
  8. Character.ai
  9. Canva AI
  10. Nova

A DeepSeek, Doubao kínai fejlesztésű, a Nova török, míg a Canva AI ausztráliai. A többi pedig nem meglepő módon amerikai.

Európában jelenleg leginkább használt 10 AI chatbot/eszköz:

  1. ChatGPT
  2. DeepL
  3. Gemini
  4. MS Copilot
  5. Mistral AI
  6. Perplexity
  7. Claude
  8. Remini
  9. Canva AI
  10. Hugging Face

A DeepL német, kölni LLM, a Hugging Face és Mistral AI francia cégek, a Remini olasz fejlesztésű.

A 3 AI – a cikkben felcserélve fogom használni az AI és LLM szavakat –, amiket én használok napi szinten, azok a ChatGPT, a Gemini és a Grok. Egyikhez sincs előfizetésem, mindegyiknél az ingyenes, nagyközönség számára elérhető modelleket fogom használni, ugyanazokkal a magyar nyelvű utasításokkal, azt kiegészítve, ha valamilyen oknál fogva ez indokolt lenne. Mindegyiknél bejelentkezve Chrome böngészőt veszek igénybe.

Kezdjük az elsőéves mérnökhallgatókat országszerte érintő feladatokkal: deriválás és integrálás. Nemcsak azt nézzük, hogy helyesen oldják-e meg a feladatot, hanem hogy mennyire vezetik le, magyarázzák el – azaz mennyire segítenek ténylegesen a tanulásban.

Egy-egy egyszerűbb deriválási és integrálási feladattal kezdtem:

Deriválási és integrálási feladatok, forrás: saját kép

A ChatGPT eredményei:

A Gemini eredményei:

A Grok eredményei:

Mint látható, mindegyik chatbot hibátlanul oldotta meg az egyenleteket, nyilván nem voltak túl nehezek, de elsőéves mérnökként én is ilyen feladatokat kaptam órákon, zárthelyiken egyaránt. A deriválási feladat utolsó részénél akadnak jelölésbeli eltérések, de azok mind ugyanazt jelentik. Mindegyik szépen tagonként derivált és integrált, ezzel szerintem könnyen követhető és érthető is a levezetés.

A chateket elérhetővé teszem, így mindenki megnézheti, tényleg ugyanazokkal a paraméterekkel dolgozott mindegyik AI:

https://chatgpt.com/share/69971893-515c-8002-97b0-703e92279407

https://gemini.google.com/share/e3d608c293b8

https://grok.com/share/bGVnYWN5_8cc71a5a-2e23-433a-b862-51a2e567b916

Mindegyik feladathoz új beszélgetést fogok indítani, hogy a különböző kihívások ne zavarják össze a nyelvi modelleket.

A szcenáriónk a következő: formatervezőként minden termékünk véglegesítésénél rendereket készítünk, esetlegesen plakátot, amin bemutatjuk a fejlesztési folyamatot. Most azt fogom tesztelni, hogy az üres hátterű PNG renderekhez mennyire tudnak megfelelő minőségű hátteret adni ezek a programok, így megspórolva nekünk a Photoshop vagy egyéb grafikai programok használatát.

Kétfajta képet kértem a programoktól: egy olyat, amiben az állatszobrot belehelyezik az eredeti élőhelyébe és egy olyat, amiben elhelyezik egy otthonban mint dísztárgyat.

ChatGPT:

Gemini:

Grok:

Az eredeti renderek 8K felbontásúak voltak és egyedül a Groknak kellett alacsonyabb felbontásút beadnom, mert nem tudta kezelni az eredeti, nagy felbontású képeket. Ezenkívül a Grok az egyetlen, amely JPEG formátumban generált képeket PNG helyett, így rontott a minőségen. Igaz mindig 2-2 képet generált, ezzel változatosságot adva, de mint a második próbálkozásánál láthatjuk, teljesen megváltoztatta a szobrom anatómiáját és „leültette” a gnút egy asztalra.

A ChatGPT képei 1536*1024 pixelesek, amivel a 1080p minőség alá esnek, ami a FullHD-t jelenti. Ezenfelül nem is lettek jók a képei, főleg a második, ahol nem veszi figyelembe a polcok mélységét. Nyilván éles helyzetben az ember nem csak 1-1 képet generál ezekkel a modellekkel, de kíváncsi vagyok, minimális energiával és első próbálkozásra mi hozható ki belőlük.

A Gemini képeinek felbontása 1184*864, ami még a ChatGPT-nél is rosszabb, de összeségében sokkal jobban sikerültek. A Google Nano Banana képgeneráló modellje eszméletlen jól működik és fejlődik. A szavannai kép kifejezetten jól sikerült szerintem, a dohányzóasztaloson lenne még mit csiszolni, de kis utómunkával az is felhasználható.

A Grok képei 1216*848 pixelesek, amivel körülbelül pariban vannak a Geminivel, de itt eléggé érződik rajtuk, hogy AI-generáltak. Bár a szavannás képek és a második beltéri is egész jók, magán a háttéren nagyon látszik, hogy mesterkélt, lerí róla, hogy mű.

A chatlogok:

https://chatgpt.com/share/69989511-88a4-8002-b8f8-7f255c8305db

https://gemini.google.com/share/66ca810addff

https://grok.com/share/bGVnYWN5_70a654cb-656a-46fe-82d1-e07f23d3456c

Lépjünk tovább, és lássuk, mihez kezdenek ezek, ha egy kis elektrotechnikával állítjuk szembe őket. Hozok egy feladatot, amit még 2024-ben kaptam én magam elektrotechnika órán.

Az alábbi áramkörre kellett a vonali áramok nagyságát kiszámolniuk:

Elektrotechnika feladat, forrás: saját kép

Itt észre kell venni elsőre, hogy a generátor szimmetrikus, másodjára pedig, hogy minden fázison azonos az impedancia, ebből kifolyólag a terhelés is szimmetrikus. Nos ennél a feladatnál szinte mindegyik AI megbukott, ráadásul mindegyik más-más számokat kapott. Egyedül a Gemini oldotta meg helyesen a feladatot és jött ki neki az I = 14,375 Amper.

A ChatGPT nem sokkal számolta el: 11,5 A-t kapott, de ez messze nem hibahatáron belüli egy mérnöknek. A Grok teljesen vakvágányra tévedt és 64,5 Ampert kapott. Persze, aki éppen tanulja ezt az egészet, annak gyanúsak lehetnek ezek a számok, és rákérdezhet, biztos-e benne az adott AI-programunk. Így is tettem, visszakérdeztem mind az OpenAI, mind az xAI nyelvi modelljeinél. A ChatGPT másodjára újraszámolva helyesen vezette le a számolást. A Grok többszöri vita ellenére is ragaszkodik az igazához, pedig még a Gemini válaszát is bemásoltam neki, de nem érdekelte. Nagy mínusz pont a makacsságért – ezért is érdemes egyszerre több AI-jal dolgozni, mert ha nagyon más eredmények jönnek ki náluk, valamelyik biztosan benézett valamit.

Az biztos, ezt a kört a Gemini nyerte, ami elsőre, pontosan számolt és egyszerűen, érthetően vitte végig a „gondolatmenetét” – már amennyire ezeknek az egyesekből és nullákból álló programoknak lehet gondolatuk.

Itt is belinkelem a beszélgetéseket, hogy mindenki maga láthassa, hogyan viselkedtek a chatbotok:

https://chatgpt.com/share/699b1b05-3f00-8002-ac92-94ad5aa9faf8

https://gemini.google.com/share/fa72371d5676

https://grok.com/share/bGVnYWN5_984b8d14-8924-4ae5-a1e0-be68e5d97c6d

Utolsó feladatnak meg fogok adni egy-egy PDF-et, és arra kérem az LLM-eket, hogy keressenek ki specifikus információkat a szövegből. Lássuk, mennyire lesznek pontosak és mennyire jó a szövegértésük. Egy tavalyi feladatom PDF-verzióját kapták meg, és abból kértem le, hogy a szerkezetem milyen anyagú és mekkora terhelésnek kell ellenállnia.

Mindegyik modell gond nélkül találta meg az alumínium típusát és a maximális Newtonméter értékét, le is hivatkozták, a PDF-nek melyik pontjában találták. Nyilván ez nem egy többszáz oldalas dokumentum, amiben összefüggő egymásra hivatkozó, előre- és visszautaló részek vannak. De semmilyen minimálisan is jogsértő dokumentumot nem akartam felhasználni, úgyhogy maradtam egy 100%-ban általam készítettnél. Szerintem ezt a feladatot objektíven mindegyik AI gond nélkül ugrotta meg.

Chatlogok:

https://chatgpt.com/share/699b2858-c72c-8002-839a-c002b5aa6d74

https://gemini.google.com/share/1b29bc8fc021

https://grok.com/share/bGVnYWN5_873ec513-b935-4743-80e9-c575835333b0

Verdiktet nem igazán tudnék mondani, hogy ezt vagy éppen azt az egy chatbotot használjátok. De talán a cikkből látszik, melyiknek jelenleg mi az erőssége és mi a gyengesége. Azért írom így, mert ezek körülbelül félévente változhatnak, amikor mindig egymásra licitálnak a különböző cégek, hogy most éppen ki hozta ki a legerősebb, legjobban kódoló stb. modellt. Érdemes ezeket együtt, párhuzamosan használni. Illetve nyilván, aki megteheti és érdekli/ki is használja, annak megérheti egy-egy előfizetés is valamelyikre.

Zárásként hadd ajánljak pár egyéb AI-eszközt, amit érdemes lehet kipróbálni. A chatbotok közül még említésre méltó a Perplexity és a Claude, utóbbi főleg kódoláshoz. Ezeket személy szerint nem használtam, de összességében jókat hallani róluk. Szintén hasznos a NotebookLM, ami a Google fejlesztése. Ide PDF-ek és egyéb források betöltésével lehet rövid podcasteket, kvízeket, tanulókártyákat generálni és csak azokból az anyagokból dolgozik, amiket mi feltöltünk neki – tehát ha kizárólag csak a saját jegyzetünkből akarunk tanulni, mert „abban az van, amit a tanár mondott, úgy ahogy ő mondta”, akkor annak sincsen semmilyen akadálya.

Eredetileg az egész cikket úgy terveztem, AI fogja írni, egymást fogják bírálni, hogy ne legyen elfogultság, és itt a végén jött volna a nagy leleplezés. De ezt elvetettem, mert én kifejezetten szeretek írni, négyszer is átfogalmazni valamit, mire úgy hangzik, ahogy szeretném. És talán ez is lehet a legfontosabb üzenete az egész cikknek – ne a kreatív feladatokat adjuk át az AI-nak, hanem használjuk ott, ahol szükséges, tanuljunk meg vele együtt élni/dolgozni, nem kell se utálni, se imádni. Ez egy eszköz és tudni kell használni. Vessétek bele magatokat, próbálgassátok, ki tudja, milyen hasznos programokra leltek!


  1. Gemini „Gondolkodó” mód kutatása ↩︎

By Viszló Dániel

Harmadéves formatervező, akinek sok a szabadideje, ezért cikkeket is ír.

Hasonló cikkek