Kövess bennünket a Facebookon!
A mesterséges intelligencia ma már nemcsak beszélget, hanem matekpéldákat is megold. De vajon érti is, amit csinál? Vagy csak emlékezik valamire, amit korábban „olvasott”?
14 matematikus olyan feladatot kapott, hogy vizsgálják meg a ChatGPT o3-mini-high gondolatmenetét nehéz matematikai feladatok megoldása során (FrontierMath teszt során). Nemcsak a válaszra koncentráltak, hanem az út is lényeges volt, hogy jutott el a válaszig.
A 29 feladatból 13-at helyesen oldott meg. A szakértők szerint a modell lenyűgözően tájékozott volt, a matematikusok kétharmada legalább 3/5-ös értékelést adott a teljesítményére.
A legtöbb szakértő szerint a ChatGPT o3-mini-high nem ridegen, logikusan gondolkodik, hanem inkább kísérletezget, ötletel, próbálgat – mintha egy kíváncsi diák lenne. Sokszor nem pontos a megfogalmazása, néha elnagyolt, de látszik benne a szándék, hogy ráérezzen a megoldásra.
Néha csak „saccol”: Bár gyakran eljut a jó válaszig, előfordul, hogy kihagyja a lényegi gondolatmenetet. Ez az úgynevezett cheesing: amikor az AI nem bizonyít, csak „rátapint” a megoldásra.
A kreativitásban. Az AI ugyan nagyon sok mindent ismer, de nem igazán tud új dolgokat kitalálni. Egyikük úgy fogalmazott: olyan, mint egy szorgalmas diák, aki sokat olvasott, de nem ért igazán mélyen a témához. Mindenhez tud idézni valamit – de nem tud újat kitalálni. Egy idő után csak ugyanazokat az ötleteket ismételgeti.
Az egyik elemző szerint az alkalmazás számára egy középiskolai matekverseny-feladat, ahol friss ötletre lenne szükség, nagyobb kihívás lenne, mint egy bonyolult egyetemi példa.
Amikor az AI „hallucinál”: A modell sokszor pontatlanul emlékezett képletekre, vagy fiktív internetes forrásokat próbált előhívni.
Emberi-e a gondolkodása? A válasz: néha igen, néha nem. Időnként úgy gondolkodik, mint egy ember – kíváncsi, próbálgat, gondolkodik. Máskor viszont túl sokat beszél, újra és újra megerősíti a válaszát. Egy matematikus ezt úgy írta le, hogy olyan mint egy diák szóbelin – aki mindenáron meg akarja győzni a tanárt, hogy tudja.
A ChatGPT o3-mini-high egy nagyon művelt, de kissé „túlbeszélő” AI, aki még nem tud új ötleteket kitalálni, és nem mindig érti mélyen, amit csinál. De már most is lenyűgöző, amit tud. A kérdés csak az, hogyan fejlődnek tovább ezek a modellek – és vajon mikor jön el az a pillanat, amikor már tényleg úgy gondolkodnak, mint mi.

📍 A teljes elemzés angol nyelven elérhető itt: Epoch.ai – Beyond Benchmark Scores
Ha kíváncsi vagy arra, hogyan sajátítja el a mesterséges intelligencia a tudást, és miként képes ilyen összetett matematikai feladatokat megoldani, olvasd el ezt a cikket a mesterséges intelligencia tanulási folyamatáról!
Tetszett amit olvastál? Hasznosnak tartod? Oszd meg Facebookon!
Kövess bennünket a Facebookon!
A legjobb felhasználói élmény biztosítása érdekében sütiket használunk az eszközinformációk tárolására és/vagy elérésére. Ezen technológiákhoz való hozzájárulás lehetővé teszi számunkra, hogy olyan adatokat dolgozzunk fel, mint a böngészési viselkedés vagy az egyedi azonosítók ezen a webhelyen. A hozzájárulás megtagadása bizonyos funkciókat hátrányosan befolyásolhat.