Az AI matematikai zsenialitása - A ChatGPT O3-mini-high modell közelről

Mennyire érti a matematikát az AI?

A mesterséges intelligencia ma már nemcsak beszélget, hanem matekpéldákat is megold. De vajon érti is, amit csinál? Vagy csak emlékezik valamire, amit korábban „olvasott”?

14 matematikus olyan feladatot kapott, hogy vizsgálják meg a ChatGPT o3-mini-high gondolatmenetét nehéz matematikai feladatok megoldása során (FrontierMath teszt során). Nemcsak a válaszra koncentráltak, hanem az út is lényeges volt, hogy jutott el a válaszig.

📚 Nem csak okos – hanem elképesztően művelt is

A 29 feladatból 13-at helyesen oldott meg. A szakértők szerint a modell lenyűgözően tájékozott volt, a matematikusok kétharmada legalább 3/5-ös értékelést adott a teljesítményére.

Mit tud az O3-mini-high modell?

A legtöbb szakértő szerint a ChatGPT o3-mini-high nem ridegen, logikusan gondolkodik, hanem inkább kísérletezget, ötletel, próbálgat – mintha egy kíváncsi diák lenne. Sokszor nem pontos a megfogalmazása, néha elnagyolt, de látszik benne a szándék, hogy ráérezzen a megoldásra.

Néha csak „saccol”: Bár gyakran eljut a jó válaszig, előfordul, hogy kihagyja a lényegi gondolatmenetet. Ez az úgynevezett cheesing: amikor az AI nem bizonyít, csak „rátapint” a megoldásra.

A leggyakoribb hibák: amikor az AI „csak tippel”

A kreativitásban. Az AI ugyan nagyon sok mindent ismer, de nem igazán tud új dolgokat kitalálni. Egyikük úgy fogalmazott: olyan, mint egy szorgalmas diák, aki sokat olvasott, de nem ért igazán mélyen a témához. Mindenhez tud idézni valamit – de nem tud újat kitalálni. Egy idő után csak ugyanazokat az ötleteket ismételgeti.

Az egyik elemző szerint az alkalmazás számára egy középiskolai matekverseny-feladat, ahol friss ötletre lenne szükség, nagyobb kihívás lenne, mint egy bonyolult egyetemi példa.

Amikor az AI „hallucinál”: A modell sokszor pontatlanul emlékezett képletekre, vagy fiktív internetes forrásokat próbált előhívni.

Emberi-e a gondolkodása? A válasz: néha igen, néha nem. Időnként úgy gondolkodik, mint egy ember – kíváncsi, próbálgat, gondolkodik. Máskor viszont túl sokat beszél, újra és újra megerősíti a válaszát. Egy matematikus ezt úgy írta le, hogy olyan mint egy diák szóbelin – aki mindenáron meg akarja győzni a tanárt, hogy tudja.

🚀 Mi jön ezután? Az AI és a matematika jövője

A ChatGPT o3-mini-high egy nagyon művelt, de kissé „túlbeszélő” AI, aki még nem tud új ötleteket kitalálni, és nem mindig érti mélyen, amit csinál. De már most is lenyűgöző, amit tud. A kérdés csak az, hogyan fejlődnek tovább ezek a modellek – és vajon mikor jön el az a pillanat, amikor már tényleg úgy gondolkodnak, mint mi.

📍 A teljes elemzés angol nyelven elérhető itt: Epoch.ai – Beyond Benchmark Scores

Ha kíváncsi vagy arra, hogyan sajátítja el a mesterséges intelligencia a tudást, és miként képes ilyen összetett matematikai feladatokat megoldani, olvasd el ezt a cikket a mesterséges intelligencia tanulási folyamatáról!

Tetszett amit olvastál? Hasznosnak tartod? Oszd meg Facebookon!