Rychlost.sk Blog Prečo ChatGPT nevie počítať? Tajomstvá matematických omylov odhalené

Prečo ChatGPT nevie počítať? Tajomstvá matematických omylov odhalené

Umelá inteligencia píše básne, ale s matematikou má problémy. Prečo ChatGPT a ďalší chatboti nezvládajú ani základné počty? Odhaľujeme príčiny matematických omylov AI, od tokenizácie, ktorá rozbíja čísla na nezrozumiteľné fragmenty, až po štatistický prístup k učeniu, ktorý v matematike zlyháva.

Prečo ChatGPT nevie počítať? Tajomstvá matematických omylov odhalené

Umelá inteligencia, vrátane ChatGPT, dokáže písať básne, skladať hudbu a prekladať texty. Napriek tomu sa často zasekne u jednoduchých matematických úloh. Prečo si chatbot, ktorý zvláda komplexné jazykové úlohy, neporadí s matematikou na úrovni základnej školy?

Tokenizácia: Keď sa čísla rozpadajú na kúsky

Jedným z kľúčových problémov je tokenizácia. Tento proces rozdeľuje dáta na menšie časti, tzv. tokeny. Predstavte si to ako skladanie puzzle, kde sa slová rozbíjajú na slabiky. Tokenizátor, model umelej inteligencie zodpovedný za tento proces, však nerozumie významu čísel.

Môže sa stať, že číslo 380 bude vnímané ako jeden token, zatiaľ čo 381 ako dva (38 a 1). Tým sa narušia vzťahy medzi číslicami a výpočet sa skomplikuje.

Štatistický stroj, ktorý tápe v číslach

Dalším dôvodom matematických ťažkostí ChatGPT je jeho štatistická podstata. Chatbot sa učí na základe obrovského množstva príkladov a hľadá v nich vzory. Napríklad sa naučí, že fráza „Vážený pane" je často nasledovaná frázou „obraciame sa na Vás".

V matematike sa však tento prístup stretáva s problémami. ChatGPT síce dokáže odhadnúť, že súčin čísel končiacich na 2 bude končiť na 4, ale s medzi výsledkami si neporadí. Zjednodušene povedané, model ChatGPT sa snaží uhádnuť výsledok na základe naučených vzorcov namiesto toho, aby vykonal presný výpočet.

Výzva menom násobenie

Štúdia prevedená Yuntianom Dengem z University of Waterloo ukázala, že ChatGPT má problémy s násobením čísel väčších ako štyri cifry. Dôvodom je, že chyba v akomkoľvek kroku výpočtu sa prejaví v konečnom výsledku.

Predstavte si to ako dominový efekt – jedna chyba spustí reťazovú reakciu a výsledok je úplne mimo. Existuje však nádej, že sa ChatGPT v budúcnosti zlepší. Deng a jeho kolegovia testovali tiež model o1 od OpenAI, ktorý sa vyznačuje schopnosťou logického uvažovania.

Tento model dosiahol výrazne lepšie výsledky než štandardný GPT-4o a dokázal správne vyriešiť aj násobenie deväťciferných čísel. Model o1 totiž premýšľa nad problémom krok za krokom, čo mu umožňuje dosiahnuť presnejšie výsledky.

Sam Altman, CEO OpenAI, oznámil, že spoločnosť už vie, ako vytvoriť všeobecnú umelú inteligenciu a smeruje k vývoju superinteligencie. Podľa jeho predpovede by mohla byť realitou už za niekoľko rokov. Napriek tomu, že súčasné AI systémy majú stále významné nedostatky, Altman verí v ich rýchle prekonanie.

Minecraft: Education Edition prepája populárny herný svet s výučbou. Deti môžu objavovať programovanie, spolupracovať pri riešení problémov a učiť sa nové zručnosti v známom prostredí plnom tvorivosti. Ako funguje a hodí sa aj pre menšie deti?

Alice je vzdelávacia platforma, ktorá umožňuje deťom aj študentom preniknúť do sveta programovania prostredníctvom tvorby 3D animácií, interaktívnych príbehov a jednoduchých hier. Hodí sa ako pre školákov, tak aj používateľov na vysokých školách. Čo všetko ponúka a ako funguje?

Americká vláda zahájila vyšetrovanie čínskej spoločnosti TP-Link, ktorá ovláda 65 % trhu s routermi. Dôvodom sú obavy o národnú bezpečnosť po odhalení využitia ich zariadení pri ransomvérových útokoch.

OpenAI zavŕšila svoju vianočnú akciu „12 dní OpenAI“ oznámením revolučného modelu o3 a jeho menšej verzie o3-mini. Nový model sľubuje výrazné zlepšenie v oblasti uvažovania a riešenia komplexných úloh. Zatiaľ bude dostupný iba pre bezpečnostných výskumníkov.

SpaceX v spolupráci s novozélandským operátorom One NZ spustila prvú celonárodnú satelitnú sieť na posielanie SMS správ. Táto prelomová služba umožňuje komunikáciu aj v oblastiach bez klasického mobilného signálu. Zatiaľ podporuje iba štyri modely telefónov a čas doručenia správ môže trvať až 10 minút.