Umelá inteligencia a ARC výzvy: rekordné skóre 29,4%
Umelá inteligencia dosiahla rekordné skóre 29,4% v náročných ARC výzvach – teste logického myslenia strojov. Jeremy Berman využil evolučný prístup a anglický jazyk na trénovanie AI, čo naznačuje potenciál pre ďalší pokrok.
V poslednom videu na Machine Learning Street Talk sa Jeremy Berman podelil o svoje skúsenosti s riešením náročných ARC (Abstraction and Reasoning Challenge) výziev. Tieto výzvy slúžia ako akýsi IQ test pre stroje a zameriavajú sa na overenie schopnosti počítačov učiť sa nové vzory a logiku, nie len reprodukovať existujúce dáta. Bermanova cesta k rekordnému skóre 29,4% je fascinujúcim príkladom inovatívneho prístupu k trénovaniu AI systémov a naznačuje potenciál pre ďalší pokrok v oblasti umelej inteligencie. V tomto článku sa pozrieme na kľúčové momenty z videa a rozoberme si, čo znamená dosiahnutie takéhoto výkonu.
ARC výzvy: Testovanie logického myslenia strojov
ARC výzvy boli vytvorené s cieľom otestovať schopnosť AI systémov riešiť problémy, ktoré vyžadujú abstraktné uvažovanie a schopnosť odvodzovania. Na rozdiel od tradičných jazykových modelov, ktoré sa zameriavajú na porozumenie a generovanie textu, ARC výzvy kladú strojom za úlohu analyzovať vizuálne vzory (gridy) a aplikovať logiku na transformáciu vstupných gridov do výstupných. Rané pokusy o riešenie týchto výziev s pomocou jazykových modelov boli neúspešné, čo poukazovalo na nedostatok schopnosti učiť sa nové koncepty a aplikovať ich v nových situáciách.
Bermanova cesta k rekordnému skóre: Od Pythonu po angličtinu a evolučný prístup
Berman začal s riešením ARC výziev pomocou Sonnet 3.5, jazykového modelu, ktorý generoval programy v Pythone. Neskôr prešiel na evolučný prístup, kde sa namiesto generovania kódu vytvárali popisy algoritmov v angličtine a tieto popisy sa iteratívne zdokonaľovali. Tento posun k anglickému jazyku bol kľúčový, pretože umožnil väčšiu flexibilitu a expresivitu pri popisovaní zložitých algoritmov. Bermanova metóda využíva koncept „thinking models“ s integrovanými revíznymi cyklami, čo znižuje potrebu explicitného riadenia procesu učenia sa.
Globálne investície do generatívnej umelej inteligencie
Kľúčové poznatky z videa:
- ARC výzvy: Slúžia ako IQ test pre stroje a overujú ich schopnosť abstraktného uvažovania.
- Evolučný prístup: Generovanie popisu algoritmov v angličtine namiesto generovania kódu v Pythone.
- Dôležitosť jazyka: Anglický jazyk ponúka väčšiu expresivitu a flexibilitu pri popisovaní zložitých algoritmov.
- „Thinking models“: Modely s integrovanými revíznymi cyklami, ktoré znižujú potrebu explicitného riadenia procesu učenia sa.
- Syntéza vs. Memorizácia: Skutočné porozumenie vyžaduje syntézu nových informácií, nie len memorizáciu existujúcich dát.
- „Invention circuit“: Mechanizmus na vyhľadávanie možných premís a budovanie na existujúcich znalostných stromoch.
Výzvy a budúcnosť AI: Od neurónových sietí po symbolické systémy
Diskusia sa dotkla aj vzťahu medzi neurónovými sieťami a symbolickými systémami. Hoci sa verí, že neurónové siete majú potenciál dosiahnuť všeobecnú inteligenciu, symbolické systémy predstavujú rozsiahlejší prístup, ktorý zahŕňa aj neurónové siete. Udržanie týchto systémov počas trénovania (problém tzv. katastrofického zabúdania) je však výzvou. Berman tiež poukázal na obmedzenia Stochastic Gradient Descent (SGD) a navrhol využitie neuroevolucionárnych algoritmov pre lepšie výsledky.
Umeló inteligencia: Výkon v testoch z vedomostí vs. výpočtová náročnosť trénovania
Znalostné stromy a ľudské porozumenie: Hľadanie logických základov
Zaujímavým bodom bolo aj porovnanie AI s ľudským porozumením. Berman definoval inteligenciu ako efektivitu, s akou si človek vytvára znalostný strom, zatiaľ čo uvažovanie je samotný proces budovania tohto stromu. Porozumenie je potom jednoducho držanie tohto stromu v mysli. Diskusia sa dotkla aj filozofických aspektov porozumenia a potenciálnej potreby fyzickej realizácie pre vedomie a kogníciu.
Odporúčania a úvahy:
Bermanove výsledky naznačujú, že cesta k skutočnej AI inteligencii vedie cez schopnosť syntetizovať nové informácie a učiť sa abstraktné koncepty. Evolučný prístup a využitie anglického jazyka ako programovacieho prostredia predstavujú sľubné cesty, ktoré by mohli viesť k ďalším pokrokom v tejto oblasti. Je dôležité pokračovať vo výskume a experimentovaní s rôznymi metódami trénovania AI systémov, aby sme dosiahli cieľ vytvoriť stroje, ktoré dokážu uvažovať a riešiť problémy rovnako efektívne ako ľudia.
Dôležité odkazy:
- Jeremy Berman's Substack: https://jeremyberman.substack.com/
- Kenneth Kumar & Charles Stanley-Fractured Entangled Representation Hypothesis: https://arxiv.org/pdf/2505.11581
Približne 242 gCO₂ bolo uvoľnených do atmosféry a na chladenie sa spotrebovalo 1.21 l vody za účelom vygenerovania tohoto článku.
Komentáre ()