Premýšľania o AI: Výpočetný výkon a budúcnosť strojového učenia

Výpočtový výkon je kľúčový pre budúcnosť AI, tvrdí odborník Richard Sutton. Súčasné jazykové modely sú neefektívne a závislé od ľudských dát. Kontinuálne učenie a efektívnejšie využívanie výpočtov môžu viesť k skutočnej inteligencii.

Premýšľania o AI: Výpočetný výkon a budúcnosť strojového učenia
Photo by 44124348109@N01/Flickr

Nedávno som si pozrel rozhovor s legendárnym odborníkom na posilňovacie učenie, Richardom Suttonom. Jeho názory na súčasný stav umelej inteligencie (AI) a smerovanie budúceho vývoja sú fascinujúce a prinútili ma zamyslieť sa nad tým, ako pristupujeme k tvorbe inteligentných systémov. V tomto článku sa pokúsim zhrnúť kľúčové myšlienky z rozhovoru a vysvetliť ich pre vás, čitateľov altka.sk. Ide o pohľad na to, ako môžeme zlepšiť AI modely a dostať ich bližšie k skutočnej inteligencii.

Kľúčové poznatky

Po dôkladnom prelúštení rozhovoru sa vynára niekoľko zásadných bodov:

  • "Bitter Lesson" (Horká lekcia): Efektívne AI systémy budú musieť využívať obrovské výpočtové zdroje, najmä počas ich používania (inference), nielen pri trénovaní.
  • Neefektívnosť tréningu: Súčasné jazykové modely (LLMs) sa učia z obrovského množstva ľudských dát, čo je veľmi neefektívne.

Exponenciálny rast dátových bodov použitých na trénovanie významných systémov umelej inteligencie.

  • Závislosť od ľudských dát: Modely sa primárne učia na základe toho, čo povedali alebo urobili ľudia, čím sa obmedzuje ich schopnosť chápať svet organickým spôsobom.
  • Chýbajúce skutočné modely sveta: LLMs vytvárajú modely toho, ako by ľudia hovorili, nie toho, ako na akciu reaguje prostredie.
  • Potreba kontinuálneho učenia: Budúcnosť AI vidím v systémoch schopných učiť sa priebežne – rovnako ako my ľudia a zvieratá.

Prečo je výpočetný výkon taký dôležitý?

Richard Sutton argumentuje, že súčasné LLMs sú príliš závislé od obrovského množstva tréningových dát, ktoré pochádzajú od ľudí. Tento prístup je neefektívny a obmedzuje schopnosť AI systémov chápať svet skutočným spôsobom. Predstavte si to takto: učíme počítač, ako hovoriť, ale neučíme ho, ako funguje svet okolo neho.

Sutton nazýva tento proces "horkou lekciou" – zistili sme, že najefektívnejší spôsob, ako vytvoriť inteligentné systémy, je využívať čo najviac výpočtového výkonu počas ich používania (inference). To znamená, že by sme mali klásť väčší dôraz na optimalizáciu modelov pre efektívne fungovanie v reálnom svete, a nielen na trénovanie s obrovským množstvom dát.

Imitácia učenia a posilňovacie učenie: Dva spôsoby, ako sa učiť

Rozhovor tiež hovorí o vzťahu medzi imitáciou učenia (imitation learning) a posilňovacím učením (reinforcement learning). Imitácia učenia je proces, kedy sa model učí pozorovaním správania iných – napríklad, ako sa učí dieťa od rodičov. Posilňovacie učenie zase spočíva v tom, že model sa učí skúšaním a omylom, pričom dostáva odmenu za správne konanie a penalizáciu za nesprávne.

Sutton tvrdí, že tieto dva prístupy nie sú navzájom si vylučujúce, ale môžu sa dopĺňať. Modely, ktoré sa naučili imitovať ľudské správanie, môžu poskytnúť dobrý základ pre učenie sa skutočných modelov sveta prostredníctvom posilňovacieho učenia.

Kontinuálne učenie: Kľúč k budúcnosti AI?

Jednou z najdôležitejších myšlienok v rozhovore je potreba kontinuálneho učenia. My ľudia sa učíme neustále – adaptujeme sa na nové situácie a získavame nové znalosti počas celého života. Súčasné LLMs sú však trénované raz a potom používajú statické znalosti, čo ich obmedzuje v schopnosti prispôsobiť sa novým okolnostiam.

Umeló inteligencia: Výkon v testoch z vedomostí vs. veľkosť datového súboru

Ako môžeme dosiahnuť kontinuálne učenie u AI systémov? Sutton naznačuje techniky ako test-time fine-tuning (jemné doladenie počas používania) alebo využívanie supervised learningu (učenia pod dohľadom) ako nástroja v rámci posilňovacieho učenia.

Evolúcia a AI: Invertovaný proces?

Zaujímavý pohľad ponúka aj porovnanie evolúcie s vývojom LLMs. Evolúcia využíva meta-posilňovacie učenie na umožnenie imitácie učenia, zatiaľ čo súčasný vývoj LLMs tento proces obracia – začíname s imitáciou a dúfame v vznik cieľov a sebauvedomenia prostredníctvom posilňovacieho učenia.

Zhrnutie a úvahy

Richard Suttonova kritika súčasných LLMs je cenná, aj keď očakávam, že tieto modely dosiahnu AGI (Artificial General Intelligence) skôr ako systémy s kontinuálnym učením. Jeho argumenty však poukazujú na dôležité nedostatky – neefektívnosť, závislosť od ľudských dát a chýbajúce kontinuálne učenie.

Je jasné, že pre dosiahnutie skutočnej AI inteligencie musíme presunúť dôraz z obrovského množstva tréningových dát na efektívne využívanie výpočtového výkonu a umožniť systémom učiť sa priebežne a adaptovať sa na nové situácie. Budúcnosť AI je v kontinuálnom učení, ktoré nám umožní vytvoriť systémy, ktoré skutočne chápu svet okolo seba.

Referencie:

Hodnotenie článku:
Premýšľania o AI: Výpočetný výkon a budúcnosť strojového učenia

Hĺbka a komplexnosť obsahu (8/10)+
Povrchné / ZjednodušenéHlboká analýza / Komplexné

Zdôvodnenie: Článok hlbšie analyzuje názory Richarda Suttona a vysvetľuje komplexné koncepty ako "horká lekcia", kontinuálne učenie a vzťah medzi imitáciou a posilňovacím učením. Zohľadňuje viaceré faktory, no mohol byť ešte rozsiahlejší.

Kredibilita (argumentácia, dôkazy, spoľahlivosť) (8/10)+
Nízka / NespoľahlivéVysoká / Spoľahlivé

Zdôvodnenie: Článok sumarizuje rozhovor s uznávaným odborníkom a prezentuje jeho myšlienky zrozumiteľne. Argumenty sú logické a podložené informáciami z rozhovoru. Chýba však priame odkazovanie na zdroje okrem samotného rozhovoru.

Úroveň zaujatosti a manipulácie (3/10)+
Objektívne / Bez manipulácieZaujaté / Manipulatívne

Zdôvodnenie: Článok sumarizuje rozhovor s odborníkom a prezentuje jeho názory. Je prevažne informatívny, hoci výber témy a zdôraznenie určitých bodov môže naznačovať miernu preferenciu. Bez zjavných manipulatívnych techník.

Konštruktívnosť (8/10)+
Deštruktívne / ProblémovéVeľmi konštruktívne / Riešenia

Zdôvodnenie: Článok kritizuje súčasné trendy v AI, ale hlavne ponúka pohľad na zlepšenia a smerovanie budúceho vývoja. Zdôrazňuje potrebu kontinuálneho učenia a efektívnejšieho využívania výpočtového výkonu.

Politické zameranie (5/10)+
Výrazne liberálneNeutrálneVýrazne konzervatívne

Zdôvodnenie: Článok sa zameriava na technické aspekty umelej inteligencie a neobsahuje politické vyhlásenia ani hodnotiacu rétoriku. Analyzuje výskum a argumenty odborníka bez zaujímania o ideologickú alebo politickú diskusiu.

Približne 169 gCO₂ bolo uvoľnených do atmosféry a na chladenie sa spotrebovalo 0.85 l vody za účelom vygenerovania tohoto článku.
Mastodon