Názor ke článku ChatGPT: Umělá inteligence programuje podle textového zadání v češtině od František Ryšánek - > Proste nikdo nevi jak AI funguje. S veškerou...

  • 16. 12. 2022 18:20

    František Ryšánek

    > Proste nikdo nevi jak AI funguje.

    S veškerou úctou, troufnu si nesouhlasit.
    Lidi kteří tyhle systémy staví a postupně vylepšují, momentálně jsme od obrazových deep-learning záležitostí pokročili k transformers, GPT a tak... vědí na poměrně mnoha úrovních, jak ta věc funguje. Jinak by nedokázali na té architektuře dál makat.

    Nejsem odborník, ale pokud mohu soudit, problém je zhruba v tom, jak získat nějaký vnější vhled do naučených "znalostí". Konkrétně u jazykových modelů, rozložit si to klubko různě tlustých nití a špagátků po stole a najít v tom nějaký smysl, strukturu... Téhle úrovni chybí "debugger". A taky ne tak docela. Třeba pro "deep" architektury s konvolučními vrstvami, používané na zpracování obrazu, existují nástroje, které nějakým způsobem zobrazí naučené "mapy" v různých vrstvách sítě. A třeba Ray Kurzweil ve své knížce tvrdí, že když před dnes už desítkami let pracovali na jazykových modelech (tuším pro zpracování psané a mluvené řeči, tehdy na bázi LSTM/RNN) tak dokázali pozorovat málem na úrovni jednotlivých neuronů, jak se síť sama učí pravidla a výjimky v jazyce, které by třeba lidský analytik/progra­mátor měl problém postřehnout a explicitně zapsat. Čili nějaké nástroje na to měli/mají.

    Pokud mohu soudit, čím vyšší úrovně abstrakce je architektura schopna, tím hůř se to naučené klubíčko rozplétá. Jako že vzít naučený model "deep" ANN a převést ho na vztahovou síť ve stylu klasického expertního systému... jestli nakonec není problém v tom, že naše kapacita vědomě chápat složitější vztahová klubíčka je omezená :-) Ve všem hledáme jednoduché pochopitelné struktury, snažíme se dekomponovat problém na subsystémy, se kterými si jednotlivě dovedeme poradit... A navíc ta "naučená mentální mapa" nemá formát dat jako experní systém. Každý neuron má větší počet různě významných příspěvků od různých výstupů "předchozí vrstvy"...

    Pokud mohu soudit, i dnešní systémy fungují tak, že mají určitou rigidní architekturu, řekněme "blokovou topologii" či vrstevnatost - až na některé experimentátory tato není běžně automaticky evolvována. Ostatně jak byste takové evoluci definoval kriteriální funkci? Myslím nějakou prakticky použitelnou v rámci genetického algoritmu. Tzn. makro-topologie systému bývá dnes daná, a pouze se učí data ze vstupního materiálu. Tady se nedivím lidem, kteří třeba staví systémy typu "language model", a smějí se jiným lidem, kteří u takových systémů doufají ve spontánní emergenci AGI. A už ujíždím off topic :-)