Siri, potřebuju se zbavit těla

2. 12. 2011 15:59 (aktualizováno) zboj

Umělou inteligencí je lidstvo fascinováno odnepaměti, už ve starém Egyptě či antickém Řecku se filozofové zabývali stroji myslícími jako člověk. Teprve počítače učinily tuto myšlenku realizovatelnou a zdá se, že právě letos se objevila první komerční aplikace umělé inteligence, která je použitelná: automatický asistent Siri v iPhonu 4S.

Vše je seznam

Ve třicátých letech došlo k rozvoji formální logiky, algoritmizace a vůbec všeho, co dnes známe jako teorie vyčíslitelnosti. Zpětně se ukazuje, že velkým pokrokem byl lambda kalkul, jejž vynalezl Alonzo Church. Na ten navázal po válce John McCarthy, když se snažil vymyslet způsob zápisu libovolného algoritmu, který by byl jednodušší než Turingův stroj. Výsledkem jeho čistě teoretické práce byla první verze Lispu. McCarthy byl nemálo překvapen, když jeden z jeho studentů, Steve Russell, napsal program schopný lispovské výrazy vyhodnocovat na počítači. Zrodil se tak jeden z vůbec prvních jazyků vyšší úrovně.

Lisp se stal populárním zejména na poli umělé inteligence, a to díky své jednoduché syntaxi založené na symbolických výrazech (jedinou datovou strukturou je seznam), formální síle a v neposlední řadě absenci alternativy. Protože tehdejší počítače výkonem zrovna neoplývaly, vznikal pro systémy psané v Lispu speciální hardware. Než se ale stihl prosadit, výkon běžných počítačů se zvýšil natolik, že pro Lisp postačoval.

I když dnes je Lisp jazykem spíše okrajovým, přímo či nepřímo ovlivnil většinu dnešních programovacích jazyků. Jako první používal automatickou správu paměti, inkrementální kompilaci, virtuální stroj atd. A veleužitečné lambda výrazy se dostaly do C++ až letos s novým standardem jazyka (C++11).

Vynález gramatiky

Přestože Noam Chomsky není a nikdy nebyl informatikem, zcela změnil kromě formální jazykovědy právě informatiku, konkrétně tvorbu překladačů a interpretů. Chomského fascinovalo, že malé děti jsou schopny naučit se perfektně jazyk, přestože v prvních letech života přijdou do styku jen s velice omezenou množinou vět. Jeho vysvětlení, mimochodem dodnes kontroverzní, předpokládá v lidském mozku existenci mechanismu, ve kterém je struktura jazyka zakódována, a parametrů, které každé dítě získá v prvních letech života z okolí. Chomsky šel ještě dál a tento domnělý mechanismus popsal. Jako Američanovi mu byl bližší lingvistický deskriptivismus spíše než evropská funkcionální jazykověda, inspiroval se proto bezprostředními složkami Leonarda Bloomfielda a vytvořil systém formálních přepisovacích pravidel. Zrodila se tak formální gramatika.

Přestože v jazykovědě má Chomského teorie dodnes odpůrce, v informatice způsobila doslova revoluci. Jak se totiž záhy ukázalo, nejobecnější typ Chomského formální gramatiky je ekvivalentní Turingovu stroji, takovou gramatikou lze tedy vyjádřit libovolný algoritmus. Omezenější typ gramatik je zase ekvivalentní regulárním výrazům. A hlavně, bezkontextové gramatiky jsou základem většiny dnešních programovacích jazyků, protože pro ně existují efektivní algoritmy pro analýzu (parsing).

Chomského zásluhou je oddělení syntaktické struktury od sémantiky. Jeho slavná věta Colorless green ideas sleep furiously je v angličtině naprosto v pořádku, i když postráda význam. Přeházíme-li slova (např. takto: Furiously sleep ideas green colorless), dostaneme nesmysl. Rozdíl mezi těmito větami je ten, že první z nich je, vyjádřeno Chomského terminologií, generována formální gramatikou anglického jazyka. Podobně v programovacím jazyce můžeme napsat x / 0, což je syntakticky naprosto korektní výraz (je-li x číselná proměnná), ale sémanticky je to nesmysl, protože nulou se dělit nedá.

Confusio linguarum

S Chomským vliv jazykovědy na informatiku nekončí. Kromě projektů zabývajících se umělou inteligencí vznikaly po válce také projekty mající za cíl strojový překlad. Ve Spojených státech byla většina financována z vojenského rozpočtu, protože v době studené války mělo ministerstvo obrany eminentní zájem na automatické analýze textů v ruštině.

Pro implementaci zpracování přirozeného jazyka chyběl vhodný formalismus. Jedním z prvních byly Q-systémy vytvořené Francouzem Alainem Colmerauerem v Kanadě. Jeho projekt byl orientován prakticky a výsledkem práce jeho týmu byl vůbec první úspěšně nasazený systém strojového překladu. Nazýval se METEO a překládal z angličtiny do francouzštiny předpovědi počasí.

I když byly Q-systémy ekvivalentní Turingovu stroji (bylo v nich možné implementovat Chomského gramatiky typu 0, tedy ty nejobecnější), jednalo se spíše o doménově specifický jazyk, který se pro něco jiného než zpracování přirozených jazyků příliš nehodil. Přímo ale ovlivnily pozdější jazyky pro logické programování, které převzaly koncepty jako deklarativní zápis pravidel, unifikaci či nedeterministické vyhodnocování výrazů.

Programujme logicky

Když se Alain Colmerauer vrátil do Francie, vytvořil tým na univerzitě v Marseille pod jeho vedením Prolog. Tento jazyk vyšel z Q-systémů, byl ale univerzálně použitelný. Podobně jako jsou podstatou Lispu lambda výrazy, Prolog je založen na Hornových klauzulích. První interpret napsal jmenovec prvního implementátora Lispu Steva Russella, Philippe Roussel. Programy v Prologu byly zpočátku interpretovány, teprve na začátku 80. let vymyslel David Warren bajtkód a k němu virtuální stroj (tzv. WAM – Warren's abstract machine) a pro Prolog začaly vznikat překladače.

Většina programátorů jistě zná Prolog ze studií, nemá tedy smysl se tu o něm rozepisovat. Připomeňme, že narozdíl od imperativních jazyků (kam spadají i objektově orientované jazyky) v Prologu program nepopisuje, jak problém řešit, ale co se má řešit. To se ovšem snáze řekne, než udělá, proto byl Prolog postupně rozšířen o některé koncepty z imperativních jazyků. Výpočet například není striktně nedeterministický (jako u Q-systémů), byla přidána negace, řez apod. Zastánci čistě logického programování to sice považují za zcestné, ale z praktického hlediska to umožňuje psát v Prologu efektivnější programy.

Pátá generace počítačů

V 80. letech Prolog zpopularizoval projekt japonského Ministerstva mezinárodní obchodu a průmyslu, jehož cílem bylo vyvinout počítač páté generace. V předchozích desetiletích Japonci ovládli americký trh se spotřební elektronikou a automobily a nyní si vytyčili cíl dobýt trh s počítači. Zmíněné ministerstvo si totiž nechalo vypracovat nákladnou studii, ze které vyplynulo, že odvětvím budoucnosti je informatika. Byl vytvořen Institute for New Generation Computer Technology a konsorcium největších japonských společností se pustilo do výzkumu a vývoje.

Cílem Japonců bylo vyvinout zcela nový hardware, odklánějící se od von Neumannovy architektury, a k němu operační systém umožňující komunikaci v přirozeném jazyce. V roce 1985 byl do provozu uveden první takový počítač, Personal sequential inference machine. Operační systém byl napsán v KL0, což je zkratka z Kernel language. KL0 nebylo nic jiného než Prolog upravený pro paralelní výpočty.

Rozhodnutí vyvinout zcela nový počítač bylo dáno slabým výkonem tehdejšího hardwaru. A protože výsledkem nemělo být nic menšího než funkční umělá inteligence, rozhodli se vědci ve fázi plánování vyvinout nový operační systém v Prologu. Vyvinuté počítače měly stovky procesorů a veškeré aplikace využívaly služeb jádra napsaného v KL0 (a později v ještě paralelizovějším Prologu KL1).

Projekt bohužel nakonec skončil neúspěchem, respektive předběhl svoji dobu. Dal ovšem akademické obci mnoho výsledků ohledně reprezentace znalostí apod.

Armáda spásou

Jak známo, do vědy jsou politici ochotni investovat velké peníze v zájmu obrany, což je důvod, proč pod americkým ministerstvem obrany existuje agentura Defense Advanced Research Projects Agency (DARPA). Jedním z projektů této agentury byl vývoj malého zařízení spojujícího rozpoznávání a generování řeči a automatického překladu. Výsledkem projektu byla krabička, se kterou běhali američtí vojáci po iráckém bojišti a mohli se díky ní domluvit s civilním obyvatelstvem. Prostě řekli něco anglicky a ze sluchátek zaznělo to samé v irácké arabštině (starší verze jen vypisovala překlad na obrazovku, než generálové do vlasti poslali hlášení, že velká část obyvatel neumí číst). V současnosti pracuje DARPA na podobném projektu, jen jde o překlad mezi angličtinou a perštinou. Asi čekají válku s Íránem.

Projekt CALO patřil v DARPĚ k těm větším, pracovaly na něm stovky vědců. Cílem bylo vyvinout automatického asistenta, kterému můžete položit otázku a on na základě databáze znalostí odpoví. Později byl tento projekt vyčleněn do samostatné firmy, která vyvinula aplikaci Siri pro iPhone a nakonec byla koupena Applem.

Celý tento dlouhý vývoj od Turingova stroje přes lambda výrazy, Lisp, Chomského fascinaci fungováním dětského mozku, Q-systémy a japonskou ambicióznost až po snahu (nejen) amerického ministerstva obrany mít na bojišti i v zázemí lepší technologii než nepřítel vedl k tomu, že když iPhonu dnes řeknete větu z nadpisu tohoto článku, příjemný ženský hlas vám ve zlomku vteřiny odpoví: „Přejete si seznam přehrad, dolů, skládek, nebo močálů?“

Přidat názor

2. 12. 2011 13:30

skrat (neregistrovaný)

Wikivycuc, ale pekny. Co tak nieco aktualne? Chysta sa revolucia zbrusu novych konceptov? Alebo jazyk kvantovych pocitadaiel?
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
2. 12. 2011 14:12

honzas (neregistrovaný)

Pozor - regulární jazyky != regulární výrazy . Regulární jazyky jsou přijímány konečnými automaty, zatímco většinu současných dialektů regulárních výrazů není možné do konečného automatu převést, pro jejich parsování se používá backtracking (věci jako lookahead, backreferences znemožňují zkonstruování rozumného konečného automatu)!
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
2. 12. 2011 14:25

zboj (neregistrovaný)

@2 Jestli se parsují backtrackingem, tak už nejsou regulární, ale bezkontextové. A pak pro ně neexistuje nejen "rozumný" konečný automat, ale vůbec žádný.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
2. 12. 2011 14:33

zboj (neregistrovaný)

@1 Spíše evoluce než revoluce, např. rámcové jazyky.
Místo Wikipedie doporučuji raději Les systèmes Q ou un formalisme pour analyser et synthétiser des phrases sur ordinateur (Colmerauer) a La naissance de Prolog (Colmerauer, Roussel). O projektu páté generace počítačů je na Wiki nejvíce informací ve španělské verzi (z evropských jazyků, japonsky neumím). K Chomskému existuje spousta literatury i v češtině.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
3. 12. 2011 14:30

Norvig (neregistrovaný)

Pekny popis "klasicke AI", ktere vsak ma se Siri malo co spolecneho :)
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
3. 12. 2011 14:55

zboj (neregistrovaný)

@5 Siri používá znalostní reprezentaci a inferenci velmi podobnou té prologovské. Navíc ale integruje databáze a vyhledávače.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
3. 12. 2011 16:22

vha (neregistrovaný)

@2 Regulární výraz je přesně definovaný matematický formalizmus, který má opravdu stejnou vyjadřovací sílu jako konečné automaty. Takže bych se nebál říct, že regulární výrazy = regulární jazyky (ve smyslu popisné síly vzhledem k jazykové ekvivalenci).
Který dialekt regulárních výrazů je silnější než klasické regulární výrazy? Já se nemohu v paměti žádného takového dopátrat. To, že se pak 'pattern matching' implementuje jinak než převodem na (N)FA nemusí nutně znamenat, že jde o silnější prostředek.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
3. 12. 2011 19:28

Norvig (neregistrovaný)

@6 "inferenci velmi podobnou té prologovské" zdroj?
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
4. 12. 2011 0:36

orangutansiri (neregistrovaný)

8 zdroj: Jak myslí Steve Jobs.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
4. 12. 2011 16:50

honzas (neregistrovaný)

@7 V Pythonu (http://docs.python.org/library/re.html) je takovým příkladem výraz (?P=name) , tj. "text, který matchuje předchozí uzávorkovaná skupina pojmenovaná name". Zde se předchozí shoda musí uložit a pak vůči ní porovnat. Základní regulární výrazy (operátory . * ? + | atd.) samozřejmě na konečný automat převést lze.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
5. 12. 2011 23:42

. (neregistrovaný)

/o\
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
6. 12. 2011 8:34

PH (neregistrovaný)

@8 Osobní zkušenost. Když jsem pracoval v DFKI, občas tam na seminářích nebo kolokviích přednášel někdo z institucí, které se na tom projektu podílely.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
7. 12. 2011 8:22

Norvig (neregistrovaný)

@12,9: Jedna pani povidala a beletrie nejsou relevantni zdroje. Neznaly ctenar by snadno mohl nabyt dojmu, ze moderni AI je postavena na prologu a ne na pravdepodobnostnich modelech.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
7. 12. 2011 9:00

zboj (neregistrovaný)

@13
1. Evidentně jsi v životě nebyl na univerzitě, vědecká konference není "jedna paní povídala".
2. Články od týmu projektu CALO jsou plné zmínek o Prologu, stačí mít něco v hlavě a vědět, jak funguje Citeseer.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
7. 12. 2011 10:19

stepo (neregistrovaný)

@13: Moc pěkný článek. Škoda, že takto "ukrytý" v odkazu na web diskutujícího, snadno by ho člověk přehlédnul. Ale musím souhlasit. Když jsem se tomuto tématu začal nedávno věnovat trochu více hlouběji, docela mě překvapilo (a stále se s tím vyrovnávám ;)), že moderní AI, machine learning a pattern recognition (omlouvám se za ty anglické názvy) jsou převážně založené na statistických modelech.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
7. 12. 2011 10:56

zboj (neregistrovaný)

@15 Na statistických modelech není založené vše. Konkrétně v komputační lingvistice existují dva rovnoměrně zastoupené směry, pravidlový a statistický (v pozadí stojí ještě EBMT). NLP se obvykle zahrnuje pod AI, ale jiná část AI, reprezentace znalostí a reasoning (inference), používá téměř výhradně systémy založené na pravidlech, tedy logické programování. Konkrétně Siri používá statistické metody pro rozpoznávání řeči a vyhledávání v databázích a pravidlové komponenty pro analýzu řeči (textového přepisu), porozumění otázce nebo pokynu a pro ontologii (zasazení do kontextu). Články z projektu CALO zmiňují přímo Prolog (a také Lisp).
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
7. 12. 2011 11:54

Norvig (neregistrovaný)

@15 Dalsi "oci otevirajici" clanek http://www.stanford.edu/class/cs124/AIMagzine-DeepQA.pdf

Přidat názor

Sdílet

zboj

Nejčtenější články autora

Poslední názory

Témata