Chart parsing a NP-úplnost

30. 3. 2012 20:05 zboj

Zpracování přirozeného jazyka

Už jsem zde stručně představil unifikační gramatiky. Také jsem uvedl, že algoritmus pro parsing podle takové gramatiky je NP-úplný (tj. v nejhorším případě zřejmě exponenciální). Typická unifikační gramatika má generativní sílu větší než bezkontextové gramatiky a dokonce větší než mírně kontextové (angl. mildly context-sensitive), tzn. že délka slova při aplikaci pravidel roste více než lineárně (např. exponenciálně).

Vzhledem k velké výpočetní i prostorové složitosti algoritmu se používá pro parsing dynamické programování. Speciální datová struktura chart reprezentuje dílčí zpracované podřetězce, čímž výrazně zvyšuje rychlost parsingu (omezením backtrackingu, algoritmus ovšem i nadále zůstane exponenciální).

Chart parsing je typu bottom-up, takže nemá problém s levou rekurzí a v případě zkracujících pravidel vždy skončí (takové gramatiky ovšem nejsou v praxi běžné). Časová náročnost algoritmu není u reálných gramatik až tak strašná, vzhledem k používání dalších omezujících podmínek (subkategorizace) je parsing většinou polynomiální. Spolehnout se na to ale nelze.

Koho problematika zajímá, snadno na internetu najde články k tématu např. od Hanse Uszkoreita.

Související články na blogu Zmatení (programovacích) jazyků
- Sensus communis 11. 2. 2014 19:58
- Kognitivní asistent 16. 1. 2014 23:52
- Ptáci létají 29. 10. 2013 1:30
- Ontologická promiskuita 15. 9. 2013 0:52
- Apple a jazyk 7. 4. 2012 22:43
- Statistický strojový překlad 16. 3. 2012 12:21

Přidat názor

5. 4. 2012 10:45

stewe (neregistrovaný)

tvrdenie ze .... NP-uplny (tj. v nejhorsim pripade zrejme exponencialni) sa mi nezda dostatocne presne. Ja mam pocit, ze kazdy NP jazyk je exponencialny na deterministickom turingovom stroji, samozrejme ked sa bavime o casovej zlozitosti, a polynomialny na nedeterministickom. Mysleli ste to teda tak, ze algoritmus pre ten parsing -- ktory je simulovany na deterministickom vypoctovom modeli -- je v najhorsom pripade exponencialny?
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
5. 4. 2012 10:54

zboj (neregistrovaný)

Jen jsem se snažil naznačit, že zatím nikdo nedokázal, že pro NP-úplné úlohy neexistuje polynomiální deterministický algoritmus.
Nezávisle na této teoretické poznámce to je, jak píšete - onen algoritmus pro parsing je v praxi v nejhorším případě exponenciální (ve skutečnosti to jde u přirozených jazyků většinou polynomiálně a dokonce existuje jazyk bez rekurze, ale bavíme se o O(n)).

Přidat názor

Sdílet

Související články na blogu Zmatení (programovacích) jazyků

Sensus communis 11. 2. 2014 19:58

Kognitivní asistent 16. 1. 2014 23:52

Ptáci létají 29. 10. 2013 1:30

Ontologická promiskuita 15. 9. 2013 0:52

Apple a jazyk 7. 4. 2012 22:43

Statistický strojový překlad 16. 3. 2012 12:21

zboj

Nejčtenější články autora

Poslední názory

Témata

Chart parsing a NP-úplnost

Sdílet

Související články na blogu Zmatení (programovacích) jazyků

Sensus communis 11. 2. 2014 19:58

Kognitivní asistent 16. 1. 2014 23:52

Ptáci létají 29. 10. 2013 1:30

Ontologická promiskuita 15. 9. 2013 0:52

Apple a jazyk 7. 4. 2012 22:43

Statistický strojový překlad 16. 3. 2012 12:21

zboj

Nejčtenější články autora

Poslední názory

Témata

Dále u nás najdete

OSVČ senioři letos v přehledech uplatní slevu na pojistném

Prima v tichosti zpřísnila podmínky přetáčení reklam

Pálení žáhy zhoršuje nevhodná večeře. Vadí přejídání i kafe

Petr Šmíd: Když startupy rostou, české fondy je opouštějí

30 % nákladů díky AI dolů, ale nuda v práci jde nahoru

Malware, ransomware a další online hrozby: Jak se liší?

Ke kuplířství nedocházelo, říká obžalovaný z kauzy Sex.cz

Google Pixel 10a má plochý design a vylepšenou odolnost

České firmy pod náletem kyberútoků. Počet vzrostl o pětinu

Google uvádí Gemini 3.1 Pro a přidává působivé benchmarky

Počet nových pracovních míst prudce klesá

Co chceme od AI asistentů? Návrhy odpovědí a třídění pošty

Nový model OpenAI kóduje 15krát rychleji než jeho předchůdce

Agentické nakupování mění pravidla e-commerce

USA chystají web na obcházení blokací obsahu

Začínající podnikatel: Základní termíny a marketing

Handicap proměnila v úspěšný byznys, učí ženy nosit paruky

Nejen daňové přiznání, OSVČ musí podat elektronicky přehledy

Připravit, pozor, teď! Spouštíme Channeltrends Awards 2025

Analýza rozebrala moderování Jílkové v Máte slovo