Home |

Vnorené Slová

aka viditeľne zásobníkové Jazyky

Čo sú vnorené slová?

Vnorené slov je model pre reprezentáciu dát s oboch lineárne usporiadanie a hierarchicky vnorené gigabitových položiek. Príklady údajov s takou dvojaký lineárne hierarchickej štruktúry zahŕňajú popravy štruktúrovaných programov, komentovaných lingvistických dát, a HTML / XML dokumentov. Vnorené slovo sa skladá z postupnosti lineárne usporiadaných pozícií, rozšírená s hniezdnu hrany pripojenie volania do výnosov (alebo open-tagy na close-tags ). Hrany nekrižujú vytvorenie správne vnorené hierarchickú štruktúru, a my dovoľovať niektoré hrany sa čaká. Tento hniezdenia štruktúra môže byť jednoznačne reprezentovaný sledom špecifikuje typy pozícií (hovory, výnosy, a vstavby). Vnorené slová zovšeobecniť obe slová a nariadil stromy, a umožniť tak slovo a stromov operácie. Vnorené slovo automaty --- konečných štátnej akceptory pre vnorené slová, definovať triedy regulárnych jazykov vnorených slov. Táto trieda má všetky lákavý teoretické vlastnosti, ktoré sú klasické pravidelné slovo jazyky mu vyhradené: deterministické nested slovo automaty sú rovnako expresívne ako ich náprotivky nedeterministických, trieda je uzavretý pod zjednotenie, prienik, doplnenie, zreťazenie, Kleene-*, predpony a jazykové homomorfismy , členstvo, prázdnota, jazyk začlenenie, a jazyk ekvivalencie sú rozhodnutelný a definovatelnost v monadického druhého poriadku logiky zodpovedá presne konečných štátnej poznatelnosti. Tieto výsledky zovšeobecniť na nekonečných vnorených slov tiež.

Ako sa vzťahujú k bezkontextových jazykov slov?

Vzhľadom k tomu, jazyk L vnorených slov nad abecedou, lineárne kódovanie vnorených slov dáva jazyk L 'cez označeného abecedy pozostávajúce zo symbolov označených s typom polohy. Ak je L regulárny jazyk vnorených slov, potom L 'je kontext-voľný. V skutočnosti, zásobníkový automat prijíma L 'má zvláštnu štruktúru: pri čítaní hovoru, musí byť automat tlačiť jeden symbol, pri čítaní spiatočnej symbol, musí pop jeden symbol (ak je zásobník non-prázdna), a pri čítaní interný symbol, môže aktualizovať iba jeho kontrolnej stav. Hovoríme napríklad automaty viditeľne zásobníkové automaty a trieda slovo jazykov prijmú viditeľne zásobníkový jazykov (VPL). Vzhľadom k tomu, naše automaty môžu byť determinized, VPLS zodpovedajú podtriedy deterministických bezkontextových jazykov (Vyhláška). VPLS zovšeobecniť na paranthesis jazykov, v zátvorkách, jazyky, a vyváženými jazyky, a majú lepšie vlastnosti ako záverečná kompaktných žiariviek, DCFLs, alebo paranthesis jazyky. Domnievame sa, že pre algoritmické overenie štruktúrovaných programov, neotvárať program ako bezkontextové jazyku cez slová, jeden by mal zobraziť ako pravidelnú jazyk vnorených slov (alebo ekvivalentne, viditeľne zásobníkový jazyk), a to by umožnila modelu kontrola mnohých vlastností (napr. zásobník inšpekcia, pre-post podmienky), ktoré nie sú vyjadriteľné v existujúcich špecifikácií logiky. Všeobecne platí, že zásobníkové automaty slúžia dva rôzne účely: objavovanie hierarchickú prispôsobenie, a spracovanie / dopytovania zladenie. V aplikáciách, kde sa len druhý účel je dôležité (ako v programe analýze), možno nahradiť zásobníkový automat s NWAs s mnohými výhod.

Ako sa vzťahujú k objednané stromy?

Dáta s duálnou lineárny hierarchickej štruktúry je tradične modelovaná pomocou binárne, a všeobecnejšie, pomocou objednal unranked, stromy, a pýtať pomocou stromu automatov. V objednané stromy, sú uzly s rovnakým rodičom lineárne nariadil, a klasické stromové traversals ako prípona (alebo do hĺbky zľava doprava) môže byť použitý na definovanie implicitné usporiadanie všetkých uzlov. Ukazuje sa, že, ploty, kde zabezpečenie je postupnosť objednaných stromov, sú zvláštne trieda vnorených slov, a síce, že tie zodpovedajúce Dyck slov, a pravidelné zaisťovacie jazyky zodpovedajú vyvážené jazykov. Pre spracovanie dokumentov, vnorené slová sa majú mnoho výhod oproti usporiadaných stromov. Tree-based charakter implicitne predpokladá, že vstupné lineárne dáta môžu byť analyzované do stromu, a tak, nikto nemôže reprezentovať a spracovávať dáta, ktoré nemusí analyzovať správne. Word operácie, ako je predponami, príponami a zreťazenie, pričom prirodzené spracovanie dokumentov, nemajú podobné stromu operácie. Po druhé, môže strom automaty prirodzene vyjadriť obmedzenia na poradí štítkov pozdĺž hierarchickej cesty, a tiež pozdĺž odišiel-k-pravej súrodencov, ale majú problémy zachytiť obmedzenia, ktoré odkazujú na globálny lineárne poradí. Napríklad, dotaz, že vzorce p1, ... pk sa objaví v dokumente v tomto poradí kompiluje do deterministický automat slovo (a teda deterministický NWA) lineárny veľkosti, ale štandardné deterministické bottom-up strom automat pre tento dotaz musí byť veľkosť exponenciálny k. NWAs môže byť videné ako druh stromu automatov tak, aby obaja bottom-up strom automaty a top-down tree automaty sú špeciálne prípady. Tieto výsledky naznačujú, že dotaz môže byť viac stručne zakódovaný vo vnorené slová pohľadu komplexnosti dávok vnorené slovo automat prečíta slovo zľava doprava, spracovanie hniezdenia hrany, ako a kedy dorazia. To zodpovedá s SAX API for XML, a tým má prirodzené užívanie vo streamovaných algoritmov.

Referencie

Model vnorených slov prešla niekoľkými iterácií: Pozri Viditeľne zásobníkové jazykov , Alur a Madhusudan, stočí 2004 a pridanie vnorenia štruktúry slov , Alur a Madhusudan; DLT 2006. Odporúčame prečítaní tento jednotný plnú verziu (Journal of ACM, 2009). zvaná prednáška na CSR 2007 je tiež dobrým východiskovým bodom. Došlo k rozsiahlej sledovanie výskum. Najmä, Mozafari et al navrhli a implementovali state-of-the-art dopytu procesor pre XML dokumenty zakorenené v tejto teórii (pozri High-performance komplexné spracovanie udalostí cez XML prúdy , víťaz z najlepších papiera ocenenie v SIGMOD 2012); a Driscoll et al zaviedli rôzne konštrukcie na NWAs do open-source knižnice OpenNWA (CAV 2012), ktorá bola použitá pre rad problémov v programe analýze. Účelom tejto stránky je sledovať najnovšie výsledkov týkajúcich sa tejto témy. Napíšte mi, s názormi a / alebo navrhnutých dodatkov.

Ďalšie rozhodnutie Problémy dobrovoľných dohôd o partnerstve / NWAs

Viditeľne zásobníkové hry, poľahnutiu, Madhusudan, a Serre, FSTTCS 2004.
Viditeľne zásobníkové automaty: Od jazyka rovnocennosť na simuláciu a bisimulation, Srba, CSL 2006.
Pravidelnosť problémy čitateľne zásobníkový jazykov; Baran, Plniace a Serre; STACS 2006.
Na členstvo problém pre čitateľne zásobníkový jazykoch, La Torre, Napoli, a Parente; ATVA 2006.

Zhodnosť a minimalizácia

Zhodnosť pre čitateľne zásobníkový jazykov; Alur, Kumar, Madhusudan, a Viswanathan, ICALP 2005.
Minimalizácia, učenie, a zhody testovania logických programov, Kumar, Madhusudan, a Viswanathan, CONCUR 2006.
Minimalizácia varianty viditeľne zásobníkových automatov, Chervet a Walukiewicz, MFC 2007.

Časové a Fixpoint logiky; expresivity

Temporálnej logika vnorených volaní a výnosov, Alur, Etessami, a Madhusudan; TACAS 2004.
Regulárne jazyky vnorených slov: pevné body, automaty, a synchronizácia, arény, Barcelo, a Libkin; ICALP 2007.
Prvého poriadku a temporálnej logiky pre vnorených slov, Alur, Arenas, Barcelo, Etessami, Immerman, a Libkin, krajiny s nízkymi príjmami 2007.
Striedavý automaty a časové Fixpoint kalkulus čitateľne zásobníkový jazykov, Bozzelli, CONCUR 2007.
Gramatická reprezentácie čitateľne zásobníkového jazykov, Baran a Barringer; WoLLIC 2007.
Vážené logiky pre vnorené slov a algebraické formálne Mocninová radu, Matissen, ICALP 2008.

Špecifikácie pre program analýzy

VPA-založené aspekty: Lepšia podpora pre AOP cez protokoly, Nguyen a Sudholt; SEFM 2006.
Instrumenting C programy s vnorenými slovo monitory, Chaudhuri a Alur, SPIN 2007.
Súhrnnú monitoruje bezpečnostných vlastností - tentoraz s volaním a výnosov; Rosu, Chen, a loptu, RV 2008.
Temporal zdôvodnenie procesných programov, Alur a Chaudhuri; VMCAI 2010.
Vnorené interpolants; Heizmann, Hoenicke, a Podelski; popl 2010.
Kontrola kompatibilitu výrobcov a spotrebiteľov; Drscoll, Burton, a opakovanie; FSE 2011.
Secure programovanie cez čitateľne zásobníkový bezpečnostných hry; Harris, Jha, a opakovanie; CAV 2012.
OpenNWA: vnorené slovo automat knižnica; Driscoll, Thakur, a opakovanie; CAV 2012.

XML Spracovanie a Tree automatov

Viditeľne zásobníkové výraz efekty pre spracovanie prúdu XML, Džbán, PLAN-X 2005.
Viditeľne zásobníkové jazyky pre streaming XML, Kumar, Madhusudan, a Viswanathan, WWW 2007.
Vziať si slová a stromy, Alur, Pods 2007.
Prepisovanie viditeľne zásobníkového jazykov pre XML integráciu dát; Thom a Venkatesh; CIKM 2008.
Streamovanie strom automaty; Gauwin, Niehren, a Roos, písmená spracovanie informácií 2009.
Najstaršie dotaz odpovedal na deterministické vnorené slovnej automatom; Gauwin, Niehren, a Tison; FCT 2009.
Otázka automaty pre vnorené slová, Madhusudan a Viswanathan; MFCS 2009.
Od regulárnych výrazov na vnorené slov: Zjednotenie jazykov a spustenie dotazu pre relačné a XML sekvencií; Mozafari, Zeng, Zaniolo; VLDB 2010.
Vysoko výkonný komplex pre spracovanie udalostí cez XML prúdov; Mozafari, Zeng, Zaniolo; SIGMOD 2012.
Streamable fragmenty dopredu XPath, Gauwin a Niehren, CIAA 2012.
Čoskoro XPath node výber na XML prúdov; Debarbieux, Gauwin, Niehren, Sebastian, a Zergaoui; 2012.

Prevodníky

Viditeľne zásobníkové prevodníky pre orientačné overenie streaming XML, Thom, Venkatesh, a Ye, FoIKS 2008.
Viditeľne zásobníkové prevodníky, Raskin a Servais, ICALP 2008.
Rovnocennosť deterministické vnorené aplikácie Word do programu Word prevodníky; Staworko, Laurence, Lema, Niehren; FCT 2009.
Vlastnosti viditeľne zásobníkové prevodníky, E. Filiot, J.-F. Raskin, P.-A. Reynier, F. Servais a J.-M. Talbot, MFCS 2010.
XEvolve: Schéma XML Evolution rámec; F. Picalausa, F. Servais a E. Zimаnyi; SACSVT 2011.
Streaming strom prevodníky, R. Alur a L. D'Antoni, ICALP 2012.

Vnorené Stromy

Počet Fixpoint pre miestne a globálne programu tokov, Alur, Chaudhuri, a Madhusudan; popletie 2006.
Jazyky vnorených stromov, Alur, Chaudhuri, a Madhusudan, CAV 2006.
Viditeľne zásobníkové jazyky a dlhodobé prepisovanie, Chabin a Rety; FroCos 2007.
Viditeľne Tree Automaty s pamäťou a obmedzenia, bývalého Sovietskeho zväzu, Lundh, Jacquemard, Perrin, Logické metódy v informatike 2008.

Slová s viac Nestings

Poznámka o vnorených slov; Blass a Gurevič; Microsoft Research TR, 2006.
Robustný trieda kontextových jazykov, La Torre, Madhusudan, a Parlato; LIC 2007.
2-Viditeľne zásobníkové automaty, Carotenuto, Murano, a Peron, DLT 2007.
Realizovateľnosti paralelných rekurzívne programov; Bollig, Grindei, a Habermehl; FoSSaCS 2009.

Nové výsledky Používanie viditeľnosť hovorov / Vracia

Tretieho rádu idealizovaný Algol s iterácii je rozhodnutelný, Murawski a Walukiewicz; FoSSaCS 2005.
Synchronizácia zásobníkových automatov, Caucal, DLT 2006.
Výroková dynamická logika rekurzívne programy, Plniace a Serre; FoSSaCS 2006.
Výška deterministický zásobníkové automaty, Nowotka a Srba, MFCS 2007.
Nekonečný automat charakteristika dvojitého exponenciálneho času, La Torre, Madhusudan, a Parlato; CSL 2008.

Náročné otvorený problém

Zvážte nasledujúce rozhodovacie problém: mať dva regulárne jazyky L1 a L2 vnorených slov, to existuje regulárny jazyk R slov nad abecedou označeného tak, že priesečník (R, L1) sa rovná L2? Toto nie je známe, že rozhodnutelný, a to aj pre špeciálny prípad, že L1 je množina všetkých dobre zhodou slov.Motivácia je nasledovné: všeobecne, skontrolujte, či je vstupné patrí do L2, spracovanie stroj potrebuje stack. Predpokladajme však, že už máme nejaké ďalšie vedomosti o vstupe, že patrí do množiny L1 (napríklad, môžeme vedieť, že vstup je dobre uzavreté), možno tieto znalosti použiť na zostrojenie DFA také, že pre vstupy v L1, je schopný rozhodnúť, členstvo v L2. Tento problém je inšpirovaný papierových "Overovanie streaming XML dokumentov" podľa Segoufin a Viana, struky 2002, ktorý tiež predstavuje čiastočné riešenie. Preložené z http://www.cis.upenn.edu/~alur/nw.html Homepage

...