| Tekst :: Walanced Extract-gescheiden tekstsequenties uit snaren |
Download nu |
Tekst :: Walanced Rangschikking & Samenvatting
- Vergunning:
- Perl Artistic License
- Naam uitgever:
- Damian Conway
- Uitgever website:
- http://search.cpan.org/~dconway/
Tekst :: Walanced Tags
Tekst :: Walanced Beschrijving
Extract gescheiden tekstsequenties van snaren Tekst: Balanced is een PERL-module voor het uitpakken van gescheiden tekstsequenties van Strings.Synopsis Gebruik tekst :: Balanced QW (Extract_delimited Extract_Bracketed Extract_Quotelike Extract_codeblock Extract_variable Extract_Tagged Extract_Multiple Gen_Delimited_Pat Gen_Extract_Tagged); # Extracteer de initiële substring van $ tekst die wordt gescheiden door # twee (ongeculaire) voorbeelden van het eerste teken in $ DELIM. ($ geëxtraheerd, $ rest) = extract_delimited ($ tekst, $ delim); # Extraheer de initiële substring van $ Tekst die bracketed # is met een scheidingsteken (en) die is opgegeven met $ DELIM (waarbij de tekenreeks # in $ DELIM een of meer van '() {} []') bevat. ($ geëxtraheerd, $ rest) = extract_bracketed ($ tekst, $ delim); # Extraheer de eerste substring van $ tekst die wordt begrensd door # een XML-tag. ($ geëxtraheerd, $ rest) = extract_tagged ($ tekst); # Extraheer de initiële substring van $ Tekst die wordt begrensd door # A C ... C-paar. Sta niet toe dat geneste C-tags ($ geëxtraheerd, $ rest) = extract_tagged ($ tekst, "begin", "einde", undef, {bad => }); # Extracteer de initiële substring van $ Tekst die een # PERL "QUOTE of QUOTE-AFSCHRIJVING" vertegenwoordigt ($ geëxtraheerd, $ rest) = extract_quotelike ($ Text); # Extraheer de initiële substring van $ Tekst die een blok # van Perl-code vertegenwoordigt, bracketed door een van de tekens (en) die is opgegeven door $ DELIM # (waarbij de snaar $ delim een of meer van '() {} []' bevat) . ($ geëxtraheerd, $ rest) = extract_codeblock ($ tekst, $ delim); # Extraheer de initiële substrings van $ tekst die zou worden geëxtraheerd door # een of meer sequentiële toepassingen van de opgegeven functies # of reguliere expressies @Extracted = Extract_Multiple ($ Text, * /, 'Letterlijke',]); # Maak een string die een geoptimaliseerd patroon (A LA FREDL) vertegenwoordigt dat overeenkomt met een substring die is gescheiden door een van de opgegeven tekens # (in dit geval: elk type citaat of een schuine streep) $ PATSTRING = Gen_Delimited_Pat (q {'"` /}); # Genereer een verwijzing naar een anonieme sub die net als extract_tagged # maar vooraf gecompileerd en geoptimaliseerd is voor een specifiek paar tags, en bijgevolg # veel sneller (dwz 3 keer sneller). Het Gebruikt qr // voor betere prestaties op # herhaalde oproepen, dus het werkt alleen onder PERL 5.005 of hoger. $ Extract_head = Gen_Extract_Tagged ('
', '
'); ($ geëxtraheerd, $ rest) = $ Extract_head -> ($ Text); de verschillende extract _... Subroutines kunnen worden gebruikt om een gescheiden substring te extraheren, PO susibel na het overslaan van een gespecificeerde voorvoegsstring. Standaard is dat voorvoegsel optioneel WhiteSpace (/ s * /), maar u kunt het wijzigen in wat u maar wilt (zie hieronder). De substring die moet worden geëxtraheerd, moet worden weergegeven op de huidige POS-locatie van de variabele van de string (of bij index nul , als er geen POS-positie is gedefinieerd). Met andere woorden, het extract _... Subroutines extraheren niet de eerste optreden van een substring overal in een string (zoals een niet-geopende regex zou). Integendeel, ze extraheren een optreden van de substring die onmiddellijk op de huidige matchingspositie in de reeks verschijnt (zoals een G-verankerde regex zou). Vereisten: · Perl