Spojoval jsem dnes více XML feedů do jednoho výstupního souboru. Jeden z feedů byl ve formátu Google Shopping. Sadou pravidel jsem zpracoval elementy, které se mi na výstupu hodily. Převáděl jsem je do formátu “negooglovského” (př.: <g:price>
→ PRICE_VAT
). Následně jsem chtěl smazat všechny zbývající nezpracované “Google” elementy. Ty měly formát <g:ELEMENT>HODNOTA</g:ELEMENT>
. Chtěl jsem smazat všechny takové elementy. Nejlépe jedním pravidlem. To pravidlo vypadalo takhle:
Typ pravidla: Smazat text
Smazat v souboru text:<g\:[^<]*<\/g\:[^>]*>
Regulární výraz: ANO
Řekl jsem si, že se o tento tip podělím. Třeba se Vám tento výraz bude někdy hodit