Odstranění duplicitních slov

regulární-výrazy
najít-a-nahradit

#1

V návaznosti na Odstranění duplicitních výrobců v názvu přidáváme tip na rychlé odstranění duplicitních slov.

Problém:

V elementu máme dvě slova za sebou, potřebujeme je odstranit. U jednotlivých produktů jde o různá slova. Jak postupovat?
Příklady:

  • Hrnek science science medicine
  • Hrnek Astronomy 3D 3D
  • Tričko s krátkým rukávem dámské dámské, velikost L

Princip je stejný, jako u odstranění duplicitních výrobců:

  • použije se pravidlo typu Najít a nahradit
  • zatrhneme, že budeme hledat jako “Regulární výraz”
  • využijeme tzv. referenci, kterou jsme popsali v příspěvku o odstranění duplicitních výrobců

V pravidle, v poli Najít, použijeme následující regulární výraz:

\b(\w+)\s+\1\b

Poznámka:

  • \b určuje hranice slov a výhody této regulární značky jsou zmíněny v příspěvku Odstranění velikostí z názvu produktu. Zde ji musíme použít, aby nám regulární výraz fungoval pro samostatná slova.
  • \s+ představuje jednu nebo více mezer v textu (nejen mezery, ale všechny “bílé” znaky, jako třeba tabulátory, apod.)

Do pole Nahradit uvedeme opět pomocí reference jen tu první část, kterou chceme zachovat:
\1

Ukázka pravidla:
31-15-32-52

Ukázka, jakému textu regulární výraz vyhovuje:
31-15-36-56