Jak připojit data o skladové dostupnosti zboží z Heureka dostupnostního XML k produktům v Mergadu

michaljanik · říjen 19, 2021, 8:19odp.

Tuhle padla otázka, zda lze “připojit” informace z Heureka dostupnostního XML feedu k produktům v exportu v Mergadu. Dříve jsem říkával, že nikoliv, protože pravidlo datového importu podporuje napojení dat z formátu CSV. Opak je ovšem pravdou. Lze to nastavit a zabere to sotva pár minut.

Postup v kostce

Využijeme pravidlo datového importu. Abychom ze vstupního dostupnostního XML feedu vytvořili CSV s potřebnými daty, použijeme aplikaci Blending Bull.

O aplikaci Blending Bull

Blending Bull je známý jako aplikace pro spojování datových feedů. Obsahuje ovšem také datový editor. Ten data nenačítá do databáze, ale upravuje rovnu text v souboru. Díky tomu dokáže zpracovat i dostupnostní XML feed nebo různé další formáty CSV či XML feedů!

Pracovní postup

Jako datový zdroj v aplikaci Blending Bull (vstupní feed) vložíme URL dostupnostního XML feedu. Odtud bude Bull data brát a pravidelně je aktualizovat.
Vytvoříme nový výstupní soubor. Do něj jako zdroj dat napojíme dostupnostní feed. V nastavení datového zdroje nastavíme smazání hlavičky a patičky XML tak, aby obsah souboru začínal <item... a končil </item>.

screenshot-app.mergado.com-2021.10.19-21_39_121885×964 92.4 KB
Pomocí pravidel upravíme obsah souboru. Já se domníval, že jediným pravidlem s regulárním výrazem dokáži data z dostupnostního XML feedu vyparsovat a uložit do struktury CSV souboru. Zápis mne ale zlobil, a tak jsem postup rozdělil na více jednodušších pravidel. Většinou šlo o pravidla “Najít a nahradit” s tím, že se nahrazovalo za prázdný obsah, tedy byl text odstraněn. Uvedu příklad pravidel. Vy si vytvoříte pravidla vlastní dle charakteru vašich dat.

screenshot-app.mergado.com-2021.10.19-21_03_221885×964 83.9 KB

Tabulka s popisem pravidel

Pravidlo	Nalézt v datovém zdroji text	Nahradit za text	Regulární výraz?	Poznámka
Odstranit zlomy řádků	`\n`	nic	ano	^[1]
Odstranit mezery	(mezera)	nic	-	^[2]
Odstranit: /item	`</item>`	nový řádek (enter)	-	^[3]
Odstranit: delivery…	`<delivery_timeorderDeadline.*<\/delivery_time>`	nic	ano
Odstranit: depotid	`<depotid.*<\/depot>`	nic	ano
Parsování dat	`<itemid="(.)"><stock_quantity>(.)<\/stock_quantity>`	`\g<1>,\g<2>`	ano	^[4]
Hlavička CSV	typ pravidla Vložit na začátek souboru	`ITEM_ID,STOCK_QUANTITY`(enter)		-

Zápis pravidel je ilustrační. V mém případě fungoval. Ve vašem případě může být potřeba pravidla upravit dle situace. Některá pravidla nemusí být potřeba vůbec. Cílem bylo ukázat princip.

Výstupní soubor z aplikace Blending Bull načteme pomocí pravidla datového importu do exportu v Mergadu.

screenshot-app.mergado.com-2021.10.19-21_04_591885×964 87.4 KB
A máme hotovo. Výsledek může v Mergadu vypadat podobně viz. příklad. Data můžeme využít pro řízení kampaní, výběry, přípravu dat pro marketplaces aj.

screenshot-app.mergado.com-2021.10.19-21_04_071885×964 104 KB

Přestože popis postupu zabral hodně řádků, naklikat jej dokážete za pár minut.

Podobně lze zpracovat i jiné formáty

V tomto příkladě jsou na vstupu data ve formátu Heureka dostupnostní feed. Obdobně můžete zpracovat jiné formáty XML případně CSV feedů. Pomocí aplikace Blending Bull je převedete do CSV (případně XML), které pak napojíte do Mergada pravidlem datového importu, nebo zpracujete jiným způsobem.

Celý fígl je v tom, že do výstupního souboru napojíte pouze jeden vstupní feed a zpracujete ho v Blending Bullovi jako v editoru.

Poznámka o screenshotu Blending Bull

Uvedený screenshot je z vývojové verze aplikace, kterou připravujeme. Na produkci by měla být v řádu jednotek týdnů. Již nyní můžete s Bullem pracovat stejně. Pouze jsou pravidla v rozhraní aplikace v části Vstupní soubory → detail souboru → Pravidla

Zlobily mne konce řádků. Tedy jsem je odstranil. Výstupem je jeden dlouhý řádek. ↩︎
Zlobily mne mezery na různých místech XML. Odstranil jsem je. ↩︎
Položka item ukončuje položku zboží. Nám odřádkuje CSV kde jeden řádek bude jedna shopitem. Nahradíme ji tedy za nový řádek (stisk enter). ↩︎
Jádro celého zpracování. Z položek (.*) načte pravidlo data. Skupin dat může být více. Do výstupu je vložíme zápisem \g<1>, \g<2> atp. kde číslo udává pořadí skupiny v parsování. Já jsem jako oddělovač zvolil čárku. ↩︎

tradag · červen 16, 2022, 10:54am

Dobrý den, mohl bych požádat o radu? Snažím se připravit CSV z dostupnostníh XML, ale bohužel se mi nedaří dodržet strukturu - stále jsou mezery mezi ITEM_ID a STOCK_QUANTITY elementy. Stejně tak se mi neřadí prvky za první řádek.

Děkuji za radu,
Dominik

ludekvolejnik · červen 16, 2022, 11:56am

Odřádkování hlavičky

v pravidle pro doplnění hlavičky jen na konci řádku zmáčkněte Enter, aby kurzor blikal o řádek níž

Odstranění mezer

Tady je více možností řešení, např. si pravidlem “Najít a nahradit” vyhledejte mezery za oddělující čárkou: ,\s+ a odstraňte, tedy nahraďte jen za čárku , takto:

tradag · červen 16, 2022, 12:43odp.

Mockrát díky. S těmi mezerami mám pořádá trochu problém. Navíc se zdá, že vše za hlavičkou se řadí jako jeden řádek CSV:

michaljanik · červen 17, 2022, 10:27am

Dobrý den, napište mi prosím na support na adresu info@shopitak.com a uveďte o jaký e-shop jde. Zde je diskuse veřejná, tak prosím e-shop neuvádějte. Pomohu Vám to nastavit. Děkuji.

ludekvolejnik · červen 17, 2022, 1:54odp.

@tradag vytvořil jsem v aplikaci Blending Bull soubor s názvem “Dostupnostní soubor - Mergado”, kde se můžete na jednotlivá pravidla podívat. Funguje to.

Pravidla jsem přidal takto:

PS: ty mezery vám tam zůstávaly proto, že v pravidle pro jejich odstranění nebyl zatržený checkbox “Zpracovat jako regulární výraz”, zatrhnul jsem jej , nicméně pořád to tam zůstává v jednom řádku, jak píšete. Mrkněte tedy na ukázku, kterou jsem tam vytvořil.