AI a R studio – optimalizace meta tagů na „jeden“ klik!

Lukáš Kostka

10 minut čtení

30. 3. 2023

Jedním z rezonujících témat letošního SEO Restartu bylo využití umělé inteligence v SEO. Kromě přednášek Jana Tichého, Pavla Ungra a Vojty Fialy jsem celý blok o umělé inteligenci završil půlhodinovým povídáním o možnosti kombinace OpenAI API a R studia, které napříč celým Effectixem s oblibou používáme k datovým analýzám, vizualizaci dat nebo třeba automatizaci. 

Následující text navazuje na přednášku a slouží zejména pro účastníky konference. Vhodný je však i pro ty, kteří hledají způsob, jak automatizovat tvorbu textu a rádi by našli startovní bod, od kterého začít. Zdarma vám k dispozici navíc poskytneme ukázkový kód! 

Jaké možnosti OpenAI nabízí

Při samotném rozhodování, zda-li využít ‚‚základní‘‘ jazykový model GPT-3 nebo ChatGPT dotrénovaný na konverzačních datech, hraje roli řada faktorů.

Zásadní výhoda využití původního GPT-3 je v možnosti fine-tuningu tohoto modelu pro širokou škálu činností. Umělou inteligenci lze vycvičit na spoustu SEO činností, na které není příliš nutné čerpat kapacity copywriterů (zejména těch levných) – od popisků produktů, kategorií nebo třeba meta tagů. Při dostatečném množství poskytnutých dat dokáže být totiž velmi efektivní.

Výhoda využití ChatuGPT tkví v tom, že komunikace s ním může být, díky optimalizaci pro lidskou konverzaci, příjemnější. Zásadním plusem může být i cena, které se budu věnovat později.

Prompt engineering vs fine–tuning

Většina těch, kteří s AI pracují, využívají právě prompt engineering. Jedná se o proces, kdy se snažíme prompty (výzvy) optimalizovat do takové podoby, aby se nám vracel nejkvalitnější a pro opakované činnosti nejstabilnější výsledek. Pokud nemáme kapacitu či rozpočet pro trénování vlastních modelů, můžeme prompty optimalizovat za pomoci one-shot či few-shot learningu, tak jak je v ukázkovém kódu níže ukázáno.

Pokud hovoříme o fine-tuningu v souvislosti s GPT-3, máme na mysli poskytnutí dostatečného množství učících dat, ze kterých se jazykový model dokáže naučit poskytnout to nejlepší řešení. Doporučovaný počet učících příkladů se různí a záleží zejména na náročnosti úlohy. Některé zdroje doporučují tisíce, samotné OpenAI alespoň stovky. Z vlastní zkušenosti se přikláním k použití kolem 500 příkladů, pokud se jedná třeba o generování meta tagů či podobných textů. Proces fine-tuningu je mnohdy mylně zaměňován za poskytování dalších znalostních dat, se kterými bude algoritmus dále pracovat. Jedná se však pouze o učení, které si můžete představit jako neustále opakující se úlohu v jiném kontextu. Zásadní výhodou fine-tuningu je mnohdy získávání kvalitnějších výsledků než při ‚‚pouhém‘‘ prompt-engineeringu, možnost poskytnutí více učících dat, než by se vešly do samotného promptu. V horizontu času také dochází k úsporám z rozsahu, protože vycvičenému modelu stačí do promptu zadat méně informací, a tím pádem je samotné používání levnější.

Cena jazykových modelů OpenAI

Jedním ze zásadních kritérií při výběru modelu, který použijete, může být cena. V současnosti lze trénovat modely GPT-3 (Ada, Babbage, Curie, Davinci). Pro češtinu se dle mých zkušeností jeví jako nejvýkonnější model, avšak je i nejdražší. Nedávno uvedený model GPT-4 možnost fine-tuningu v době publikace článku ještě nenabízí a na možnost využití API musíte ‚‚vystát frontu‘‘. Mnohonásobně levnější je dotazování přes ChatGPT – proto jsem se také rozhodl, že pro nízké náklady a jednoduchost budu příklad použití API v R demonstrovat právě na této variantě.

Cena openai

Co je R a RStudio?

R, chcete-li Rko, je programovací jazyk pro analýzu dat, který vyvíjí programátoři z celého světa pod otevřeným zdrojovým kódem. Své zalíbení si našel zejména pro zpracování nejrůznějších statistických výpočtů a jeho možnosti jsou v podstatě neomezené – zpracování sociologických výzkumů, sledování vlastností kryptoměn, ale samozřejmě rovněž zpracování veškerých dat, která můžeme získat z webů a oblíbených marketingových nástrojů. Výhoda otevřené licence poskytuje možnost doinstalování více než 5 000 rozšiřujících balíčků, a každý si tak může vytvořit nástroj s potřebami přímo na míru.

RStudio je velmi intuitivní prostředí, které slouží pro práci s jazykem R, ale nejen s ním. Pro začátek je důležité vědět, že čisté R v práci prakticky používat nebudete a veškerá činnost se odehrává v RStudiu.

Nejprve je nutné si nainstalovat jak R, tak i RStudio. Pokud se chcete o prvních krocích s Rkem dozvědět víc, doporučuji e-book Marka Prokopa Od Excelu k R.

R má v SEO mnoho využití, pokud byste chtěli prozkoumat i další možnosti aplikace a nezůstat pouze u AI, mnoho užitečných příkladů naleznete v e-booku R for SEO.


Výchozí teze pro využití umělé inteligence v SEO

Předtím, než se pustíte do samotné optimalizace, bych rád uvedl několik důvodů, proč jsme se v Effectixu rozhodli využívat AI pro účely SEO.

Jedná se zejména o 3 následující:

  1. Neradi využíváme kapacity drahých copywriterů na mnohdy generické texty, zároveň je ale nechceme či nemůžeme generovat přímo na webu (například skládáním parametrů produktu apod.).
  2. Nechceme využívat levné copywritery, po kterých práci musíme kontrolovat. Po AI sice musíme také, ale s daleko menšími náklady (například při ceně copywritera 500,- / NS jsou náklady na meta tagy generované AI až 600× nižší).
  3. Můžeme rychle generovat texty pro weby, které mají velké množství chybějících/neoptimalizovaných meta tagů (v řádech stovek/tisíců, například na začátku spolupráce). 

Rstudio workflow

Samotné workflow pro optimalizaci meta tagů jsem se pokusil co nejvíce zjednodušit tak, aby bylo použitelné jak pro specialisty, kteří nemají s R studiem takřka žádné zkušenosti, tak i pro ty, kteří si kód upraví pro své vlastní potřeby.

Proces se dělí na 4 části – analýza vhodných landing pages pro optimalizaci, nalezení klíčových slov, na která budete optimalizovat, scraping obsahu z webu, generování meta tagů za pomoci ChatGPT API.

RStudio workflow pro optimalizaci meta tagů

Kdy optimalizovat meta titles a descriptions?

Řada výzkumů průměrných křivek CTR hovoří o hodnotách, o kterých se často agenturám jenom zdá. Nezřídka se u nových klientů setkáte s neoptimalizovanými meta tagy, které vedou k daleko nižším průměrným hodnotám.

Průměrná křivka CTR výzkumy vs realita


Ukázkový kód zdarma

Ukázkový kód v R Markdown jsem pro vás připravil ve zjednodušené formě zdarma ke stažení zde. Do samotného R Markdown souboru jsou vloženy poznámky, které by vám měly usnadnit orientaci.

První část workflow se zabývá stažením a následnou analýzou dat z Google Search Console.

V Effectixu k analýze používáme vlastní predikční modely, na základě kterých obsah optimalizujeme.

Pro rychlou analýzu lze však rovněž využít postup, který je nastíněn na webu oblíbeného Marketing Mineru. Analytická část skriptu z něj vychází a v R je velmi rychlá. Vychází z rovnice CTR * Pozice, z čehož za vhodná data vezměte ta, která mají nejmenší skóre. Pro správnou funkčnost je vhodné vyfiltrovat relevantní pozice a také minimální počet impresí - například vyšší než 100.

V další částí kódu zvolte počet landing pages, které se jeví jako nejvhodnější pro optimalizaci. Ukázkovým skriptem se není nutné limitovat – lze ho upravit rovněž pro načtení vlastního seznamu landing pages s klíčovými slovy apod.

Nezbytným krokem pro poskytnutí dostatečného množství dat a kontextu pro OpenAI je scraping dat. Při scrapování je vhodné vybrat text, ze kterého bude ChatGPT vycházet. Můžete využít CSS či Xpath selektor. Vybrat lze například parametr p, popisky produktů, kategorií atd.

Dalším Rkovým blokem je možné optimalizovat počet klíčových slov, na která bude umělá inteligence generování textů mířit.

Pro samotný přístup k API je nutné si vygenerovat vlastní klíč ve vašem OpenAI účtu.



Blížíte se k cíli! Jako předposlední vytvoříte samotný prompt. Pro jednoduchost přiložte i one-shot-learning, kterému se věnovala předchozí část textu. Samotný prompt můžete měnit, jak hrdlo ráčí. Pro zkoušení promptů doporučuji Playground OpenAI, kde si můžete vyzkoušet, zdali prompt generuje vaše požadavky.

A máte to! Spuštěním posledního skriptu vygenerujete texty pro URLs, které jste si vybrali. Umělá inteligence vyjde z vyscrapovaného textu a generovaný content zacílí na vhodná klíčová slova. Třešničkou na dortu může být experimentování s parametrem temperature, který ovlivňuje, jak moc bude AI kreativní.

A nakonec si vygenerovaná data můžete uložit třeba do Excelu.

Doufám, že jsem vás tímto článkem i praktickými ukázkami inspiroval a věřím, že ve vašich počítačích začínají vznikat vlastní laboratoře s umělou inteligencí. Budeme vděční za sdílení vašich zkušeností, článků, zpětnou vazbu a i vámi upravených kódů pro práci s umělou inteligencí v R.

Chtěli byste se o využití umělé inteligence v marketingu dozvědět více nebo máte zájem o školení? Napište mi na lukas.kostka@effectix.com!

Přečtěte si také:

Zviditelněte váš web ve vyhledávání pomocí strukturovaných dat

Strukturovaná data_fb

Blog

SDÍLEJTE ČLÁNEK

Chcete vědět více o zlepšení obsahu? Ozvěte se mi.

AUTOR:

Lukáš Kostka
Data Scientist


lukas.kostka@effectix.com

Více o Lukášovi

Jestli chcete být in v onlinu, odebírejte nás.

© 2024 Effectix. Všechna práva vyhrazena.

Vytvořeno v Beneš & Michl