Come utilizziamo l'intelligenza artificiale e l'apprendimento automatico per aumentare le prestazioni dei contenuti SEO del 30%

Pubblicato: 2021-07-13

Chiunque abbia parlato con me negli ultimi nove mesi saprà che sono stato in profondità nella tana del coniglio dell'IA. Mi sono completamente assorbito dal modo in cui funziona l'IA e in Ellipsis l'abbiamo rapidamente adottato nei nostri processi.

Il principale beneficiario è stato il nostro lavoro sui contenuti SEO, che costituisce la maggior parte del nostro lavoro quotidiano. Ora disponiamo di una serie di strumenti interni ottimizzati specificamente per la creazione di contenuti per le aziende WordPress. Questo set di strumenti è significativamente migliore di qualsiasi altro disponibile in commercio e ci aiuta a garantire che i nostri contenuti ottengano classifiche e conversioni.

Chiamiamo il sistema FALCON e con esso abbiamo migliorato i risultati SEO Content di circa il 30%. È così che funziona tutto.

Questo post è interessante come un'istantanea nel tempo! Ma ora non è aggiornato. FALCON AI è ora enormemente più potente, ottiene risultati ancora migliori di quelli che abbiamo seguito qui e informazioni aggiornate possono essere trovate su questa pagina dedicata: https://getellipsis.com/falcon-ai/

Panoramica: cosa può fare l'IA?

Siamo interessati a quattro tipi di IA qui:

  • classificazione del testo (in quale categoria si trova un testo?)
  • generazione del testo (crea una risposta per lo più originale)
  • previsione (cosa accadrà dopo, in base ai dati passati?)
  • comprensione del linguaggio naturale (cosa significa testo?)

L'IA nel 2021 è adatta a questi casi d'uso. Ciascuno di questi tipi richiede un "modello" utilizzato per generare l'output. Ne esistono di due tipi: autodidatta e pre-addestrata.

Gli auto-addestrati sono modelli personalizzati costruiti sui tuoi dati per il tuo caso d'uso. Questo è alimentato da Machine Learning (ML), quindi spesso vedi ML usato in modo intercambiabile qui. I modelli pre-addestrati vengono addestrati con i dati di qualcun altro. Questi tendono ad essere molto più generali, ma un buon modello generale è molto potente.

Se vuoi sapere se una nuova richiesta di modulo di contatto è un'e-mail di vendita o una richiesta di assistenza clienti, probabilmente stai bene utilizzando un modello pre-addestrato. Se vuoi sapere a quale team deve essere indirizzato un messaggio di supporto specifico, probabilmente avrai bisogno di un modello personalizzato auto-addestrato.

Il grande passo avanti nell'ultimo anno circa è stato il miglioramento significativo dei modelli pre-addestrati. Artisti del calibro di GPT-3 di Open AI, che esegue la generazione di testi molto bene, hanno aperto molte più possibilità. Questo è stato combinato con l'addestramento di modelli personalizzati che sono diventati molto più accessibili (grida al client di Ellipsis Akkio): in precedenza avevi bisogno di un Data Scientist per farlo.

Questo è il contesto su ciò che l'IA può fare e su come possiamo usarlo. Diamo ora un'occhiata ai casi d'uso specifici che Ellipsis ha per ciascuno di questi nel nostro processo di contenuto SEO.

Machine learning per aumentare la percentuale di successo delle combinazioni di parole chiave e titoli

Una delle prime fasi del processo di produzione dei contenuti SEO è la selezione delle parole chiave. Identificheremo in quale cluster di argomenti vogliamo inserire il contenuto del cliente, quindi cercheremo una buona parola chiave di destinazione per il post. Se scegli la parola chiave sbagliata, nulla che puoi fare con la creazione di contenuti farà funzionare il post.

Con FALCON, utilizziamo un modello di Machine Learning personalizzato per prevedere il rendimento di una combinazione di parole chiave e titolo, in base ai nostri dati interni sul successo dei post precedenti. Questo modello personalizzato da solo è responsabile da solo della parte del leone dell'aumento del 30% delle nostre prestazioni dei contenuti SEO.

Abbiamo quattro versioni di questo, per verificare:

  1. Parole chiave esistenti
  2. Parole chiave correlate
  3. Parole chiave a coda lunga
  4. Parole chiave su contenuti già attivi

Il primo esegue un semplice controllo della parola chiave che gli hai assegnato e può controllare fino a 100 parole chiave alla volta. Il secondo cerca le parole chiave correlate e le esegue attraverso la previsione su larga scala (fino a 100 alla volta), mostrando le parole chiave correlate che funzionerebbero. Questo a sua volta può gestire 100 parole chiave di base alla volta, quindi stiamo controllando 1000 parole chiave in pochi minuti. Il terzo è simile ma approfondisce le parole chiave a coda lunga. La versione finale controlla se una parola chiave di destinazione diversa su un post esistente avrebbe prestazioni migliori.

Attraverso il nostro utilizzo di FALCON, stiamo assistendo sia a un aumento delle prestazioni dei contenuti che produciamo, poiché abbiamo un'elevata fiducia che il post si classificherà, sia a miglioramenti nelle parole chiave che possiamo trovare, poiché l'IA rende più facile far emergere le parole chiave.

Classificazione dell'intento di ricerca utilizzando BERT

Google è interessato a fornire la migliore esperienza utente possibile al ricercatore. Ciò significa fornire una risposta completa a tutto ciò che hanno cercato, rapidamente. Per fare ciò, Google deve capire cosa sta cercando il ricercatore e se i risultati che mostra forniscono la risposta a questo. Chiamiamo questo intento di ricerca.

Capiamo cosa sta cercando il ricercatore guardando i risultati mostrati da Google.

BERT è una metodologia di comprensione del linguaggio naturale (NLU) open source fornita da Google nel 2018. BERT è utilizzato da Google per comprendere l'intento di ricerca nel contesto: se cerchi "Queen albums" capirai che Queen in questo contesto significa la band, non Queen la persona.

Google sta utilizzando la metodologia per capire cosa sta cercando il ricercatore. Lo stiamo usando per fare lo stesso con FALCON, guardando i risultati e usandoli per classificare l'intento di ricerca. Stiamo usando un modello BERT pre-addestrato per farlo.

Questo entra nel nostro processo di ricerca delle parole chiave. Puoi farlo manualmente, ma manualmente tende a essere fatto sulla query di ricerca e non sui risultati della ricerca: è abbastanza intuitivo "acquista temi WordPress" è una parola chiave con intenzione di acquisto. Tuttavia, Google genera sempre più risultati inaspettati, poiché risponde agli utenti del mondo reale, quindi l'utilizzo di BERT ci consente di guardare i primi 10 risultati e fare una classificazione basata su tutti loro, e lo fa in circa mezzo secondo.

Elaborazione del linguaggio naturale per l'identificazione degli argomenti

Google vuole capire cosa sta cercando il ricercatore. Per determinare dove classificare i contenuti, deve capire cosa c'è in una pagina in modo da poter capire fino a che punto il risultato corrisponde alle esigenze del ricercatore.

Google utilizza Natural Language Processing (NLP) per questo. La PNL consente a Google di prendere un URL e comprendere le entità e gli argomenti contenuti nella pagina. Una volta che sa cosa c'è nella pagina, può capire dove posizionarla.

La PNL è stata a lungo un'area all'avanguardia della SEO ed è stata una parte fondamentale del nostro processo di contenuto negli ultimi tre anni. Strumenti commerciali come Clearscope, MarketMuse e Frase hanno reso popolare la metodologia: esamineranno i primi 10-30 risultati per una parola chiave target, quindi aggregheranno gli argomenti all'interno di tali risultati. Questo ti darà un elenco di 30-50 argomenti da trattare nel post e coprirli ti consente di assicurarti di aver svolto un buon lavoro nel rispondere a tutte le domande che un ricercatore avrà.

Questo è un processo collaudato e abbiamo ottenuto buoni risultati per diversi anni.

Un esempio di copertura di argomenti basata sulla PNL. Abbiamo utilizzato strumenti come Clearscope per diversi anni, ma ora possiamo andare oltre con la PNL personalizzata.

Tuttavia, gli strumenti commerciali hanno alcune limitazioni. La principale è l'IA: la PNL è buona, ma ha dei limiti. Gli strumenti dipendono dai buoni risultati della PNL che usano. Google, ad esempio, è in grado di identificare solo il 18% circa degli argomenti di una pagina e spesso li identifica erroneamente.

Vediamo lo stesso con gli strumenti commerciali: è tipico che utilizzino un provider NLP, quindi perderanno argomenti ed entità che i post devono affrontare. Se stai basando i tuoi contenuti su un elenco incompleto di argomenti, ti stai perdendo.

Come puoi vedere in questo esempio, ho eseguito la demo NLP di Google sul post in cima alla classifica per "il miglior hosting WordPress":

La classificazione ha per lo più funzionato, ma Google pensa che Hostinger sia una persona e non un'azienda.

Questo ci ha portato a sviluppare la nostra soluzione FALCON NLP, per ottenere meglio argomenti specifici di WordPress .

Con la nostra soluzione NLP interna, possiamo ottenere una migliore identificazione degli argomenti. Questo ci consente di produrre contenuti più completi anche rispetto ai contenuti concorrenti prodotti con strumenti commerciali.

Se riesci a identificare meglio gli argomenti da trattare e assicurarti che i tuoi contenuti consentano a Google di identificare i tuoi argomenti, hai un vantaggio competitivo. Questo è ciò che hanno i nostri contenuti.

Utilizziamo anche la NLP nella nostra fase di ricerca delle parole chiave per raggruppare automaticamente le parole chiave in cluster di argomenti. In precedenza questo era un processo manuale lento, quindi l'automazione è estremamente utile.

Modelli GPT-3 personalizzati per la generazione del titolo

Ho evidenziato GPT-3 sopra. GPT-3 è una tecnologia straordinaria realizzata da Open AI. Genera testo e fa un buon lavoro. GPT-3 è addestrato su 175 miliardi di parametri e può scrivere un breve testo indistinguibile da ciò che può fare un essere umano. È abbastanza incredibile.

Non stiamo usando GPT-3 per nessuna generazione di contenuti di lunga durata, come parlerò più avanti. Quello che stiamo facendo, tuttavia, è utilizzare modelli personalizzati per parti specifiche del processo di contenuto. Questa è roba piuttosto potente.

Gran parte del clamore per GPT-3 deriva da ciò che puoi farci. C'è un lungo elenco di app costruite su di esso. Il "copywriting dell'IA" è una delle aree più ovvie per GPT-3 e attualmente è in corso una corsa agli armamenti per costruire strumenti che li facciano. Tutti questi strumenti sono basati sull'API GPT-3 di Open AI.

Il limite con gli strumenti commerciali è che fai affidamento su prompt generici. Il "generatore di titoli per post di blog" che otterrai da un SaaS "copywriter AI" deve funzionare con tutti i tipi di titoli. Abbiamo bisogno di qualcosa di specificamente ottimizzato per i contenuti di WordPress.

Utilizziamo l'IA per generare titoli ottimizzati per la SEO estremamente efficaci. Con FALCON siamo in grado di prendere una parola chiave target, cercare i risultati migliori e quindi utilizzare GPT-3 per generare titoli simili ai risultati dei contenuti più in classifica (filtriamo i risultati dei post non blog). L'output è un titolo perfettamente ottimizzato per Google , poiché si basa su ciò che è già in classifica.

È qui che l'IA è molto meglio degli esseri umani: l'IA può guardare le sfumature dei risultati e generare più versioni al volo. Stiamo quindi generando più opzioni per il titolo e le stiamo eseguendo attraverso il passaggio di apprendimento automatico descritto sopra: FALCON produrrà quindi il titolo vincente.

FALCON al lavoro su titoli altamente ottimizzati: l'IA genera titoli in base ai primi risultati in classifica, quindi testiamo più versioni per ottenere l'opzione vincente.

Non stiamo offrendo risparmi di tempo o costi qui (se non altro è più dispendioso in termini di tempo e denaro), ma ora possiamo valutare molte più opzioni su larga scala e offrire ai nostri clienti le migliori. I miei ringraziamenti al dottor Oliver Crook dell'Università di Oxford per il supporto su questo.

Una domanda ovvia è: che dire dei contenuti generati dall'IA? Sono piuttosto ottimista sul fatto che questa sia un'idea terribile, poiché arriverò alla prossima.

E i contenuti generati dall'IA?

NON stiamo usando GPT-3 per la generazione di contenuti di lunga durata. GPT-3 è terribile per i contenuti di lunga durata in quanto non sa di cosa sta parlando. Non ha idea di quale sia la verità: può collegare le parole insieme, ma non ha idea di cosa significhino.

Quando Google apprezza sempre di più l'autorità in materia, l'utilizzo di un'IA che non ha idea di cosa stia parlando è una ricetta per il disastro.

Strumenti come Conversion.AI sono fantastici, ma usarli per la generazione di contenuti di lunga durata è un'idea terribile. I contenuti di lunga durata devono avere intuizione ed esperienza e l'IA non ha idea di cosa stia parlando.

Pertanto, utilizziamo la generazione di testo ai margini del nostro processo di contenuto per apportare miglioramenti e trovare efficienze, ma non utilizziamo GPT-3 per la generazione di contenuti di lunga durata.

Semmai, l'aumento di questo ci rende più felici di raddoppiare la collaborazione con esperti in materia. Questi esperti sono costosi, ma se altri iniziano a provare a generare automaticamente contenuti che potrebbero non avere senso, noi e i nostri clienti avremo un vantaggio competitivo ancora maggiore. Prendilo!

Il sistema FALCON e come ottenerlo

I nostri risultati finora hanno mostrato un miglioramento del 30% nei risultati dei contenuti SEO da quando abbiamo iniziato a implementare seriamente l'IA nel nostro processo di contenuto. Dall'inizio di quest'anno, abbiamo iniziato a realizzare questi risultati per i clienti.

Il sistema nel suo insieme è etichettato come sistema FALCON. È la nostra raccolta di strumenti interni progettati per aumentare il successo del lavoro sui contenuti SEO che svolgiamo per i clienti.

FALCON è ora incluso in tutti i nostri pacchetti di crescita dei contenuti per i contenuti SEO. Puoi vedere i dettagli qui o metterti in contatto per vedere come possiamo aiutarti.