Jak wykorzystujemy sztuczną inteligencję i uczenie maszynowe, aby zwiększyć wydajność treści SEO o 30%

Opublikowany: 2021-07-13

Każdy, kto rozmawiał ze mną w ciągu ostatnich dziewięciu miesięcy, będzie wiedział, że byłem głęboko w króliczej norce AI. Całkowicie pochłonąłem się tym, jak działa sztuczna inteligencja, a w Ellipsis szybko zaadaptowaliśmy to do naszych procesów.

Największym beneficjentem jest nasza praca nad SEO Content, która stanowi większość naszej codziennej pracy. Mamy teraz zestaw wewnętrznych narzędzi, które są zoptymalizowane specjalnie do tworzenia treści dla firm WordPress. Ten zestaw narzędzi jest znacznie lepszy niż wszystkie dostępne komercyjnie i pomaga nam zapewnić, że nasze treści będą uzyskiwać rankingi i konwersje.

System nazywamy FALCON i dzięki niemu poprawiliśmy wyniki SEO Content o około 30%. Tak to wszystko działa.

Ten post jest interesujący jako migawka w czasie! Ale teraz jest nieaktualny. FALCON AI jest teraz znacznie potężniejszy, osiąga jeszcze lepsze wyniki niż te, które tutaj śledziliśmy, a aktualne informacje można znaleźć na tej dedykowanej stronie: https://getellipsis.com/falcon-ai/

Przegląd: co może zrobić sztuczna inteligencja?

Interesują nas cztery rodzaje sztucznej inteligencji:

  • klasyfikacja tekstu (w jakiej kategorii znajduje się tekst?)
  • generowanie tekstu (utwórz w większości oryginalną odpowiedź)
  • przewidywanie (co będzie dalej, na podstawie danych z przeszłości?)
  • rozumienie języka naturalnego (co oznacza tekst?)

Sztuczna inteligencja w 2021 r. dobrze sprawdza się w takich przypadkach użycia. Każdy z tych typów wymaga „modelu”, który służy do generowania danych wyjściowych. Istnieją dwa ich rodzaje: samokształcenie i wstępne szkolenie.

Samouczący się to niestandardowe modele zbudowane na Twoich własnych danych dla Twojego przypadku użycia. Jest to obsługiwane przez uczenie maszynowe (ML), więc często widzisz tutaj używane uczenie maszynowe zamiennie. Wstępnie wytrenowane modele są trenowane przy użyciu danych innych osób. Są one zwykle znacznie bardziej ogólne, ale dobry model ogólny jest bardzo potężny.

Jeśli chcesz wiedzieć, czy nowe zapytanie w formularzu kontaktowym to wiadomość e-mail dotycząca sprzedaży, czy prośba o obsługę klienta, prawdopodobnie nie ma problemu z użyciem wstępnie wytrenowanego modelu. Jeśli chcesz wiedzieć, do którego zespołu należy skierować konkretną wiadomość pomocy technicznej, prawdopodobnie potrzebujesz samouczącego się modelu niestandardowego.

Wielkim przełomem w ciągu ostatniego roku było to, że wstępnie wytrenowane modele stały się znacznie lepsze. GPT-3, takie jak Open AI, który bardzo dobrze radzi sobie z generowaniem tekstu, otworzyło o wiele więcej możliwości. Zostało to połączone ze szkoleniem niestandardowych modeli, które stały się znacznie bardziej dostępne (pozdrowienia dla klienta Ellipsis, Akkio): wcześniej do tego celu potrzebny był Data Scientist.

Oto kontekst tego, co może zrobić sztuczna inteligencja i jak możemy z niej korzystać. Przyjrzyjmy się teraz konkretnym przypadkom użycia, jakie Ellipsis ma dla każdego z nich w naszym procesie treści SEO.

Uczenie maszynowe w celu zwiększenia skuteczności kombinacji słów kluczowych i tytułów

Jednym z pierwszych etapów procesu tworzenia treści SEO jest wybór słów kluczowych. Zidentyfikujemy klaster tematów, do którego chcemy dopasować treść klienta, a następnie poszukamy dobrego docelowego słowa kluczowego dla posta. Jeśli wybierzesz niewłaściwe słowo kluczowe, nic, co możesz zrobić z tworzeniem treści, nie sprawi, że post będzie działał.

W przypadku FALCON korzystamy z niestandardowego modelu uczenia maszynowego, aby przewidzieć skuteczność kombinacji słów kluczowych i tytułów na podstawie naszych wewnętrznych danych dotyczących sukcesu z poprzedniego wpisu. Sam ten niestandardowy model jest odpowiedzialny za lwią część 30% wzrostu wydajności treści SEO.

Mamy cztery wersje tego, aby sprawdzić:

  1. Istniejące słowa kluczowe
  2. Powiązane słowa kluczowe
  3. Słowa kluczowe z długim ogonem
  4. Słowa kluczowe w już opublikowanych treściach

Pierwszy z nich wykonuje proste sprawdzenie podanego słowa kluczowego i może jednocześnie sprawdzić do 100 słów kluczowych. Drugi wyszukuje pokrewne słowa kluczowe i analizuje je na dużą skalę (do 100 naraz), pokazując powiązane słowa kluczowe, które będą działać. To z kolei może obsłużyć jednocześnie 100 podstawowych słów kluczowych, więc sprawdzamy 1000 słów kluczowych w ciągu kilku minut. Trzecia jest podobna, ale zagłębia się w słowa kluczowe z długim ogonem. Ostateczna wersja sprawdza, czy inne docelowe słowo kluczowe w istniejącym poście działałoby lepiej.

Korzystając z FALCON, widzimy zarówno zwiększoną wydajność tworzonych przez nas treści – ponieważ mamy dużą pewność, że post będzie się pozycjonował – jak i ulepszenia słów kluczowych, które możemy znaleźć, ponieważ sztuczna inteligencja ułatwia ich wyświetlanie.

Klasyfikowanie zamiaru wyszukiwania za pomocą BERT

Firma Google jest zainteresowana zapewnieniem jak najlepszego doświadczenia użytkownika dla osoby wyszukującej. Oznacza to szybkie udzielenie pełnej odpowiedzi na wszystko, czego szukali. Aby to zrobić, Google musi zrozumieć, czego szuka wyszukiwarka i czy wyniki, które pokazuje, stanowią odpowiedź na to. Nazywamy to zamiarem wyszukiwania.

Rozumiemy, czego szuka wyszukiwarka, patrząc na wyniki wyświetlane przez Google.

BERT jest metodologią Natural Language Understanding (NLU) otwartą przez Google w 2018 roku. BERT jest używany przez Google do zrozumienia zamiaru wyszukiwania w kontekście: jeśli wyszukasz „albumy Queen”, zrozumiesz, że Queen w tym kontekście oznacza zespół, nie Królową osoby.

Google używa metodologii, aby zrozumieć, czego szuka wyszukiwarka. Używamy go, aby zrobić to samo z FALCON, patrząc na wyniki i używając ich do klasyfikowania celu wyszukiwania. W tym celu używamy wstępnie wytrenowanego modelu BERT.

To wchodzi w nasz proces badania słów kluczowych. Możesz to zrobić ręcznie, ale ręcznie robi się to na podstawie zapytania, a nie wyników wyszukiwania: jest to dość intuicyjne „kup motywy WordPress” to słowo kluczowe, które ma na celu zakup. Jednak Google coraz częściej rzuca nieoczekiwane wyniki, ponieważ reaguje na rzeczywistych użytkowników, więc użycie BERT pozwala nam spojrzeć na 10 najlepszych wyników i dokonać klasyfikacji na podstawie wszystkich – i robi to w około pół sekundy.

Przetwarzanie języka naturalnego w celu identyfikacji tematów

Google chce zrozumieć, czego szuka wyszukiwarka. Aby określić, gdzie uszeregować treść, musi zrozumieć, co znajduje się na stronie, aby zrozumieć, w jakim stopniu wynik odpowiada potrzebom osoby wyszukującej.

Google używa w tym celu przetwarzania języka naturalnego (NLP). NLP pozwala Google pobrać adres URL i zrozumieć jednostki i tematy zawarte na stronie. Gdy wie, co jest na stronie, może zrozumieć, gdzie ją uszeregować.

NLP od dawna jest najnowocześniejszym obszarem SEO i stanowi kluczową część naszego procesu tworzenia treści przez ostatnie trzy lata. Narzędzia komercyjne, takie jak Clearscope, MarketMuse i Frase, spopularyzowały tę metodologię: sprawdzają pierwsze 10-30 wyników dla docelowego słowa kluczowego, a następnie grupują tematy w ramach tych wyników. To da ci listę 30-50 tematów, które możesz omówić w poście, a uwzględnienie ich pozwoli ci upewnić się, że wykonałeś dobrą robotę, odpowiadając na wszystkie pytania, które będzie miała wyszukiwarka.

Jest to wypróbowany i przetestowany proces, który od wielu lat przynosi nam dobre wyniki.

Przykład pokrycia tematu opartego na NLP. Używamy narzędzi takich jak Clearscope przez wiele lat, ale teraz możemy wyjść poza to dzięki niestandardowemu NLP.

Narzędzia komercyjne mają jednak pewne ograniczenia. Podstawowym jest AI: NLP jest dobre, ale ma ograniczenia. Narzędzia są uzależnione od dobrych wyników z NLP, z których korzystają. Na przykład Google jest w stanie zidentyfikować tylko około 18% tematów na stronie i często je błędnie identyfikuje.

To samo widzimy z narzędziami komercyjnymi: zazwyczaj korzystają z jednego dostawcy NLP, więc przegapią tematy i posty podmiotów, które muszą omówić. Jeśli opierasz swoje treści na niepełnej liście tematów, tracisz.

Jak widać w tym przykładzie, uruchomiłem demo NLP Google na najwyższym poście w rankingu „najlepszego hostingu WordPress”:

Klasyfikacja w większości się sprawdziła, ale Google uważa, że ​​Hostinger to osoba, a nie firma.

Doprowadziło to do opracowania własnego rozwiązania FALCON NLP, aby lepiej pozyskiwać tematy związane z WordPressem .

Dzięki naszemu wewnętrznemu rozwiązaniu NLP możemy uzyskać lepszą identyfikację tematu. Dzięki temu możemy tworzyć pełniejsze treści, nawet niż konkurencyjne treści tworzone przy użyciu komercyjnych narzędzi.

Jeśli możesz lepiej zidentyfikować tematy do omówienia i upewnić się, że Twoje treści pozwalają Google zidentyfikować Twoje tematy, masz przewagę nad konkurencją. To właśnie ma nasza treść.

Używamy również NLP na etapie badania słów kluczowych, aby automatycznie grupować słowa kluczowe w klastry tematyczne. Wcześniej był to powolny proces ręczny, więc automatyzacja jest niezwykle przydatna.

Niestandardowe modele GPT-3 do generowania tytułów

Podkreśliłem GPT-3 powyżej. GPT-3 to niezwykła technologia stworzona przez Open AI. Wykonuje generowanie tekstu i wykonuje dobrą robotę. GPT-3 jest wyszkolony w zakresie 175 miliardów parametrów i potrafi napisać krótki tekst, którego nie da się odróżnić od tego, co potrafi człowiek. To niesamowite.

Nie używamy GPT-3 do generowania długich treści, o czym zajmę się później. To, co robimy, to używanie niestandardowych modeli dla określonych części procesu tworzenia treści. To całkiem potężna rzecz.

Wiele szumu wokół GPT-3 bierze się z tego, co można z nim zrobić. Jest na nim długa lista aplikacji. „Copywriting AI” jest jednym z najbardziej oczywistych obszarów GPT-3, a obecnie trwa wyścig zbrojeń, aby zbudować narzędzia do tego. Wszystkie te narzędzia są oparte na API GPT-3 od Open AI.

Ograniczeniem w przypadku narzędzi komercyjnych jest poleganie na ogólnych podpowiedziach. „Generator tytułów postów na blogu”, który otrzymasz od „copywritera AI”, SaaS musi działać ze wszystkimi rodzajami tytułów. Potrzebujemy czegoś specjalnie zoptymalizowanego pod kątem treści WordPress.

Wykorzystujemy sztuczną inteligencję do generowania bardzo dobrze zoptymalizowanych pod kątem SEO tytułów. Dzięki FALCON jesteśmy w stanie wybrać docelowe słowo kluczowe, wyszukać najlepsze wyniki, a następnie użyć GPT-3 do wygenerowania tytułów podobnych do najlepszych wyników treści w rankingu (odfiltrowujemy wyniki postów spoza bloga). Wynikiem jest tytuł doskonale zoptymalizowany pod kątem Google , ponieważ opiera się na tym, co już jest w rankingu.

Tutaj sztuczna inteligencja jest znacznie lepsza niż ludzie: sztuczna inteligencja może przyjrzeć się niuansom wyników i wygenerować wiele wersji w locie. W ten sposób generujemy wiele opcji tytułów i przeprowadzamy je przez krok uczenia maszynowego opisany powyżej: FALCON wygeneruje zwycięski tytuł.

FALCON pracuje nad wysoce zoptymalizowanymi tytułami: sztuczna inteligencja generuje tytuły na podstawie najlepszych wyników w rankingu, a następnie testujemy wiele wersji, aby uzyskać zwycięską opcję.

Nie zapewniamy tutaj żadnych oszczędności czasu ani kosztów (jeśli w ogóle jest to bardziej czasochłonne i drogie), ale teraz możemy ocenić znacznie więcej opcji na dużą skalę i dać naszym klientom najlepsze z nich. Dziękuję dr Oliverowi Crookowi z Oxford University za wsparcie w tej sprawie.

Oczywiste pytanie brzmi: co z treściami generowanymi przez sztuczną inteligencję? Jestem dość uparty, że to okropny pomysł, ponieważ przejdę do następnego.

A co z treściami generowanymi przez sztuczną inteligencję?

NIE używamy GPT-3 do generowania długich treści. GPT-3 jest okropny w przypadku długich treści, ponieważ nie wie, o czym mówi. Nie ma pojęcia, czym jest prawda: może łączyć ze sobą słowa, ale nie ma pojęcia, co one znaczą.

Kiedy Google coraz bardziej ceni autorytet merytoryczny, korzystanie ze sztucznej inteligencji, która nie ma pojęcia, o czym mówi, jest receptą na katastrofę.

Narzędzia takie jak Conversion.AI są fajne, ale używanie ich do generowania długich treści to fatalny pomysł. Długie treści muszą mieć wgląd i wiedzę, a sztuczna inteligencja nie ma pojęcia, o czym mówi.

Dlatego używamy generowania tekstu na marginesach naszego procesu tworzenia treści, aby wprowadzać ulepszenia i znajdować usprawnienia, ale nie używamy GPT-3 do generowania długich treści.

Jeśli już, wzrost tego sprawia, że ​​jesteśmy bardziej szczęśliwi, gdy pracujemy z ekspertami w danej dziedzinie. Eksperci ci są drodzy, ale jeśli inni zaczną próbować automatycznie generować treści, które mogą być bezsensowne, my i nasi klienci będziemy mieli jeszcze większą przewagę konkurencyjną. Przynieś to!

System FALCON i jak go zdobyć

Nasze dotychczasowe wyniki wykazały 30% poprawę wyników SEO w zakresie treści , odkąd zaczęliśmy poważnie wdrażać sztuczną inteligencję w naszym procesie tworzenia treści. Od początku tego roku zaczęliśmy zdawać sobie sprawę z tych wyników dla klientów.

System jako całość jest oznaczony jako system FALCON. To nasza kolekcja wewnętrznych narzędzi zaprojektowanych w celu zwiększenia sukcesu prac SEO, które wykonujemy dla klientów.

FALCON jest teraz zawarty we wszystkich naszych pakietach Content Growth dla treści SEO. Możesz zobaczyć szczegóły tutaj lub skontaktować się z nami, aby zobaczyć, jak możemy Ci pomóc.