Alles over Soft 404’s + hoe je ‘onterechte’ soft 404’s fixt

Alles over Soft 404’s + hoe je ‘onterechte’ soft 404’s fixt
mei 15, 2022 Frederik
Soft 404 foutmelding search console

Misschien ben je het recentelijk tegengekomen in search console: een forse stijging in het aantal ‘soft 404’s’. No panic, wees gerust: Je bent namelijk niet de enige… Het aantal meldingen van soft 404’s is namelijk bij heel veel (grote) websites & webshops fors gestegen de afgelopen periode.

Maar wat is dan zo’n soft 404, hoe herken je een ‘onterechte’ soft 404 en nóg beter, hoe fix je het?!

In dit artikel vertel ik je graag meer over dit nieuwe verschijnsel en hoe we dit bij UNIS Group hebben op kunnen lossen voor meer dan 4 miljoen pagina’s op 14 verschillende websites.

De korte versie: Last van soft 404’s? Check je HTML op typische 404 tekst. Vervangen deze tekst en je Probleem opgelost. De lange versie? Die lees je hieronder.

 

Soft 404’s: de basis

Wat zijn soft 404’s?

Voordat we beginnen is het wel handig om duidelijk te hebben wat nou precies een ‘soft 404 is:

“Een soft 404-fout is in tegenstelling tot een echte 404 geen statuscode die een webserver aan Google retourneert, het is een label die Google aan een pagina toekent op basis van het algoritme.”

Hoe herken je soft 404’s

Er zijn een aantal redenen waarom Google een pagina als een soft 404 kan beschouwen. Hieronder een opsomming van de meest voorkomende redenen:

  • 404-pagina geeft ten onrechte HTTP-status 200;
  • Een redirect doel-url is niet relevant genoeg;
  • Pagina is leeg of heeft geen inhoud;
  • Pagina-inhoud bevat typische 404 tekst;

De laatste in het rijtje is waar we op in gaan zoomen. Recentelijk heeft Google namelijk iets gewijzigd in de manier waar op ze soft 404’s herkennen.  Dit kan een gigantische impact hebben, met name voor E-commerce sites of grote websites. Zo ook op de 14 webshops van UNIS Group.

 

Hoe één zin, potentieel méér dan 4 miljoen pagina’s uit Google index kan halen.

Het is half juni, ik zie een mega daling in het dekkingsrapport van onze sites in search console… Nu hebben we bij UNIS Group behoorlijk wat technische issues, maar zo’n forse daling…. Waar komt die opeens vandaan?!

Na het openen van het dekkingsrapport van één van onze websites zie ik een méga-spike in het aantal soft 404’s. Soft 404’s?! Maar waarom dan? De pagina werkt gewoon, geen rare redirects en bij de ‘live test’-functie van search console komt niets naar voren.

Soft 404 onterecht

Online maar weinig wijzer

Ik ging op onderzoek uit en kwam een vergelijkbare vraag tegen van SEO-specialist Mark Sprenger. Na het lezen van de reacties was ik nog maar weinig wijzer. Dus heb ik hem maar een bericht gestuurd. Mark vertelde me dat hij een fix had toegepast en dat het probleem bij Veneta.com langzaam kleiner werd. De boosdoener? Een hidden error-tekst in de html ‘Geen resultaten gevonden’.

 

De boosdoener: dát ene zinnetje….

Aan de hand van Mark’s opmerking wist ik waar ik moest beginnen. En ja hoor…. BINGO.

Na het inspecteren van de HTML van een aantal van de getroffen pagina’s, wist ik het: De boosdoener was een alt-tag van onze afbeeldingen: ‘Helaas deze afbeelding is niet beschikbaar’.

Het bleken voornamelijk productpagina’s te zijn, allemaal zónder foto.  En productpagina’s zonder foto’s, daar hebben we nogal veel van. Naar schatting ruim 300.000 per webshop. Vermenigvuldig het met 14 en je komt uit op meer dan 4.000.000 pagina’s die potentieel uit de SERP gehaald konden worden.

 

De oplossing voor de onterechte 404’s:

Het is eigenlijk heel simpel, maar je moet het maar net even weten: ‘Helaas deze afbeelding is niet beschikbaar’, lijkt voor Google te veel op de tekst van een 404-pagina. Oplossing: de alt-tekst aanpassen.

 

LET OP: Niet iedere taal is hetzelfde

Het bijzondere aan deze situatie is dat wij voor 14 verschillende webshops (12 talen) een letterlijke vertaling hadden van bovenstaande zin. Echter markeerde Google niet op iedere webshop de productpagina’s als soft 404’s.

Zo hadden we er geen last van op onze Italiaanse en Franse shops, maar wel op de Nederlandse,  Engelse en Spaanse webshops.

Blijkbaar zorgen de kleine verschillen in taal ervoor dat het algoritme het juist herkent of over het hoofd ziet.

 

Een paar weken later…

Nu, een paar weken later zien ook wij het aantal soft 404’s flink afnemen. Nice!

Soft 404 foutmelding search console

 

Hoe jij het zélf kunt oplossen: Stappenplan en tips

Heb je te maken met ‘onterechte’ soft 404’s maar snap je niet waarom? Check je HTML op typische 404-tekst. Is dit aanwezig op de pagina? Dan zal dát hoogstwaarschijnlijk de boosdoener zijn. Hoe je dit analyseert? Daar heb ik een kort stappenplan van gemaakt.

Stap 1: Open het dekkingsrapport in Google Search Console en check deze op soft 404’s

Indien je last hebt van soft 404’s, dan zul je dit rapport zeker kunnen vinden. Is het dekkingsrapport nieuw voor je? Volg dan de volgende stappen:

Login bij search console en ga in het linker menu naar ‘overzicht’ (als je daar niet al bent)

In het midden van je scherm zie je nu het dekkingsrapport. Klik op ‘rapport openen’

Je komt nu op de pagina van het dekkingsrapport. Deze ziet er als volgt uit:

 

Soft 404 reden

 

Heb je last van soft 404’s dan zal hier duidelijk een melding staan. Klik op ‘ingediende url is een soft 404’ en je krijgt een overzicht met voorbeelden van getroffen pagina’s.

Maak een export/uitdraai van de voorbeelden, rechts bovenin je scherm.

 

Stap 2: Loop de uitdraai/export door en kijk naar overeenkomstige pagina’s

Nadat je een export hebt gemaakt van de soft 404 pagina’s, is het verstandig om te kijken of je overeenkomsten ziet in de lijst. Zijn de getroffen pagina’s bijvoorbeeld allemaal productpagina’s? Of zijn het toch voornamelijk categoriepagina’s?

Overeenkomst gevonden? Dan adviseer ik je daar te beginnen met zoeken. Neem 5 tot 10 pagina’s als steekproef en bekijk voor deze pagina’s de HTML output.

 

Stap 3: Open een aantal pagina’s en inspecteer de html

Open de 5 tot 10 pagina’s die je als steekproef hebt gekozen en open in je browser. Je gaat nu kijken naar typische 404 tekst.

De 404 tekst hoeft niet perse zichtbaar te zijn. Daarom is het belangrijk dat je de pagina HTML inspecteert. Dit doe je door op de desbetreffende pagina op CTRL + U te drukken (windows).

Een nieuw tabblad met de html van de pagina wordt geopend. Nu is het tijd om de pagina door te lopen op ‘typische 404 tekst’. Deze html tekst kan echt overal voorkomen: In headings, paragraphs, div elementen en in ons geval zelfs in alt-tags!!

Je kunt de pagina van boven naar beneden doorlopen, maar nóg beter is om gebruik te maken van de zoekfunctie (CTRL + F). Dat gaat je waarschijnlijk een hoop tijd besparen.

Soft 404 source code bekijken

 

 

Voorbeelden van teksten waar je op kunt letten:

  • “niet langer beschikbaar” / “no longer available”
  • “Dit item is niet beschikbaar” / “item not available”
  • “niet op voorraad” / “not in stock”
  • “dit ….. bestaat niet” / “does not exist”
  • “niet gevonden” / “not found”
  • “sorry we hebben geen resultaten gevonden” / “Sorry there are no ….. that match your search”

LET OP: Het wil nog wel eens voorkomen dat er ook Engelse tekst op de pagina aanwezig is. Vergeet dus niet de Engelse varianten te checken.

 

Stap 4: Hoe je de soft 404’s fixt: Pas de gevonden tekst aan in je CMS

Tekst gevonden en ben je van mening dat dit Google onterecht een ‘soft 404’ laat triggeren? Dan is het tijd om de tekst(en) aan te passen.

Dit is voor de één wat gemakkelijker dan de ander. Dat is afhankelijk van hoe jouw pagina’s in elkaar steken. Kun je het niet direct vinden of heb je niet de mogelijkheid om het aan te passen? Vraag dan jouw webbouwer of technische collega om met je mee te kijken! Zij kunnen het probleem in veel gevallen vrij gemakkelijk oplossen.

 

Tekst aangepast? Dan is het wachten.

Is de typische 404 tekst vervangen voor iets anders dat google niet zal triggeren? Dan zijn de getroffen pagina’s niet meteen weer terug in de index. Het kan even duren voordat Google de betreffende pagina’s opnieuw heeft gecrawld en weer in de index opgenomen heeft.

Wees geduldig en je zult zien dat het aantal soft 404 pagina’s in het dekkingsrapport, langzaam kleiner wordt.