Son zamanlarda iyi optimize edilmemiş ve sıralama yapmayan bir müşteri web sitesini yenilemek için işe alındım. Blogdaki gerçek site yapısı, site haritası, kategoriler ve etiketler bir karışıklıktır.
122 kategori var (temel olarak etiketler gibi kullanılıyorlardı, sadece her yerde şeyleri kategorize ediyorlardı) ve 2.100’den fazla (!!!) etiket. Temel olarak anahtar kelime spam: Yazarlar makalenin hakkında olduğunu düşündükleri herhangi bir avuç kelimenin etiketini yapıyorlar. Bu yüzden bunların nuked ve tamamen yeniden inşa edilmesi gerektiğini biliyorum ve bu arada etiket arşivlerini yok ettiler ve etiketler site haritası XML’yi Google Search Console’dan sildi. Umarım bu tek başına Google’ın siteyi bir anahtar kelime salatası olarak taramasını ve dizine eklemesini engellemeye yardımcı olur.
Ancak kategoriler için kötü ama tahtada tamamen çok kullanılmıyorlar. 20 gerçek kategoriye indirebileceğimizi ve gerisini silebileceğimizi söyleyebilirim. Şimdilik, endişem, bazılarının altında düzinelerce düzgün kategorize edilmiş blog yazısı var. "iyi" kategoriler. Genel olarak, hala yüzlerce kötü tanımlanmış ve kötü organize edilmiş kategorilere sahip bir karmaşa. En azından şimdilik kategorileri mahvetmeli ve XML kategorisini GSC sit haritalarından silmeli miyim? Herhangi bir endişe (Re: SEO/Google) yaklaşık birkaç yüz gönderi "iyi" Eğer tahtadaki kategori yapısı böyle bir karmaşa ise, bu yapıyı kaybeden kategoriler?
Tıpkı etiketler gibi hepsini ve her şeyi havaya uçurdum (o zaman iyi bir kategori+etiket yapısı ile yeniden inşa edildikten sonra yeni bir site haritası yapın), ancak kategorilerde tetiği çekmekte tereddüt ettim … eğer bundan herhangi bir olumsuz sonuç görürsem veya bu noktada bir zorunluluksa.
Are you getting traffic to those posts? If so, then no. Start cleaning it up. Use Screaming Frog to extract all the posts and download them into an Excel spreadsheet, then sort by category and proceed. Work your way down the list little by little. Then any URL changes redirect them. Map out what you’re going to do first. Unless you’re dealing with thousands of pages, that is a different approach.
You can (and should) allow crawl but not index.
But you should also clean them up – remove any categories/tags with low count (IE if there’s only 1 or 2 then remove/redirect).
Based on your description, it seems like you are using WordPress or a similar CMS. If so, unless you have the categories in your nav (which I doubt), it really doesn’t matter much, because the chances of getting hits to the category pages are slim. If this is the case, and I bet it is, what we do in these cases is very simple: define a set of categories you want to keep or even create them. Suppose 20 categories, like you said. Then filter posts for `”crap category 1″` and map them to `”clean category 1.”` Of course, you’ll have a lot of `”crap category {1, 2, 3, N},”` so repeat this process for each `”crap category.”` It could also happen that posts are in several categories, so you’ll end up with something like `”clean category 1″, “crap category 2.”` Simply repeat this process, keeping the clean category, and that’s it. The whole process may take you a couple hours at most.
**Once you do all this, delete all crap categories** (not before!). Again, assuming you use WordPress, you can use a plugin to automatically redirect the deleted pages. RankMath is quite good for that purpose.
And that’s it. No need to noindex or do weird stuff, simply category mapping. This will create a new sitemap and trigger a recrawl, which may impact results for a few days or a couple of weeks, but that’s it. The only issue is if you have hardcoded URLs like domain/category/post in your posts, but again, given the description you provided, I doubt anyone took care of internal linking, much less used hardcoded links.