Büyük bir WordPress sitesinde (20.000’den fazla sayfa) tarama bütçesi sorunuyla karşılaşıyorum. Binlerce yayın URL’si, bunları engellemek ve işlemek için zaten birçok adım atmış olmama rağmen Google tarafından tekrar tekrar taranıyor.

Hemen hemen her blogun ve açılış sayfasının ilişkili bir özelliği vardır. /feed/ URL ve Google her 2-3 günde bir ~15.000’den fazla tanesini tarıyor. Hatta bu yayın URL’lerinden bazıları dizine ekleniyor ve ben bunu tamamen ortadan kaldırmak istiyorum.

Şu ana kadar uyguladıklarım şunlar:

  • WordPress ayarları/eklentileri aracılığıyla engellenen yayınlar
  • Kurallar eklendi robots.txt:İzin verme: /feed İzin verme: */feed/ İzin verme: /?*
  • Koşullu işleme uygulandı:
    • Normal kullanıcılar için → feed URL’leri standart (feed olmayan) sürüme 301 yönlendirilir
    • Botlar için → yayın URL’leri 410 değerini döndürür (Gitti)

Tüm bunlara rağmen Google, büyük miktarda yayın URL’sini tutarlı bir şekilde taramaya devam ediyor ve bu da önemli sayfalar için tarama verimliliğimi olumsuz etkiliyor.

Hangi konuda yardıma ihtiyacım var:

  • Nasıl yapabilirim tamamen dur Google’ın bu yayın URL’lerini taraması mı gerekiyor?
  • Botlar için 410 + kullanıcılar için yönlendirmeden daha iyi bir yaklaşım var mı?
  • Tarama bütçesini yönlü/özet akışı URL’lerinden geniş ölçekte geri almaya yönelik kanıtlanmış stratejiler var mı?