Hey herkes
Büyük bir site çalıştırıyorum (hakkında 350.000 böcek türü) böyle organize edildi:
Aile → Alt Family → Türler → Fotoğraflar/Haritalar → Bireysel Fotoğraf/Veri Sayfaları.
Her şey statik, İspanyolca ve sadece yılda bir kez güncellendi (nüfus verileri, yeni fotoğraflar vb.).
İşte arama konsolunda gördüğüm şey:
- 143K URL’ler: Trawled – şu anda endekslenmemiş (yarısı fotoğraf/harita/veri seviyelerinden)
 - 68K URL’ler: Keşfedildi – Şu anda endekslenmemiş (neredeyse hepsi bu düşük seviyelerden)
 
Birkaç yıl önce, bunların hepsi para cezasını endeksliyordu. 2022 civarında (yararlı içerik + temel güncellemeler), Google ana tür sayfalarının altında zar zor endekslemektedir.
Yani benim sorularım:
- Bu gibi büyük yapılandırılmış siteler için bu normal mi?
 - Tüm bu “indekslenmemiş” URL’ler üst seviyeler için tarama veya sıralamaya zarar verebilir mi?
 - Her şeyi (fotoğraflar, haritalar vb.) Ana türler sayfasına birleştirmeli ve ekstra url’leri öldürmeli miyim?
 
Büyük veritabanı tarzı veya taksonomi tipi siteleri yöneten herhangi birinin aynı soruna girdiğini duymak isterim.
Teşekkürler!

This is about shaping authority. Most big sites have less than 50% indexed.
Yes its normal
No, they can’t hurt your sites ranking or crawl budget
You can merge them or you can try to better shape authority to them
I would look at whether there’s value in having them indexed
Pages can become de-indexed because they’re not earning impressions
You shape authority by building points of authority throughout the tiers and then linking to the fringe pages.
I would export that data and delete all but the ones that should be indexed. usually keep just the clean URLs with no funky tail at the end. then check those URLs to see if they are indexed. if any that should be are not click Request Indexing.
a bit laborious but it works well.
when you are done click Crawled – currently not indexed and start a new validation. after it is done, if you see pages come back onto the list there is most likely a reason why Google doesn’t want to index it. duplicate or low content, or something.