Otomatik bir yamyamlık tespit hattı oluşturuyorum ve yaklaşımla ilgili geri bildirim almak isterim.
Çoğu araç, GSC’de aynı anahtar kelime için rekabet eden URL’leri işaretler. Bu, bariz şeyleri yakalar, ancak semantik olarak Google’ın ayırt edemeyeceği kadar yakın olan sayfaları, tam sorguları paylaşmasalar bile gözden kaçırır.
İşte test ettiğim şey şu: Her blog makalesini vektör uzayına yerleştiriyorum, ardından anlam açısından tehlikeli derecede yakın olan içerik kümelerini bulmak için hepsinde kosinüs benzerliği çalıştırıyorum. Buradan, GSC verilerine sahip makaleler için, bir yamyamlık riski puanı oluşturmak amacıyla gerçek sinyalleri (gösterimler, tıklamalar, konum eğilimleri) katmanlara ekliyorum. Odak noktası yalnızca teorik örtüşme değil, halihazırda sıralamasını kaybetmiş makalelerdir. Son olarak, yüksek riskli kümeler daha derin bir anlamsal ve tematik inceleme için bir Yüksek Lisans’a gönderilir: bunlar gerçekten aynı amacı mı kapsıyor? Otorite sayfası hangisi olmalı?
Temel olarak: tespit etmek için vektör yakınlığı, doğrulamak için GSC verileri, onaylamak ve önermek için LLM.
İlk sonuçlar umut vericidir; kümeleme adımı ilgili grupları etkili bir şekilde ortaya çıkarır ve nihai LLM analizi, makalelerin yeniden düzenlenmesi, birleştirilmesi veya yeniden yönlendirilmesi için uygulanabilir önerilerle birlikte kümeye bağlı olarak %60 ila %85 arasında bir güvenilirlik oranı gösterir.
Hâlâ çözdüğüm birkaç şey var: – Hangi kosinüs benzerliği eşiği işaretleme için anlamlıdır? 0,85 civarında test ediyorum ama keyfi gibi geliyor – Birleştirme/yönlendirme çağrısını yapması için Yüksek Lisans’a güvenir misiniz, yoksa onu sadece işaretleme için mi kullanırsınız? – Bu tür bir boru hattında kör noktalar görüyor musunuz?
Gerçekten geri bildirim arıyorum, hiçbir şeyin tanıtımını yapmıyorum.
