Robots.txt , arama motorları sitenizi tararken nasıl davranması gerektiğini düzenleyebileceğiniz, sitenizde erişmesini istemediğiniz yerleri gösterdiğiniz, sitenin kök dizinine atılan bir metin metin dosyasıdır. Robots,txt , küçük bir komut setine sahip bir protokol olan Robotları Engelleme Standardı‘nı kullanır.
Daha basit bir ifade ile anlatmak gerekirse, arama motoru botları’nı yönlendirebileceğiniz, belirli dosyaların listelenmesini engellemenize yarayan bir yönlendiricidir. Robots.txt dosyaları sitemizin ana dizininde bulunmalıdır. Farklı bir dizine eklendiği taktirde çalışmayacaktır. Dosyayı ana dizine eklediğiniz zaman ozengen.com/robots.txt şeklinde görünmesi gerekmektedir. Yazının devamında WordPress sistemler için en uygun robots.txt dosyasını bulabilirsiniz.
Sitemizin arama motorları tarafından doğru şekilde indexlenmesi çok önemlidir. Bunun yanında site içeriğimizn doğru şekilde listelenmesi daha da önemlidir. Çok fazla içeriğin arama motorunda görünmesi bir başarı değildir. Önemli olan faydalı ve kullanıcıların ilgisini çeken içeriklerin arama sonuçlarında görünüyor olmasıdır. Hazır sistemlerde eğer özel bir yapılandırma yapılmadıysa, sistem, indexlenecek ve indexlenmeyecek dosyaları belirler. Fakat birçok sistem için bu ayarın manuel olarak yapılandırılması gerekmektedir.
Googlebot’un ve diğer web tarayıcılarının robots.txt dosyanızı bulup tanıyabilmesi için kaydetmeye ilişkin aşağıdaki esasları uygulamanız gerekir:
Örnek olarak, http://www.example.com/robots.txt URL adresinde example.com kök dizinine kaydedilen bir robots.txt dosyası, web tarayıcıları tarafından bulunabilir, ancak http://www.example.com/not_root/robots.txt adresindeki bir robots.txt dosyası web tarayıcıları tarafından bulunamaz.
User-agent Komutu: Hangi arama motorları tarafından sitenizin listelenmesini ayarlayabileceğiniz komuttur. Örneğin Yandex tarafından sitenizin indexlenmesini istemiyorsanız aşağıdaki gibi kullanabilirsiniz.
user-agent: *(yandex.com)
Disallow Komutu: Sitenizde indekslenmesini istemediğiniz dosyaları belirleyebileceğiniz komuttur. Örneğin; sitenizde bulunan resimler klasörünü arama motorlarından gizlemek istiyorsanız:
Disallow: /resimler/ komutunu kullanarak bu işlemi yapabilirsiniz.
WordPress sistemlerde kullanabileceğiniz örnek Robots.txt dosyası:
WordPress siteler için en çok kullanılan dizilim aşağıdaki gibidir. Özel bir ayarınız yoksa bu dosyayı kullanabilirsiniz.
User-agent: * Disallow: Disallow: /cgi-bin/ Disallow: /wp-admin/ Sitemap: https://www.siteadi.com/sitemap.xml
2024 yılında Broadcom tarafından tamamlanan satın alma sürecinin ardından VMware’in lisanslama stratejisinde köklü değişiklikler yapıldı.…
Telefon rehberinizde yer alan bazı numaraları silmek istediğinizde “salt okunur kişi silinemez”, “bu kişi düzenlenemez”…
Dijital dönüşüm hız kazandıkça yapay zeka okuryazarlığı ve prompt mühendisliği kavramları hem bireyler hem de…
e-Devlet Kapısı, vatandaşların kamu kurumlarına ait pek çok hizmete tek noktadan, hızlı ve güvenli biçimde…
Yapay zekâ (AI) teknolojilerinin hızlı gelişimi, insan–makine etkileşiminde köklü değişiklikler yaratmıştır. Bu dönüşümün en dikkat…
Microsoft Word kullanırken zaman zaman boş veya istemediğimiz bir sayfa oluşabilir. Özellikle belge düzenlerken, çıktı…