Làm sao để chặn Google index cho subdomain?

Trong quá trình phát triển và xây dựng website chắc hẵn bạn cũng sẽ gặp vấn đề google index các subdomain mà bạn đã tạo. Vậy Làm sao để chặn Google index cho subdomain?

Giải thích cụ thể cho câu hỏi như ở tiêu đề là: Em có 1 domain chính và 1 subdomain. Khi kiểm tra số index trên Google (site:domain[.]com) thì kết quả index ra cả sub[.]domain[.]com và domain.com.

Em chỉ muốn kết quả index của sub thì sẽ ra đường link của sub chứ không ra một chút gì liên quan tới domain chính. Như trang taimienphi[.]vn đó ạ. Họ có sub domain là thuthuat[.]taimienphi[.]vn. Khi kiểm tra index và gõ: site:taimienphi[.]vn – Kết quả trả về không có sub domain từ thuthuat[.]taimienphi[.]vn. Và khi kiểm tra site:thuthuat[.]taimienphi[.]vn thì kết quả trả về cũng chỉ có các trang được index dưới sub domain của họ.

Nguồn: Diễn đàn Hỗ trợ Google

Chặn Google index subdomain
Chặn Google index subdomain

Cách chặn Goolge bot thu thập dữ liệu subdomain ( tên miền con )

Search trên google thì mìn thấy có nhiều cách để giải quyết trường hợp này. Nhưng mình thấy cách làm sau đây là hiệu quả và dễ tùy biến nhất.

Giải pháp đó là sữ dụng file robots động thay thế cho file robotst.txt tĩnh.

Tại file httpd.conf (.htaccess): 

RewriteRule /robots\.txt$ /var/www/myweb/robots.php

Tạo file robots.php tại thư mục góc của website với nội dung sau:

header('Content-type: text/plain');

if($_SERVER['HTTP_HOST']=='*.myweb.com'){
echo "User-agent: *\n";
echo "Disallow: /\n";
}else{
include("./robots.txt");
}

Vậy là đã xong, bạn đã có thể chặn google thu thập dữ liệu của các subdomain. Nếu bạn có thắc mắc gì trong quá trình thực hiện hãy để lại commet hoặc thông tin bên dưới mình sẽ hỗ trợ.