Bij www.patrickgodshal.com heb ik gewoon een robots.txt draaien.
Dus gewoon in je root zetten, dan pakt Google hem. Met http://www.patrickgodshal.com/sitemap.xml verwijs ik naar de belangrijkste content.
Code:
User-agent: Googlebot Disallow: User-agent: googlebot-image Disallow: User-agent: googlebot-mobile Disallow: User-agent: MSNBot Disallow: User-agent: Slurp Disallow: User-agent: Teoma Disallow: User-agent: twiceler Disallow: User-agent: Gigabot Disallow: User-agent: Scrubby Disallow: User-agent: Robozilla Disallow: User-agent: Nutch Disallow: User-agent: ia_archiver Disallow: User-agent: baiduspider Disallow: User-agent: naverbot Disallow: User-agent: yeti Disallow: User-agent: yahoo-mmcrawler Disallow: User-agent: psbot Disallow: User-agent: asterias Disallow: User-agent: yahoo-blogs/v3.9 Disallow: User-agent: * Disallow: / Crawl-delay: 10 Disallow: /cgi-bin/ Disallow: /private/ Sitemap: http://www.patrickgodshal.com/sitemap.xml
Dus gewoon in je root zetten, dan pakt Google hem. Met http://www.patrickgodshal.com/sitemap.xml verwijs ik naar de belangrijkste content.
Comment