Inlog voor klanten: Uw Persoonlijke Omgeving / Webmail: Uebimiau.Webmail of SquirrelMail / Control Panel / TelHosting Platform
 

Vanaf 22 maart 1995 staan wij voor de beste service en een no nonsense werkwijze. Binnen uw onderneming willen wij een klankbord zijn wat betreft uw internet-activiteiten.
Wat InfoData betreft is uw website niet een aanhangsel maar uw vestiging op het internet welke mede zorgt voor een goed bedrijfsresultaat.

 
Het is belangrijk dat op alle pagina's van uw website de correcte code wordt gebruikt.
Dat geldt voor de:
- algehele structuur
(HTML 4.01 ok!)
maar evenzeer voor de
- opmaak (CSS 2.1 ok!)
Achterwerf 302
NL-1357 DD  Almere
tel: +31 (0)36 5400445
Stuur een email
kvk: 33267638
Infodata onderschrijft de ISP-gedragscode

Klik voor meer info

Internet diensten
- registratie domeinnamen
- hosting
- webdesign
- website optimalisatie
  Webmaster-hulp
Hulp nodig als webmaster?
CD - workshop - gratis tips
gratis nieuwsbrief
  Beter computeren
Haal meer uit uw computer.
Maak gebruik van
de Computer-CD
[ meer info ] [ meer info ] [ meer info ]

Pagina's indexeren, robots.txt en sitemap.xml
gepubliceerd op 4 februari 2010

In dit artikel wil ik het hebben over het door de zoekrobots (lees Google) wel of niet indexeren van de pagina's van uw website. Hiervoor bespreek ik de bestanden robots.txt en sitemap.xml.
Maar eerst nog iets in aansluiting op het vorige artikel. Ik heb u als tip meegegeven om ook zoektermen in de url van uw pagina te plaatsen. De url dat is de bestandsnaam van de pagina, meestal een .htm- of .html-bestand of soms een .php-bestand.
Wanneer u nu de naam van een bestaande pagina gaat veranderen, is het verstandig ervoor te zorgen dat dezelfde pagina ook onder de oude naam bereikbaar blijft. Een voorbeeldje:

  • De (oude) naam van de pagina is pagina001.html
    Deze naam heeft geen enkele waarde voor een zoekmachine. We gaan ervan uit dat u op deze pagina producten plaats welke in aanbieding zijn. Voor de duidelijkheid u verkoopt tuinproducten.
  • Google zal het waarderen wanneer u de nietszeggende naam zou veranderen in bijvoorbeeld
    aanbiedingen-voor-uw-tuin.html
  • U herbenoemt het bestand. Vergeet niet om ook de link in het menu op uw site aan te passen.
  • Maakt een leeg bestand aan met de oude naam (pagina001.html)
    In dat bestand plaats u de volgende content:
    <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
    <html>
    <head>
    <title></title>
    <meta http-equiv="content-type" content="text/html; charset=ISO-8859-1">
    <meta name="robots" content="none, noindex, nofollow">
    <META HTTP-EQUIV="refresh" CONTENT="0; url=aanbiedingen-voor-uw-tuin.html">
    </head>
    <body></body></html>
    Wanneer nu iemand op deze pagina terechtkomt wordt deze pagina onmiddelijk (na 0 seconden) ververst (refresh) met de pagina 'aanbiedingen-voor-uw-tuin.html'. De bezoeker zal daar niets van merken.

De bestanden robots.txt en sitemap.xml zijn bedoeld om zoekmachines behulpzaam te zijn bij het indexeren van de pagina's van uw website. Beide bestanden plaatst u in de root (de hoofddirectory) van uw hosting. Dat is waar ook uw index-bestand staat.

In robots.txt geeft u instructies mee voor de zoekrobots. U vermeld daar de bestanden welke NIET geïndexeerd worden. Dat is bijvoorbeeld het lege (oude) bestand van hiervoor. Persoonlijk sluit ik ook pagina's met alleen een formulier of een bedankpagina uit van indexatie.
Robots.txt is een txt-bestand met de volgende inhoud:

User-agent: *
Disallow: /beeld/
Disallow: pagina001.html
Disallow: bedankt.html

In dit voorbeeld vertel ik
  -  dat het geldt voor alle user-agents (voor alle zoekmachines)
  -  dat alle pagina's in de directory beeld niet geïndexeerd mogen worden
  -  dat de pagina's pagina001.html en bedankt.html niet geïndexeerd mogen worden.
Zo kunt u meerdere pagina's en directories afsluiten voor zoekmachines.

In het bestand sitemap.xml plaats u de pagina's welke wel geïndexeerd dienen te worden en verstrekt u bijkomende informatie voor de zoekrobot. Hierna een voorbeeld met daarin de home-pagina en de pagina 'aanbiedingen-voor-uw-tuin.html':

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://google.com/schemas/sitemap/0.84">
<url>
<loc>http://www.uwwebsite.nl/index.html</loc>
<lastmod>2010-02-04</lastmod>
<changefreq>monthly</changefreq>
<priority>0.9</priority>
</url>
<url>
<loc>http://www.uwwebsite.nl/aanbiedingen-voor-uw-tuin.html</loc>
<lastmod>2010-02-04</lastmod>
<changefreq>weekly</changefreq>
<priority>0.7</priority>
</url>
</urlset>
  • op de eerste regel wordt het type document weergegeven
  • op regel 2 wordt de 'urlset' geopend
  • op de laatste regel van het bestand wordt de 'urlset' afgesloten
  • op de regels tussen <urlset .... > en </urlset> worden de 'url's' weergegeven tussen de tags <url> en </url>
    Voor elke url (elk bestand) worden weergegeven:
    • de locatie van het bestand tussen <loc> en </loc>
      Bemerk dat altijd de volledige url inclusief http:// vermeld moet worden.
    • de datum van de laatste wijziging aan het bestand tussen <lastmod> en </lastmod>
      Let op de weergave van de datum.
    • de frequentie waarmee het bestand wordt geupdated tussen <changefreq> en </changefreq>
      U heeft de volgende mogelijkheden:
      • never
      • yearly
      • monthly
      • weekly
      • dayly
    • de belangrijkheid van het bestand tussen <priority> en </priority>
      Dat is een waarde tussen 1.0 (meest belangrijk) en 0.1 (minst belangrijk)

Vergeet niet bij elke update van uw website het bestand sitemap.xml en (wanneer van toepassing) ook robots.txt aan te passen en te uploaden.

Dit was het voor deze keer. Reageer op het artikel met uw vragen of opmerkingen.
Succes met uw website.


Uw reactie op dit artikel is welkom

Wilt u reageren op dit artikel dan kan dat via onderstaand formulier.

Uw naam:
Email-adres
wordt niet vermeld:
Uw reactie:
Teneinde SPAM tegen te gaan, vragen wij u de hierna vermelde berekening te maken.
11 + 13=
InfoDataTitels
  -  Op de website plaatsen wij, wanneer daar aanleiding toe bestaat, mededelingen en nieuwsberichten.
  -  Daarnaast is er een blog. Waar u de mogelijkheid heeft op de artikelen vanaf december 2009 te reageren. Wij hopen dat er daardoor een uitwisselen van meningen ontstaat rondom uw en onze activiteiten op internet.
  -  Relevante onderdelen van onze nieuwsbrieven welke wij sinds 30 juli 2005 zijn in deze nieuwe structuur opgenomen.
  -  Vanaf 2010 ontvangt u dus geen nieuwsbrieven meer maar elke 3de zaterdag van de maand een overzicht van de in voorafgaande periode geplaatste berichten en artikelen. Het overzicht krijgt de naam InfoDataTitels.
  -  Voor wat betreft de InfoDataTitels gelden dezelfde regels als voorheen voor de nieuwsbrieven.
 
Aan- en afmelden
Wenst u de InfoDataTitels te ontvangen of niet meer te ontvangen dat kunt u zich hier AAN- of AFmelden.

 
[ naar boven ]    [ Vorige pagina ]    [ home ] www.infodata-nl.eu  //  www.infodata-be.eu
 
Vaak gezocht op internet beter computeren administratie zzp check domeinnaam
domeinnaam registreren hosting webdesign website optimalisatie
domeinnaam registreren Almere hosting Almere webdesign Almere website optimalisatie Almere
domeinnaam registreren Flevoland hosting Flevoland webdesign Flevoland website optimalisatie Flevoland
domeinnaam registreren Nederland hosting Nederland webdesign Nederland website optimalisatie Nederland
domeinnaam registreren België hosting België webdesign België website optimalisatie België
de beste domeinnaam de beste hosting de beste website zelf een website bouwen