Hvad er webstedsindeksering? Hvordan sker det? Du kan finde svar på disse og andre spørgsmål i artiklen. Webindeksering (indeksering i søgemaskiner) er processen med at tilføje information om et websted til databasen af en søgemaskinerobot, som efterfølgende bruges til at søge efter information om webprojekter, der har gennemgået en sådan procedure.
Data om webressourcer består oftest af søgeord, artikler, links, dokumenter. Lyd, billeder og så videre kan også indekseres. Det er kendt, at søgeordsdetektionsalgoritmen er afhængig af søgemaskinen.
Der er en vis begrænsning for typerne af indekseret information (flash-filer, javascript).
Initiationsstyring
Indeksering af et websted er en kompleks proces. For at administrere det (f.eks. for at forbyde vedhæftning af en bestemt side), skal du bruge robots.txt-filen og sådanne instruktioner som Tillad, Disallow, Crawl-delay, User-agent og andre.
Tags og rekvisitter bruges også til indeksering, og skjuler indholdet af ressourcen fra Google og Yandex-robotter (Yahoo bruger tagget).
I Goglle-søgemaskinen indekseres nye websteder fra et par dage til en uge, og i Yandex - fra en til fire uger.
Vil du have dit websted til at blive vist i søgemaskineresultater? Så skal det behandles af Rambler, Yandex, Google, Yahoo og så videre. Du skal informere søgemaskiner (edderkopper, systemer) om eksistensen af dit websted, og så vil de gennemgå det helt eller delvist.
Mange websteder er ikke blevet indekseret i årevis. De oplysninger, der er på dem, kan ikke ses af andre end deres ejere.
Behandlingsmetoder
Indeksering af et websted kan gøres på flere måder:
- Første mulighed er manuel tilføjelse. Du skal indtaste dine webstedsdata gennem særlige formularer, der tilbydes af søgemaskiner.
- I det andet tilfælde finder søgemaskinerobotten selv dit websted ved hjælp af links og indekserer det. Han kan finde dit websted ved hjælp af links fra andre ressourcer, der fører til dit projekt. Denne metode er den mest effektive. Hvis en søgemaskine finder et websted på denne måde, anser den det for vigtigt.
Timing
Indeksering af webstedet er ikke for hurtigt. Vilkår varierer, fra 1-2 uger. Links fra autoritative ressourcer (med fremragende PR og Titz) fremskynder markant placeringen af webstedet i søgemaskinens database. I dag betragtes Google som den langsomste, selvom den indtil 2012 kunne klare dette job på en uge. TilDesværre ændrer tingene sig meget hurtigt. Det er kendt, at Mail.ru har arbejdet med websteder i dette område i omkring seks måneder.
Indeksering af et websted i søgemaskiner er ikke muligt for enhver specialist. Tidspunktet for tilføjelse af nye sider til databasen på et websted, der allerede er behandlet af søgemaskiner, påvirkes af hyppigheden af opdatering af dets indhold. Hvis der konstant dukker frisk information op på en ressource, betragter systemet den som hyppigt opdateret og nyttig for folk. I dette tilfælde er hendes arbejde fremskyndet.
Du kan følge indekseringen af et websted på særlige sektioner for webmastere eller på søgemaskiner.
Ændringer
Så vi har allerede fundet ud af, hvordan webstedet er indekseret. Det skal bemærkes, at søgemaskinedatabaser ofte opdateres. Derfor kan antallet af sider i dit projekt, der føjes til dem, ændre sig (både falde og stige) af følgende årsager:
- søgemaskinesanktioner mod webstedet;
- tilstedeværelsen af fejl på webstedet;
- ændring af søgemaskinealgoritmer;
- ulækkert hosting (utilgængelighed af serveren, hvor projektet er placeret) og så videre.
Yandex-svar på almindelige spørgsmål
"Yandex" er en søgemaskine, der bruges af mange brugere. Det ligger på en femteplads blandt verdens søgesystemer med hensyn til antallet af behandlede forskningsanmodninger. Hvis du føjede et websted til det, kan det tage for lang tid at tilføje til databasen.
Tilføjelse af en URL garanterer ikke dens indeksering. Dette er blot en af de metoder, som systemrobotten bliver fort altom en ny ressource. Hvis der er få eller ingen links til et websted fra andre websteder, vil tilføjelse af det hjælpe dig med at finde det hurtigere.
Hvis indeksering ikke fandt sted, skal du kontrollere, om der var fejl på serveren på tidspunktet for oprettelse af en applikation til den fra Yandex-robotten. Hvis serveren rapporterer en fejl, vil robotten afslutte sit arbejde og forsøge at fuldføre det i en tur-retur-ordre. Yandex-medarbejdere kan ikke øge hastigheden af tilføjelse af sider til søgemaskinedatabasen.
Indeksering af et websted i Yandex er en ret vanskelig opgave. Ved du ikke, hvordan du tilføjer en ressource til en søgemaskine? Hvis der er links til det fra andre websteder, så behøver du ikke tilføje et særligt websted - robotten vil automatisk finde det og indeksere det. Hvis du ikke har sådanne links, kan du bruge formularen "Tilføj URL" til at fortælle søgemaskinen, at webstedet eksisterer.
Husk, at tilføjelse af en URL ikke garanterer, at din skabelse vil blive indekseret (eller indekseret).
Mange undrer sig over, hvor lang tid det tager at indeksere et websted i Yandex. Medarbejdere i denne virksomhed giver ikke garantier og forudsiger ikke vilkår. Som regel, siden robotten fandt ud af webstedet, vises dens sider i søgningen om to dage, nogle gange om et par uger.
Process
"Yandex" er en søgemaskine, der kræver nøjagtighed og opmærksomhed. Siteindeksering består af tre dele:
- Søgerobot gennemgår ressourcesider.
- Indhold(indhold) af webstedet er registreret i databasen (indekset) i søgesystemet.
- Om 2-4 uger, efter opdatering af databasen, kan du se resultaterne. Dit websted vil (eller vil ikke) blive vist i søgeresultaterne.
Indekseringscheck
Hvordan tjekker man hjemmesideindeksering? Der er tre måder at gøre dette på:
- Indtast navnet på din virksomhed i søgefeltet (f.eks. "Yandex"), og tjek hvert link på den første og anden side. Hvis du finder URL'en til dit hjernebarn der, så har robotten fuldført sin opgave.
- Du kan indtaste dit websteds URL i søgefeltet. Du vil være i stand til at se, hvor mange internetark, der vises, dvs. indekseret.
- Tilmeld dig på webmasters sider i Mail.ru, Google, Yandex. Når du har bestået webstedsbekræftelsen, vil du være i stand til at se indekseringsresultaterne og andre søgemaskinetjenester, der er oprettet for at forbedre ydeevnen af din ressource.
Hvorfor fejler Yandex?
Indeksering af et websted i Google udføres som følger: robotten indtaster alle siderne på webstedet i databasen, lav kvalitet og høj kvalitet, uden at vælge. Men kun nyttige dokumenter er inkluderet i ranglisten. Og "Yandex" udelukker straks al webpapirkurv. Den kan indeksere enhver side, men søgemaskinen vil i sidste ende fjerne alt affald.
Begge systemer har et trinvis indeks. Begge sider af lav kvalitet påvirker placeringen af webstedet som helhed. Der er en simpel filosofi på spil her. Favorit ressourcer af en bestemtbrugeren vil indtage højere positioner i sin udstedelse. Men denne samme person vil have svært ved at finde et websted, han ikke kunne lide sidste gang.
Det er derfor, for det første, at det er nødvendigt at dække kopier af webdokumenter fra indeksering, kontrollere for tomme sider og forhindre indhold af lav kvalitet i at blive indekseret.
Fremskynd Yandex
Hvordan kan jeg fremskynde webstedsindeksering i Yandex? Følg disse trin:
- Installer Yandex-browseren på din computer, og brug den til at gennemse siderne på webstedet.
- Bekræft rettighederne til at administrere ressourcen i Yandex. Webmaster.
- Send et link til artiklen på Twitter. Det er kendt, at Yandex har samarbejdet med denne virksomhed siden 2012.
- Tilføj søgning fra Yandex til webstedet. I sektionen "Indeksering" kan du indtaste dine egne webadresser.
- Indtast "Yandex. Metrica"-koden uden at afkrydse "Indsendelse af sider til indeksering er forbudt".
- Producer et sitemap, der kun eksisterer for robotten og ikke er synligt for publikum. Verifikationen begynder med ham. Sitemapadressen indtastes i robots.txt eller i den relevante form i "Webmaster" - "Indekseringsindstillinger" - "Sitemapfiler".
Mellemliggende handlinger
Hvad skal der gøres, indtil websiden er indekseret af Yandex? Den indenlandske søgemaskine bør betragte webstedet som den primære kilde. Det er derfor, selv før artiklens offentliggørelse, er det bydende nødvendigt at tilføje dens indhold til formen af "Specifikke tekster". Ellersplagiatører vil kopiere posten til deres ressource og vil være den første i databasen. Som et resultat vil de blive anerkendt som forfatterne.
Google Database
For Google er de samme anbefalinger, som vi beskrev ovenfor, egnede, kun tjenesterne vil være anderledes:
- Google+ (erstatter Twitter);
- Google Chrome;
- Google-værktøjer til programmører - "Scan" - "Look like Googlebot" - mulighed "Scan" - mulighed "Index";
- søg i en ressource fra Google;
- Google Analytics (i stedet for Yandex. Metrics).
Forbud
Hvad er et webstedsindekseringsforbud? Du kan overlejre det både på hele siden og på en separat del af den (link eller et stykke tekst). Faktisk er der både et glob alt indekseringsforbud og et lok alt. Hvordan implementeres det?
Lad os overveje forbuddet mod at tilføje et websted til søgemaskinedatabasen i Robots.txt. Ved at bruge robots.txt-filen kan du udelukke indeksering af en side eller en hel ressourceoverskrift som denne:
- Bruger-agent:
- Disallow: /kolobok.html
- Disallow: /foto/
Det første punkt siger, at instruktionerne er defineret for alle PS'er, det andet angiver, at indeksering af kolobok.html-filen er forbudt, og det tredje tillader ikke tilføjelse af hele udfyldningen af fotomappen til database. Hvis du har brug for at ekskludere flere sider eller mapper, skal du angive dem alle i Robots.
For at forhindre indeksering af et bestemt internetark, kan du bruge robots-metatagget. Det er anderledes end robots.txtdet faktum, at det giver instruktioner til alle PS på én gang. Dette metatag følger de generelle principper for html-formatet. Det skal placeres i titlen på siden mellem tags. En indgang til et forbud kan f.eks. skrives således:.
Ajax
Hvordan indekserer Yandex Ajax-websteder? I dag bruges Ajax-teknologi af mange webstedsudviklere. Selvfølgelig har hun et stort potentiale. Med det kan du oprette hurtige og produktive interaktive websider.
Søgemaskinerobotten "ser" imidlertid weblisten anderledes end brugeren og browseren. For eksempel ser en person på en behagelig grænseflade med bevægeligt indlæste internetark. For en crawler kan indholdet på den samme side være tomt eller præsenteret som resten af det statiske HTML-indhold, som scripts ikke fungerer for.
Du kan bruge en URL medtil at oprette Ajax-websteder, men søgemaskinen bruger den ikke. Norm alt er den del af URL'en efter 'et adskilt. Dette skal tages i betragtning. Derfor, i stedet for en URL som https://site.ru/example, laver han en ansøgning til ressourcens hovedside, der er placeret på https://site.ru. Det betyder, at indholdet af internetarket muligvis ikke kommer ind i databasen. Som et resultat vil det ikke blive vist i søgeresultaterne.
For at forbedre indekseringen af Ajax-websteder understøttede Yandex ændringer i søgerobotten og reglerne for behandling af URL'erne på sådanne websteder. I dag kan webmastere indikere over for Yandex-søgemaskinen behovet for indeksering ved at oprette et passende skema i ressourcestrukturen. Til dette skal du bruge:
- Erstat symboleti URL'en på sidernepå den !. Nu vil robotten forstå, at den kan ansøge om HTML-versionen af indholdet af dette internetark.
- HTML-version af indholdet på en sådan side skal placeres på en URL, hvor ! erstattet med ?_escaped_fragment_=.