På internettet, på forskellige websteder, tilbydes brugeren en stor mængde forskellig information. Der er oprettet søgemaskiner for at få den nødvendige information, søge efter svar på spørgsmål. Når man hører denne sætning, tænker mange mennesker på Google, Yandex. Der er dog mange flere søgemaskiner på internettet.
Hvad er en søgemaskine
En søgemaskine anses for at være software, der består af en database med dokumenter. Brugere er udstyret med en speciel grænseflade, der giver dem mulighed for at indtaste de nødvendige forespørgsler og modtage links med relevant information. Dokumenter, der bedst matcher det, en bestemt person leder efter, er altid øverst i søgeresultaterne.
Søgeresultater, som genereres i overensstemmelse med den indtastede forespørgsel, indeholder norm alt forskellige typer resultater. Det kan indeholde websider, video- og lydfiler, billeder, pdf-filer, specifikke produkter (hvis søgningen udføres i en onlinebutik).
Klassificering af søgemaskiner
Eksisterende søgemaskiner er klassificeret i flere typer. Først og fremmest er det værd at nævne traditionelle søgemaskiner. For sådanne søgemaskiner er arbejdsprincipperne fokuseret på at finde information på et stort antal eksisterende websteder. Søgemaskiner er stadig tilgængelige på separate internetressourcer:
- i onlinebutikker (for at søge efter de rigtige produkter);
- på fora og blogs (for at søge efter indlæg);
- på informationswebsteder (for at søge efter artikler om det ønskede emne eller nyheder) osv.
Søgemaskiner er også underinddelt baseret på geografiske træk. I denne klassifikation er der 3 grupper af søgemaskiner:
- Global. Eftersøgningen udføres over hele verden. Lederen i denne gruppe er Google-søgemaskinen. Tidligere var der søgemaskiner såsom Inktomi, AltaVista osv.
- Region alt. Søgningen udføres efter land eller gruppe af lande, som er forenet af ét sprog. Regionale søgemaskiner er udbredte. Deres eksempel i Rusland er Yandex, Rambler.
- Lok alt. Eftersøgningen udføres i en bestemt by. Et eksempel på en sådan søgemaskine er Tomsk.ru.
Komponenter af søgemaskiner
I enhver søgemaskine er der 3 bestanddele, der bestemmer søgemaskinens principper:
- robot (indekser, edderkop, crawler);
- database;
- anmodningshandler.
Robot er et specielt program, hvis formål er at danne en database. Databasen gemmer og sortereralle indsamlede oplysninger. Anmodningsbehandleren, også kaldet klienten, arbejder med brugeranmodninger. Den har adgang til databasen. Klienten er ikke altid placeret på den samme computer. Anmodningsbehandleren kan spredes over flere fysisk ikke-relaterede elektroniske computere.
Principper for søgemaskiner
Alle eksisterende systemer fungerer efter samme princip. Overvej f.eks. funktionen af traditionelle søgemaskiner designet til internettet. Robottens funktion ligner en normal brugers handlinger. Dette program omgår med jævne mellemrum alle websteder, tilføjer nye sider og internetressourcer til databasen. Denne proces kaldes indeksering.
Når en bruger på internettet indtaster en bestemt forespørgsel i søgefeltet, begynder klienten at arbejde. Programmet tilgår den eksisterende database og genererer resultater baseret på nøgleord. Søgemaskinen giver links til brugeren i en bestemt rækkefølge. De sorteres efterhånden som de matcher forespørgslen, dvs. der tages hensyn til relevans.
Hver søgemaskine har sin egen måde at bestemme relevans på. Hvis brugeren sender en specifik anmodning til forskellige systemer, vil han ikke modtage nøjagtigt de samme resultater. Algoritmen til at bestemme relevans holdes hemmelig.
Relevansdetaljer
Med enkle ord er relevans korrespondancen af ordet eller kombinationen af ord, der er indtastet i søgningenspecifikke links i SERP. Flere nuancer påvirker placeringen af dokumenter på listen:
- Tilstedeværelse af søgeord i dokumenter. Denne nuance er indlysende. Hvis dokumentet indeholder ord fra den forespørgsel, som brugeren har indtastet, betyder det, at dette dokument matcher søgebetingelserne.
- Frekvens for forekomst af ord. Jo oftere søgeord bruges i et dokument, jo højere vil det være på SERP-listen. Dog ikke alt så enkelt. For meget brug af ord kan være et tegn på indhold af lav kvalitet til søgemaskinen.
Algorithmen til at bestemme relevans er ret kompliceret. For et par år siden kunne links, der indeholdt de nødvendige søgeord, men ikke svarer til dem i indhold, komme ind i søgeresultaterne. På nuværende tidspunkt er principperne for drift af søgemaskiner komplicerede. Nu kan robotter analysere hele teksten. Søgemaskiner tager højde for en lang række forskellige faktorer. Takket være dette er udgaven dannet ud fra relevante links af højeste kvalitet.
Sådan formuleres anmodninger korrekt
Selv i skolen blev vi lært at stille spørgsmål korrekt. Det afhænger af, hvilken slags svar vi får. Denne regel skal dog ikke overholdes, når du bruger søgemaskiner. For moderne søgemaskiner er det ligegyldigt i hvilket nummer eller tilfælde en person skriver sin anmodning. Uanset hvad, vil outputtet inkludere de samme resultater.
Søgemaskiner behøver ikke en klar formulering af spørgsmålet. Brugeren skal kun vælge de rigtige søgeord. Overvej et eksempel. Vi skal findeteksten til sangen "A Day Without You", som fremføres af den berømte kvindelige popgruppe "Via-Gra". Når du kontakter en søgemaskine, er det ikke nødvendigt at navngive gruppen, angiv at dette er en sang. Det er nok at skrive "en dag uden dig sms." Behold sag, tegnsætning er ikke påkrævet. Disse nuancer tages ikke i betragtning af søgemaskiner.
Ranking af søgemaskiner i verden
Den førende søgemaskine i verden er Google. Det blev grundlagt i 1998. Systemet er meget populært, hvilket bekræftes af analytiske oplysninger. Omkring 70 % af de anmodninger, der kommer til internettet, håndteres af Google. Søgemaskinedatabasen er enorm. Mere end 60 billioner forskellige dokumenter er blevet indekseret. Google tiltrækker brugere med en enkel grænseflade. Hovedsiden har et logo og en søgelinje. Denne funktion giver os mulighed for at kalde Google for en af de mest minimalistiske søgemaskiner.
Bing er den næstmest populære søgemaskine. Det dukkede op samme år som Google. Skaberen af denne søgemaskine er den velkendte internationale virksomhed Microsoft. Lavere positioner i ranglisten er besat af Baidu, Yahoo!, AOL, Excite, Ask.
Hvad er populært i Rusland
Yandex er den mest populære søgemaskine i Rusland. Denne tjeneste dukkede op i 1997. Først var det russiske firma CompTek International engageret i det. Lidt senere dukkede Yandex-virksomheden op, som fortsatte med at engagere sig i en søgemaskine. Søgemaskine tilårs eksistens har vundet enorm popularitet. Det kan søges på flere sprog – russisk, hviderussisk, ukrainsk, tatarisk, kasakhisk, engelsk, tysk, fransk, tyrkisk.
Fra statistiske data er det kendt, at "Yandex" er interessant for mere end 50 % af Runet-brugere. Over 40 % af folk foretrækker Google. Cirka 3 % af brugerne valgte Mail.ru, en russisksproget internetportal.
Beskyttede søgemaskiner
De sædvanlige søgemaskiner, som vi kender, er ikke ligefrem egnede til børn. Unge internetbrugere kan ved et uheld finde nogle materialer til voksne, information, der kan skade psyken. Af denne grund er der oprettet særlige sikre søgemaskiner. Deres databaser indeholder kun sikkert indhold for børn.
Et eksempel på en sådan søgemaskine er Sputnik. Children. Denne service er ret ung. Det blev skabt af Rostelecom i 2014. Søgemaskinens hovedside er lys og interessant designet. Den præsenterer en bred vifte af indenlandske og udenlandske tegnefilm til børn i forskellige aldre. Derudover er der på hovedsiden informative links relateret til flere overskrifter - "Sport", "Jeg vil vide alt", "Gør det selv", "Spil", "Teknologi", "Skole", "Natur".
Et andet eksempel på en sikker børnesøgemaskine er Agakids.ru. Dette er en absolut sikker ressource. Hvordan fungerer en søgemaskine? Robotten er konfigureret på en sådan måde, at den kun omgår de websteder, der er relateret til børns emner ellerer nyttige for forældre. Søgemaskinens database indeholder ressourcer med tegnefilm, bøger, undervisningslitteratur, spil, malebøger. Forældre, der bruger Agakids.ru, kan selv finde websteder om børns opdragelse og sundhed.
Afslutningsvis er det værd at bemærke, at søgemaskiner er komplekse systemer. De står over for en masse problemer - problemerne med spam, at bestemme relevansen af dokumenter, frasortere indhold af lav kvalitet, analysere dokumenter, der ikke indeholder tekstinformation. Af denne grund introducerer udviklere nye tilgange og algoritmer, der er forretningshemmeligheder i internetsøgemaskiners arbejde.