Søg efter information ved hjælp af søgemaskiner. For at søge på den nøjagtige ordform skal du sætte et udråbstegn foran ordet.

Søgning efter information på internettet

Søgning efter information på internettet

For at søge information i almindeligt anvendte tre måder(Se fig. 1). Først af dem - søg på adresse. Det bruges, når brugeren kender adressen på en informationsressource, der indeholder de oplysninger, han har brug for. Når du organiserer søgningen efter information efter adresse (adressens form - IP, domæne eller URL - i dette tilfælde er ligegyldigt), skal brugeren blot indtaste adressen på ressourcen i det relevante felt i browseren - et program designet til at give adgang til netværksressourcer.

Ris. 1. Måder at søge efter information i hypertekstdatabaser

Anden- søg ved hjælp af hyperlinknavigation. Ved brug af denne type søgning skal brugeren først tilgå den server, der er knyttet til den tilsvarende database. Du kan derefter finde dokumentet ved hjælp af hyperlinks. Denne metode er naturligvis praktisk, når adressen på ressourcen er ukendt for brugeren. For at blive brugt som udgangspunkt for søgning ved implementering af denne metode er webportaler beregnet til - servere, der giver direkte adgang til et bestemt sæt servere, herunder informationsressourcer installeret på dem, samt webapplikationer, der implementerer webtjenester svarende til formålet med portalen. Serverne, der er tilgængelige via portalen, kan referere til et specifikt system (f.eks. virksomheder) eller forskellige systemer og være specielt udvalgt i henhold til de specifikke, tematiske eller andre funktioner i dokumenterne og dataene på deres websteder. Typisk kombinerer portaler en række funktioner for at holde kunden så længe som muligt. Portalens dominerende tjeneste er referencetjenesten: søgning, rubrikatorer, finansielle indekser, vejrinformation mv. Mens websteder for det meste er samlinger af statiske websider, er portaler samlinger af softwareværktøjer og præ-ustruktureret information, som disse værktøjer forvandler til strukturerede data efter anmodning fra specifikke brugere.

Den tredje søgemetoden involverer brug af internetsøgeservere. Søgeservere er dedikerede værter - computere, der er vært for databaser med internetressourcer. Brugergrænsefladen på en sådan server har et felt til indtastning af nøgleord, der beskriver emnet af interesse for brugeren (se fig. 2).

Fig.2. Visning af Yandex-søgeservervinduet

Serveren opfatter disse ord som en informationsanmodning, i overensstemmelse med hvilken den søger efter ressourcer og præsenterer en liste over fundne dokumenter for brugeren. Når denne metode implementeres, er fejl af både 1. (mangler målet) og 2. type (informationsstøj) naturligvis mulige. Det skal nævnes, at der skelnes mellem to grupper af søgeservere: søgemaskiner og emnemapper. Deres forskel skyldes metoden til oprettelse og efterfølgende genopfyldning af databasen med internetressourcer, som denne server udfører informationssøgning. Så søgemaskiner inkorporerer et særligt program - en søgerobot. Det overvåger konstant netværket, indsamler information fra websider, indekserer dem og retter deres søgebillede i sin database. I emnekataloger dannes en database med internetdokumenter "manuelt" af specialiserede redaktører. Da der ikke er en enkelt administration på internettet, ændrer dets informationsressourcer sig konstant. Nye dokumenter kan dukke op i den, og eksisterende dokumenter kan forsvinde. Hyppigheden af ​​at opdatere oplysninger i dokumenter for forskellige websteder er forskellig: for nogle er det flere gange i timen, for nogle er det en gang om dagen, dag, måned osv. Derfor er det meget vigtigt at forstå, at når du bruger informationssøgningssystemer til at finde information på internettet, udføres søgningen ikke i webdokumenternes virkelige rum, men i en model, hvis indhold kan afvige væsentligt fra faktiske indhold på internettet på tidspunktet for søgningen. I henhold til graden af ​​dækning af indekserede ressourcer kan søgemaskiner opdeles i to grupper: international og russisksproget. Førstnævnte indekserer alle dokumenter udgivet på internettet i en række. Den anden indekserer ressourcer placeret i domænezoner med en overvægt af det russiske sprog. Listen over de mest populære systemer er angivet i tabel. en.

Tab. 1. Mest populære søgemaskiner

International russisktalende
Google Yandex (44,4 % af Runet)
Yahoo! Rambler (10,6 % af Runet)
Bing Mail.ru (7,3 % af Runet)
msn Nigma (0,5 % Runet)
AltaVista Gogo.ru (0,3 % Runet)
Spørg Aport (0,2 % Runet)

Bemærk: Runet er den russisktalende del af internettet, som udgør domæner med navne ru og rf.

Det skal nævnes, at der er en særlig kategori af søgemaskiner – metasøgemaskiner. Deres grundlæggende forskel fra søgemaskiner og emnekataloger er, at de ikke har deres egen indeksdatabase, og derfor, når de modtager en brugeranmodning, omdirigerer de den til flere søgeservere på én gang (se fig. 3).

Ris. 3. Skemaet for metasøgningssystemet

Muligheden for samtidig at bruge flere søgemaskiner til en enkelt anmodning er en åbenlys fordel ved metasøgemaskiner. På nuværende tidspunkt har Metabot.ru-systemet fundet bred anvendelse, hvis grænseflade er vist i fig. 4. Dette system giver dig mulighed for at bruge både internationale og russisksprogede søgeservere til at søge efter ressourcer.

1. Introduktion

Hvert år stiger mængden af ​​internettet mange gange, så sandsynligheden for at finde den nødvendige information stiger dramatisk. Internettet forener millioner af computere, mange forskellige netværk, antallet af brugere stiger med 15-80% årligt. Og ikke desto mindre, oftere og oftere, når man får adgang til internettet, er hovedproblemet ikke manglen på den nødvendige information, men evnen til at finde den. Som regel kan eller ønsker en almindelig person på grund af forskellige omstændigheder ikke at bruge mere end 15-20 minutter på at søge efter det svar, han har brug for. Derfor er det især vigtigt at lære korrekt og kompetent, ser det ud til, en simpel ting - hvor og hvordan man skal kigge for at få de ØNSKEDE svar.

For at finde de oplysninger, du har brug for, skal du finde dens adresse. Til dette er der specialiserede søgeservere (indeksrobotter (søgemaskiner), tematiske internetmapper, meta-søgesystemer, personsøgningstjenester osv.). Denne mesterklasse afslører de vigtigste teknologier til at søge information på internettet, giver fælles funktioner i søgeværktøjer, undersøger strukturen af ​​søgeforespørgsler for de mest populære russisk-sprogede og engelsksprogede søgemaskiner.

2. Søgeteknologier

Web-teknologi World Wide Web (WWW) betragtes som en særlig teknologi til udarbejdelse og placering af dokumenter på internettet. WWW inkluderer websider, elektroniske biblioteker, kataloger og endda virtuelle museer! Med sådan en overflod af information opstår spørgsmålet skarpt: "Hvordan navigerer man i et så stort og storstilet informationsrum?"
Søgeværktøjer kommer til undsætning ved at løse dette problem.

2.1 Søgeværktøjer

Søgeværktøjer er speciel software, hvis hovedformål er at levere den mest optimale og højkvalitets informationssøgning til internetbrugere. Søgeværktøjer hostes på specielle webservere, som hver især udfører en bestemt funktion:

  1. Analyse af websider og indtastning af resultaterne af analysen til et eller andet niveau af søgeserverdatabasen.
  2. Søg efter information på brugerens anmodning.
  3. Tilvejebringelse af en brugervenlig grænseflade til at søge information og se søgeresultatet af brugeren.

De arbejdsmetoder, der bruges, når man arbejder med disse eller andre søgeværktøjer, er næsten de samme. Inden du fortsætter med at diskutere dem, skal du overveje følgende begreber:

  1. Søgeværktøjets grænseflade er præsenteret som en side med hyperlinks, en forespørgselsstreng (søgestreng) og forespørgselsaktiveringsværktøjer.
  2. Søgemaskineindekset er en informationsbase, der indeholder resultatet af analysen af ​​websider, udarbejdet efter bestemte regler.
  3. En forespørgsel er et søgeord eller en sætning, som brugeren indtaster i søgefeltet. Specialtegn ("", ~), matematiske symboler (*, +, ?) bruges til at danne forskellige forespørgsler.

Ordningen for at søge information på internettet er enkel. Brugeren indtaster en nøglesætning og aktiverer søgningen og modtager derved et udvalg af dokumenter i henhold til den formulerede (givne) anmodning. Denne liste over dokumenter er rangeret efter bestemte kriterier, så øverst på listen er de dokumenter, der bedst matcher brugerens forespørgsel. Hvert af søgeværktøjerne bruger forskellige kriterier til rangering af dokumenter, både i analyse af søgeresultater og i dannelsen af ​​indekset (udfylder indeksdatabasen over websider).

Hvis du angiver en forespørgsel af samme design i søgestrengen for hvert søgeværktøj, kan du således få forskellige søgeresultater. For brugeren er det af stor betydning, hvilke dokumenter der vil optræde i de første to eller tre dusin dokumenter i henhold til søgeresultaterne, og i hvilket omfang disse dokumenter svarer til brugerens forventninger.

De fleste søgeværktøjer tilbyder to måder at søge på − simpel søgning(simpel søgning) og Avanceret søgning(avanceret søgning) med og uden en særlig anmodningsformular. Lad os overveje begge typer søgning på eksemplet med en engelsksproget søgemaskine.

For eksempel er AltaVista nyttig til vilkårlige forespørgsler, "Noget om online grader i informationsteknologi", mens Yahoo-søgeværktøjet giver dig mulighed for at få verdensnyheder, valutakursinformation eller vejrudsigt.

At mestre kriterierne for at forfine forespørgslen og avancerede søgeteknikker giver dig mulighed for at øge effektiviteten af ​​søgningen og hurtigt finde den nødvendige information. Først og fremmest kan du øge søgeeffektiviteten ved at bruge logiske operatorer (operationer) eller, og, tæt på, ikke, matematiske og specielle symboler i forespørgsler. Ved hjælp af operatorer og/eller symboler sammenkæder brugeren nøgleordene i den ønskede rækkefølge for at få det mest passende søgeresultat til forespørgslen. Anmodningsformularer er vist i tabel 1.

tabel 1

En simpel forespørgsel giver en række links til dokumenter, fordi listen omfatter dokumenter, der indeholder et af de ord, der er indtastet på anmodningen, eller en simpel sætning (se tabel 1). Operatoren og giver dig mulighed for at angive, at alle nøgleord skal inkluderes i dokumentindholdet. Antallet af dokumenter kan dog stadig være stort, og det kan tage lang tid at gennemgå dem. Derfor er det i nogle tilfælde meget mere praktisk at bruge nær kontekst-operatoren, som angiver, at ordene skal være placeret i tilstrækkelig nærhed i dokumentet. Brug af nær reducerer i høj grad antallet af fundne dokumenter. Tilstedeværelsen af ​​symbolet "*" i forespørgselsstrengen betyder, at ordet søges efter dets maske. Lad os f.eks. få en liste over dokumenter, der indeholder ord, der starter med "gov", hvis vi skriver "gov*" i forespørgselsstrengen. Det kan være ordene regering, guvernør osv.

Den lige så populære søgemaskine Rambler vedligeholder statistik over linktrafik fra sin egen database, de samme logiske operatorer OG, ELLER, IKKE, meta-tegnet * (svarende til tegnet * i AltaVista, der udvider forespørgselsområdet), koefficientsymboler + og - er understøttet til at øge eller mindske betydningsord indtastet i forespørgslen.

Lad os se på de mest populære informationssøgningsteknologier på internettet.

2.2 Søgemaskiner

Websøgemaskiner er servere med en enorm database af URL'er, der automatisk får adgang til WWW-sider på alle disse adresser, undersøger indholdet af disse sider, danner og skriver nøgleord fra siderne ind i deres database (indekssider).

Desuden følger søgemaskinerobotter de links, de støder på på siderne, og genindekserer dem. Da næsten enhver WWW-side har mange links til andre sider, kan søgemaskinen i slutresultatet teoretisk omgå alle websteder på internettet.

Det er denne type søgeværktøjer, der er den mest berømte og populære blandt alle internetbrugere. Alle kender navnene på velkendte websøgemaskiner (søgemaskiner) - Yandex, Rambler, Aport.

For at bruge denne type søgeværktøj skal du gå til det og skrive det søgeord, du er interesseret i, i søgefeltet. Dernæst vil du modtage et output fra de links, der er gemt i søgemaskinedatabasen, som er tættest på din forespørgsel. For at gøre søgningen mest effektiv skal du være opmærksom på følgende punkter på forhånd:

  • tage stilling til emnet for anmodningen. Hvad er det helt præcist, du ender med at lede efter?
  • være opmærksom på sprog, grammatik, brug af forskellige ikke-alfabetiske tegn, morfologi Det er også vigtigt at formulere og indtaste nøgleord korrekt. Hver søgemaskine har sin egen form for at lave en anmodning - princippet er det samme, men de anvendte symboler eller operatorer kan være forskellige. De påkrævede anmodningsformularer varierer også afhængigt af kompleksiteten af ​​søgemaskinesoftwaren og de tjenester, de leverer. På den ene eller anden måde har hver søgemaskine et afsnit "Hjælp" ("Hjælp"), hvor alle syntaksreglerne samt anbefalinger og tips til søgning er forklaret på en tilgængelig måde (skærmbillede af søgemaskinesider).
  • bruge mulighederne i forskellige søgemaskiner. Hvis du ikke kan finde det på Yandex, så prøv Google. Brug avancerede søgetjenester.
  • for at udelukke dokumenter, der indeholder visse termer, skal du bruge tegnet "-" før hvert sådant ord. For eksempel, hvis du ønsker information om Shakespeares værker, med undtagelse af "Hamlet", så indtast forespørgslen i formen: "Shakespeare-Hamlet". Og for at sikre, at visse links nødvendigvis er inkluderet i søgeresultaterne, skal du bruge "+"-symbolet. Så for at finde links om salg af biler specifikt, skal du bruge forespørgslen "udsalg + bil". Brug kombinationer af disse tegn for at øge effektiviteten og nøjagtigheden af ​​din søgning.
  • hvert link i listen over søgeresultater indeholder - flere linjer fra det fundne dokument, blandt hvilke der er dine søgeord. Før du klikker på linket, skal du vurdere uddragets relevans for emnet for anmodningen. Når du har klikket på linket til et bestemt websted, skal du omhyggeligt se dig omkring på hovedsiden. Som regel er den første side nok til at forstå, om du er kommet til adressen eller ej. Hvis ja, så foretag yderligere søgninger efter de nødvendige oplysninger på det valgte websted (i sektioner af webstedet), hvis ikke, vend tilbage til søgeresultaterne og prøv det næste link.
  • husk, at søgemaskiner ikke producerer uafhængig information (bortset fra forklaringer om dem selv). Søgemaskinen er kun et mellemled mellem ejeren af ​​informationen (hjemmesiden) og dig. Databaserne opdateres konstant, nye adresser indtastes i dem, men efterslæbet fra den information, der reelt findes i verden, er stadig tilbage. Simpelthen fordi søgemaskinerne ikke fungerer med lysets hastighed.

De mest berømte websøgemaskiner omfatter Google, Yahoo, Alta Vista, Excite, Hot Bot, Lycos. Blandt de russisktalende kan man fremhæve Yandex, Rambler, Aport.

Søgemaskiner er de største og mest værdifulde, men langt fra de eneste informationskilder på nettet, fordi der er andre måder at søge på internettet udover dem.

2.3 Mapper

Kataloget over internetressourcer er et konstant opdateret og genopfyldt hierarkisk katalog, der indeholder mange kategorier og individuelle webservere med en kort beskrivelse af deres indhold. Katalogsøgningsmetoden indebærer "at gå ned ad trinene", det vil sige at gå fra mere generelle kategorier til mere specifikke. En af fordelene ved tematiske mapper er, at forklaringerne til linkene er givet af skaberne af biblioteket og fuldt ud afspejler dets indhold, det vil sige, det giver dig mulighed for mere præcist at bestemme, hvordan indholdet på serveren svarer til formålet af din søgning.

Et eksempel på et tematisk russisk-sproget katalog er ressourcen http://www.ulitka.ru/.

På hovedsiden af ​​dette websted er der en tematisk rubrikator,

ved hjælp af hvilken brugeren indtaster rubrikken med links til de produkter, der interesserer ham.

Derudover giver nogle emnemapper dig mulighed for at søge efter nøgleord. Brugeren indtaster det ønskede søgeord i søgefeltet

og modtager en liste over links med beskrivelser af websteder, der bedst matcher hans anmodning. Det skal bemærkes, at denne søgning ikke finder sted i indholdet af WWW-servere, men i deres korte beskrivelse gemt i biblioteket.

I vores eksempel har biblioteket også mulighed for at sortere websteder efter antallet af besøg, alfabetisk, efter dato for indtastning.

Andre eksempler på russisksprogede mapper:
[email protected]
Webliste
Vsego.ru
Blandt de engelsksprogede mapper er:
http://www.DMOS.org
http://www.yahoo.com/
http://www.looksmart.com

2.4 Samlinger af links

Linksamlinger er links sorteret efter emne. De er indholdsmæssigt ret forskellige fra hinanden, så for at finde et udvalg, der passer bedst til dine interesser, skal du selv gennemgå dem for at danne dig din egen mening.

Som et eksempel vil vi give et udvalg af links "Treasures of the Internet" JSC "Relcom"

Brugeren ved at klikke på en af ​​de sektioner, der interesserer ham

  • INDHOLD

    For bilister

    • Astronomi og astrologi
    • Dit hus
    • Dine kæledyr
    • Børn er livets blomster
    • Fritid
    • Byer på internettet
    • Sundhed og medicin
    • Informationsbureauer og -tjenester
    • Museum for lokal viden osv.,
    • Bilelektronik.
    • Antik Automotive Museum.
    • Nævnet for Retsbeskyttelse af Bilejere.
    • sportdrive.

    Fordelen ved denne type søgeværktøjer er deres fokus, normalt omfatter udvalget sjældne internetressourcer, udvalgt af en bestemt webmaster eller ejer af en webside.

    2.5 Adressedatabaser

    Adressedatabaser er specielle søgeservere, der normalt bruger klassifikationer efter type aktivitet, efter leverede produkter og tjenester og efter geografi. Nogle gange suppleres de med en alfabetisk søgning. Databaseposterne gemmer oplysninger om websteder, der giver oplysninger om e-mailadresse, organisation og postadresse mod et gebyr.

    Den største engelsksprogede adressedatabase kan kaldes: http://www.lookup.com/ -

    Når brugeren kommer ind i disse undermapper, finder han links til websteder, der tilbyder information af interesse for ham.

    Bredt tilgængelige og officielle databaser med adresser i Den Russiske Føderation er ukendte for os.

    2.6 Søgning i Gopher-arkiver

    Gopher er et sammenkoblet system af servere (Gopher space) distribueret over internettet.

    Det rigeste litterære bibliotek er samlet i Gopher-rummet, men materialerne er ikke tilgængelige for fjernvisning: Brugeren kan kun se den hierarkisk organiserede indholdsfortegnelse og vælge en fil efter titel. Ved hjælp af et særligt program (Veronica) kan en sådan søgning foretages automatisk ved hjælp af forespørgsler baseret på nøgleord.

    Indtil 1995 var Gopher den mest dynamiske internetteknologi: vækstraten i antallet af relaterede servere oversteg vækstraten for servere på alle andre typer internet. I EUnet/Relcom-netværket har Gopher-servere ikke fået aktiv udvikling, og i dag er der næsten ingen, der husker dem.

    2.7 FTP-filsøgningssystem (FTP-søgning)

    En FTP-filsøgemaskine er en speciel type internetsøgemaskine, der giver dig mulighed for at finde filer, der er tilgængelige på "anonyme" FTP-servere. FTP-protokollen er designet til at overføre filer over et netværk, og i denne forstand er den funktionelt en slags analog af Gopher.

    Det primære søgekriterium er filnavnet angivet på forskellige måder (eksakt match, understreng, regulært udtryk osv.). Denne type søgning kan naturligvis ikke konkurrere med søgemaskiner med hensyn til muligheder, da indholdet af filer ikke tages i betragtning på nogen måde under søgningen, og filer, som du ved, kan få vilkårlige navne. Men hvis du har brug for at finde et velkendt program eller standardbeskrivelse, så vil filen, der indeholder det, med stor sandsynlighed have det passende navn, og du kan finde den ved at bruge en af ​​FTP-søgeserverne:

    FileSearch søger efter filer på FTP-servere efter navnene på selve filerne og mapper. Hvis du leder efter et program eller andet, så finder du på WWW-servere højst sandsynligt deres beskrivelse, og fra FTP-servere kan du downloade dem til dig selv.

    2.8 Søgemaskine i Usenet-nyhedskonferencer

    USENET NEWS er ​​internetfællesskabets telekonferencesystem. I Vesten kaldes denne tjeneste nyheder. En tæt analog til telekonferencer er de såkaldte "ekkoer" i FIDO-netværket.

    Fra en telekonferenceabonnents synspunkt er USENET en opslagstavle, der har sektioner, hvor du kan finde artikler om alt fra politik til havearbejde. Denne opslagstavle er tilgængelig via en computer, ligesom e-mail. Uden at forlade din computer kan du læse eller poste artikler til en bestemt konference, finde nyttige råd eller deltage i diskussioner. Naturligvis optager artikler plads på computere, så de opbevares ikke for evigt, men bliver periodisk ødelagt, hvilket giver plads til nye. På verdensplan er den bedste service til at finde information i Usenet-konferencer Google Groups-serveren (Google Inc.).

    Google Groups er et gratis online fællesskab og en diskussionsgruppetjeneste, der tilbyder det største arkiv af Usenet-meddelelser på internettet (mere end en milliard meddelelser). For mere information om vilkårene for brug af tjenesten, besøg venligst http://groups. google.com/intl/ru /googlegroups/tour/index.html

    Blandt de russisktalende skiller USENET World System-serveren og Relcom-telekonferencer sig ud. Ligesom i andre søgetjenester, skriver brugeren en forespørgselsstreng, og serveren genererer en liste over konferencer, der indeholder nøgleord. Dernæst skal du abonnere på de udvalgte konferencer i nyhedsprogrammet. Der er også en lignende russisk FidoNet Online-server: Fido-konferencer på WWW.

    2.9 Meta søgesystemer

    For en hurtig søgning i flere søgemaskiners databaser på én gang er det bedre at henvende sig til meta-søgesystemer.

    Meta-søgemaskiner er søgemaskiner, der sender din forespørgsel til et stort antal forskellige søgemaskiner, derefter behandler resultaterne, fjerner dublerede ressourceadresser og præsenterer et bredere udvalg af det, der præsenteres på internettet.

    Verdens mest populære meta-søgemaskine er Search.com.

    Unified Search.com søgemaskine fra CNET, Inc. omfatter næsten to dusin søgemaskiner, hvortil links er fyldt med hele internettet.

    Ved at bruge denne type søgeværktøjer kan brugeren søge efter information i en række forskellige søgemaskiner, men den negative side af disse systemer kan kaldes deres ustabilitet.

    2.10 Personsøgningssystemer

    Personsøgningssystemer er specielle servere, der giver dig mulighed for at søge efter personer på internettet, brugeren kan angive det fulde navn. person og få deres e-mailadresse og URL. Det skal dog bemærkes, at folks søgemaskiner generelt tager information om e-mail-adresser fra åbne kilder, såsom Usenet-fora. Blandt de mest berømte personsøgningssystemer er:

    At finde e-mailadresser

    i særlige søgefelter for kontaktoplysninger (Fornavn. By, Efternavn, Telefonnummer), kan du finde de oplysninger, du er interesseret i.

    Personsøgemaskiner er virkelig store servere, deres databaser indeholder omkring 6.000.000 adresser.

    3. Konklusion

    Vi gennemgik de vigtigste teknologier til at søge information på internettet og præsenterede i generelle vendinger de søgeværktøjer, der i øjeblikket findes på internettet, samt strukturen af ​​søgeforespørgsler til de mest populære russisksprogede og engelsksprogede søgemaskiner, og, opsummering af ovenstående vil vi bemærke, at en enkelt optimal ordning, der søger efter information på internettet, ikke eksisterer. Afhængigt af de specifikke oplysninger, du har brug for, kan du bruge de relevante søgeværktøjer og -tjenester. Og kvaliteten af ​​søgeresultaterne afhænger af, hvor kompetent søgetjenesterne er udvalgt.

  • Det er ofte ret svært at finde den rigtige information på internettet. Internettet udvikler sig kaotisk, det har ikke en klart defineret struktur. Ingen kan garantere, at der på et domæne kun vil være information om et bestemt emne, og på det andet - information om et andet, men også klart defineret emne. For eksempel kan du på .com-domæner ikke kun finde kommerciel information, men for eksempel diverse dokumentation om softwareprodukter eller endda vittigheder.

    Hvis domænestrukturen lignede mappestrukturen, for eksempel i ru.comp.os.linux-domænet (som i nyhedssystemet) ville der være al information om Linux-operativsystemet på russisk, og en moderatororganisation ville sørge for at der i andre domæner ikke postede information om Linux, så ville søgningen være meget nemmere. Når alt kommer til alt, ville vi vide, hvor vi skulle lede. Du åbner en browser, indtaster ru.comp.os.linux og du får... millioner af forskellige links til artikler, HOWTO-dokumenter og anden information relateret til Linux på den ene eller anden måde.

    Søgeydelse

      Søgeydelse afhænger af mange faktorer:
    • Fra selve informationen - der kan være meget information om et emne, men lidt om et andet. Nogle gange kan du finde en masse information om et givent emne, men effektiviteten af ​​denne søgning vil være tæt på 0,0%, og du kan kun finde 3-4 links, og dette vil være lige hvad du har brug for. Dette inkluderer også webmasterens mulighed for at indsende oplysninger korrekt, så søgemaskinerne selv kan finde dem. Antag, at der et sted meget langt væk er den information, du har brug for, men søgemaskinen ved intet om det. Måske er oplysningerne lige blevet offentliggjort, eller bare har webmasteren, der har offentliggjort oplysningerne, ikke engang mistanke om, at der findes søgemaskiner. Du leder efter information ved hjælp af en søgemaskine. Hvis hun ikke "kender" de oplysninger, du har brug for, så vil du derfor heller ikke vide noget om hende.
    • Fra søgemaskinen - der er mange søgemaskiner, og de er alle forskellige. Selvom de er af samme type (vi vil tale om typerne af søgemaskiner lidt senere), vil hver af dem selvfølgelig have sin egen algoritme. Hvis du ikke kan finde information med én søgemaskine, kan du prøve at søge efter den med en anden. Bliv ikke hængt op på én søgemaskine, uanset hvor meget du kan lide den.
    • Meget afhænger af evnen til at bruge en søgemaskine – hvordan du ved, hvordan du bruger en søgemaskine. Hvis du ikke ved, hvordan du bruger en søgemaskine, er det usandsynligt, at din søgning vil være effektiv.

    Sådan søger du information

    Da du oftest ikke vælger det websted, du har brug for, fra søgemaskinens bibliotek, men indtaster et specifikt søgeord (eller flere søgeord), skal du specificere netop dette søgeord så specifikt som muligt. Jo mere præcist du definerer emnet for søgningen, jo mere præcist bliver resultatet. Søgemaskinen kan ikke gætte dine tanker, du skal tydeligt angive, hvad du leder efter.

    Hver søgemaskine har sin egen syntaks, som du skal kende. Dette kapitel vil beskrive syntaksen for søgemaskinerne Google, Yandex og Rambler. Hvis du vil bruge en anden søgemaskine, så kan du finde dens syntaks på dens egen hjemmeside (normalt er den beskrevet i detaljer).

    Internet søgemaskiner

    Lad os nu tale om selve søgemaskinerne.

    På territoriet til det tidligere CIS er følgende søgemaskiner de mest populære, ifølge SpyLog (Openstat):

    • 1. Yandex (www.yandex.ru);
    • 2. Google (www.google.com);
    • 3. [email protected] (go.mail.ru);
    • 3. Rambler (www.rambler.ru);
    • 5 Yahoo! (www.yahoo.com);
    • 6. AltaVista (www.altavista.com);
    • 7. Bing (www.bing.com).

    Søgemaskiner er opført i faldende popularitetsrækkefølge. Som du kan se, er vores mest populære søgemaskine Yandex.

    Søgemaskinetyper

      Der er to hovedtyper af søgemaskiner:
    • indeks - Google, AltaVista, Rambler, HotBot, Yandex osv.;
    • klassifikation (katalog) - Rambler, Yahoo! og osv.

    Bliv ikke overrasket over, at Rambler-søgemaskinen er opført to gange - det var både indeks og klassifikation på samme tid. Vi vender tilbage til dette senere, men lad os nu tale om forskellene mellem disse to systemer.

    Hvordan fungerer en indekssøgemaskine? Søgemaskinen lancerer et specielt program, der scanner indholdet af webservere og indekserer information: den indtaster nøgleordene på en bestemt webside i sin database, nogle oplysninger fra websiden.

    En kort historie om Google

    Lad os starte med navnet. Google er en let modificeret version af ordet googol (det kaldes ofte "Google" af en grund). Til gengæld blev dette ord introduceret af Milton Sirota, nevø til den berømte matematiker Edward Kasner, og blev derefter populært i Kasner og Newmans bog Mathematics and Imagination. Ordet "googol" viser tallet som et 1 efterfulgt af 100 nuller. Navnet "Google" afspejler et forsøg på at organisere den store mængde information på nettet.

    Så lad os starte helt fra begyndelsen. Fremtidige Google-udviklere Sergey Brin og Larry Page mødtes i 1999 på Stanford University. Så var Larry 24 år gammel, og Sergey - 23. Larry var på det tidspunkt studerende ved University of Michigan og kom til Stanford for et par dage. Sergei var i en gruppe studerende, der skulle gøre gæsterne bekendt med universitetet. Fra det første møde kunne Sergey og Larry mildt sagt ikke lide hinanden – de skændtes om alt, hvad der kunne skændes om. Selvom dette i sidste ende viste sig at være en positiv ting, da deres forskellige meninger førte til oprettelsen af ​​en algoritme til at løse et af de mest presserende computerproblemer: at finde den rigtige information blandt en enorm mængde data. I januar 1996 begyndte Larry og Sergey arbejdet med BackRub-søgemaskinen, som skulle analysere "tilbage"-links, der pegede på denne hjemmeside. Arbejdet på denne server blev udført i en konstant mangel på midler - trods alt på det tidspunkt var Sergey og Larry kandidatstuderende på universitetet - du forstår selv, at kandidatstuderende ikke har særlig mange penge. Det var i øvrigt første gang, Larry deltog i et så seriøst projekt, og før det var han engageret i alle mulige "letfærdige", endda nogle gange anekdotiske projekter, for eksempel byggede han en fungerende printer fra en Lego-konstruktør.

    Google søgealgoritmer

    Googles grænseflade er slående i sin enkelhed: et inputfelt og to knapper. Som de siger, er alt genialt enkelt.

    Google speciel (udvidet) syntaks

    Ud over de logiske operatorer giver Google dig de søgemodifikatorer, der er angivet i tabellen. Søgemodifikatorer kaldes speciel Google-syntaks. Tag denne tabel seriøst: Når du prøver at søge efter noget ved hjælp af modifikatorer, vil du ikke afvise dem.

    Google inurl modifier

    Inurl-modifikatoren bruges til at søge efter den angivne URL. Og i modsætning til site-modifikatoren, som tillader dig at søge efter information på kun ét websted eller domæne, giver inurl-modifieren dig mulighed for at søge efter information i undermapper til webstedet, for eksempel:

    inurl: siteskype-zvonim-free

    Inurl-modifikatoren giver dig mulighed for at bruge *-tegnet til at angive et domæne, for eksempel:
    inurl: "*.redhat.com"

    Det er bedst at bruge inurl med webstedet. Følgende forespørgsel vil søge efter information i domænet gidmir.ru på alle dets underdomæner undtagen www:
    site: gidmir.ru inurl: "*.gidmir" -inurl: "www.gidmir.ru"

    Google søgesprog

    Google tillader blandet syntaks, dvs. en syntaks, der bruger flere specielle søgemodifikatorer i en forespørgsel. Dette giver dig mulighed for at opnå det bedste resultat.

    Her er det enkleste eksempel på blandet syntaks:
    site: ru inurl: disk

    I dette tilfælde vil søgningen blive udført på domænewebsteder, og URL'en skal indeholde ordet disk.

    Her er et andet eksempel:
    websted: ru -inurl: org.ua

    Søgningen vil blive udført på websteder på ru-domænet, men søgeresultaterne vil ikke indeholde sider, der er placeret på org.ua.

    Søgeord på Google

    For de fleste almindelige Google-brugere er grænsen på 10 søgeord ikke mærkbar. Men elskere af lange forespørgsler har sikkert bemærket, at Google kun tager højde for de første 10 søgeord, og alle de andre bliver simpelthen ignoreret.

    Hvorfor søge efter lange sætninger? I de fleste tilfælde er der tale om uddrag fra værker. Antag, at vi leder efter værket "Mester og Margarita". Det skal bemærkes, at nøglesætningen skal ligne "Master Margarita", da ordene og, eller, og, af, eller, I, a, the og nogle andre ignoreres af søgemaskinen. Hvis du vil tvinge et af disse ord til at blive inkluderet i din søgning, skal du gå foran ordet med et "+"-tegn, såsom +den.

    At overvinde grænsen på 10 ord tillader den korrekte konstruktion af forespørgslen. Følgende anbefalinger hjælper dig ikke kun med at reducere længden af ​​forespørgslen, men også forbedre effektiviteten af ​​din søgning generelt.

    Avanceret Google-søgning

    Vi indtaster i browserens input-linje adressen - www.google.ru/advanced_search og går til den avancerede Google-søgning.

    Med avanceret søgning kan du søge efter information næsten lige så fleksibelt som med søgemodifikatorer. Hvorfor "næsten"? Den avancerede søgegrænseflade giver ikke adgang til alle søgemodifikatorer.

    Indstilling af Google Search-egenskaber i browsercookies

    Jeg vil ikke genere dig med tekniske detaljer, så jeg vil kort sige, hvad Cookies er og ikke, hvad de ikke spises med, men hvordan de skal arbejdes med.

    Forestil dig, at vi har følgende opgave: Vi skal skrive en individuel besøgsrapport for hver kunde på vores virksomheds hjemmeside. Det vil sige, så brugeren ikke kan se det samlede antal besøg, ved hvor mange gange han var på vores side. For hver IP-adresse skal vi føre optegnelser i én tabel, som sandsynligvis vil være stor, og heraf følger, at vi irrationelt bruger processortid og diskplads. Det ville være meget mere korrekt af os at bruge denne plads med større fordel.

    Google søgeresultat

    Et Google-søgeresultat er ikke kun en samling af links, der matcher bestemte søgetermer. Dette er noget mere, der fortjener særskilt overvejelse. Indtast ordet "rusopen" og klik på Google Søg-knappen.

    Øverst ser vi det samlede antal resultater (883.000.000) og den samlede tid søgningen tog, nemlig 0,34 sekunder.

      I de fleste tilfælde præsenteres resultatet som:
    • sidenavn;
    • sidebeskrivelse;
    • Side URL;
    • sidestørrelse;
    • dato for sidste indeksering af siden;

    Google billedsøgning

    Tjenesten Google Billeder giver dig mulighed for at finde forskellige billeder på nettet. Selvom selve billederne ikke kan indekseres, indekseres sider, der indeholder disse billeder. Indtast en beskrivelse af billedet, og du får mange, mange links, samt selve billederne præsenteret som et galleri.

      For en mere effektiv billedsøgning skal du bruge følgende søgemodifikatorer:
    • intitle: - søg i sidetitlen;
    • filtype: - giver dig mulighed for at angive billedtypen, du kan angive følgende typer: JPEG og GIF, ikke BMP, PNG, billeder af andre typer er ikke indekseret;
    • inurl: - søg efter den angivne URL, for eksempel inurl: www.gidmir.ru ;
    • site: søg på det angivne domæne eller websted, for eksempel site: com.

    Google-tjenester

    Google er en kraftfuld søgemaskine med over 3 milliarder sider. Ud over almindelige websider indekserer Google Word-, Excel-, PowerPoint-, PDF- og RTF-filer. Google kan også bruges til at søge efter billeder og telefonnumre: Google Billeder og Telefonbog er designet til dette. I denne artikel vil vi tale om Google Ad Hoc Services.

    Google e-mail

    Prøv at bruge mail fra Google. Det skal bemærkes, at dette ikke er helt almindelig webmail.

      Blandt funktionerne i Gmail skal følgende fremhæves:
    • enorm postkassestørrelse - mere end 7 GB;
    • i stedet for at slette breve, kan du arkivere dem - så har du plads nok i lang tid, og du vil kunne gendanne breve, der blev modtaget eller sendt af dig for flere år siden;
    • evnen til at søge i postkassen med Googles effektivitet;
    • praktisk organisering af breve og svar på dem: alle breve og svar danner en kæde, der er let at spore;
    • god spambeskyttelse;
    • mindeværdig adresse [email protected];
    • brugervenlig grænseflade.

    Søgemaskine Rambler (Rambler)

    Ramblers historie

    Det hele startede tilbage i 1991 i byen Pushchino, Moskva-regionen. I det fjerne år samledes en gruppe ligesindede mennesker, blandt dem var Dmitry Kryukov, Sergey Lysakov, Viktor Voronkov, Vladimir Samoilov, Yuri Ershov. Den fælles interesse for denne gruppe var internettet. Sandsynligvis i 1991 forestillede ingen af ​​de fremtidige udviklere af Rambler endda, at de ville blive skaberne af en af ​​de største og mest berømte søgemaskiner på Runet. Når alt kommer til alt, før det, tjente de alle radioapparater på Institut for biokemi og fysiologi af mikroorganismer ved det russiske videnskabsakademi. I 1992 blev virksomheden "Stack" oprettet, ledet af Sergei Lysakov. Virksomhedsprofil - lokale netværk og internettet. Faktisk var firmaet "Stack" en internetudbyder. Virksomheden oprettede et intracity-netværk, forbandt derefter Pushchino til Moskva og gennem det - til internettet. Forresten var dette den første IP-kanal, der gik ud over Moskva. Og det er i 1992! Nu er det ret problematisk at lægge en kanal - der er altid mange nuancer, og så skulle kablerne lægges uafhængigt, manuelt, under jorden, og alt dette blev gjort om vinteren.

    Hvordan Rambler-søgningen fungerede

    Internettet udvikler sig konstant: Antallet af websteder og deres størrelser stiger hver dag. Trods alt, forestil dig bare: store websteder opdateres hver dag, selvom mængden af ​​opdateringer er 1024 bytes (1 KB), så hvis vi antager, at der er 10.000 sådanne websteder, skal søgemaskinen hver dag behandle (indeksere) 10.000 KB (groft sagt 10 MB ) information. Tallet 10.000 er taget "fra loftet" - for et eksempels skyld. Det kan være højere eller lavere – selv store sider bliver trods alt ikke opdateret hver dag. Opgraderingsstørrelsen er også konstrueret. Forestil dig et informations- og analytisk websted, hvor nye artikler udgives næsten hver dag, eller materialer bliver genoptrykt fra andre websteder. I dette tilfælde vil størrelsen af ​​opdateringerne være langt fra 1 KB, men mindst 10. Tilføj til alt dette flere nyheder og anden information, og det viser sig, at med antallet af opdaterede websteder 10.000, bør søgemaskinen indeksere 120 MB tekst. Og med alt dette skal søgemaskinen ikke kun vise søgeresultaterne nøjagtigt, men også gøre det så hurtigt som muligt, så brugeren er tryg ved at arbejde med den. Hvem ønsker at vente 10 minutter på søgeresultater? Jeg overdriver selvfølgelig dette, men personligt ville jeg ikke vente mere end 30 sekunder på søgeresultater (fra det øjeblik du klikker på knappen Find, til de første ti resultater vises). Det viser sig, at udviklerne af søgemaskinen konstant skal holde på det rette niveau, ikke kun hardwaren, som skal kunne behandle konstant voksende mængder af information, men du kan heller ikke tage "matematikken" med ét jern. Det er nødvendigt konstant at forbedre søgealgoritmerne, så søgetiden med en stigning i søgebasens volumen ikke øges (hvilket betyder en væsentlig stigning i tiden - for brugeren er der ingen forskel, hvor lang søgningen vil være på 2,5 sekunder eller 2,0555 sekunder, da han ikke er i stand til at estimere denne tid).

    Rambler-forespørgsler, Rambler-syntaks

    Anmodningen til Rambler kunne bestå af et eller flere ord, og anmodningen kunne indeholde tegnsætningstegn. Rambler-udviklere har designet deres søgemaskine til maksimal brugervenlighed. Rambler kunne bruges selv af en uerfaren bruger, der slet ikke er fortrolig med forespørgselssproget. Det eneste, han skulle gøre, var at indtaste en anmodning bestående af flere ord (for eksempel en sætning) og uden tegnsætningstegn - Rambler fandt selv de nødvendige dokumenter og gjorde det så effektivt som muligt. Selvfølgelig, hvis forespørgselssproget blev brugt korrekt, steg effektiviteten markant, men selv med fuldstændig uvidenhed om forespørgselssproget var søgeeffektiviteten på et højt niveau. Som allerede nævnt er kendskab til forespørgselssproget i dine egne interesser, du kan simpelthen finde den information, du har brug for, meget hurtigere.

    Yandex søgemaskine (Yandex)

    Historik reference

    Tilbage i 1990 begyndte Arcadia-virksomheden, ledet af Arkady Borkovsky og Arkady Volozh, at udvikle søgesoftware. Seks år senere dukkede Yandex-webstedet op. Men hvad skete der i de seks år?

    I to år blev der oprettet to informationssøgningssystemer - "International klassifikation af opfindelser" og "klassificering af varer og tjenester". Begge systemer fungerede under DOS og gjorde det muligt at søge efter et ord fra en given ordbog ved hjælp af logiske operatorer.

    Arcadia blev en afdeling af CompTek i 1993. I løbet af 1993-1994 blev søgeteknologierne væsentligt forbedret, for eksempel, en ordbog, der giver søgning under hensyntagen til morfologien af ​​det russiske sprog optog kun 300 KB, hvilket betyder, at det frit passer ind i RAM, og arbejdet med det skete meget hurtigt. På basis af denne nye teknologi blev der i 1994 skabt "Bible Computer Reference" - et informationssøgningssystem, der arbejder med oversættelser af Det Gamle og Nye Testamente.

    Yandex sprogsøgning

    Hvordan vil søgemaskinen fortolke det ord, du indtaster?

      Nu skal vi tale om dette:
    • Regel 1. Det viser sig, at systemet fortolker det efter reglerne for det russiske sprog. Eksempel: Hvis du indtaster ordet "bil", får du også resultater, der indeholder ordene "biler", "bil" osv. På samme måde, med verber - for forespørgslen "gå", vil du modtage dokumenter, der indeholder ordene "gå", "går", "gik", "gik" osv. Som du kan se, er søgemaskinen mere intelligent, end du måske tror – den er ikke kun et værktøj til at slå et bestemt ord op i en database.
    • Regel 2. Der lægges særlig vægt på ord med store bogstaver. Hvis et ord er med stort og ikke er det første ord i en sætning, vil der kun blive fundet ord med stort. Ellers findes ord skrevet både med store og små bogstaver. Eksempel: på forespørgsel "Dachshund A." dokumenter, der indeholder både "taxa" (gebyr) og "taxa" (efternavn) vil blive fundet, da ordet "taxa" selvom det er stort, men det kommer først i sætningen. Men forespørgslen "A. Gravhund" vil finde dokumenter, der kun indeholder ordet "gravhund", skrevet med stort bogstav.

    Yandex syntaks

    Som standard bruger Yandex den logiske OG-operator. Det betyder, at hvis du indtaster forespørgslen "Samsung TV", så vil du modtage dokumenter i resultaterne, hvor ordene "TV" og "Samsung" vil optræde i samme sætning. Hvis du eksplicit vil angive AND-operatoren, skal du bruge og-tegnet &. Med andre ord er "Samsung TV" det samme som "TV & Samsung". Du kan også bruge forespørgslen "TV + Samsung".

    Ønsker man den modsatte effekt, dvs. Hvis du ønsker at få dokumenter, der indeholder ordet "TV" separat og ordet "Samsung" separat, så skal du bruge OR-operatøren (|), for eksempel: "TV | Samsung".

    Yandex-forespørgselssyntaks

    Alle ord i teksten i et dokument er nummereret af Yandex i rækkefølge. Afstanden mellem tilstødende ord er 1 (ikke 0!), og afstanden mellem ord i omvendt rækkefølge er -1. Det samme gælder tilbud.

    For at angive afstanden mellem ord, sættes tegnet /, umiddelbart efterfulgt af et tal, hvilket betyder, at dette er afstanden mellem ordene. Forespørgslen "udvikler /2 programmer" vil f.eks. finde dokumenter, der indeholder ordene "udvikler" og "programmer", og afstanden mellem ordene bør ikke være mere end to ord, og alle disse ord skal være i én sætning. I dette tilfælde vil dokumenter indeholdende "applikationsprogramudvikler", "systemprogramudvikler" osv. blive fundet.

    Hvis vi kender nøjagtig afstanden og ordrækkefølgen, så kan vi bruge / + n-syntaksen. Forespørgslen "red /+1 riding hood" vil f.eks. resultere i ordet "cap" umiddelbart efter ordet "rød". Forespørgslen "lille rødhætte" ville føre til det samme resultat.

    Yandex søgeoperatorer

    Parenteser bruges til at repræsentere et helt udtryk i en forespørgsel. For eksempel vil forespørgslen "(historie | teknologier | programmer)/+1 Linux" finde dokumenter, der indeholder en af ​​sætningerne "Linux historie", "Linux teknologier", "Linux programmer".

    Zoner

    En zone er et sted, hvor du kan finde den information, du har brug for. Du kan angive den zone, du vil søge i - overskrifter (Titelzone), links (ankre) eller adresse (Adresse). Du kan også bruge alle zonen - søg gennem hele dokumentet.

    Syntaks: $zone_name forespørgsel.

    For eksempel: anmod om $title "(!LANG:Microsoft" найдет все документы, в заголовках которых встречается точная фраза "Microsoft".!}

    Yderligere Yandex søgemuligheder

    Google-søgemaskinen gjorde det muligt at begrænse søgeplaceringen til en bestemt liste af servere, eller omvendt at udelukke bestemte servere fra søgelisten. Der er nøjagtig de samme muligheder i Yandex-søgemaskinen. Du kan også søge efter dokumenter, der linker til bestemte URL'er eller billeder. Når du angiver en filmaske (f.eks. et billede), kan du bruge tegnet *, som betyder alle tegn, for eksempel: ”audi-*”.

    Syntaksen er: #element_name="værdi".

    På det globale internet kan du finde information om ethvert emne af interesse. Men det sværeste ved at arbejde med internettet er at finde den information, du har brug for. Da internettet ikke har en klar centraliseret struktur, det udvikler sig kaotisk, og flere og flere nye servere dukker op i verden, bliver informationssøgningsspørgsmål meget relevante.

    Søgemaskiner letter arbejdet på internettet i høj grad og hjælper os med hurtigt at finde den information, vi har brug for, på et stort udvalg af internetservere. Der er flere tusinde søgemaskiner på World Wide Web, blandt hvilke der er både veletablerede og mindre kendte.

    Mest populære søgemaskiner

    • Yandex— et værktøj til genfinding af fuldtekstinformation under hensyntagen til det russiske sprogs morfologi; søg på websteder, dit katalog, nyheder, produkter, kort, ordbøger, blogs, billeder, Microsoft Office-dokumenter og Adobe Acrobat PDF
      • Yandex
    • Rambler(OJSC "Rambler Internet Holding") — webstedssøgning under hensyntagen til morfologien af ​​det russiske og engelske sprog; Det har også et katalogsøgningssystem.
      • Rambler Lite: søgemaskine- en kort version af søgesiden
    • Søgetjeneste Sputnik(JSC "Rostelecom") - søg på websteder, offentlige tjenester osv.; Sikker søgning
    • NIGMa - intelligent søgemaskine(Lomonosov Moscow State University og Stanford University) — søg efter dokumenter, billeder, bøger, nyheder via Google, Yahoo, MSN, Yandex, Rambler, altavista, Aport; systemet giver også en unik søgning efter kemiske formler og reaktioner
    • Google — søg efter websteder (det er muligt at søge efter russisksprogede websteder); søg efter dokumenter i formaterne adobe acrobat PDF, Microsoft Office, PostScript, Corel WordPerfect, Lotus 1-2-3 osv.; søg efter billeder, videoer, nyheder, kortsøgning; evnen til at søge på russisksprogede og russiske websteder; der er et system til at oversætte tekst til andre sprog (49 sprog)
    • Bing(Microsoft Corp.) - søg efter websteder, billeder og videoer; evnen til at søge på russisksprogede og russiske websteder; der er et system til at oversætte tekst til andre sprog (22 sprog)
    • Yahoo!(Yahoo) - søg efter websteder, e-mail-adresser osv.

    Hver af søgemaskinerne har sine egne fordele og ulemper, som bestemmes af søgemaskinens funktionsprincip, brugervenlighed, dens design, kompleksiteten af ​​forespørgselssproget, tilstedeværelsen af ​​forskellige avancerede funktioner (styrende format og rangering af outputinformation, rettelse af stavefejl og fejlagtige tastaturlayout ved indtastning af søgeord, oversættelse af siden til andre sprog osv.), arbejdshastighed og andre parametre. Valget af søgemaskine til en bestemt applikation bestemmes af formålet med søgningen, arten af ​​den information, der søges, det ønskede outputformat og bredden af ​​sporbare serveradresser i internetverdenen.

    Søgeordssøgning. Søgemaskineforespørgselssprog

    Søgemaskinen har normalt et felt til indtastning af nøgleord, hvorved den finder dokumenter, der indeholder disse søgeord. Jo bedre (højere kvalitet) forespørgslen til søgemaskinen er, jo lavere er det samlede antal fundne dokumenter, og flere af dem er dokumenter, der svarer til det, du har brug for. Hvis anmodningen er meget enkel eller analfabet, så kan søgemaskinen give dig flere millioner dokumenter, som du ikke vil kigge igennem i hele dit liv.

    Brug af et forespørgselssprog, der indeholder logiske operationer (logiske operatorer OG, eller IKKE, parentes osv.), præfikser for obligatorisk tilstedeværelse af nøgleord i dokumentet «+» og «-» (når du søger efter højt specialiserede termer, er det at foretrække at bruge det), placeringen af ​​nøgleord i et dokument i nærheden eller i en vis afstand osv.), og andre elementer og et større antal relaterede søgeord kan indsnævre søgeområde og bedre komponere anmodning til søgeserveren. Man skal huske på, at forskellige søgemaskiner kan have både forskellige søgesprog og meget lignende.

    Nogle søgemaskiner har desuden en funktion Avanceret søgning, giver brugeren mulighed for mere præcist at beskrive, hvad han specifikt har brug for uden at kende forespørgselssproget. Den avancerede søgefunktion er for eksempel søgemaskinerne Yandex og Google.

    De vigtigste typer søgemaskiner. Hvilken søgemaskine du skal bruge

    Der er 2 hovedtyper af internetsøgemaskiner: indeks og klassifikation (katalog). Indeks søgemaskiner (f.eks. Yandex, Rambler, Sputnik, Google, Bing osv.), arbejder i den automatiske tilstand med at opdatere deres oplysninger, se indholdet af servere på internettet, indeksere oplysningerne i dem og indtaste oplysninger om placeringen af ​​ord på webstedets sider i deres databaser. Katalogsøgemaskiner (f.eks. Rambler, Yahoo! osv.) indeholder et tematisk struktureret katalog over servere og genopfyldes oftest manuelt. Typisk indeholder klassifikationssøgemaskinens WWW-side også et felt til indtastning af nøgleord til søgning i sin egen database. I katalogsøgningssystemet kan du starte med en større tematisk overskrift og gradvist gå længere ned langs overskrifterne for at komme til et link til det websted, du har brug for. I nogle tilfælde er det mere bekvemt at bruge den første type søgemaskiner, i andre - den anden. Der er søgemaskiner, der kombinerer begge principper for arbejde. Især mange indekssøgemaskiner har også et katalogsøgesystem. Søgemaskiner kan også bruge nogle andre principper for søgemetoder.

    Mange søgemaskiner er forvandlet til internetportaler, der kombinerer et stort antal ressourcer og tjenester. På siderne af sådanne portaler kan du læse nyheder, stifte bekendtskab med tv-programmet, lære om vejret, valutakurser, bruge korttjenesten og mere. andre

    De mest populære russiske søgemaskiner har søgefunktioner, der tager højde for det russiske sprogs særegenheder.

    For at søge samtidigt i flere søgemaskiner kan du bruge de såkaldte søgemetamaskiner, der tilgår flere søgemaskiner på én gang, for eksempel NIGMa.

    Der er også søgemaskiner, der specialiserer sig i at søge efter et enkelt emne (f.eks. informationsteknologi, musik, ressourcer, natur osv.)

    Der er en type mennesker, der bare elsker at bruge en masse smukke metaforer. Det er de mennesker, der sammenligner World Wide Web med en losseplads. Som om på netværket er alt dumpet i en stor bunke, og djævelen kan brække et ben der. Det ser ud til, at alt er på nettet, men for at finde noget, skal du grave enorme bjerge af affald op.

    Nå, det er en fin metafor. Men det betyder ikke, at hun har ret. For mange mennesker er der ved første øjekast stablet en enorm mængde ubrugelige ting på bordet. Men for de mennesker, der arbejder ved disse borde, giver arrangementet af tingene sig til en meget bestemt logik. De ting, der oftest er brug for, såsom et tekrus, er på armslængde. Og de ting, der ikke altid er nødvendige, er placeret længere. Og dette er på ingen måde et dump eller noget rod.

    Internettet har også sin egen logik. Hvis du kender et par regler og bruger dem, når du søger, så vil enhver information fra internettet være som et krus til te i en armslængde, og følelsen af, at nettet er et dump, vil straks forsvinde.

    I denne artikel vil vi tale om søgemaskiner og internetsøgningsregler.

    SØGEMOTORENHED

    Til at begynde med - en lille lyrisk digression om søgemaskinens opbygning. Det er således indrettet, at brugeren kun ser grænsefladen til selve systemet, altså søgefeltet, og alt, hvad der er inde i systemet, forbliver der.

    Den første komponent i søgemaskinen er den såkaldte "edderkop", en søgerobot. Hvad er dens funktioner? Han vandrer rundt på nettet, surfer på internettet - sider, besøger links. Og han gør det hele uafbrudt. Edderkoppen vandrer ikke for sin egen fornøjelses skyld. Den indtaster absolut alle de sider, den har set, i søgemaskinens indeks. Indsætter dem i form af meningsfulde ord, der forekommer på siden.

    Således viser det sig, at indekset, den anden komponent i søgemaskinen, er en enorm database, ved hjælp af hvilken det er muligt hurtigt at finde ud af, på hvilke sider på nettet søgeordet forekommer. Information til reference - hele volumen af ​​indekset for den velkendte Yandex-søgemaskine er mere end firs gigabyte.

    Den tredje komponent efter indekset er selve søgemaskinen. Dens formål er at søge efter de rigtige ord eller sætninger i indekset. Husk, at en søgemaskine ikke søger på hele internettet – det gør den ikke. Forestil dig bare, at dette er sandt: for eksempel er hele mængden af ​​indekseret information på Yandex 269 gigabyte. Og hvis der ikke var noget indeks efter at have indtastet din anmodning, skulle systemet downloade og se 260 gigabyte information. Det er urealistisk. Tænk bare på, hvor lang tid det vil tage at behandle en enkelt anmodning.

    Som følge af, at søgningen ikke udføres i hele Netværket, men i indekset, kommer der to konklusioner. For det første, hvis søgemaskinen ikke fandt nogle oplysninger, betyder det slet ikke, at denne information ikke er på nettet, den er ikke i indekset for denne særlige søgemaskine. For det andet adskiller informationssøgningssystemer i netværket sig ikke kun fra hinanden i grænsefladen, men også for eksempel i indekset og metoderne til at kompilere det. Derfor, hvis du ikke fandt den information, du har brug for i én søgemaskine, skal du lede efter den i en anden.

    Søgerobotten, der kompilerer indekset, gennemgår alle websteder i en cirkel og meget regelmæssigt - således viser indekset altid korrekt de ændringer, der er sket på webstedet. Websteder, der lige har vist sig som "edderkop", kan finde på egen hånd ved at ramme dem på linket fra andre websteder. Også webstedsforfattere kan lade "edderkoppen" vide om deres websted.

    Den sidste komponent i en søgemaskine er dens World Wide Web-server, som er systemets ansigt. Dette er grænsefladen, hvorigennem brugere fremsætter anmodninger og modtager svar på dem. World Wide Web-serveren er kun en del af systemet og ikke den største.

    SØG SPROG

    For at kunne kommunikere med søgemaskiner er der et særligt sprog og særlige regler. Det ville selvfølgelig bare være skønt, hvis dit spørgsmål straks fik et fyldestgørende svar. Men lige nu bliver der bare arbejdet på det.

    Først skal du fremhæve søgeordene. Det er nødvendigt at beslutte, hvilke få ord der mere fyldestgørende vil karakterisere det, du leder efter, og indtaste disse særlige ord. Du vil sige, at dette er indlysende. Ja det er. Men du vil blive overrasket over at vide, hvad mange mennesker indtaster i søgefeltet.

    Der er en god ting på Yandex kaldet "live udsendelse". Dette er en side, hvor du kan se de sidste 20 søgte sætninger eller ord. Se denne side længere, og du vil opleve mange forskellige følelser. Nogle anmodninger kan optages i en separat bog – de er så fantastiske. Ser du på nogle anmodninger, vil du forstå, at det bestemt IKKE er nødvendigt at søge på denne måde.

    Normalt har en stor procentdel af anmodninger ingen klarhed: "video", "tv", "download" og så videre. Anmoderne mener, at systemet selv bør gætte, hvad brugerne vil have ud af det. Form en søgeforespørgsel mere tydeligt, og jo mere specifik den er, jo mindre unødvendige resultater vil søgemaskinen give.

    Nogle søgemaskiner skelner mellem de samme forespørgsler, men starter med stort eller lille bogstav. For eksempel vil Yandex give et andet antal søgeresultater, mens Google-systemet ignorerer store og små bogstaver.

    Ved at bruge "+" og "-" tegnene kan du enten ekskludere ord fra søgningen eller gøre dem obligatoriske. I dette tilfælde bør der ikke være et mellemrum mellem tegnet og ordet. Denne regel gælder for alle søgemaskiner.

    I denne forespørgsel leder vi efter online computerudstyrsbutikker, der ikke er specialiserede i bærbare computere, og i den næste, tværtimod, de butikker, der sælger de samme bærbare computere.

    Som du kan se, gav søgemaskinen virkelig forskellige resultater.

    Hvis flere ord i din anmodning blot er adskilt af mellemrum, vil søgemaskinen lede efter de sider, hvor disse ord er en del af en sætning. Nå, hvis du vil finde et dokument, der indeholder et af de ord, du har angivet i forespørgslen, skal du bruge tegnet "|".

    Yandex gav kun et uhyrligt antal resultater, og alt sammen fordi vi nu ikke leder efter en specifik sætning, men alle resultater, der indeholder nogen af ​​disse populære ord. Generelt er en sådan forespørgsel mest praktisk at lave, hvis der er mange synonymord.

    Hvis du vil finde stabile sætninger, så indtast dem i anførselstegn. Dette kan anvendes, hvis du for eksempel leder efter linjer fra nogle litterære værker eller citater.

    Som du kan se, efter at have specificeret anmodningen og instrueret søgemaskinen om at søge specifikt efter dette tilbud, har vi allerede modtaget et mærkbart mindre antal resultater.

    KONKLUSION

    Ved at bruge alle ovenstående metoder kan du nemt finde den information, du har brug for. Heldigvis er der søgemaskiner nok. Der er dog et stort antal opgaver, som søgemaskiner ikke kan udføre.

    Lad os forestille os følgende situation: du har akut brug for den bedste systemadministrator i byen. Hvordan vil du søge efter det? Du kan for eksempel annoncere i avisen og derefter besvare mange telefonopkald i flere måneder. Eller du kan komme til et specialiseret bureau og hurtigt finde en passende kandidat der.

    På samme måde er de med søgemaskiner designet til at dække så meget information som muligt. Hvis du skal finde noget særligt, så giver det mening at bruge specialiserede søgemaskiner, der søger inden for forskellige områder.

    Afslutningsvis vil jeg gerne give et råd. Inden for rammerne af denne artikel har vi kun givet dig generaliseret information om kompilering af søgeforespørgsler. Faktisk har hver søgemaskine sit eget avancerede forespørgselssprog. Tag dig tid til at udforske mulighederne for forespørgselssyntaksen for din foretrukne søgemaskine. I fremtiden vil dette i høj grad forenkle søgningen efter de nødvendige materialer. For at hjælpe dig med links til referencematerialer fra de to mest populære søgemaskiner: