Søk etter informasjon ved hjelp av søkemotorer. For å søke etter den eksakte ordformen, sett et utropstegn foran ordet.

Søker etter informasjon på Internett

Søker etter informasjon på Internett

For å søke etter informasjon i ofte brukt tre måter(Se fig.1). Først av dem - søk på adresse. Den brukes når brukeren kjenner adressen til en informasjonsressurs som inneholder informasjonen han trenger. Når du organiserer søket etter informasjon etter adresse (adresseformen - IP, domene eller URL - spiller ingen rolle i dette tilfellet), trenger brukeren bare å skrive inn adressen til ressursen i det aktuelle feltet i nettleseren - et program designet for å gi tilgang til nettverksressurser.

Ris. 1. Måter å søke etter informasjon i hypertekstdatabaser

Sekund- søk ved hjelp av hyperkoblingsnavigasjon. Ved bruk av denne typen søk må brukeren først få tilgang til serveren som er knyttet til den tilsvarende databasen. Du kan deretter finne dokumentet ved hjelp av hyperkoblinger. Denne metoden er åpenbart praktisk når adressen til ressursen er ukjent for brukeren. For å bli brukt som et utgangspunkt for søk ved implementering av denne metoden, er webportaler ment - servere som gir direkte tilgang til et bestemt sett med servere, inkludert informasjonsressurser installert på dem, samt webapplikasjoner som implementerer webtjenester som tilsvarer formålet med portalen. Serverne som er tilgjengelige via portalen kan referere til et spesifikt system (for eksempel bedrifts-) eller forskjellige systemer og være spesielt utvalgt i henhold til de spesifikke, tematiske eller andre funksjonene til dokumentene og dataene på deres nettsteder. Vanligvis kombinerer portaler en rekke funksjoner for å beholde klienten så lenge som mulig. Den dominerende tjenesten til portalen er referansetjenesten: søk, rubrikatorer, økonomiske indekser, værinformasjon, etc. Mens nettsteder for det meste er samlinger av statiske nettsider, er portaler samlinger av programvareverktøy og pre-ustrukturert informasjon som disse verktøyene gjør til strukturerte data på forespørsel fra spesifikke brukere.

Den tredje søkemetoden innebærer bruk av Internett-søkeservere. Søkeservere er dedikerte verter - datamaskiner som er vert for databaser med Internett-ressurser. Brukergrensesnittet til en slik server har et felt for å legge inn nøkkelord som beskriver emnet av interesse for brukeren (Se fig. 2).

Fig.2. Visning av Yandex-søkeservervinduet

Serveren oppfatter disse ordene som en informasjonsforespørsel, i samsvar med hvilken den søker etter ressurser og presenterer en liste over funnet dokumenter til brukeren. Åpenbart, når du implementerer denne metoden, er feil av både den første (mangler målet) og den andre typen (informasjonsstøy) mulig. Det skal nevnes at det skilles mellom to grupper søkeservere: søkemotorer og emnekataloger. Forskjellen deres skyldes metoden for opprettelse og påfølgende påfyll av databasen med Internett-ressurser, som denne serveren utfører informasjonsinnhenting av. Så søkemotorer har i sin sammensetning et spesielt program - en søkerobot. Den overvåker hele tiden nettverket, samler informasjon fra nettsider, indekserer dem og fikser søkebildet deres i databasen. I fagkataloger dannes en database med internettdokumenter "manuelt" av spesialistredaktører. Siden det ikke er en enkelt administrasjon på Internett, endres informasjonsressursene hele tiden. Nye dokumenter kan dukke opp i den og eksisterende dokumenter kan forsvinne. Hyppigheten av å oppdatere informasjon i dokumenter for forskjellige nettsteder er forskjellig: for noen er det flere ganger i timen, for noen er det en gang om dagen, dag, måned, etc. Derfor er det veldig viktig å forstå at når du bruker informasjonsinnhentingssystemer for å finne informasjon på Internett, utføres søket ikke i det virkelige rommet til nettdokumentene, men i en eller annen modell, hvis innhold kan avvike betydelig fra faktisk innhold på Internett på tidspunktet for søket. I henhold til graden av dekning av indekserte ressurser, kan søkemotorer deles inn i to grupper: internasjonal og russisktalende. Førstnevnte indekserer alle dokumenter publisert på Internett på rad. Den andre indekserer ressurser som ligger i domenesoner med en overvekt av det russiske språket. Listen over de mest populære systemene er gitt i tabell. en.

Tab. 1. Mest populære søkemotorer

Internasjonal russisktalende
Google Yandex (44,4 % av Runet)
Yahoo! Rambler (10,6 % av Runet)
Bing Mail.ru (7,3 % av Runet)
msn Nigma (0,5 % Runet)
AltaVista Gogo.ru (0,3 % Runet)
Spørre Aport (0,2 % Runet)

Merk: Runet er den russisktalende delen av Internett, som utgjør domener med navn ru og rf.

Det bør nevnes at det finnes en spesiell kategori søkemotorer – metasøkemotorer. Deres grunnleggende forskjell fra søkemotorer og emnekataloger er at de ikke har sin egen indeksdatabase, og derfor, når de mottar en brukerforespørsel, omdirigerer de den til flere søkeservere samtidig (se fig. 3).

Ris. 3. Oppsettet til metasøkesystemet

Muligheten til å bruke flere søkemotorer samtidig for en enkelt forespørsel er en åpenbar fordel med metasøkemotorer. For tiden har Metabot.ru-systemet funnet bred applikasjon, hvis grensesnitt er vist i fig. 4. Dette systemet lar deg bruke både internasjonale og russiskspråklige søkeservere for å søke etter ressurser.

1. Introduksjon

Hvert år øker volumet på Internett mange ganger, så sannsynligheten for å finne den nødvendige informasjonen øker dramatisk. Internett forener millioner av datamaskiner, mange forskjellige nettverk, antall brukere øker med 15-80% årlig. Og ikke desto mindre, oftere og oftere når du får tilgang til Internett, er hovedproblemet ikke mangelen på nødvendig informasjon, men muligheten til å finne den. Som regel kan eller vil en vanlig person på grunn av ulike omstendigheter ikke bruke mer enn 15-20 minutter på å søke etter svaret han trenger. Derfor er det spesielt viktig å lære riktig og kompetent, ser det ut til, en enkel ting - hvor og hvordan du skal lete for å få de ØNSKEDE svarene.

For å finne informasjonen du trenger, må du finne adressen. For dette er det spesialiserte søkeservere (indeksroboter (søkemotorer), tematiske Internett-kataloger, metasøkesystemer, personsøktjenester osv.). Denne mesterklassen avslører hovedteknologiene for å søke informasjon på Internett, gir vanlige funksjoner for søkeverktøy, undersøker strukturen til søkespørsmål for de mest populære russiskspråklige og engelskspråklige søkemotorene.

2. Søketeknologier

Web-teknologi World Wide Web (WWW) regnes som en spesiell teknologi for utarbeidelse og plassering av dokumenter på Internett. WWW inkluderer nettsider, elektroniske biblioteker, kataloger og til og med virtuelle museer! Med en slik overflod av informasjon, oppstår spørsmålet skarpt: "Hvordan navigere i et så stort og storskala informasjonsrom?"
Søkeverktøy kommer til unnsetning for å løse dette problemet.

2.1 Søkeverktøy

Søkeverktøy er spesiell programvare, hvis hovedformål er å gi det mest optimale og høykvalitets informasjonssøk for Internett-brukere. Søkeverktøy er vert på spesielle webservere, som hver utfører en spesifikk funksjon:

  1. Analyse av nettsider og innføring av resultatene av analysen til et eller annet nivå i søkeserverdatabasen.
  2. Søk etter informasjon på brukerens forespørsel.
  3. Tilbyr et brukervennlig grensesnitt for å søke informasjon og se søkeresultatet av brukeren.

Arbeidsmetodene som brukes når du arbeider med disse eller andre søkeverktøy er nesten de samme. Før du fortsetter å diskutere dem, bør du vurdere følgende konsepter:

  1. Søkeverktøyets grensesnitt presenteres som en side med hyperlenker, en søkestreng (søkestreng) og søkeaktiveringsverktøy.
  2. Søkemotorindeksen er en informasjonsbase som inneholder resultatet av analysen av nettsider, kompilert i henhold til visse regler.
  3. Et søk er et nøkkelord eller en setning som brukeren skriver inn i søkefeltet. Spesialtegn ("", ~), matematiske symboler (*, +, ?) brukes til å lage forskjellige spørringer.

Ordningen for å søke etter informasjon på Internett er enkel. Brukeren skriver inn en nøkkelfrase og aktiverer søket, og mottar dermed et utvalg dokumenter i henhold til den formulerte (gitte) forespørselen. Denne listen over dokumenter er rangert i henhold til visse kriterier slik at øverst på listen er de dokumentene som samsvarer best med brukerens forespørsel. Hvert av søkeverktøyene bruker forskjellige kriterier for rangering av dokumenter, både i analyse av søkeresultater og i dannelsen av indeksen (fyller indeksdatabasen over nettsider).

Hvis du derfor spesifiserer et søk med samme design i søkestrengen for hvert søkeverktøy, kan du få forskjellige søkeresultater. For brukeren er det av stor betydning hvilke dokumenter som vil vises i de første to eller tre dusin dokumentene i henhold til søkeresultatene og i hvilken grad disse dokumentene samsvarer med brukerens forventninger.

De fleste søkeverktøy tilbyr to måter å søke på − enkelt søk(enkelt søk) og Avansert søk(avansert søk) med og uten spesielt forespørselsskjema. La oss vurdere begge typer søk på eksemplet med en engelskspråklig søkemotor.

AltaVista er for eksempel nyttig for vilkårlige spørringer, "Noe om online grader i informasjonsteknologi", mens Yahoos søkeverktøy lar deg få verdensnyheter, valutakursinformasjon eller værmelding.

Å mestre kriteriene for å avgrense søket og avanserte søketeknikker lar deg øke effektiviteten i søket og raskt finne den nødvendige informasjonen. Først av alt kan du øke søkeeffektiviteten ved å bruke logiske operatorer (operasjoner) Eller, Og, Nær, Ikke, matematiske og spesielle symboler i spørringer. Ved hjelp av operatorer og/eller symboler kobler brukeren nøkkelordene i ønsket rekkefølge for å få det mest passende søkeresultatet for søket. Forespørselsskjemaer er vist i tabell 1.

Tabell 1

En enkel spørring gir en rekke lenker til dokumenter, fordi listen inneholder dokumenter som inneholder ett av ordene som ble skrevet inn på forespørselen, eller en enkel frase (se tabell 1). Operatoren og lar deg spesifisere at alle nøkkelord skal inkluderes i dokumentinnholdet. Imidlertid kan antallet dokumenter fortsatt være stort, og det kan ta lang tid å gjennomgå dem. Derfor er det i noen tilfeller mye mer praktisk å bruke nær kontekst-operatoren, som indikerer at ordene skal være plassert i tilstrekkelig nærhet i dokumentet. Ved å bruke nær reduseres antallet dokumenter som blir funnet betraktelig. Tilstedeværelsen av symbolet "*" i søkestrengen betyr at ordet vil bli søkt etter av masken. La oss for eksempel få en liste over dokumenter som inneholder ord som begynner med "gov" hvis vi skriver "gov*" i søkestrengen. Dette kan være ordene regjering, guvernør osv.

Den like populære søkemotoren Rambler opprettholder statistikk over lenketrafikk fra sin egen database, de samme logiske operatorene OG, OR, NOT, meta-tegnet * (ligner tegnet * i AltaVista som utvider søkeområdet), koeffisientsymbolene + og - er støttes for å øke eller redusere betydningsord som er lagt inn i spørringen.

La oss se på de mest populære informasjonssøketeknologiene på Internett.

2.2 Søkemotorer

Nettsøkemotorer er servere med en enorm database med URL-er som automatisk får tilgang til WWW-sider på alle disse adressene, undersøker innholdet på disse sidene, danner og skriver nøkkelord fra sidene inn i databasen deres (indekssidene).

Dessuten følger søkemotorroboter koblingene de møter på sidene og indekserer dem på nytt. Siden nesten hvilken som helst WWW-side har mange lenker til andre sider, med slikt arbeid, kan søkemotoren i sluttresultatet teoretisk omgå alle nettsteder på Internett.

Det er denne typen søkeverktøy som er den mest kjente og populære blant alle Internett-brukere. Alle kjenner navnene på kjente nettsøkemotorer (søkemotorer) - Yandex, Rambler, Aport.

For å bruke denne typen søkeverktøy, må du gå til den og skrive inn søkeordet du er interessert i i søkefeltet. Deretter vil du motta en utdata fra lenkene som er lagret i søkemotordatabasen som er nærmest søket ditt. For å gjøre søket mest effektivt, vær oppmerksom på følgende punkter på forhånd:

  • ta stilling til temaet for forespørselen. Hva ender du opp med å lete etter?
  • ta hensyn til språk, grammatikk, bruk av ulike ikke-alfabetiske tegn, morfologi Det er også viktig å formulere og legge inn nøkkelord riktig. Hver søkemotor har sin egen form for forespørsel - prinsippet er det samme, men symbolene eller operatorene som brukes kan variere. De nødvendige forespørselsskjemaene varierer også avhengig av kompleksiteten til søkemotorprogramvaren og tjenestene de tilbyr. På en eller annen måte har hver søkemotor en seksjon "Hjelp" ("Hjelp"), der alle syntaksreglene, samt anbefalinger og tips for søk, er forklart på en tilgjengelig måte (skjermdump av søkemotorsider).
  • bruke funksjonene til forskjellige søkemotorer. Hvis du ikke finner den på Yandex, prøv Google. Bruk avanserte søketjenester.
  • for å ekskludere dokumenter som inneholder visse termer, bruk "-"-tegnet foran hvert slikt ord. For eksempel, hvis du ønsker informasjon om verkene til Shakespeare, med unntak av "Hamlet", så skriv inn søket i skjemaet: "Shakespeare-Hamlet". Og for å sikre at visse lenker nødvendigvis er inkludert i søkeresultatene, bruk "+"-symbolet. Så for å finne lenker om salg av biler spesifikt, trenger du søket "salg + bil". For å øke effektiviteten og nøyaktigheten til søket ditt, bruk kombinasjoner av disse tegnene.
  • hver lenke i listen over søkeresultater inneholder - flere linjer fra dokumentet som ble funnet, blant disse er nøkkelordene dine. Før du klikker på lenken, evaluer utdragets relevans for emnet for forespørselen. Etter å ha klikket på lenken til et bestemt nettsted, se nøye rundt på hovedsiden. Som regel er den første siden nok til å forstå om du har kommet til adressen eller ikke. Hvis ja, utfør ytterligere søk etter nødvendig informasjon på det valgte nettstedet (i deler av nettstedet), hvis ikke, gå tilbake til søkeresultatene og prøv neste lenke.
  • husk at søkemotorer ikke produserer uavhengig informasjon (bortsett fra forklaringer om seg selv). Søkemotoren er kun et mellomledd mellom eieren av informasjonen (nettsiden) og deg. Databasene oppdateres kontinuerlig, nye adresser legges inn i dem, men etterslepet fra informasjonen som virkelig finnes i verden gjenstår fortsatt. Rett og slett fordi søkemotorer ikke opererer med lysets hastighet.

De mest kjente nettsøkemotorene inkluderer Google, Yahoo, Alta Vista, Excite, Hot Bot, Lycos. Blant de russisktalende kan man trekke frem Yandex, Rambler, Aport.

Søkemotorer er de største og mest verdifulle, men langt fra de eneste informasjonskildene på nettet, fordi det finnes andre måter å søke på Internett enn dem på.

2.3 Kataloger

Katalogen over Internett-ressurser er en konstant oppdatert og påfyllende hierarkisk katalog som inneholder mange kategorier og individuelle webservere med en kort beskrivelse av innholdet. Katalogsøkemetoden innebærer å "flytte ned trinnene", det vil si å gå fra mer generelle kategorier til mer. spesifikke. En av fordelene med tematiske kataloger er at forklaringene til koblingene er gitt av skaperne av katalogen og fullt ut reflekterer innholdet, det vil si at det gir deg muligheten til mer nøyaktig å bestemme hvordan innholdet på serveren samsvarer med formålet. av søket ditt.

Et eksempel på en tematisk russiskspråklig katalog er ressursen http://www.ulitka.ru/.

På hovedsiden til dette nettstedet er det en tematisk rubrikator,

ved hjelp av hvilken brukeren går inn i rubrikken med lenker til produktene som er av interesse for ham.

I tillegg lar noen emnekataloger deg søke etter nøkkelord. Brukeren skriver inn ønsket nøkkelord i søkefeltet

og mottar en liste over lenker med beskrivelser av nettsteder som samsvarer best med forespørselen hans. Det skal bemerkes at dette søket ikke finner sted i innholdet på WWW-servere, men i deres korte beskrivelse som er lagret i katalogen.

I vårt eksempel har katalogen også muligheten til å sortere nettsteder etter antall besøk, alfabetisk, etter dato for oppføring.

Andre eksempler på russiskspråklige kataloger:
[email protected]
Nettliste
Vsego.ru
Blant de engelskspråklige katalogene er:
http://www.DMOS.org
http://www.yahoo.com/
http://www.looksmart.com

2.4 Samlinger av lenker

Lenkesamlinger er lenker sortert etter emne. De er ganske forskjellige fra hverandre når det gjelder innhold, så for å finne et utvalg som passer best for dine interesser, må du gå gjennom dem på egen hånd for å danne deg din egen mening.

Som et eksempel vil vi gi et utvalg lenker "Treasures of the Internet" JSC "Relcom"

Brukeren, ved å klikke på en av delene som er interessert for ham

  • INNHOLD

    For bilister

    • Astronomi og astrologi
    • Huset ditt
    • Dine kjæledyr
    • Barn er livets blomster
    • Fritid
    • Byer på Internett
    • Helse og medisin
    • Informasjonsbyråer og tjenester
    • Museum for lokal historie, etc.,
    • Bilelektronikk.
    • Antik bilmuseum.
    • Styret for rettsvern for bileiere.
    • sportdrive.

    Fordelen med denne typen søkeverktøy er deres fokus, vanligvis inkluderer utvalget sjeldne Internett-ressurser, valgt av en bestemt webmaster eller eier av en nettside.

    2.5 Adressedatabaser

    Adressedatabaser er spesielle søkeservere som vanligvis bruker klassifiseringer etter type aktivitet, etter produkter og tjenester som tilbys, og etter geografi. Noen ganger blir de supplert med et alfabetisk søk. Databasepostene lagrer informasjon om nettsteder som gir informasjon om e-postadresse, organisasjon og postadresse mot et gebyr.

    Den største engelskspråklige adressedatabasen kan kalles: http://www.lookup.com/ -

    Når brukeren kommer inn i disse underkatalogene, finner han lenker til nettsteder som tilbyr informasjon av interesse for ham.

    Allment tilgjengelige og offisielle databaser med adresser i den russiske føderasjonen er ukjente for oss.

    2.6 Søke i Gopher-arkiver

    Gopher er et sammenkoblet system av servere (Gopher space) distribuert over Internett.

    Det rikeste litterære biblioteket er samlet i Gopher-rommet, men materialet er ikke tilgjengelig for ekstern visning: brukeren kan bare se den hierarkisk organiserte innholdsfortegnelsen og velge en fil etter tittel. Ved hjelp av et spesialprogram (Veronica) kan et slikt søk gjøres automatisk ved hjelp av søk basert på nøkkelord.

    Fram til 1995 var Gopher den mest dynamiske Internett-teknologien: veksthastigheten for antall relaterte servere overgikk vekstraten for servere for alle andre typer Internett. I EUnet/Relcom-nettverket har ikke Gopher-servere fått aktiv utvikling, og i dag er det nesten ingen som husker dem.

    2.7 FTP-filsøksystem (FTP-søk)

    En FTP-filsøkemotor er en spesiell type Internett-søkemotor som lar deg finne filer tilgjengelig på "anonyme" FTP-servere. FTP-protokollen er designet for å overføre filer over et nettverk, og i denne forstand er den funksjonelt en slags analog av Gopher.

    Hovedsøkekriteriet er filnavnet spesifisert på ulike måter (eksakt samsvar, understreng, regulært uttrykk, etc.). Denne typen søk kan selvfølgelig ikke konkurrere med søkemotorer når det gjelder muligheter, siden innholdet i filene ikke tas med på noen måte under søket, og filer, som du vet, kan gis vilkårlige navn. Men hvis du trenger å finne et kjent program eller standardbeskrivelse, vil filen som inneholder det med stor sannsynlighet ha det riktige navnet, og du kan finne den ved å bruke en av FTP-søkeserverne:

    FileSearch søker etter filer på FTP-servere etter navn på selve filene og kataloger. Hvis du leter etter et program eller noe annet, så finner du mest sannsynlig beskrivelsen på WWW-servere, og fra FTP-servere kan du laste dem ned til deg selv.

    2.8 Søkemotor i Usenet nyhetskonferanser

    USENET NEWS er ​​Internett-samfunnets telekonferansesystem. I vesten kalles denne tjenesten nyheter. En nær analog av telekonferanser er de såkalte "ekkoene" i FIDO-nettverket.

    Fra en telekonferanseabonnents synspunkt er USENET en oppslagstavle som har seksjoner hvor du kan finne artikler om alt fra politikk til hagearbeid. Denne oppslagstavlen er tilgjengelig via en datamaskin, på samme måte som e-post. Uten å forlate datamaskinen kan du lese eller legge ut artikler til en bestemt konferanse, finne nyttige råd eller delta i diskusjoner. Naturligvis tar artikler opp plass på datamaskiner, så de lagres ikke for alltid, men blir periodisk ødelagt, noe som gir plass til nye. På verdensbasis er den beste tjenesten for å finne informasjon i Usenet-konferanser Google Groups-serveren (Google Inc.).

    Google Groups er et gratis nettsamfunn og diskusjonsgruppetjeneste som tilbyr det største arkivet av Usenet-meldinger på Internett (mer enn en milliard meldinger). For mer informasjon om vilkårene for bruk av tjenesten, besøk http://groups. google.com/intl/ru /googlegroups/tour/index.html

    Blant de russisktalende skiller USENET World System-serveren og Relcom-telekonferanser seg ut. Akkurat som i andre søketjenester, skriver brukeren en søkestreng, og serveren genererer en liste over konferanser som inneholder nøkkelord. Deretter må du abonnere på de valgte konferansene i nyhetsprogrammet. Det er også en lignende russisk FidoNet Online-server: Fido-konferanser på WWW.

    2.9 Metasøkesystemer

    For et raskt søk i databasene til flere søkemotorer samtidig, er det bedre å vende seg til metasøkesystemer.

    Metasøkemotorer er søkemotorer som sender søket ditt til et stort antall forskjellige søkemotorer, deretter behandler resultatene, fjerner dupliserte ressursadresser og presenterer et bredere spekter av det som presenteres på Internett.

    Verdens mest populære meta-søkemotor er Search.com.

    Unified Search.com søkemotor fra CNET, Inc. inkluderer nesten to dusin søkemotorer, lenker til disse er fulle av hele Internett.

    Ved å bruke denne typen søkeverktøy kan brukeren søke etter informasjon i en rekke søkemotorer, men den negative siden av disse systemene kan kalles deres ustabilitet.

    2.10 Personsøksystemer

    People search-systemer er spesielle servere som lar deg søke etter personer på Internett, brukeren kan spesifisere hele navnet. person og få deres e-postadresse og URL. Det bør imidlertid bemerkes at folks søkemotorer vanligvis tar informasjon om e-postadresser fra åpne kilder, for eksempel Usenet-fora. Blant de mest kjente systemene for personsøk er:

    Finne e-postadresser

    i spesielle søkefelt for kontaktinformasjon (Fornavn. By, Etternavn, Telefonnummer), kan du finne informasjonen du er interessert i.

    Personsøkemotorer er virkelig store servere, databasene deres inneholder omtrent 6 000 000 adresser.

    3. Konklusjon

    Vi gjennomgikk hovedteknologiene for å søke etter informasjon på Internett og presenterte i generelle termer søkeverktøyene som for tiden finnes på Internett, samt strukturen til søk for de mest populære russiskspråklige og engelskspråklige søkemotorene, og, oppsummerer vi ovenfor, vil vi merke oss at en enkelt optimal ordning for å søke etter informasjon på Internett ikke eksisterer. Avhengig av den spesifikke informasjonen du trenger, kan du bruke de riktige søkeverktøyene og -tjenestene. Og kvaliteten på søkeresultatene avhenger av hvor kompetent søketjenestene er valgt.

  • Å finne riktig informasjon på Internett er ofte ganske vanskelig. Internett utvikler seg kaotisk, det har ikke en klart definert struktur. Ingen kan garantere at det på ett domene bare vil være informasjon om et bestemt emne, og på det andre - informasjon om et annet, men også klart definert emne. For eksempel, på .com-domener kan du finne ikke bare kommersiell informasjon, men for eksempel forskjellig dokumentasjon om programvareprodukter eller til og med vitser.

    Hvis domenestrukturen var lik katalogstrukturen, for eksempel i ru.comp.os.linux-domenet (som i nyhetssystemet) ville det være all informasjon om Linux-operativsystemet på russisk, og en moderatororganisasjon ville sørget for at i andre domener ikke postet informasjon om Linux, så ville søket vært mye enklere. Tross alt ville vi vite hvor vi skulle se. Du åpner en nettleser, skriver inn ru.comp.os.linux og du får... millioner av forskjellige lenker til artikler, HOWTO-dokumenter og annen informasjon relatert til Linux på en eller annen måte.

    Søkeytelse

      Søkeresultater avhenger av mange faktorer:
    • Fra selve informasjonen - det kan være mye informasjon om ett emne, men lite om et annet. Noen ganger kan du finne mye informasjon om et gitt emne, men effektiviteten til dette søket vil være nær 0,0%, og du kan bare finne 3-4 lenker, og dette vil være akkurat det du trenger. Dette inkluderer også muligheten til webmaster til å sende inn informasjon på riktig måte slik at søkemotorene selv kan finne den. Anta at et sted veldig langt unna er det informasjonen du trenger, men søkemotoren vet ingenting om det. Kanskje informasjonen nettopp har blitt publisert eller bare webmasteren som publiserte informasjonen mistenker ikke engang eksistensen av søkemotorer. Du leter etter informasjon ved hjelp av en søkemotor. Hvis hun ikke "vet" informasjonen du trenger, vil du derfor heller ikke vite noe om henne.
    • Fra søkemotoren - det er mange søkemotorer og de er alle forskjellige. Selv om de er av samme type (vi vil snakke om typene søkemotorer litt senere), vil selvfølgelig hver av dem ha sin egen algoritme. Hvis du ikke finner informasjon med én søkemotor, kan du prøve å søke etter den med en annen. Ikke bli hengt opp i én søkemotor, uansett hvor godt du liker den.
    • Mye avhenger av muligheten til å bruke en søkemotor – hvordan du vet hvordan du bruker en søkemotor. Hvis du ikke vet hvordan du bruker en søkemotor, er det usannsynlig at søket ditt vil være effektivt.

    Hvordan søke etter informasjon

    Siden du oftest ikke velger nettstedet du trenger fra søkemotorkatalogen, men skriver inn et spesifikt nøkkelord (eller flere nøkkelord), må du spesifisere nettopp dette nøkkelordet så spesifikt som mulig. Jo mer nøyaktig du definerer emnet for søket, desto mer nøyaktig blir resultatet. Søkemotoren kan ikke gjette tankene dine, du må tydelig angi for den hva du leter etter.

    Hver søkemotor har sin egen syntaks som du trenger å vite. Dette kapittelet vil beskrive syntaksen til søkemotorene Google, Yandex og Rambler. Hvis du vil bruke en annen søkemotor, kan du finne syntaksen på nettsiden (vanligvis er den beskrevet i detalj).

    Internett-søkemotorer

    La oss nå snakke om selve søkemotorene.

    På territoriet til det tidligere CIS er følgende søkemotorer de mest populære, ifølge SpyLog (Openstat):

    • 1. Yandex (www.yandex.ru);
    • 2. Google (www.google.com);
    • 3. Sø[email protected] (go.mail.ru);
    • 3. Rambler (www.rambler.ru);
    • 5 Yahoo! (www.yahoo.com);
    • 6. AltaVista (www.altavista.com);
    • 7. Bing (www.bing.com).

    Søkemotorer er oppført i synkende rekkefølge etter popularitet. Som du kan se, er vår mest populære søkemotor Yandex.

    Søkemotortyper

      Det er to hovedtyper søkemotorer:
    • indeks - Google, AltaVista, Rambler, HotBot, Yandex, etc.;
    • klassifisering (katalog) - Rambler, Yahoo! og så videre.

    Ikke bli overrasket over at Rambler-søkemotoren er oppført to ganger - det var både indeks og klassifisering på samme tid. Vi kommer tilbake til dette senere, men la oss nå snakke om forskjellene mellom disse to systemene.

    Hvordan fungerer en indekssøkemotor? Søkemotoren lanserer et spesielt program som skanner innholdet på webservere, indekserer informasjon: den legger inn nøkkelordene til en bestemt nettside i databasen, noe informasjon fra nettsiden.

    En kort historie om Google

    La oss begynne med navnet. Google er en litt modifisert versjon av ordet googol (det kalles ofte «Google» av en grunn). På sin side ble dette ordet introdusert av Milton Sirota, nevø av den berømte matematikeren Edward Kasner, og ble deretter popularisert i Kasner og Newmans bok Mathematics and Imagination. Ordet "googol" viser tallet som én 1 etterfulgt av 100 nuller. Navnet "Google" gjenspeiler et forsøk på å organisere den enorme mengden informasjon på nettet.

    Så, la oss starte helt fra begynnelsen. Fremtidige Google-utviklere Sergey Brin og Larry Page møttes i 1999 ved Stanford University. Da var Larry 24 år gammel, og Sergey - 23. Larry var på den tiden student ved University of Michigan og kom til Stanford for noen dager. Sergei var i en gruppe studenter som skulle gjøre gjestene kjent med universitetet. Fra det første møtet likte Sergey og Larry mildt sagt ikke hverandre – de kranglet om alt som kunne krangles om. Selv om dette til slutt viste seg å være en positiv ting, siden deres forskjellige meninger førte til opprettelsen av en algoritme for å løse et av de mest presserende dataproblemene: å finne riktig informasjon blant en enorm mengde data. I januar 1996 begynte Larry og Sergey arbeidet med BackRub-søkemotoren, som skulle analysere "tilbake"-lenker som pekte til denne nettsiden. Arbeidet med denne serveren ble utført i en konstant mangel på midler - tross alt på den tiden var Sergey og Larry doktorgradsstudenter ved universitetet - du forstår selv at doktorgradsstudenter ikke har så mye penger. Forresten, det var første gang Larry deltok i et så seriøst prosjekt, og før det var han engasjert i alle slags "frivole", til og med noen ganger anekdotiske prosjekter, for eksempel bygde han en fungerende skriver fra en Lego-konstruktør.

    Googles søkealgoritmer

    Googles grensesnitt er slående i sin enkelhet: et inndatafelt og to knapper. Som de sier, alt genialt er enkelt.

    Google spesiell (utvidet) syntaks

    I tillegg til de logiske operatorene gir Google deg søkemodifikatorene som er oppført i tabellen. Søkemodifikatorer kalles spesiell Google-syntaks. Ta denne tabellen på alvor: Når du prøver å søke etter noe ved hjelp av modifikatorer, vil du ikke nekte dem.

    Google inurl modifikator

    Inurl-modifikatoren brukes til å søke etter den angitte URL-en. Og i motsetning til nettstedmodifikatoren, som lar deg søke etter informasjon på bare ett nettsted eller domene, lar inurl-modifikatoren deg søke etter informasjon i underkataloger til nettstedet, for eksempel:

    inurl: siteskype-zvonim-free

    Inurl-modifikatoren lar deg bruke *-tegnet for å spesifisere et domene, for eksempel:
    inurl: "*.redhat.com"

    Det er best å bruke inurl med nettstedet. Følgende spørring vil søke etter informasjon i gidmir.ru-domenet, på alle dets underdomener bortsett fra www:
    nettsted: gidmir.ru inurl: "*.gidmir" -inurl: "www.gidmir.ru"

    Googles søkespråk

    Google tillater blandet syntaks, dvs. en syntaks som bruker flere spesielle søkemodifikatorer i en spørring. Dette lar deg oppnå det beste resultatet.

    Her er det enkleste eksemplet på blandet syntaks:
    nettsted: ru inurl: plate

    I dette tilfellet vil søket utføres på domenesider, og URL-en må inneholde ordet plate.

    Her er et annet eksempel:
    nettsted: ru -inurl: org.ua

    Søket vil bli utført på nettsteder til ru-domenet, men søkeresultatene vil ikke inneholde sider på org.ua.

    Søkeord på Google

    For de fleste vanlige Google-brukere er grensen på 10 søkeord ikke merkbar. Men elskere av lange søk har sannsynligvis lagt merke til at Google bare tar hensyn til de første 10 søkeordene, og alle resten blir ganske enkelt ignorert.

    Hvorfor søke etter lange fraser? I de fleste tilfeller er dette utdrag fra verk. Anta at vi ser etter verket "Mester og Margarita". Det skal bemerkes at nøkkelfrasen skal se ut som "Master Margarita" fordi ordene og, eller, og, av, eller, I, a, the og noen andre blir ignorert av søkemotoren. Hvis du vil tvinge et av disse ordene til å inkluderes i søket ditt, før ordet med et "+"-tegn, for eksempel +den.

    Å overvinne grensen på 10 ord tillater riktig konstruksjon av spørringen. De følgende anbefalingene vil hjelpe deg ikke bare å redusere lengden på søket, men også forbedre effektiviteten til søket generelt.

    Avansert Google-søk

    Vi skriver inn adressen i nettleserens inndatalinje - www.google.ru/advanced_search og går til det avanserte Google-søket.

    Med avansert søk kan du søke etter informasjon nesten like fleksibelt som med søkemodifikatorer. Hvorfor "nesten"? Det avanserte søkegrensesnittet gir ikke tilgang til alle søkemodifikatorer.

    Innstilling av Google Search-egenskaper i nettleserinformasjonskapsler

    Jeg ønsker ikke å plage deg med tekniske detaljer, så jeg vil kort si hva informasjonskapsler er og ikke, hva de ikke spises med, men hvordan de må jobbes med.

    La oss forestille oss at vi har følgende oppgave: Vi må skrive en individuell besøksrapport for hver kunde på selskapets nettsted. Det vil si, slik at brukeren ikke ser det totale antallet besøk, vet hvor mange ganger han var på siden vår. For hver IP-adresse må vi føre poster i én tabell, som sannsynligvis vil være stor, og av dette følger det at vi irrasjonelt bruker prosessortid og diskplass. Det ville vært mye riktigere av oss å bruke denne plassen med større utbytte.

    Google søkeresultat

    Et Google-søkeresultat er ikke bare en samling lenker som samsvarer med spesifiserte søkeord. Dette er noe mer som fortjener separat vurdering. Skriv inn ordet "rusopen" og klikk på Google Søk-knappen.

    Øverst ser vi totalt antall resultater (883 000 000) og den totale tiden søket tok, nemlig 0,34 sekunder.

      I de fleste tilfeller presenteres resultatet som:
    • sidenavn;
    • sidebeskrivelse;
    • Side URL;
    • sidestørrelse;
    • dato for siste indeksering av siden;

    Google bildesøk

    Google Images-tjenesten lar deg finne ulike bilder på nettet. Selv om bildene ikke kan indekseres, blir sider som inneholder disse bildene indeksert. Skriv inn en beskrivelse for bildet, så får du mange, mange linker, i tillegg til selve bildene presentert som et galleri.

      For et mer effektivt bildesøk må du bruke følgende søkemodifikatorer:
    • intitle: - søk i sidetittelen;
    • filtype: - lar deg spesifisere bildetypen, du kan spesifisere følgende typer: JPEG og GIF, ikke BMP, PNG, bilder av andre typer er ikke indeksert;
    • inurl: - søk etter spesifisert URL, for eksempel inurl: www.gidmir.ru ;
    • site: søk på det angitte domenet eller nettstedet, for eksempel site: com.

    Google-tjenester

    Google er en kraftig søkemotor med over 3 milliarder sider. I tillegg til vanlige nettsider, indekserer Google Word-, Excel-, PowerPoint-, PDF- og RTF-filer. Google kan også brukes til å søke etter bilder og telefonnumre: henholdsvis Google Bilder og Telefonbok er laget for dette. I denne artikkelen skal vi snakke om Google Ad Hoc-tjenester.

    Google e-post

    Prøv å bruke e-post fra Google. Det skal bemerkes at dette ikke er helt vanlig webmail.

      Blant funksjonene til Gmail bør følgende fremheves:
    • stor postkassestørrelse - mer enn 7 GB;
    • i stedet for å slette brev, kan du arkivere dem - da vil du ha nok plass i lang tid, og du vil kunne gjenopprette brev som ble mottatt eller sendt av deg for flere år siden;
    • muligheten til å søke i postkassen med effektiviteten til Google;
    • praktisk organisering av brev og svar på dem: alle brev og svar danner en kjede som er lett å spore;
    • god spambeskyttelse;
    • minneverdig adresse [email protected];
    • brukervennlig grensesnitt.

    Søkemotor Rambler (Rambler)

    Historien om Rambler

    Det hele startet tilbake i 1991 i byen Pushchino, Moskva-regionen. I det fjerne året samlet en gruppe likesinnede seg, blant dem var Dmitrij Kryukov, Sergey Lysakov, Viktor Voronkov, Vladimir Samoilov, Yuri Ershov. Den felles interessen til denne gruppen var Internett. Sannsynligvis, i 1991, forestilte ingen av de fremtidige utviklerne av Rambler at de ville bli skaperne av en av de største og mest kjente søkemotorene på Runet. Tross alt, før det, tjente de alle radioenheter ved Institute of Biochemistry and Physiology of Microorganisms of the Russian Academy of Sciences. I 1992 ble selskapet "Stack" opprettet, ledet av Sergei Lysakov. Bedriftsprofil - lokale nettverk og Internett. Faktisk var selskapet "Stack" en Internett-leverandør. Selskapet opprettet et intracity-nettverk, koblet deretter Pushchino til Moskva, og gjennom det - til Internett. Dette var forresten den første IP-kanalen som gikk utover Moskva. Og dette er i 1992! Å legge en kanal er ganske problematisk - det er alltid mange nyanser, og da måtte kablene legges uavhengig, manuelt, under jorden, og alt dette ble gjort om vinteren.

    Hvordan Rambler-søket fungerte

    Internett er i stadig utvikling: antall nettsteder og deres størrelser øker hver dag. Tross alt, bare forestill deg: store nettsteder oppdateres hver dag, selv om volumet av oppdateringer er 1024 byte (1 KB), så hvis vi antar at det er 10 000 slike nettsteder, må søkemotoren behandle (indeksere) 10 000 hver dag KB (grovt sett 10 MB ) informasjon. Tallet 10.000 er tatt «fra taket» – for eksempels skyld. Det kan være høyere eller lavere – tross alt oppdateres ikke selv store nettsteder hver dag. Oppgraderingsstørrelsen er også konstruert. Se for deg et informasjons- og analytisk nettsted hvor nye artikler publiseres nesten hver dag eller materiale trykkes på nytt fra andre nettsteder. I dette tilfellet vil størrelsen på oppdateringene være langt fra 1 KB, men minst 10. Legg til alt dette flere nyheter og annen informasjon, og det viser seg at med antallet oppdaterte nettsteder 10 000, bør søkemotoren indeksere 120 MB tekst. Og med alt dette skal søkemotoren ikke bare vise søkeresultatene nøyaktig, men også gjøre det så raskt som mulig slik at brukeren er komfortabel med å jobbe med den. Hvem vil vente 10 minutter på søkeresultater? Jeg overdriver selvfølgelig dette, men personlig ville jeg ikke ventet mer enn 30 sekunder på søkeresultater (fra du klikker på Finn-knappen til de ti første resultatene vises). Det viser seg at utviklerne av søkemotoren hele tiden må holde på riktig nivå, ikke bare maskinvaren, som må kunne behandle stadig økende informasjonsmengder, men du kan heller ikke ta "matematikken" med ett jern. Det er nødvendig å hele tiden forbedre søkealgoritmene slik at søketiden ikke øker med en økning i volumet av søkebasen (som betyr en betydelig økning i tid - for brukeren er det ingen forskjell hvor lenge søket vil være på 2,5 sekunder eller 2,0555 sekunder, siden han ikke er i stand til å anslå denne tiden).

    Rambler-spørringer, Rambler-syntaks

    Forespørselen til Rambler kan bestå av ett eller flere ord, og forespørselen kan inneholde skilletegn. Rambler-utviklere har designet sin søkemotor for maksimal brukervennlighet. Rambler kan brukes selv av en uerfaren bruker som slett ikke er kjent med søkespråket. Alt han trengte å gjøre var å skrive inn en forespørsel bestående av flere ord (for eksempel en setning) og uten skilletegn - Rambler fant selv de nødvendige dokumentene, og gjorde det så effektivt som mulig. Selvsagt, hvis søkespråket ble brukt riktig, økte effektiviteten betydelig, men selv med fullstendig uvitenhet om søkespråket var søkeeffektiviteten på et høyt nivå. Som allerede nevnt, er kunnskap om spørringsspråket i dine egne interesser, du kan ganske enkelt finne informasjonen du trenger mye raskere.

    Yandex søkemotor (Yandex)

    Historiereferanse

    Tilbake i 1990 begynte Arcadia-selskapet, ledet av Arkady Borkovsky og Arkady Volozh, å utvikle søkeprogramvare. Seks år senere dukket Yandex-nettstedet opp. Men hva skjedde på disse seks årene?

    I to år ble det opprettet to systemer for informasjonsinnhenting - "International Classification of Inventions" og "Classifier of Goods and Services". Begge systemene fungerte under DOS og tillot å søke etter et ord fra en gitt ordbok ved å bruke logiske operatorer.

    Arcadia ble en avdeling av CompTek i 1993. I løpet av 1993-1994 ble søketeknologiene betydelig forbedret, for eksempel en ordbok som gir søk tatt i betraktning morfologien til det russiske språket okkuperte bare 300 KB, noe som betyr at det fritt passet inn i RAM, og arbeidet med det skjedde veldig raskt. På grunnlag av denne nye teknologien, i 1994, ble "Bible Computer Reference" opprettet - et informasjonsinnhentingssystem som fungerer med oversettelser av Det gamle og det nye testamentet.

    Yandex språksøk

    Hvordan vil søkemotoren tolke ordet du skriver inn?

      Nå skal vi snakke om dette:
    • Regel 1. Det viser seg at systemet tolker det i henhold til reglene for det russiske språket. Eksempel: hvis du skriver inn ordet "bil", vil du også få resultater som inneholder ordene "biler", "bil" osv. På samme måte, med verb - for søket "gå", vil du motta dokumenter som inneholder ordene "gå", "går", "gikk", "gikk", etc. Som du kan se, er søkemotoren mer intelligent enn du kanskje tror – den er ikke bare et verktøy for å slå opp et bestemt ord i en database.
    • Regel 2. Spesiell oppmerksomhet rettes mot ord med store bokstaver. Hvis et ord har stor bokstav og ikke er det første ordet i en setning, vil bare ord med stor bokstav bli funnet. Ellers vil ord som er skrevet både med store og små bokstaver bli funnet. Eksempel: på forespørsel "Dachshund A." dokumenter som inneholder både "taxa" (gebyr) og "taxa" (etternavn) vil bli funnet, siden ordet "taxa" selv om det er stort, men det kommer først i setningen. Men søket "A. Dachshund" vil finne dokumenter som bare inneholder ordet "Dachshund", skrevet med stor bokstav.

    Yandex syntaks

    Som standard bruker Yandex den logiske OG-operatoren. Dette betyr at hvis du skriver inn søket "Samsung TV", vil du motta dokumenter i resultatene der ordene "TV" og "Samsung" vil vises i samme setning. Hvis du vil spesifisere AND-operatoren eksplisitt, bruk og-tegnet &. Med andre ord, "Samsung TV" er det samme som "TV & Samsung". Du kan også bruke søket "TV + Samsung".

    Hvis du ønsker motsatt effekt, dvs. Hvis du ønsker å få dokumenter som inneholder ordet "TV" separat og ordet "Samsung" separat, må du bruke OR-operatøren (|), for eksempel: "TV | Samsung".

    Yandex spørringssyntaks

    Alle ord i teksten i et dokument er nummerert av Yandex i rekkefølge. Avstanden mellom tilstøtende ord er 1 (ikke 0!), og avstanden mellom ord i omvendt rekkefølge er -1. Det samme gjelder tilbud.

    For å indikere avstanden mellom ord, settes tegnet / umiddelbart etterfulgt av et tall, som betyr at dette er avstanden mellom ordene. For eksempel vil søket "utvikler /2 programmer" finne dokumenter som inneholder ordene "utvikler" og "programmer", og avstanden mellom ordene skal ikke være mer enn to ord, og alle disse ordene skal være i én setning. I dette tilfellet vil dokumenter som inneholder "applikasjonsprogramutvikler", "systemprogramutvikler" etc. bli funnet.

    Hvis vi vet nøyaktig avstanden og ordrekkefølgen, kan vi bruke / + n-syntaksen. For eksempel vil søket "rød /+1 ridehette" resultere i ordet "cap" umiddelbart etter ordet "rød". Spørsmålet "lille rødhette" ville føre til samme resultat.

    Yandex søkeoperatører

    Parenteser brukes til å representere et helt uttrykk i en spørring. For eksempel vil søket "(historie | teknologier | programmer)/+1 Linux" finne dokumenter som inneholder en av setningene "Linux-historie", "Linux-teknologier", "Linux-programmer".

    Soner

    En sone er et sted å finne informasjonen du trenger. Du kan spesifisere sonen du vil søke i - overskrifter (tittelsone), lenker (ankre) eller adresse (adresse). Du kan også bruke all-sonen - søk gjennom hele dokumentet.

    Syntaks: $zone_name-spørring.

    For eksempel: be om $title "(!LANG:Microsoft" найдет все документы, в заголовках которых встречается точная фраза "Microsoft".!}

    Ekstra Yandex-søkealternativer

    Googles søkemotor gjorde det mulig å begrense søkestedet til en bestemt liste over servere, eller omvendt å ekskludere visse servere fra søkelisten. Det er nøyaktig de samme mulighetene i Yandex-søkemotoren. Du kan også søke etter dokumenter som lenker til bestemte URL-er eller bilder. Når du spesifiserer en filmaske (for eksempel et bilde), kan du bruke *-tegnet, som betyr alle tegn, for eksempel: ”audi-*”.

    Syntaksen er: #element_name="verdi".

    På det globale Internett kan du finne informasjon om alle emner av interesse. Men det vanskeligste med å jobbe med Internett er å finne informasjonen du trenger. Siden Internett ikke har en klar sentralisert struktur, det utvikler seg kaotisk, og flere og flere nye servere dukker opp i verden, blir spørsmål om informasjonssøk svært relevante.

    Søkemotorer letter arbeidet på Internett i stor grad og hjelper oss raskt å finne informasjonen vi trenger på et stort utvalg av Internett-servere. Det finnes flere tusen søkemotorer på World Wide Web, blant dem er det både veletablerte og mindre kjente.

    Mest populære søkemotorer

    • Yandex— et verktøy for gjenfinning av fulltekstinformasjon, tatt i betraktning morfologien til det russiske språket; søk på nettsteder, katalogen din, nyheter, produkter, kart, ordbøker, blogger, bilder, Microsoft Office-dokumenter og Adobe Acrobat PDF
      • Yandex
    • Rambler(OJSC "Rambler Internet Holding") — nettstedsøk som tar hensyn til morfologien til det russiske og engelske språket; Den har også et katalogsøkesystem.
      • Rambler Lite: søkemotor- en kortversjon av søkesiden
    • Søketjeneste Sputnik(JSC "Rostelecom") - søk på nettsteder, offentlige tjenester, etc.; Sikkert søk
    • NIGMa - intelligent søkemotor(Lomonosov Moscow State University og Stanford University) — søk etter dokumenter, bilder, bøker, nyheter via Google, Yahoo, MSN, Yandex, Rambler, altavista, Aport; systemet gir også et unikt søk etter kjemiske formler og reaksjoner
    • Google — søk etter nettsteder (det er mulig å søke etter russiskspråklige nettsteder); søk etter dokumenter i formatene adobe acrobat PDF, Microsoft Office, PostScript, Corel WordPerfect, Lotus 1-2-3 osv.; søk etter bilder, videoer, nyheter, kartsøk; muligheten til å søke på russiskspråklige og russiske nettsteder; det er et system for å oversette tekst til andre språk (49 språk)
    • Bing(Microsoft Corp.) - søk etter nettsteder, bilder og videoer; muligheten til å søke på russiskspråklige og russiske nettsteder; det er et system for å oversette tekst til andre språk (22 språk)
    • Yahoo!(Yahoo) - søk etter nettsteder, e-postadresser osv.

    Hver av søkemotorene har sine egne fordeler og ulemper, som bestemmes av søkemotorens prinsipp, brukervennlighet, design, kompleksiteten til søkespråket, tilstedeværelsen av forskjellige avanserte funksjoner (kontrollerer formatet og rangering av utdatainformasjon, retting av stavefeil og feil tastaturoppsett ved inntasting av nøkkelord, oversettelse av siden til andre språk osv.), arbeidshastighet og andre parametere. Valget av søkemotor for en bestemt applikasjon bestemmes av formålet med søket, arten av informasjonen som søkes, ønsket utdataformat og bredden av sporbare serveradresser i internettverdenen.

    Stikkordsøk. Språk for søkemotorer

    Søkemotoren har vanligvis et felt for inntasting av nøkkelord, der den finner dokumenter som inneholder disse nøkkelordene. Jo bedre (høyere kvalitet) spørringen til søkemotoren er, jo lavere er det totale antallet dokumenter som er funnet, og flere av dem er dokumenter som samsvarer med det du trenger. Hvis forespørselen er veldig enkel eller analfabet, kan søkemotoren gi deg flere millioner dokumenter som du ikke vil se gjennom hele livet.

    Bruke et spørringsspråk som inneholder logiske operasjoner (logiske operatorer OG, eller IKKE, parentes, etc.), prefikser for obligatorisk tilstedeværelse av nøkkelord i dokumentet «+» og «-» (når du søker etter høyt spesialiserte termer, er det å foretrekke å bruke det), plasseringen av nøkkelord i et dokument i nærheten eller på en viss avstand osv.) og andre elementer, og et større antall relaterte søkeord, kan begrense søket betydelig område og bedre skrive forespørsel til søkeserveren. Det bør huskes at forskjellige søkemotorer kan ha både forskjellige søkespråk og svært like.

    Noen søkemotorer har i tillegg en funksjon Avansert søk, slik at brukeren mer nøyaktig kan beskrive hva han spesifikt trenger uten å kunne spørrespråket. Den avanserte søkefunksjonen er for eksempel søkemotorene Yandex og Google.

    De viktigste typene søkemotorer. Hvilken søkemotor du skal bruke

    Det er 2 hovedtyper av Internett-søkemotorer: indeks og klassifisering (katalog). Indeks søkemotorer (for eksempel Yandex, Rambler, Sputnik, Google, Bing, etc.), arbeider i automatisk modus for å oppdatere informasjonen deres, se innholdet på servere på Internett, indeksere informasjonen i dem og legge inn informasjon om plasseringen av ordene på sidene deres i databasene deres. Katalogsøkemotorer (for eksempel Rambler, Yahoo! osv.) inneholder en tematisk strukturert katalog over servere, og fylles oftest på manuelt. Vanligvis inneholder WWW-siden til klassifiseringssøkemotoren også et felt for å legge inn nøkkelord for søk i sin egen database. I katalogsøkesystemet kan du starte med en større tematisk overskrift, og gradvis gå lenger ned langs overskriftene, for å komme til en lenke til nettstedet du trenger. I noen tilfeller er det mer praktisk å bruke den første typen søkemotorer, i andre - den andre. Det finnes søkemotorer som kombinerer begge prinsippene for arbeid. Spesielt har mange indekssøkemotorer også et katalogsøkesystem. Søkemotorer kan også bruke noen andre prinsipper for søkemetoder.

    Mange søkemotorer har forvandlet seg til internettportaler som kombinerer et stort antall ressurser og tjenester. På sidene til slike portaler kan du lese nyhetene, bli kjent med TV-programmet, lære om været, valutakurser, bruke karttjenesten og mer. andre

    De mest populære russiske søkemotorene har søkefunksjoner som tar hensyn til det russiske språkets særegenheter.

    For å søke samtidig i flere søkemotorer kan du bruke de såkalte søkemetamaskinene som får tilgang til flere søkemotorer samtidig, for eksempel NIGMa.

    Det finnes også søkemotorer som spesialiserer seg på å søke etter et enkelt emne (for eksempel informasjonsteknologi, musikk, ressurser, natur osv.)

    Det er en type mennesker som bare elsker å bruke mange vakre metaforer. Dette er menneskene som sammenligner World Wide Web med en dump. Som om på nettverket er alt dumpet i en stor haug og djevelen kan brekke et bein der. Det ser ut til at alt er på nettet, men for å finne noe må du grave opp enorme fjell med søppel.

    Vel, det er en fin metafor. Men det betyr ikke at hun har rett. For mange mennesker, ved første øyekast, er en enorm mengde ubrukelige ting stablet på bordet. Men for de menneskene som jobber ved disse bordene, gir arrangementet av ting seg til en veldig bestemt logikk. De tingene som trengs oftest, for eksempel et tekrus, er på armlengdes avstand. Og de tingene som ikke alltid er nødvendige er plassert lenger. Og dette er på ingen måte en dump eller et rot.

    Internett har også sin egen logikk. Hvis du kjenner noen regler og bruker dem når du søker, vil all informasjon fra Internett være som et krus for te på en armlengdes avstand, og følelsen av at nettet er en dump vil umiddelbart forsvinne.

    I denne artikkelen vil vi snakke om søkemotorer og internettsøkeregler.

    SØKEMOTORENHET

    Til å begynne med - en liten lyrisk digresjon om strukturen til søkemotoren. Det er slik ordnet at brukeren bare ser grensesnittet til selve systemet, det vil si søkefeltet, og alt som er inne i systemet forblir der.

    Den første komponenten i søkemotoren er den såkalte «edderkoppen», en søkerobot. Hva er dens funksjoner? Han vandrer over hele nettet, surfer på Internett - sider, besøker lenker. Og han gjør alt uten stans. Edderkoppen vandrer ikke for sin egen fornøyelse. Den legger inn absolutt alle sidene den har sett i søkemotorindeksen. Skriver dem inn i form av meningsfulle ord som forekommer på siden.

    Dermed viser det seg at indeksen, den andre komponenten i søkemotoren, er en enorm database, ved hjelp av hvilken det er mulig å raskt finne ut på hvilke sider på nettet søkeordet forekommer. Informasjon for referanse - hele volumet av indeksen til den velkjente Yandex-søkemotoren er mer enn åtti gigabyte.

    Den tredje komponenten etter indeksen er selve søkemotoren. Hensikten er å søke etter de riktige ordene eller setningene i indeksen. Husk at en søkemotor ikke søker på hele internett – det gjør den ikke. Tenk deg at dette er sant: for eksempel er hele volumet av indeksert informasjon på Yandex 269 gigabyte. Og hvis det ikke var noen indeks etter at du skrev inn søket ditt, ville systemet måtte laste ned og vise 260 gigabyte med informasjon. Det er urealistisk. Bare tenk på hvor lang tid det vil ta å behandle én enkelt forespørsel.

    Som følge av at søket ikke utføres i hele nettverket, men i indeksen, kommer to konklusjoner. For det første, hvis søkemotoren ikke fant informasjon, betyr ikke dette i det hele tatt at denne informasjonen ikke er på nettet, den er ikke i indeksen til denne søkemotoren. For det andre skiller informasjonsinnhentingssystemer i nettverket seg fra hverandre, ikke bare i grensesnittet, men også for eksempel i indeksen og metodene for å kompilere den. Derfor, hvis du ikke fant informasjonen du trenger i en søkemotor, må du lete etter den i en annen.

    Søkeroboten som kompilerer indeksen, gjennomsøker alle nettsteder i en sirkel og veldig regelmessig - dermed viser indeksen alltid riktig endringene som har skjedd på nettstedet. Nettsteder som nettopp har dukket opp som "edderkopp" kan finne på egen hånd, og trykke dem på lenken fra andre nettsteder. Også nettstedsforfattere kan fortelle "edderkoppen" om nettstedet deres.

    Den siste komponenten i en søkemotor er dens World Wide Web-server, som er ansiktet til systemet. Dette er grensesnittet der brukere sender forespørsler og mottar svar på dem. World Wide Web-serveren er bare en del av systemet, og ikke den største.

    SØK SPRÅK

    For å kommunisere med søkemotorer er det et spesielt språk og spesielle regler. Selvfølgelig ville det vært flott om spørsmålet ditt umiddelbart ble gitt et utfyllende svar. Men akkurat nå jobbes det bare med det.

    Først må du markere søkeordene. Det er nødvendig å bestemme hvilke få ord som mer fullstendig vil karakterisere det du leter etter og angi disse spesielle ordene. Du vil si at dette er åpenbart. Ja, det er det. Men du vil bli overrasket over å vite hva mange mennesker skriver inn i søkefeltet.

    Det er en god ting på Yandex som heter "direktesending". Dette er en side hvor du kan se de siste 20 søkte setningene eller ordene. Se denne siden lenger og du vil oppleve mange forskjellige følelser. Noen forespørsler kan registreres i en egen bok - de er så fantastiske. Når du ser på noen forespørsler, vil du forstå at det definitivt IKKE er nødvendig å søke slik.

    Vanligvis har en stor prosentandel av forespørslene ingen klarhet: "video", "tv", "nedlasting" og så videre. Forespørsler mener at systemet selv bør gjette hva brukerne vil ha fra det. Form et søk tydeligere, og jo mer spesifikt det er, jo mindre unødvendige resultater vil søkemotoren gi.

    Noen søkemotorer skiller mellom de samme søkene, men starter med stor eller liten bokstav. For eksempel vil Yandex gi et annet antall søkeresultater, mens Google-systemet ignorerer store og små bokstaver.

    Ved å bruke "+" og "-"-tegn kan du enten ekskludere ord fra søket eller gjøre dem obligatoriske. I dette tilfellet skal det ikke være mellomrom mellom tegnet og ordet. Denne regelen gjelder for alle søkemotorer.

    I denne spørringen ser vi etter nettbutikker for datautstyr som ikke spesialiserer seg på bærbare datamaskiner, og i den neste, tvert imot, de butikkene som selger de samme bærbare datamaskinene.

    Som du kan se, ga søkemotoren virkelig forskjellige resultater.

    Hvis i søket ditt er flere ord ganske enkelt atskilt med mellomrom, vil søkemotoren lete etter de sidene der disse ordene er en del av én setning. Vel, hvis du vil finne et dokument som inneholder noen av ordene du har oppført i spørringen, må du bruke tegnet "|".

    Yandex ga bare ut et uhyrlig antall resultater, og alt fordi vi nå ikke leter etter en spesifikk setning, men alle resultater som inneholder noen av disse populære ordene. Generelt er en slik spørring mest praktisk å gjøre hvis det er mange synonymord.

    Hvis du vil finne stabile setninger, skriv dem inn i anførselstegn. Dette kan brukes hvis du for eksempel leter etter linjer fra noen litterære verk eller sitater.

    Som du kan se, etter å ha spesifisert forespørselen og bedt søkemotoren om å søke spesifikt etter dette tilbudet, har vi allerede mottatt et merkbart mindre antall resultater.

    KONKLUSJON

    Ved å bruke alle metodene ovenfor kan du enkelt finne informasjonen du trenger. Heldigvis finnes det nok søkemotorer. Imidlertid er det et stort antall oppgaver som søkemotorer ikke kan utføre.

    La oss forestille oss følgende situasjon: du trenger raskt den beste systemadministratoren i byen. Hvordan vil du søke etter det? Du kan for eksempel annonsere i avisen og deretter svare på mange telefoner i flere måneder. Eller du kan komme til et spesialisert byrå og raskt finne en passende kandidat der.

    På samme måte, med søkemotorer - de er designet for å dekke så mye informasjon som mulig. Hvis du trenger å finne noe spesielt, er det fornuftig å bruke spesialiserte søkemotorer som søker innen ulike områder.

    Avslutningsvis vil jeg gi ett råd. Innenfor rammen av denne artikkelen har vi kun gitt deg generell informasjon om kompilering av søk. Faktisk har hver søkemotor sitt eget avanserte søkespråk. Ta deg tid til å utforske mulighetene for søkesyntaksen til din favorittsøkemotor. I fremtiden vil dette i stor grad forenkle søket etter nødvendige materialer. For å hjelpe deg med linker til referansemateriale til de to mest populære søkemotorene: