Tražite informacije koristeći pretraživače. Da biste pretraživali po tačnom obliku riječi, stavite uzvičnik ispred riječi.

Traženje informacija na internetu

Traženje informacija na internetu

Za traženje informacija u uobičajenoj upotrebi tri načina(Vidi sl.1). Prvo od njih - pretraga po adresi. Koristi se kada korisnik zna adresu informacijskog izvora koji sadrži informacije koje su mu potrebne. Prilikom organiziranja pretraživanja informacija po adresi (oblik adrese - IP, domena ili URL - u ovom slučaju nije bitan), korisnik jednostavno treba da unese adresu resursa u odgovarajuće polje pretraživača - programa dizajniran da omogući pristup mrežnim resursima.

Rice. 1. Načini traženja informacija u hipertekstualnim bazama podataka

Sekunda- pretražujte pomoću navigacije hiperlinkom. Kada koristi ovu vrstu pretraživanja, korisnik prvo mora pristupiti serveru povezanom s odgovarajućom bazom podataka. Zatim možete pronaći dokument koristeći hiperveze. Očigledno, ova metoda je zgodna kada je adresa resursa nepoznata korisniku. Kao polazna tačka za pretraživanje pri implementaciji ove metode, predviđeni su Web portali - serveri koji omogućavaju direktan pristup određenom skupu servera, uključujući informacijske resurse instalirane na njima, kao i Web aplikacije koje implementiraju Web servise koji odgovaraju svrha portala. Serveri dostupni putem portala mogu se odnositi na određeni sistem (na primjer, korporativni) ili različite sisteme i biti posebno odabrani prema specifičnim, tematskim ili drugim karakteristikama dokumenata i podataka sadržanih na njihovim stranicama. Obično portali kombinuju različite funkcije kako bi zadržali klijenta što je duže moguće. Dominantni servis portala je referentni servis: pretraga, rubrikatori, finansijski indeksi, informacije o vremenu itd. Dok su web stranice uglavnom zbirke statičnih web stranica, portali su zbirke softverskih alata i unaprijed nestrukturiranih informacija koje ovi alati pretvaraju u strukturirane podatke na zahtjev određenih korisnika.

Treći metoda pretraživanja uključuje korištenje internetskih servera za pretraživanje. Pretraživački serveri su namjenski hostovi - računari na kojima se nalaze baze podataka Internet resursa. Korisnički interfejs takvog servera ima polje za unos ključnih reči koje opisuju temu od interesa za korisnika (vidi sliku 2).

Fig.2. Prikaz prozora Yandex servera za pretragu

Server ove riječi doživljava kao informacijski zahtjev, u skladu s kojim traži resurse i korisniku prikazuje listu pronađenih dokumenata. Očigledno, prilikom implementacije ove metode moguće su greške i 1. (propuštanje cilja) i 2. vrste (informacioni šum). Treba napomenuti da se razlikuju dvije grupe servera za pretraživanje: pretraživači i predmetni direktoriji. Njihova razlika je zbog načina kreiranja i naknadnog dopunjavanja baze podataka Internet resursa, kojima ovaj server vrši dohvaćanje informacija. Dakle, pretraživači u svom sastavu imaju poseban program - robot za pretraživanje. Stalno prati mrežu, prikuplja informacije sa web stranica, indeksira ih i popravlja njihovu sliku pretraživanja u svojoj bazi podataka. U predmetnim katalozima bazu podataka internetskih dokumenata formiraju "ručno" stručni urednici. Kako na Internetu ne postoji jedinstvena uprava, njeni informacioni resursi se stalno mijenjaju. U njemu se mogu pojaviti novi dokumenti, a postojeći dokumenti mogu nestati. Učestalost ažuriranja informacija u dokumentima za različite stranice je različita: za neke je to nekoliko puta na sat, za neke jednom dnevno, dan, mjesec itd. Stoga je vrlo važno shvatiti da se prilikom korištenja sistema za pronalaženje informacija na Internetu pretraživanje ne vrši u stvarnom prostoru web dokumenata, već u nekom modelu čiji se sadržaj može značajno razlikovati od stvarni sadržaj interneta u vrijeme pretrage. Prema stepenu pokrivenosti indeksiranih resursa, pretraživači se mogu podijeliti u dvije grupe: međunarodni i ruski. Bivši indeks sve dokumente objavljene na internetu zaredom. Drugi indeksira resurse koji se nalaze u domenskim zonama u kojima dominira ruski jezik. Lista najpopularnijih sistema data je u tabeli. jedan.

Tab. 1. Najpopularnije tražilice

International Ruski govornici
Google Yandex (44,4% Runeta)
Yahoo! Rambler (10,6% Runeta)
bing Mail.ru (7,3% Runeta)
msn Nigma (0,5% Runet)
AltaVista Gogo.ru (0,3% Runet)
Pitaj Aport (0,2% Runet)

Napomena: Runet je dio interneta koji govori ruski, koji čini domene s imenima ru i rf.

Treba napomenuti da postoji posebna kategorija pretraživača - metapretraživači. Njihova fundamentalna razlika od pretraživača i predmetnih kataloga je u tome što nemaju sopstvenu indeksnu bazu podataka, pa je stoga, po prijemu korisničkog zahtjeva, preusmjeravaju na nekoliko servera za pretraživanje odjednom (vidi sliku 3).

Rice. 3. Šema sistema metapretraživanja

Mogućnost istovremenog korištenja više tražilica za jedan zahtjev je očigledna prednost metapretraživača. Trenutno je sistem Metabot.ru pronašao široku primenu, čiji je interfejs prikazan na Sl. 4. Ovaj sistem vam omogućava da koristite međunarodne i servere za pretraživanje na ruskom jeziku za pretraživanje resursa.

1. Uvod

Svake godine obim Interneta se višestruko povećava, pa se vjerovatnoća pronalaženja potrebnih informacija dramatično povećava. Internet objedinjuje milione računara, mnogo različitih mreža, broj korisnika se povećava za 15-80% godišnje. Ipak, sve češće pri pristupu Internetu glavni problem nije nedostatak potrebnih informacija, već mogućnost njihovog pronalaženja. U pravilu, običan čovjek, zbog različitih okolnosti, ne može ili ne želi potrošiti više od 15-20 minuta tražeći odgovor koji mu je potreban. Stoga je posebno važno pravilno i kompetentno naučiti, čini se, jednostavnu stvar - gdje i kako tražiti da biste dobili ŽELJENE odgovore.

Da biste pronašli informacije koje su vam potrebne, morate pronaći njegovu adresu. Za to postoje specijalizovani serveri za pretragu (indeksni roboti (pretraživači), tematski internet imenici, meta-sistemi za pretraživanje, servisi za pretragu ljudi itd.). Ova majstorska klasa otkriva glavne tehnologije za pretraživanje informacija na Internetu, pruža zajedničke karakteristike alata za pretraživanje, ispituje strukturu upita za pretraživanje najpopularnijih pretraživača na ruskom i engleskom jeziku.

2. Tehnologije pretraživanja

Web-tehnologija World Wide Web (WWW) smatra se posebnom tehnologijom za pripremu i postavljanje dokumenata na Internet. WWW uključuje web stranice, elektronske biblioteke, kataloge, pa čak i virtuelne muzeje! Uz takvo obilje informacija, oštro se postavlja pitanje: "Kako se kretati u tako ogromnom i velikom informacijskom prostoru?"
Alati za pretragu dolaze u pomoć u rješavanju ovog problema.

2.1 Alati za pretraživanje

Alati za pretraživanje su poseban softver čija je glavna svrha pružiti najoptimalnije i najkvalitetnije pretraživanje informacija korisnicima Interneta. Alati za pretraživanje se nalaze na posebnim web serverima, od kojih svaki obavlja određenu funkciju:

  1. Analiza web stranica i unos rezultata analize na jedan ili drugi nivo baze podataka servera pretraživanja.
  2. Tražite informacije na zahtjev korisnika.
  3. Pružanje korisničkog sučelja za pretraživanje informacija i pregled rezultata pretraživanja od strane korisnika.

Metode rada koje se koriste pri radu s ovim ili drugim alatima za pretraživanje su gotovo iste. Prije nego što nastavite s raspravom o njima, razmotrite sljedeće koncepte:

  1. Interfejs alata za pretraživanje je predstavljen kao stranica sa hiperlinkovima, nizom upita (stringom za pretraživanje) i alatima za aktivaciju upita.
  2. Indeks pretraživača je baza podataka koja sadrži rezultate analize web stranica, sastavljenih prema određenim pravilima.
  3. Upit je ključna riječ ili fraza koju korisnik unese u traku za pretraživanje. Specijalni znakovi ("", ~), matematički simboli (*, +, ?) se koriste za formiranje različitih upita.

Šema za traženje informacija na Internetu je jednostavna. Korisnik upisuje ključnu frazu i aktivira pretragu, pri čemu dobija izbor dokumenata prema formulisanom (datom) zahtevu. Ova lista dokumenata se rangira prema određenim kriterijumima tako da se na vrhu liste nalaze oni dokumenti koji najviše odgovaraju upitu korisnika. Svaki od alata za pretraživanje koristi različite kriterije za rangiranje dokumenata, kako u analizi rezultata pretraživanja, tako iu formiranju indeksa (punjanju indeksne baze web stranica).

Stoga, ako navedete upit istog dizajna u nizu za pretraživanje za svaki alat za pretraživanje, možete dobiti različite rezultate pretraživanja. Za korisnika je od velikog značaja koji će se dokumenti pojaviti u prvih dva-tri tuceta dokumenata prema rezultatima pretrage i u kojoj meri ti dokumenti odgovaraju očekivanjima korisnika.

Većina alata za pretraživanje nudi dva načina pretraživanja − jednostavna pretraga(jednostavna pretraga) i napredna pretraga(napredna pretraga) sa i bez obrasca za poseban zahtjev. Razmotrimo obje vrste pretraživanja na primjeru tražilice na engleskom jeziku.

Na primjer, AltaVista je korisna za proizvoljne upite, "Nešto o online diplomama u informacionoj tehnologiji", dok Yahoo alatka za pretragu vam omogućava da dobijete vijesti iz svijeta, informacije o kursu ili vremensku prognozu.

Savladavanje kriterija za preciziranje upita i naprednih tehnika pretraživanja omogućava vam da povećate efikasnost pretraživanja i brzo pronađete potrebne informacije. Prije svega, možete povećati efikasnost pretraživanja korištenjem logičkih operatora (operacija) Ili, I, Near, Not, matematičkih i specijalnih simbola u upitima. Uz pomoć operatora i/ili simbola, korisnik povezuje ključne riječi u željenom nizu kako bi dobio najprikladniji rezultat pretraživanja za upit. Obrasci zahtjeva su prikazani u tabeli 1.

Tabela 1

Jednostavan upit daje brojne veze do dokumenata, jer lista uključuje dokumente koji sadrže jednu od riječi unesenih na zahtjev ili jednostavnu frazu (vidi tabelu 1). Operator and vam omogućava da navedete da sve ključne riječi trebaju biti uključene u sadržaj dokumenta. Međutim, broj dokumenata i dalje može biti velik i može potrajati dugo da se pregledaju. Stoga je u nekim slučajevima mnogo zgodnije koristiti operator bliskog konteksta, koji ukazuje da bi riječi trebale biti smještene u dovoljnoj blizini u dokumentu. Korištenje blizu uvelike smanjuje broj pronađenih dokumenata. Prisustvo simbola "*" u nizu upita znači da će se riječ tražiti po svojoj maski. Na primjer, hajde da dobijemo listu dokumenata koji sadrže riječi koje počinju sa "gov" ako napišemo "gov*" u nizu upita. To mogu biti riječi vlada, guverner, itd.

Jednako popularan pretraživač Rambler održava statistiku o prometu linkova iz vlastite baze podataka, isti logički operatori AND, OR, NOT, metaznak * (slično znaku * u AltaVisti koji proširuje raspon upita), simboli koeficijenata + i - su podržano za povećanje ili smanjenje značajnih riječi unesenih u upit.

Pogledajmo najpopularnije tehnologije pretraživanja informacija na Internetu.

2.2 Pretraživači

Web pretraživači su serveri sa ogromnom bazom URL-ova koji automatski pristupaju WWW stranicama na svim ovim adresama, ispituju sadržaj tih stranica, formiraju i upisuju ključne riječi sa stranica u njihovu bazu podataka (indeks stranice).

Štaviše, roboti pretraživača prate veze na koje naiđu na stranicama i ponovo ih indeksiraju. Budući da gotovo svaka WWW stranica ima mnogo linkova na druge stranice, takvim radom pretraživač u krajnjem rezultatu teoretski može zaobići sve stranice na Internetu.

Upravo je ova vrsta alata za pretraživanje najpoznatija i najpopularnija među svim korisnicima interneta. Svi znaju imena poznatih web pretraživača (pretraživača) - Yandex, Rambler, Aport.

Da biste koristili ovu vrstu alata za pretraživanje, morate otići na njega i u traku za pretraživanje upisati ključnu riječ koja vas zanima. Zatim ćete dobiti izlaz od veza pohranjenih u bazi podataka tražilice koje su najbliže vašem upitu. Da bi pretraga bila najefikasnija, obratite pažnju na sljedeće točke unaprijed:

  • odlučiti o temi zahtjeva. Šta tačno na kraju tražite?
  • obratite pažnju na jezik, gramatiku, upotrebu raznih neazbučnih znakova, morfologiju.Takođe je važno pravilno formulisati i uneti ključne reči. Svaki pretraživač ima svoj oblik postavljanja zahtjeva - princip je isti, ali se simboli ili operatori koji se koriste mogu razlikovati. Potrebni obrasci zahtjeva također se razlikuju u zavisnosti od složenosti softvera pretraživača i usluga koje pružaju. Na ovaj ili onaj način, svaka tražilica ima odjeljak "Pomoć" ("Help"), gdje su na pristupačan način objašnjena sva pravila sintakse, kao i preporuke i savjeti za pretraživanje (screenshot stranica pretraživača).
  • koristiti mogućnosti različitih pretraživača. Ako ga ne možete pronaći na Yandexu, isprobajte Google. Koristite napredne usluge pretraživanja.
  • da biste isključili dokumente koji sadrže određene termine, koristite znak "-" ispred svake takve riječi. Na primjer, ako želite informacije o djelima Shakespearea, s izuzetkom "Hamleta", onda unesite upit u obliku: "Shakespeare-Hamlet". A kako biste bili sigurni da su određene veze nužno uključene u rezultate pretraživanja, koristite simbol "+". Dakle, da biste pronašli veze o prodaji automobila konkretno, potreban vam je upit "prodaja + auto". Da biste povećali efikasnost i tačnost Vaše pretrage, koristite kombinacije ovih simbola.
  • svaki link na listi rezultata pretrage sadrži - nekoliko redova iz pronađenog dokumenta, među kojima se nalaze vaše ključne riječi. Prije nego što kliknete na vezu, procijenite relevantnost isječka za temu zahtjeva. Nakon što kliknete na vezu do određene stranice, pažljivo pogledajte glavnu stranicu. Po pravilu, prva stranica je dovoljna da shvatite da li ste došli na adresu ili ne. Ako je odgovor da, izvršite daljnju pretragu potrebnih informacija na odabranoj stranici (u odjeljcima stranice), ako ne, vratite se na rezultate pretraživanja i pokušajte sa sljedećom vezom.
  • zapamtite da pretraživači ne proizvode nezavisne informacije (osim objašnjenja o sebi). Pretraživač je samo posrednik između vlasnika informacija (web stranice) i vas. Baze podataka se stalno ažuriraju, u njih se unose nove adrese, ali i dalje ostaje zaostatak od informacija koje zaista postoje u svijetu. Jednostavno zato što pretraživači ne rade brzinom svjetlosti.

Najpoznatiji web pretraživači uključuju Google, Yahoo, Alta Vista, Excite, Hot Bot, Lycos. Među onima koji govore ruski, mogu se izdvojiti Yandex, Rambler, Aport.

Pretraživači su najveći i najvredniji, ali daleko od jedinih izvora informacija na webu, jer osim njih postoje i drugi načini pretraživanja interneta.

2.3 Imenici

Katalog internetskih resursa je hijerarhijski katalog koji se stalno ažurira i nadopunjuje, koji sadrži mnoge kategorije i pojedinačne web servere sa kratkim opisom njihovog sadržaja.Način pretraživanja kataloga podrazumijeva „pomicanje niz stepenice“, odnosno pomicanje sa opštijih kategorija. na konkretnije. Jedna od prednosti tematskih imenika je što objašnjenja veza daju kreatori direktorija i u potpunosti odražavaju njegov sadržaj, odnosno daje vam mogućnost da preciznije odredite kako sadržaj servera odgovara namjeni. Vaše pretrage.

Primjer tematskog kataloga na ruskom jeziku je resurs http://www.ulitka.ru/.

Na glavnoj stranici ovog sajta nalazi se tematski rubrikator,

uz pomoć kojih korisnik ulazi u rubriku sa linkovima do proizvoda koji ga zanimaju.

Osim toga, neki imenici predmeta vam omogućavaju pretraživanje po ključnim riječima. Korisnik unese željenu ključnu riječ u traku za pretraživanje

i prima listu linkova sa opisima sajtova koji najviše odgovaraju njegovom zahtevu. Treba napomenuti da se ova pretraga ne odvija u sadržaju WWW-servera, već u njihovim kratkim opisima pohranjenim u direktoriju.

U našem primeru, imenik takođe ima mogućnost sortiranja sajtova po broju poseta, po abecednom redu, prema datumu unosa.

Drugi primjeri imenika na ruskom jeziku:
[email protected]
Weblist
Vsego.ru
Među imenicima na engleskom jeziku su:
http://www.DMOS.org
http://www.yahoo.com/
http://www.looksmart.com

2.4 Zbirke veza

Zbirke linkova su veze sortirane po temi. One se međusobno dosta razlikuju po sadržaju, pa da biste pronašli izbor koji najviše odgovara vašim interesima, morate ih sami prošetati kako biste formirali svoje mišljenje.

Kao primjer daćemo izbor linkova "Blago interneta" dd "Relcom"

Korisnik, klikom na bilo koju sekciju koja ga zanima

  • SADRŽAJ

    Za vozače

    • Astronomija i astrologija
    • Svoju kuću
    • Vaši ljubimci
    • Deca su cveće života
    • Slobodno vrijeme
    • Gradovi na internetu
    • Zdravlje i medicina
    • Informativne agencije i usluge
    • zavičajni muzej itd.,
    • Automobilska elektronika.
    • Muzej antičkog automobila.
    • Odbor za pravnu zaštitu vlasnika automobila.
    • sportdrive.

    Prednost ove vrste alata za pretraživanje je njihova fokusiranost, obično izbor uključuje rijetke internetske resurse, odabrane od strane određenog webmastera ili vlasnika web stranice.

    2.5 Adresne baze podataka

    Adresne baze podataka su posebni serveri za pretraživanje koji obično koriste klasifikacije prema vrsti aktivnosti, prema proizvodima i uslugama koje se pružaju i prema geografiji. Ponekad se dopunjuju pretraživanjem po abecednom redu. Zapisi baze podataka pohranjuju informacije o web lokacijama koje pružaju informacije o e-mail adresi, organizaciji i poštanskoj adresi uz naknadu.

    Najveća adresa na engleskom jeziku može se nazvati: http://www.lookup.com/ -

    Ulazeći u ove poddirektorije, korisnik pronalazi linkove ka stranicama koje nude informacije koje ga zanimaju.

    Široko dostupne i zvanične baze podataka adresa u Ruskoj Federaciji su nam nepoznate.

    2.6 Pretraživanje Gopher arhiva

    Gopher je međusobno povezani sistem servera (Gopher space) distribuiran preko Interneta.

    Najbogatija književna biblioteka sakupljena je u prostoru Gopher, ali materijali nisu dostupni za daljinsko gledanje: korisnik može samo pregledati hijerarhijski organizovan sadržaj i odabrati datoteku po naslovu. Uz pomoć posebnog programa (Veronica), takva pretraga se može obaviti i automatski, koristeći upite na osnovu ključnih riječi.

    Do 1995. Gopher je bio najdinamičnija internet tehnologija: stopa rasta broja povezanih servera nadmašila je stopu rasta servera svih drugih vrsta interneta. U mreži EUnet/Relcom Gopher serveri nisu dobili aktivan razvoj, a danas ih se gotovo niko ne sjeća.

    2.7 FTP sistem pretraživanja datoteka (FTP pretraga)

    FTP pretraživač je poseban tip internet pretraživača koji vam omogućava da pronađete datoteke dostupne na "anonimnim" FTP serverima. FTP protokol je dizajniran za prijenos datoteka preko mreže i u tom smislu je funkcionalno svojevrsni analog Gopher-a.

    Glavni kriterij pretraživanja je naziv datoteke specificiran na različite načine (tačno podudaranje, podniz, regularni izraz, itd.). Ova vrsta pretraživanja, naravno, ne može se takmičiti sa pretraživačima u smislu mogućnosti, jer se sadržaj datoteka ni na koji način ne uzima u obzir prilikom pretraživanja, a fajlovima se, kao što znate, mogu dati proizvoljna imena. Međutim, ako trebate pronaći neki dobro poznati program ili standardni opis, onda će s velikom vjerovatnoćom datoteka koja ga sadrži imati odgovarajuće ime, a možete ga pronaći pomoću jednog od FTP servera za pretragu:

    FileSearch traži datoteke na FTP serverima prema nazivima samih datoteka i direktorija. Ako tražite program ili nešto drugo, onda ćete na WWW-serverima najvjerovatnije pronaći njihov opis, a sa FTP-servera možete ih preuzeti sebi.

    2.8 Tražilica u Usenet konferencijama za vijesti

    USENET NEWS je sistem za telekonferencije Internet zajednice. Na Zapadu se ovaj servis naziva vijestima. Bliski analog telekonferencija su takozvani "odjeci" u FIDO mreži.

    Sa stanovišta pretplatnika na telekonferenciju, USENET je oglasna ploča koja ima odeljke u kojima možete pronaći članke o svemu, od politike do baštovanstva. Ovoj oglasnoj tabli je moguće pristupiti putem računara, slično kao e-mail. Bez napuštanja računara, možete čitati ili objavljivati ​​članke na određenoj konferenciji, pronaći korisne savjete ili se pridružiti diskusijama. Naravno, artikli zauzimaju prostor na računarima, pa se ne pohranjuju zauvijek, već se povremeno uništavaju, ostavljajući mjesta za nove. U svijetu, najbolji servis za pronalaženje informacija o Usenet konferencijama je server Google grupa (Google Inc.).

    Google Groups je besplatna online zajednica i usluga diskusionih grupa koja nudi najveću arhivu Usenet poruka na internetu (više od milijardu poruka). Za više informacija o uslovima korištenja usluge posjetite http://groups. google.com/intl/ru /googlegroups/tour/index.html

    Među onima koji govore ruski ističu se server USENET World System i Relcom telekonferencije. Kao iu drugim uslugama pretraživanja, korisnik upisuje string upita, a server generiše listu konferencija koja sadrži ključne riječi. Zatim se morate pretplatiti na odabrane konferencije u informativnom programu. Postoji i sličan ruski FidoNet Online server: Fido konferencije na WWW.

    2.9 Meta sistemi pretraživanja

    Za brzu pretragu u bazama podataka nekoliko pretraživača odjednom, bolje je obratiti se meta-sistemima za pretraživanje.

    Meta pretraživači su pretraživači koji šalju vaš upit velikom broju različitih pretraživača, zatim obrađuju rezultate, uklanjaju duple adrese resursa i predstavljaju širi spektar onoga što je predstavljeno na Internetu.

    Najpopularniji svjetski meta pretraživač je Search.com.

    Unified Search.com pretraživač iz CNET, Inc. uključuje gotovo dvadesetak pretraživača, linkovi na koje su prepune cijelog Interneta.

    Koristeći ovu vrstu alata za pretraživanje, korisnik može pretraživati ​​informacije u raznim pretraživačima, ali negativna strana ovih sistema može se nazvati njihovom nestabilnošću.

    2.10 Sistemi za traženje ljudi

    Sistemi za pretraživanje ljudi su posebni serveri koji vam omogućavaju da tražite ljude na Internetu, korisnik može navesti puno ime. osobu i dobiti njenu adresu e-pošte i URL. Međutim, treba napomenuti da pretraživači ljudi uglavnom preuzimaju informacije o adresama e-pošte iz otvorenih izvora, kao što su Usenet forumi. Među najpoznatijim sistemima za pretraživanje ljudi su:

    Pronalaženje e-mail adresa

    u posebnim poljima za pretragu za kontakt informacije (Ime. Grad, Prezime, Broj telefona) možete pronaći informacije koje vas zanimaju.

    Pretraživači ljudi su zaista veliki serveri, njihove baze podataka sadrže oko 6.000.000 adresa.

    3. Zaključak

    Pregledali smo glavne tehnologije za pretraživanje informacija na Internetu i u opštim crtama predstavili alate za pretragu koji trenutno postoje na Internetu, kao i strukturu upita za pretragu za najpopularnije pretraživače na ruskom i engleskom jeziku i, Sumirajući gore navedeno, želimo napomenuti da jedinstvena optimalna šema traženja informacija na Internetu ne postoji. Ovisno o konkretnim informacijama koje su vam potrebne, možete koristiti odgovarajuće alate za pretraživanje i usluge. A kvaliteta rezultata pretraživanja ovisi o tome koliko su kompetentno odabrane usluge pretraživanja.

  • Pronalaženje pravih informacija na internetu često je prilično teško. Internet se razvija haotično, nema jasno definisanu strukturu. Niko ne može garantovati da će na jednom domenu biti samo informacije o određenom predmetu, a na drugom - informacije o drugom, ali i jasno definisanom predmetu. Na primjer, na .com domenima možete pronaći ne samo komercijalne informacije, već, na primjer, raznu dokumentaciju o softverskim proizvodima ili čak šale.

    Kada bi struktura domena bila slična strukturi direktorija, na primjer, u domeni ru.comp.os.linux (kao u sistemu vijesti) bile bi sve informacije o Linux operativnom sistemu na ruskom i neka organizacija moderatora bi se pobrinula da u drugim domenima ne objavljuju informacije o Linuxu, onda bi pretraga bila mnogo lakša. Uostalom, znali bismo gde da tražimo. Otvorite pretraživač, unesete ru.comp.os.linux i dobijete... milione različitih linkova do članaka, KAKO dokumenata i drugih informacija vezanih za Linux na ovaj ili onaj način.

    Performanse pretrage

      Učinak pretraživanja ovisi o mnogim faktorima:
    • Iz same informacije - može biti puno informacija o jednoj temi, a malo o drugoj. Ponekad možete pronaći mnogo informacija o datoj temi, ali efikasnost ove pretrage će biti blizu 0,0%, a možete pronaći samo 3-4 linka, a to će biti upravo ono što vam treba. Ovo također uključuje sposobnost webmastera da ispravno dostavi informacije tako da ih sami pretraživači mogu pronaći. Pretpostavimo da se negdje vrlo daleko nalaze informacije koje su vam potrebne, ali tražilica o tome ne zna ništa. Možda je informacija upravo objavljena ili samo webmaster koji je objavio informaciju i ne sumnja u postojanje pretraživača. Tražite informacije pomoću tražilice. Ako ona ne "zna" informacije koje su vam potrebne, onda ni vi nećete znati ništa o njoj.
    • Od tražilice - postoji mnogo pretraživača i svi su različiti. Čak i ako su istog tipa (o vrstama pretraživača ćemo govoriti nešto kasnije), naravno, svaki od njih će imati svoj algoritam. Ako ne možete pronaći informacije s jednom tražilicom, pokušajte je potražiti s drugom. Nemojte se zadržavati na jednom pretraživaču, bez obzira koliko vam se sviđa.
    • Mnogo toga ovisi o sposobnosti korištenja tražilice – kako znate koristiti tražilicu. Ako ne znate kako da koristite pretraživač, malo je vjerovatno da će vaša pretraga biti efikasna.

    Kako tražiti informacije

    Budući da najčešće ne birate željenu stranicu iz direktorija tražilice, već upisujete određenu ključnu riječ (ili nekoliko ključnih riječi), potrebno je što preciznije navesti upravo ovu ključnu riječ. Što preciznije definišete predmet pretrage, to će rezultat biti tačniji. Pretraživač ne može pogoditi vaše misli, morate mu jasno naznačiti šta tražite.

    Svaki pretraživač ima svoju sintaksu koju morate znati. Ovo poglavlje će opisati sintaksu pretraživača Google, Yandex i Rambler. Ako želite da koristite neki drugi pretraživač, možete pronaći njegovu sintaksu na njegovoj web stranici (obično je detaljno opisana).

    Internet pretraživači

    Hajde sada da pričamo o samim pretraživačima.

    Na području bivšeg ZND-a, prema SpyLog-u (Openstat), najpopularniji su sljedeći pretraživači:

    • 1. Yandex (www.yandex.ru);
    • 2. Google (www.google.com);
    • 3. [email protected] (go.mail.ru);
    • 3. Rambler (www.rambler.ru);
    • 5 Yahoo! (www.yahoo.com);
    • 6. AltaVista (www.altavista.com);
    • 7. Bing (www.bing.com).

    Pretraživači su navedeni u opadajućem redoslijedu popularnosti. Kao što vidite, naš najpopularniji pretraživač je Yandex.

    Vrste pretraživača

      Postoje dvije glavne vrste pretraživača:
    • indeks - Google, AltaVista, Rambler, HotBot, Yandex, itd.;
    • klasifikacija (katalog) - Rambler, Yahoo! i sl.

    Nemojte se iznenaditi što je pretraživač Rambler naveden dva puta - bio je i indeks i klasifikacija u isto vrijeme. Na ovo ćemo se vratiti kasnije, ali za sada hajde da pričamo o razlikama između ova dva sistema.

    Kako radi indeksni pretraživač? Pretraživač pokreće poseban program koji skenira sadržaj web servera, indeksira informacije: unosi ključne riječi određene web stranice u svoju bazu podataka, neke informacije sa web stranice.

    Kratka istorija Google-a

    Počnimo s naslovom. Google je malo izmijenjena verzija riječi googol (često se s razlogom naziva "Google"). Zauzvrat, ovu riječ je uveo Milton Sirota, nećak poznatog matematičara Edwarda Kasnera, a zatim je popularizirana u Kasnerovoj i Newmanovoj knjizi Matematika i imaginacija. Riječ "googol" prikazuje broj kao jedan 1 praćen sa 100 nula. Naziv "Google" odražava pokušaj organiziranja ogromne količine informacija na webu.

    Dakle, krenimo od samog početka. Budući Google programeri Sergey Brin i Larry Page upoznali su se 1999. na Univerzitetu Stanford. Tada je Larry imao 24 godine, a Sergey - 23. Larry je u to vrijeme bio student na Univerzitetu Michigan i došao je na Stanford na nekoliko dana. Sergej je bio u grupi studenata koji su goste trebali upoznati sa univerzitetom. Od prvog susreta, Sergej i Lari se, najblaže rečeno, nisu svideli jedno drugom - svađali su se oko svega o čemu se moglo raspravljati. Iako se to na kraju pokazalo kao pozitivna stvar, jer su njihova različita mišljenja dovela do stvaranja algoritma za rješavanje jednog od najhitnijih kompjuterskih problema: pronalaženja pravih informacija među ogromnom količinom podataka. U januaru 1996. Larry i Sergey su započeli rad na pretraživaču BackRub, koji je trebao analizirati "povratne" veze koje su upućivale na ovu web stranicu. Rad na ovom serveru odvijao se u stalnom nedostatku sredstava - uostalom, u to vrijeme Sergey i Larry su bili diplomirani studenti univerziteta - sami razumijete da diplomirani studenti nemaju mnogo novca. Inače, Larry je prvi put učestvovao u ovako ozbiljnom projektu, a prije toga se bavio raznim "neozbiljnim", ponekad i anegdotskim projektima, na primjer, napravio je radni štampač od Lego konstruktora.

    Google algoritmi pretraživanja

    Googleov interfejs je upečatljiv svojom jednostavnošću: polje za unos i dva dugmeta. Kako kažu, sve genijalno je jednostavno.

    Google posebna (proširena) sintaksa

    Pored logičkih operatora, Google vam nudi modifikatore pretraživanja koji su navedeni u tabeli. Modifikatori pretraživanja se nazivaju posebna Google sintaksa. Ozbiljno shvatite ovu tabelu: kada jednom pokušate da tražite nešto koristeći modifikatore, nećete ih odbiti.

    Google inurl modifikator

    Inurl modifikator se koristi za traženje navedenog URL-a. I za razliku od modifikatora stranice, koji vam omogućava da pretražujete informacije samo na jednoj stranici ili domeni, inurl modifikator vam omogućava da pretražujete informacije u poddirektorijumima stranice, na primjer:

    inurl: siteskype-zvonim-free

    Inurl modifikator vam omogućava da koristite znak * za navođenje domene, na primjer:
    inurl: "*.redhat.com"

    Najbolje je koristiti inurl sa sajtom. Sljedeći upit će tražiti informacije u domeni gidmir.ru, na svim njenim poddomenama osim na www:
    site: gidmir.ru inurl: "*.gidmir" -inurl: "www.gidmir.ru"

    Jezik Google pretraživanja

    Google dozvoljava mješovitu sintaksu, tj. sintaksa koja koristi nekoliko posebnih modifikatora pretraživanja u upitu. To vam omogućava da postignete najbolji rezultat.

    Evo najjednostavnijeg primjera mješovite sintakse:
    stranica: ru inurl: disk

    U tom slučaju, pretraga će se izvršiti na web lokacijama domene, a URL mora sadržavati riječ disk.

    Evo još jednog primjera:
    sajt: ru -inurl: org.ua

    Pretraživanje će se vršiti na stranicama domene ru, ali rezultati pretrage neće sadržavati stranice koje se nalaze na org.ua.

    Pojmovi za pretraživanje na Googleu

    Za većinu običnih Google korisnika ograničenje od 10 ključnih riječi nije primjetno. Ali ljubitelji dugih upita, vjerovatno su primijetili da Google uzima u obzir samo prvih 10 ključnih riječi, a sve ostale jednostavno ignorišu.

    Zašto tražiti dugačke fraze? U većini slučajeva to su odlomci iz djela. Pretpostavimo da tražimo djelo "Majstor i Margarita". Treba napomenuti da bi ključna fraza trebala izgledati kao "Master Margarita", jer riječi i, ili, i, od, ili, I, a, the i neke druge pretraživač ignorira. Ako želite natjerati da se jedna od ovih riječi uključi u vašu pretragu, ispred riječi stavite znak "+", kao što je +the.

    Prevazilaženje ograničenja od 10 riječi omogućava ispravnu konstrukciju upita. Sljedeće preporuke pomoći će vam ne samo da smanjite dužinu upita, već i poboljšate efikasnost pretraživanja općenito.

    Napredno Google pretraživanje

    Upisujemo u liniju za unos pretraživača adresu - www.google.ru/advanced_search i idemo na naprednu Google pretragu.

    Uz naprednu pretragu, možete pretraživati ​​informacije gotovo jednako fleksibilno kao i sa modifikatorima pretraživanja. Zašto "skoro"? Interfejs za napredno pretraživanje ne omogućava pristup svim modifikatorima pretraživanja.

    Podešavanje svojstava Google pretrage u kolačićima pretraživača

    Ne želim da vas zamaram tehničkim detaljima, pa ću ukratko reći šta su kolačići, a šta nisu, sa čime se ne jedu, ali kako sa njima treba raditi.

    Zamislite da imamo sljedeći zadatak: potrebno je da napišemo pojedinačni izvještaj o posjeti za svakog klijenta web stranice naše kompanije. Odnosno, tako da korisnik ne vidi ukupan broj posjeta, zna koliko je puta bio na našoj stranici. Za svaku IP adresu moramo voditi evidenciju u jednoj tabeli, koja će vjerovatno biti velika, a iz toga proizilazi da neracionalno koristimo procesorsko vrijeme i prostor na disku. Bilo bi mnogo ispravnije da ovaj prostor koristimo sa većom koristi.

    Rezultat Google pretrage

    Rezultat Google pretrage nije samo kolekcija linkova koji odgovaraju navedenim pojmovima za pretraživanje. Ovo je nešto više što zaslužuje posebnu pažnju. Unesite riječ "rusopen" i kliknite na dugme Google Search.

    Na vrhu vidimo ukupan broj rezultata (883.000.000) i ukupno vrijeme traženja, odnosno 0,34 sekunde.

      U većini slučajeva, rezultat je predstavljen kao:
    • naziv stranice;
    • opis stranice;
    • URL stranice;
    • veličina stranice;
    • datum posljednjeg indeksiranja stranice;

    Google pretraga slika

    Usluga Google Images vam omogućava da pronađete različite slike na webu. Dok se same slike ne mogu indeksirati, stranice koje sadrže te slike se indeksiraju. Unesite opis za sliku i dobićete mnogo, mnogo linkova, kao i same slike predstavljene kao galerija.

      Za efikasnije pretraživanje slika, trebate koristiti sljedeće modifikatore pretraživanja:
    • intitle: - pretraga u naslovu stranice;
    • filetype: - omogućava vam da odredite tip slike, možete odrediti sljedeće tipove: JPEG i GIF, ne BMP, PNG, slike drugih tipova nisu indeksirane;
    • inurl: - potražite navedeni URL, na primjer inurl: www.gidmir.ru ;
    • site: pretražite na navedenoj domeni ili stranici, na primjer, site: com.

    Google usluge

    Google je moćan pretraživač sa preko 3 milijarde stranica. Osim običnih web stranica, Google indeksira Word, Excel, PowerPoint, PDF i RTF datoteke. Google se također može koristiti za pretraživanje slika i telefonskih brojeva: Google slike i telefonski imenik su dizajnirani za to, respektivno. U ovom članku ćemo govoriti o Google Ad Hoc uslugama.

    Google Email

    Pokušajte koristiti poštu od Googlea. Treba napomenuti da ovo nije sasvim obična web pošta.

      Među funkcijama Gmail-a treba istaći sljedeće:
    • velika veličina poštanskog sandučeta - više od 7 GB;
    • umjesto brisanja pisama, možete ih arhivirati - tada ćete imati dovoljno prostora za dugo vremena i moći ćete vratiti pisma koja ste primili ili poslali prije nekoliko godina;
    • mogućnost pretraživanja u poštanskom sandučetu uz efikasnost Google-a;
    • pogodna organizacija pisama i odgovora na njih: sva pisma i odgovori čine jedan lanac koji je lako pratiti;
    • dobra zaštita od neželjene pošte;
    • nezaboravna adresa vaš[email protected];
    • korisničko sučelje.

    Pretraživač Rambler (Rambler)

    Istorija Ramblera

    Sve je počelo davne 1991. godine u gradu Puščino u Moskovskoj oblasti. Te daleke godine okupila se grupa istomišljenika, među kojima su bili Dmitrij Krjukov, Sergej Lisakov, Viktor Voronkov, Vladimir Samojlov, Jurij Eršov. Zajednički interes ove grupe bio je internet. Vjerovatno 1991. godine nitko od budućih programera Ramblera nije ni zamišljao da će postati kreatori jednog od najvećih i najpoznatijih pretraživača na Runetu. Uostalom, prije toga svi su služili radio uređajima na Institutu za biohemiju i fiziologiju mikroorganizama Ruske akademije nauka. Godine 1992. stvorena je kompanija "Stack" na čijem je čelu bio Sergej Lysakov. Profil kompanije - lokalne mreže i internet. U stvari, kompanija "Stack" je bila internet provajder. Kompanija je stvorila unutargradsku mrežu, zatim je Pushchino povezala s Moskvom, a preko nje - na Internet. Inače, ovo je bio prvi IP kanal koji je izašao izvan Moskve. I to 1992. godine! Sada je postavljanje kanala prilično problematično - uvijek ima puno nijansi, a onda su kablovi morali biti položeni samostalno, ručno, pod zemljom, a sve se to radilo zimi.

    Kako je funkcionisala pretraga Ramblera

    Internet se stalno razvija: broj stranica i njihove veličine se povećavaju svakim danom. Uostalom, zamislite samo: velike stranice se ažuriraju svaki dan, čak i ako je obim ažuriranja 1024 bajta (1 KB), onda ako pretpostavimo da takvih stranica ima 10.000, svaki dan pretraživač mora obraditi (indeksirati) 10.000 KB (grubo rečeno, 10 MB) informacija. Broj 10.000 uzet je "sa plafona" - primjera radi. Može biti veći ili niži - uostalom, čak se i velike stranice ne ažuriraju svaki dan. Veličina nadogradnje je također izmišljena. Zamislite informativno-analitičku stranicu na kojoj se gotovo svaki dan objavljuju novi članci ili se materijali preštampaju sa drugih stranica. U ovom slučaju, veličina ažuriranja će biti daleko od 1 KB, ali najmanje 10. Dodajte na sve ovo još vijesti i drugih informacija, ispada da bi s brojem ažuriranih stranica od 10.000, pretraživač trebao indeksirati 120 MB teksta. I uz sve to, pretraživač ne samo da bi trebao precizno prikazati rezultate pretraživanja, već i učiniti to što je brže moguće kako bi korisniku bilo ugodno raditi s njim. Ko želi da čeka 10 minuta na rezultate pretrage? Preterujem, naravno, ali lično ne bih čekao više od 30 sekundi na rezultate pretrage (od trenutka kada kliknete na dugme Pronađi do prvih deset rezultata). Ispostavilo se da programeri pretraživača moraju stalno održavati na odgovarajućem nivou ne samo hardver, koji mora biti u stanju da obrađuje konstantno rastuće količine informacija, već ne možete uzeti ni "matematiku" jednom peglom. Potrebno je stalno poboljšavati algoritme pretraživanja kako se s povećanjem obima baze pretraživanja ne povećava vrijeme pretraživanja (što znači značajno povećanje vremena - za korisnika nema razlike koliko će pretraga trajati 2,5 sekunde ili 2,0555 sekundi, jer nije u stanju da proceni ovo vreme).

    Rambler upiti, Rambler sintaksa

    Zahtjev upućen Rambleru može se sastojati od jedne ili više riječi, a zahtjev može sadržavati znakove interpunkcije. Rambler programeri su dizajnirali svoj pretraživač za maksimalnu udobnost korisnika. Rambler bi mogao koristiti čak i neiskusan korisnik koji uopće nije upoznat s jezikom upita. Sve što je trebalo da uradi je da unese zahtev koji se sastoji od nekoliko reči (na primer, neke fraze) i bez znakova interpunkcije - Rambler je sam pronašao potrebne dokumente, i to što je moguće efikasnije. Naravno, ako se pravilno koristi jezik upita, efikasnost se značajno povećava, ali čak i uz potpuno nepoznavanje jezika upita, efikasnost pretraživanja je bila na visokom nivou. Kao što je već napomenuto, poznavanje jezika upita je u vašem interesu, jednostavno možete mnogo brže pronaći informacije koje su vam potrebne.

    Yandex pretraživač (Yandex)

    Istorijat

    Davne 1990. godine kompanija Arcadia, na čelu sa Arkadijem Borkovskim i Arkadijem Voložom, počela je da razvija softver za pretraživanje. Šest godina kasnije pojavila se web stranica Yandex. Ali šta se dogodilo u tih šest godina?

    Za dvije godine stvorena su dva sistema za pronalaženje informacija - "Međunarodna klasifikacija izuma" i "Klasifikator roba i usluga". Oba sistema su radila pod DOS-om i omogućavala su traženje reči iz datog rečnika pomoću logičkih operatora.

    Arcadia je postala divizija CompTek-a 1993. godine. Tokom 1993-1994, tehnologije pretraživanja su se značajno poboljšale, na primjer, rečnik koji omogućava pretragu uzimajući u obzir morfologiju ruskog jezika zauzimao je samo 300 KB, što znači da se slobodno uklapao u RAM, a rad s njim se odvijao vrlo brzo. Na osnovu ove nove tehnologije 1994. godine kreiran je "Bible Computer Reference" - sistem za pronalaženje informacija koji radi sa prevodima Starog i Novog zaveta.

    Yandex pretraživanje jezika

    Kako će pretraživač protumačiti riječ koju unesete?

      Sada ćemo pričati o ovome:
    • Pravilo 1. Ispada da ga sistem tumači prema pravilima ruskog jezika. Primjer: ako unesete riječ "automobil", također ćete dobiti rezultate koji sadrže riječi "automobili", "automobil" itd. Slično, sa glagolima - za upit "idi", dobićete dokumente koji sadrže riječi "ide", "ide", "hodao", "hodao" itd. Kao što vidite, pretraživač je inteligentniji nego što mislite – nije samo alat za traženje određene riječi u bazi podataka.
    • Pravilo 2. Posebna pažnja se poklanja riječima napisanim velikim slovom. Ako je riječ napisana velikim slovom i nije prva riječ u rečenici, naći će se samo riječi napisane velikim slovom. Inače će se naći riječi napisane i velikim i malim slovima. Primjer: na upit "Javačar A." naći će se dokumenti koji sadrže i "taxa" (naknada) i "taxa" (prezime), budući da je riječ "taxa" iako napisana velikim slovom, ali dolazi na prvom mjestu u rečenici. Ali upit "A. jazavčar" će pronaći dokumente koji sadrže samo riječ "jazavac", napisanu velikim slovom.

    Yandex sintaksa

    Yandex po defaultu koristi logički operator I. To znači da ako unesete upit "Samsung TV", tada ćete u rezultatima dobiti dokumente u kojima će se riječi "TV" i "Samsung" pojaviti u istoj rečenici. Ako želite eksplicitno specificirati operator AND, tada koristite simbol ampersanda &. Drugim riječima, "Samsung TV" je isto što i "TV & Samsung". Možete koristiti i upit "TV + Samsung".

    Ako želite suprotan efekat, tj. Ako želite da dobijete dokumente koji sadrže reč "TV" odvojeno i reč "Samsung" odvojeno, onda morate da koristite OR operator (|), na primer: "TV | Samsung".

    Sintaksa Yandex upita

    Sve riječi u tekstu dokumenta su numerirane Yandexom po redu. Udaljenost između susjednih riječi je 1 (ne 0!), a udaljenost između riječi obrnutim redoslijedom je -1. Isto važi i za ponude.

    Da bi se označila udaljenost između riječi, stavlja se znak /, nakon čega odmah slijedi broj, što znači da je ovo udaljenost između riječi. Na primjer, upitom "razvojnik /2 programa" će se pronaći dokumenti koji sadrže riječi "programi" i "programi", a razmak između riječi ne bi trebao biti veći od dvije riječi, a sve ove riječi bi trebale biti u jednoj rečenici. U tom slučaju će se pronaći dokumenti koji sadrže "programer aplikacijskog programa", "programer sistemskog programa" itd.

    Ako znamo tačno udaljenost i red riječi, onda možemo koristiti / + n sintaksu. Na primjer, upit "crvena /+1 kapulja" će rezultirati riječju "kapa" odmah iza riječi "crvena". Upit "crvenkapica" doveo bi do istog rezultata.

    Yandex operatori pretraživanja

    Zagrade se koriste za predstavljanje cijelog izraza u upitu. Na primjer, upit "(istorija | tehnologije | programi)/+1 Linux" će pronaći dokumente koji sadrže jednu od fraza "Linux historija", "Linux tehnologije", "Linux programi".

    Zone

    Zona je mjesto za pronalaženje informacija koje su vam potrebne. Možete odrediti zonu u kojoj želite da pretražujete - naslove (Title zona), linkove (sidra) ili adresu (Adresa). Možete koristiti i zonu za sve - pretražite cijeli dokument.

    Sintaksa: upit $zone_name.

    Na primjer: zahtjev $title "(!LANG:Microsoft" найдет все документы, в заголовках которых встречается точная фраза "Microsoft".!}

    Dodatne opcije Yandex pretraživanja

    Google pretraživač je omogućio da se lokacija pretraživanja ograniči na određenu listu servera, ili, obrnuto, da se određeni serveri izuzmu iz liste pretraživanja. Postoje potpuno iste mogućnosti u Yandex pretraživaču. Također možete tražiti dokumente koji povezuju na određene URL adrese ili slike. Prilikom navođenja maske datoteke (na primjer, slike), možete koristiti znak *, što znači sve znakove, na primjer: ”audi-*”.

    Sintaksa je: #element_name=”value”.

    Na globalnom Internetu možete pronaći informacije o bilo kojoj temi koja vas zanima. Ali najteža stvar u radu s internetom je pronaći informacije koje su vam potrebne. Budući da Internet nema jasnu centraliziranu strukturu, razvija se haotično, a u svijetu se pojavljuje sve više novih servera, pitanja pretraživanja informacija postaju vrlo relevantna.

    Pretraživači uvelike olakšavaju rad na Internetu i pomažu nam da brzo pronađemo potrebne informacije na ogromnom nizu internet servera. Na World Wide Web-u postoji nekoliko hiljada pretraživača, među kojima ima i dobro uhodanih i manje poznatih.

    Najpopularniji pretraživači

    • Yandex— alat za pronalaženje informacija u punom tekstu, uzimajući u obzir morfologiju ruskog jezika; pretražujte web stranice, vaš katalog, vijesti, proizvode, karte, rječnike, blogove, slike, Microsoft Office dokumente i adobe acrobat PDF
      • Yandex
    • Rambler(OJSC "Rambler Internet Holding") — pretraga sajta uzimajući u obzir morfologiju ruskog i engleskog jezika; Takođe ima sistem za pretraživanje kataloga.
      • Rambler Lite: tražilica- kratka verzija stranice za pretraživanje
    • Pretraga servisa Sputnjik(JSC "Rostelecom") - pretraga na sajtovima, javnim servisima itd.; Sigurna pretraga
    • NIGMa - inteligentni pretraživač(Moskovski državni univerzitet Lomonosov i Univerzitet Stanford) — pretražite dokumente, slike, knjige, vijesti putem Google-a, Yahooa, MSN-a, Yandexa, Ramblera, altavista, Aporta; sistem takođe pruža jedinstvenu pretragu hemijskih formula i reakcija
    • Google — pretraga po sajtovima (moguće je pretraživanje sajtova na ruskom jeziku); pretražite dokumente u formatima adobe acrobat PDF, Microsoft Office, PostScript, Corel WordPerfect, Lotus 1-2-3 itd.; traženje slika, video zapisa, vijesti, pretraživanje mapa; mogućnost pretraživanja na ruskim i ruskim stranicama; postoji sistem za prevođenje teksta na druge jezike (49 jezika)
    • bing(Microsoft Corp.) - pretraga sajtova, slika i video zapisa; mogućnost pretraživanja na ruskim i ruskim stranicama; postoji sistem za prevođenje teksta na druge jezike (22 jezika)
    • Yahoo!(Yahoo) - traži web lokacije, adrese e-pošte itd.

    Svaki od pretraživača ima svoje prednosti i nedostatke, koje su određene principom rada pretraživača, jednostavnošću upotrebe, njegovim dizajnom, složenošću jezika upita, prisustvom raznih naprednih funkcija (kontrola formata i rangiranje izlaznih informacija, ispravljanje pravopisnih grešaka i pogrešnih rasporeda tastature pri unosu ključnih reči, prevođenje stranice na druge jezike itd.), brzina rada i drugi parametri. Izbor pretraživača za određenu aplikaciju određen je svrhom pretraživanja, prirodom traženih informacija, željenim izlaznim formatom i širinom sljedivih adresa servera u svijetu Interneta.

    Pretraga po ključnim riječima. Jezik upita pretraživača

    Pretraživač obično ima polje za unos ključnih riječi, pomoću kojeg pronalazi dokumente koji sadrže te ključne riječi. Što je upit pretraživaču bolji (kvalitetniji), to je ukupan broj pronađenih dokumenata manji, a više je dokumenata koji odgovaraju onome što vam je potrebno. Ako je zahtjev vrlo jednostavan ili nepismen, onda vam pretraživač može dati nekoliko miliona dokumenata koje nećete pregledati cijeli život.

    Korištenje jezika upita koji sadrži logičke operacije (logičke operatore I, ili NE, zagrade itd.), prefiksi obaveznog prisustva ključnih reči u dokumentu «+» i «-» (kod traženja visokospecijaliziranih pojmova poželjno je koristiti ga), lokacija ključnih riječi u dokumentu u blizini ili na određenoj udaljenosti i sl.), i drugi elementi, te veći broj srodnih ključnih riječi, mogu značajno suziti područje pretraživanja i bolje sastaviti zahtjev serveru za pretraživanje. Treba imati na umu da različite tražilice mogu imati i različite jezike upita i vrlo slične.

    Neki pretraživači dodatno imaju funkciju napredna pretraga, omogućavajući korisniku da preciznije opiše šta mu je konkretno potrebno bez poznavanja jezika upita. Funkcija naprednog pretraživanja su, na primjer, tražilice Yandex i Google.

    Glavne vrste pretraživača. Koji pretraživač koristiti

    Postoje 2 glavne vrste internet pretraživača: indeks i klasifikacija (katalog). Indeksirajte pretraživače (na primjer, Yandex, Rambler, Sputnik, Google, Bing itd.), radeći u automatskom načinu ažuriranja svojih informacija, pregledavaju sadržaje servera na Internetu, indeksiraju informacije koje se na njima nalaze i unose informacije o lokaciji riječi na stranicama stranice u svoje baze podataka. Pretraživači imenika (na primjer, Rambler, Yahoo!, itd.) sadrže tematski strukturiran katalog servera, a najčešće se popunjavaju ručno. Obično WWW stranica klasifikacijskog pretraživača sadrži i polje za unos ključnih riječi za pretraživanje u vlastitoj bazi podataka. U sistemu pretraživanja kataloga možete početi sa većim tematskim naslovom, i postepeno se spuštati dalje duž naslova, da biste došli do linka do stranice koja vam je potrebna. U nekim slučajevima je prikladnije koristiti prvu vrstu tražilica, u drugima - drugu. Postoje pretraživači koji kombinuju oba principa rada. Konkretno, mnogi indeksni pretraživači takođe imaju sistem za pretraživanje kataloga. Također, pretraživači mogu koristiti neke druge principe metoda pretraživanja.

    Mnogi pretraživači su se transformisali u internet portale koji kombinuju veliki broj resursa i usluga. Na stranicama ovakvih portala možete čitati vijesti, upoznati se sa TV programom, saznati o vremenu, tečajevima, koristiti uslugu mapiranja i još mnogo toga. drugi

    Najpopularniji ruski pretraživači imaju mogućnosti pretraživanja koje uzimaju u obzir posebnosti ruskog jezika.

    Za istovremeno pretraživanje u nekoliko pretraživača možete koristiti takozvane metamašine za pretraživanje koje pristupaju nekoliko pretraživača odjednom, na primjer NIGMa.

    Postoje i pretraživači koji su specijalizovani za traženje jedne teme (na primer, informacione tehnologije, muzika, resursi, priroda, itd.)

    Postoji tip ljudi koji jednostavno vole da koriste mnogo lepih metafora. To su ljudi koji World Wide Web upoređuju sa smetlištem. Kao da je na mreži sve bačeno u veliku gomilu i tu đavo može slomiti nogu. Čini se da je sve na internetu, ali da biste pronašli nešto, morate iskopati ogromne planine smeća.

    Pa, to je lepa metafora. Ali to ne znači da je u pravu. Mnogima se na prvi pogled na stolu gomila ogromna količina beskorisnih stvari. Ali za one ljude koji rade za ovim stolovima, raspored stvari se daje sasvim jasnoj logici. One stvari koje su najčešće potrebne, kao što je šolja za čaj, nalaze se na dohvat ruke. A one stvari koje nisu uvijek neophodne nalaze se dalje. I ovo nikako nije smetlište ili nered.

    Internet takođe ima svoju logiku. Ako znate nekoliko pravila i koristite ih pri pretraživanju, onda će svaka informacija s interneta biti poput šolje za čaj na dohvat ruke, a osjećaj da je Web smetlište odmah će nestati.

    U ovom članku ćemo govoriti o tražilicama i pravilima internet pretraživanja.

    UREĐAJ PRETRAŽIVAČA

    Za početak - mala lirska digresija o strukturi tražilice. Tako je uređeno da korisnik vidi samo interfejs samog sistema, odnosno traku za pretragu, a sve što je unutar sistema ostaje tu.

    Prva komponenta pretraživača je takozvani "pauk", robot za pretraživanje. Koje su njegove funkcije? On luta po cijelom webu, pregledava internet - stranice, posjećuje linkove. I sve to radi bez prestanka. Pauk ne luta iz vlastitog zadovoljstva. Unosi apsolutno sve stranice koje je pregledao u indeks pretraživača. Unosi ih u obliku smislenih riječi koje se pojavljuju na stranici.

    Tako se ispostavlja da je indeks, druga komponenta tražilice, ogromna baza podataka, uz pomoć koje je moguće brzo saznati na kojim stranicama na webu se riječ za pretraživanje pojavljuje. Informacije za referencu - cjelokupni obim indeksa poznatog Yandex pretraživača je više od osamdeset gigabajta.

    Treća komponenta nakon indeksa je sama tražilica. Njegova svrha je traženje pravih riječi ili fraza u indeksu. Zapamtite da pretraživač ne pretražuje cijeli internet – ne pretražuje. Zamislite samo da je ovo istina: na primjer, cjelokupna količina indeksiranih informacija na Yandexu iznosi 269 gigabajta. A ako nije bilo indeksa nakon unosa vašeg upita, sistem bi morao preuzeti i pregledati 260 gigabajta informacija. To je nerealno. Zamislite samo koliko će vremena trebati za obradu jednog zahtjeva.

    Iz činjenice da se pretraga ne vrši u cijeloj Mreži, već u indeksu, proizilaze dva zaključka. Prvo, ako tražilica nije pronašla neku informaciju, to uopće ne znači da te informacije nema na webu, nema je u indeksu ove konkretne tražilice. Drugo, sistemi za pronalaženje informacija u mreži razlikuju se jedan od drugog ne samo po interfejsu, već i, na primjer, po indeksu i metodama njegovog sastavljanja. Stoga, ako niste pronašli potrebne informacije u jednoj tražilici, trebate ih potražiti u drugoj.

    Robot za pretraživanje koji sastavlja indeks pretražuje sve stranice u krugu i to vrlo redovno - tako indeks uvijek ispravno prikazuje promjene koje su se dogodile na stranici. Sajtove koje su se upravo pojavile "pauk" mogu sami da pronađu, pogodivši ih na link sa drugih sajtova. Takođe, autori sajta mogu da obaveste "pauka" o svom sajtu.

    Posljednja komponenta pretraživača je njegov World Wide Web server, koji je lice sistema. Ovo je interfejs preko koga korisnici postavljaju zahteve i dobijaju odgovore na njih. World Wide Web server je samo jedan dio sistema, a ne najveći.

    PRETRAŽI JEZIK

    Za komunikaciju sa pretraživačima postoji poseban jezik i posebna pravila. Naravno, bilo bi sjajno kada bi na vaše pitanje odmah dali iscrpan odgovor. Ali trenutno se samo radi na tome.

    Prvo morate istaknuti ključne riječi. Potrebno je odlučiti koje nekoliko riječi će potpunije okarakterizirati ono što tražite i unesite te riječi. Reći ćete da je to očigledno. Da, jeste. Ali bićete iznenađeni kada saznate šta mnogi ljudi unose u traku za pretragu.

    Postoji dobra stvar na Yandexu koja se zove "prenos uživo". Ovo je stranica na kojoj možete vidjeti posljednjih 20 traženih fraza ili riječi. Gledajte ovu stranicu duže i doživjet ćete mnogo različitih osjećaja. Neki zahtjevi se mogu zabilježiti u posebnu knjigu - tako su nevjerovatni. Gledajući neke zahtjeve, shvatit ćete da definitivno NIJE potrebno ovako pretraživati.

    Obično veliki postotak zahtjeva ne sadrži nikakvu jasnoću: "video", "tv", "download" i tako dalje. Podnosioci zahtjeva smatraju da sistem sam treba da pogodi šta korisnici žele od njega. Formirajte upit za pretragu jasnije, a što je konkretniji, pretraživač će dati manje nepotrebnih rezultata.

    Neki pretraživači razlikuju iste upite, ali počinju velikim ili malim slovom. Na primjer, Yandex će dati drugačiji broj rezultata pretraživanja, dok Google sistem ignoriše velika i mala slova.

    Koristeći znakove "+" i "-", možete ili isključiti riječi iz pretraživanja ili ih učiniti obaveznim. U ovom slučaju ne bi trebalo biti razmaka između znaka i riječi. Ovo pravilo važi za sve pretraživače.

    U ovom upitu tražimo online prodavnice računarske opreme koje nisu specijalizovane za laptopove, a u sledećem, naprotiv, one prodavnice koje prodaju te iste laptopove.

    Kao što vidite, tražilica je zaista dala različite rezultate.

    Ako je u vašem zahtjevu nekoliko riječi jednostavno odvojeno razmacima, tada će tražilica tražiti one stranice na kojima su te riječi dio jedne rečenice. Pa, ako želite pronaći dokument koji sadrži bilo koju od riječi koje ste naveli u upitu, morate koristiti znak "|".

    Yandex je dao samo monstruozan broj rezultata, a sve zato što sada ne tražimo određenu frazu, već sve rezultate koji sadrže bilo koju od ovih popularnih riječi. Općenito, takav upit je najpogodniji za napraviti ako postoji mnogo riječi sinonima.

    Ako želite pronaći stabilne fraze, unesite ih pod navodnicima. Ovo se može primijeniti ako, na primjer, tražite retke iz nekih književnih djela ili citate.

    Kao što vidite, nakon što smo specificirali zahtjev i uputili pretraživač da traži upravo ovu ponudu, već smo dobili osjetno manji broj rezultata.

    ZAKLJUČAK

    Koristeći sve gore navedene metode, lako možete pronaći informacije koje su vam potrebne. Srećom, ima dovoljno pretraživača. Međutim, postoji ogroman broj zadataka koje tražilice ne mogu obaviti.

    Zamislimo sljedeću situaciju: hitno vam treba najbolji sistem administrator u gradu. Kako ćete to tražiti? Na primjer, možete se oglasiti u novinama, a zatim odgovoriti na mnoge telefonske pozive nekoliko mjeseci. Ili možete doći u specijaliziranu agenciju i tamo brzo pronaći odgovarajućeg kandidata.

    Slično, sa pretraživačima - oni su dizajnirani da pokriju što je više moguće informacija. Ako trebate pronaći nešto posebno, onda ima smisla koristiti specijalizirane tražilice koje pretražuju u različitim područjima.

    Kao zaključak, želio bih dati jedan savjet. U okviru ovog članka dali smo vam samo generalizirane informacije o sastavljanju upita za pretraživanje. Zapravo, svaki pretraživač ima svoj napredni jezik upita. Odvojite vrijeme da istražite mogućnosti sintakse upita vašeg omiljenog pretraživača. U budućnosti će to uvelike pojednostaviti potragu za potrebnim materijalima. Da vam pomognu linkovi na referentne materijale dvaju najpopularnijih pretraživača: