Ieškokite informacijos naudodami paieškos variklius. Norėdami ieškoti pagal tikslią žodžio formą, prieš žodį padėkite šauktuką.

Ieškoma informacijos internete

Ieškoma informacijos internete

Norėdami ieškoti informacijos dažniausiai naudojamuose trys būdai(Žr. 1 pav.). Pirmas iš jų – paieška pagal adresą. Jis naudojamas, kai vartotojas žino informacijos šaltinio, kuriame yra jam reikalinga informacija, adresą. Organizuodamas informacijos paiešką pagal adresą (adreso forma – IP, domenas arba URL – šiuo atveju nesvarbu), vartotojui tereikia įvesti ištekliaus adresą atitinkamame naršyklės lauke – programoje. skirtas suteikti prieigą prie tinklo išteklių.

Ryžiai. 1. Informacijos paieškos hipertekstinėse duomenų bazėse būdai

Antra- paieška naudojant hipersaitų navigaciją. Naudodamas šio tipo paiešką, vartotojas pirmiausia turi pasiekti serverį, susietą su atitinkama duomenų baze. Tada dokumentą galite rasti naudodami hipersaitus. Akivaizdu, kad šis metodas yra patogus, kai resurso adresas vartotojui nežinomas. Diegiant šį metodą paieškos pradžiai yra skirti žiniatinklio portalai – serveriai, suteikiantys tiesioginę prieigą prie tam tikro serverių rinkinio, įskaitant juose įdiegtus informacijos išteklius, taip pat žiniatinklio programas, įgyvendinančias žiniatinklio paslaugas, atitinkančias portalo paskirtis. Per portalą pasiekiami serveriai gali būti susiję su konkrečia sistema (pavyzdžiui, įmonės) arba skirtingomis sistemomis ir būti specialiai parinkti pagal specifines, temines ar kitas jų svetainėse esančių dokumentų ir duomenų ypatybes. Paprastai portaluose derinamos įvairios funkcijos, siekiant išlaikyti klientą kuo ilgiau. Portalo dominuojanti paslauga yra nuorodų paslauga: paieška, rubrikai, finansiniai indeksai, orų informacija ir kt. Nors interneto svetainės dažniausiai yra statinių tinklalapių rinkiniai, portalai yra programinės įrangos įrankių ir iš anksto nesutvarkytos informacijos rinkiniai, kuriuos šios priemonės paverčia struktūriniais duomenimis konkrečių vartotojų prašymu.

Trečioji paieškos metodas apima interneto paieškos serverių naudojimą. Paieškos serveriai yra dedikuoti kompiuteriai – kompiuteriai, kuriuose yra interneto išteklių duomenų bazės. Tokio serverio vartotojo sąsajoje yra laukas raktiniams žodžiams, apibūdinantiems vartotoją dominančią temą, įvesti (Žr. 2 pav.).

2 pav. „Yandex“ paieškos serverio lango vaizdas

Serveris šiuos žodžius suvokia kaip informacijos užklausą, pagal kurią ieško išteklių ir pateikia vartotojui rastų dokumentų sąrašą. Akivaizdu, kad įgyvendinant šį metodą galimos ir 1-ojo (nepavyksta tikslo), ir 2-ojo tipo (informacinis triukšmas) klaidos. Reikia paminėti, kad išskiriamos dvi paieškos serverių grupės: paieškos sistemos ir temų katalogai. Jų skirtumą lemia interneto išteklių duomenų bazės, kurią šis serveris atlieka informacijos gavimą, sukūrimo ir vėlesnio papildymo būdas. Taigi, paieškos sistemose yra speciali programa - paieškos robotas. Jis nuolat stebi tinklą, renka informaciją iš tinklalapių, indeksuoja juos ir pataiso jų paieškos vaizdą savo duomenų bazėje. Dalykų kataloguose interneto dokumentų duomenų bazę „rankiniu būdu“ formuoja redaktoriai specialistai. Kadangi internete nėra vienos administracijos, jos informaciniai ištekliai nuolat keičiasi. Joje gali atsirasti naujų dokumentų, o esami – išnykti. Įvairių svetainių dokumentuose informacijos atnaujinimo dažnis yra skirtingas: kai kuriems tai yra kelis kartus per valandą, kai kuriems - kartą per dieną, dieną, mėnesį ir pan. Todėl labai svarbu suprasti, kad naudojant informacijos paieškos sistemas informacijos paieškai internete, paieška vykdoma ne realioje žiniatinklio dokumentų erdvėje, o kokiame nors modelyje, kurio turinys gali labai skirtis nuo tikrojo interneto turinio paieškos metu. Pagal indeksuotų išteklių aprėpties laipsnį paieškos sistemas galima suskirstyti į dvi grupes: tarptautines ir rusakalbes. Pirmieji iš eilės indeksuoja visus internete paskelbtus dokumentus. Antrasis indeksuoja išteklius, esančius domenų zonose, kuriose vyrauja rusų kalba. Populiariausių sistemų sąrašas pateiktas lentelėje. vienas.

Skirtukas. 1. Populiariausios paieškos sistemos

Tarptautinė rusakalbiai
Google „Yandex“ (44,4 % „Runet“)
Yahoo! Rambler (10,6 % Runet)
bing Mail.ru (7,3 % Runet)
msn Nigma (0,5 % Runet)
AltaVista Gogo.ru (0,3 % Runet)
Paklausk Aport (0,2 % Runet)

Pastaba: Runet yra rusiškai kalbanti interneto dalis, kuri sudaro domenus su pavadinimais ru ir rf.

Reikia paminėti, kad yra speciali paieškos sistemų kategorija – metapaieškos sistemos. Esminis jų skirtumas nuo paieškos sistemų ir temų katalogų yra tas, kad jie neturi savo indeksų duomenų bazės, todėl, gavę vartotojo užklausą, nukreipia ją į kelis paieškos serverius vienu metu (žr. 3 pav.).

Ryžiai. 3. Metapaieškos sistemos schema

Galimybė vienu metu naudoti kelias paieškos sistemas vienai užklausai yra akivaizdus metapaieškos sistemų pranašumas. Šiuo metu Metabot.ru sistema yra plačiai pritaikyta, kurios sąsaja parodyta fig. 4. Ši sistema leidžia išteklių paieškai naudoti tiek tarptautinius, tiek rusų kalbos paieškos serverius.

1. Įvadas

Kiekvienais metais interneto apimtys išauga daug kartų, todėl tikimybė rasti reikiamą informaciją smarkiai išauga. Internetas vienija milijonus kompiuterių, daugybę skirtingų tinklų, vartotojų skaičius kasmet didėja 15-80%. Ir, nepaisant to, vis dažniau prisijungiant prie interneto pagrindinė problema yra ne reikalingos informacijos trūkumas, o galimybė ją rasti. Paprastai paprastas žmogus dėl įvairių aplinkybių negali arba nenori skirti daugiau nei 15-20 minučių sau reikalingo atsakymo paieškoms. Todėl ypač svarbu teisingai ir kompetentingai išmokti, atrodytų, paprastą dalyką – kur ir kaip ieškoti, norint gauti NORIMUS atsakymus.

Norėdami rasti reikiamą informaciją, turite rasti jos adresą. Tam yra specializuoti paieškos serveriai (indekso robotai (paieškos sistemos), teminiai interneto katalogai, metapaieškos sistemos, žmonių paieškos paslaugos ir kt.). Šioje meistriškumo klasėje atskleidžiamos pagrindinės informacijos paieškos internete technologijos, pateikiamos bendrosios paieškos įrankių savybės, nagrinėjama populiariausių rusų ir anglų kalbų paieškos sistemų paieškos užklausų struktūra.

2. Paieškos technologijos

Web-technology World Wide Web (WWW) yra laikoma specialia dokumentų rengimo ir talpinimo internete technologija. WWW apima interneto puslapius, elektronines bibliotekas, katalogus ir net virtualius muziejus! Esant tokiai informacijos gausai, kyla aštrus klausimas: „Kaip naršyti tokioje didžiulėje ir plataus masto informacinėje erdvėje?
Paieškos įrankiai padeda išspręsti šią problemą.

2.1 Paieškos įrankiai

Paieškos įrankiai – tai speciali programinė įranga, kurios pagrindinis tikslas – užtikrinti optimaliausią ir kokybiškiausią informacijos paiešką interneto vartotojams. Paieškos įrankiai talpinami specialiuose žiniatinklio serveriuose, kurių kiekvienas atlieka tam tikrą funkciją:

  1. Interneto puslapių analizė ir analizės rezultatų įvedimas į vieną ar kitą paieškos serverio duomenų bazės lygį.
  2. Naudotojo prašymu ieškokite informacijos.
  3. Patogios sąsajos suteikimas, skirtas vartotojui ieškoti informacijos ir peržiūrėti paieškos rezultatus.

Darbo metodai, naudojami dirbant su šiais ar kitais paieškos įrankiais, yra beveik vienodi. Prieš pradėdami juos aptarti, apsvarstykite šias sąvokas:

  1. Paieškos įrankio sąsaja pateikiama kaip puslapis su hipersaitais, užklausos eilute (paieškos eilute) ir užklausos aktyvinimo įrankiais.
  2. Paieškos sistemos rodyklė yra informacinė bazė, kurioje yra tinklalapių analizės rezultatai, sudaryti pagal tam tikras taisykles.
  3. Užklausa yra raktinis žodis arba frazė, kurią vartotojas įveda paieškos juostoje. Įvairioms užklausoms formuoti naudojami specialieji simboliai ("", ~), matematiniai simboliai (*, +, ?).

Informacijos paieškos internete schema yra paprasta. Vartotojas įveda raktinę frazę ir suaktyvina paiešką, taip gaudamas dokumentų pasirinkimą pagal suformuluotą (duotą) užklausą. Šis dokumentų sąrašas reitinguojamas pagal tam tikrus kriterijus, kad sąrašo viršuje būtų tie dokumentai, kurie labiausiai atitinka vartotojo užklausą. Kiekviena iš paieškos įrankių naudoja skirtingus dokumentų reitingavimo kriterijus, tiek analizuojant paieškos rezultatus, tiek formuojant indeksą (pildant internetinių puslapių indeksų duomenų bazę).

Taigi, jei kiekvieno paieškos įrankio paieškos eilutėje nurodysite to paties dizaino užklausą, galite gauti skirtingus paieškos rezultatus. Vartotojui labai svarbu, kokie dokumentai pagal paieškos rezultatus atsidurs pirmose dviejose ar trijose dešimtyse dokumentų ir kiek šie dokumentai atitinka vartotojo lūkesčius.

Dauguma paieškos įrankių siūlo du būdus ieškoti − paprasta paieška(paprasta paieška) ir Išplėstinė paieška(išplėstinė paieška) su specialia prašymo forma ir be jos. Panagrinėkime abiejų tipų paiešką anglų kalbos paieškos variklio pavyzdžiu.

Pavyzdžiui, „AltaVista“ naudinga atliekant savavališkas užklausas „Kažkas apie internetinius informacinių technologijų laipsnius“, o „Yahoo“ paieškos įrankis leidžia gauti pasaulio naujienas, informaciją apie valiutų kursą ar orų prognozes.

Užklausos patikslinimo kriterijų ir išplėstinės paieškos technikos įvaldymas leidžia padidinti paieškos efektyvumą ir greitai rasti reikiamą informaciją. Visų pirma, paieškos efektyvumą galite padidinti naudodami loginius operatorius (operacijas) Or, And, Near, Not, matematinius ir specialiuosius simbolius užklausose. Naudodamas operatorius ir (arba) simbolius, vartotojas susieja raktinius žodžius norima seka, kad gautų tinkamiausią užklausos paieškos rezultatą. Prašymo formos pateiktos 1 lentelėje.

1 lentelė

Paprasta užklausa suteikia daugybę nuorodų į dokumentus, nes į sąrašą įtraukiami dokumentai, kuriuose yra vienas iš žodžių, įrašytų prašant, arba paprasta frazė (žr. 1 lentelę). Operatorius ir leidžia nurodyti, kad visi raktiniai žodžiai turi būti įtraukti į dokumento turinį. Tačiau dokumentų skaičius vis tiek gali būti didelis ir jų peržiūra gali užtrukti ilgai. Todėl kai kuriais atvejais daug patogiau naudoti artimojo konteksto operatorių, kuris rodo, kad žodžiai dokumente turi būti pakankamai arti. Naudojant šalia labai sumažėja rastų dokumentų skaičius. Simbolio „*“ buvimas užklausos eilutėje reiškia, kad žodžio bus ieškoma pagal jo kaukę. Pavyzdžiui, gaukime dokumentų sąrašą, kuriame yra žodžių, prasidedančių „gov“, jei užklausos eilutėje rašome „gov*“. Tai gali būti žodžiai vyriausybė, gubernatorius ir kt.

Ne mažiau populiarus paieškos variklis „Rambler“ tvarko nuorodų srauto statistiką iš savo duomenų bazės, tuos pačius loginius operatorius AND, OR, NOT, metasimbolį * (panašų į „AltaVista“ simbolį *, kuris išplečia užklausų diapazoną), koeficientų simboliai + ir - yra palaikoma norint padidinti arba sumažinti į užklausą įvestų žodžių reikšmę.

Pažvelkime į populiariausias informacijos paieškos internete technologijas.

2.2 Paieškos sistemos

Interneto paieškos sistemos yra serveriai su didžiule URL duomenų baze, kurie automatiškai pasiekia WWW puslapius visais šiais adresais, tiria šių puslapių turinį, formuoja ir įrašo puslapių raktinius žodžius į savo duomenų bazę (indekso puslapius).

Be to, paieškos sistemų robotai seka nuorodas, su kuriomis susiduria puslapiuose, ir iš naujo jas indeksuoja. Kadangi beveik bet kuriame WWW puslapyje yra daug nuorodų į kitus puslapius, su tokiu darbu paieškos sistema galutiniame rezultate teoriškai gali apeiti visas interneto svetaines.

Būtent tokio tipo paieškos įrankiai yra žinomiausi ir populiariausi tarp visų interneto vartotojų. Visi žino gerai žinomų interneto paieškos sistemų (paieškos sistemų) pavadinimus – „Yandex“, „Rambler“, „Aport“.

Norėdami naudoti tokio tipo paieškos įrankį, turite eiti į jį ir paieškos juostoje įvesti jus dominantį raktinį žodį. Tada gausite išvestį iš paieškos sistemos duomenų bazėje saugomų nuorodų, kurios yra arčiausiai jūsų užklausos. Kad paieška būtų kuo veiksmingesnė, iš anksto atkreipkite dėmesį į šiuos dalykus:

  • nuspręsti dėl prašymo temos. Ko tiksliai galiausiai ieškote?
  • atkreipti dėmesį į kalbą, gramatiką, įvairių neabėcėlės ženklų vartojimą, morfologiją Taip pat svarbu teisingai suformuluoti ir įvesti pagrindinius žodžius. Kiekviena paieškos sistema turi savo užklausos pateikimo formą – principas tas pats, tačiau naudojami simboliai ar operatoriai gali skirtis. Reikalingos užklausų formos taip pat skiriasi priklausomai nuo paieškos variklio programinės įrangos sudėtingumo ir jos teikiamų paslaugų. Vienaip ar kitaip, kiekviena paieškos sistema turi skyrių „Pagalba“ („Pagalba“), kuriame prieinamai paaiškinamos visos sintaksės taisyklės, taip pat rekomendacijos ir patarimai ieškant (paieškos sistemos puslapių ekrano kopija).
  • pasinaudoti įvairių paieškos sistemų galimybėmis. Jei nerandate jo „Yandex“, išbandykite „Google“. Naudokite išplėstinės paieškos paslaugas.
  • norėdami neįtraukti dokumentų, kuriuose yra tam tikrų terminų, prieš kiekvieną tokį žodį naudokite ženklą „-“. Pavyzdžiui, jei norite gauti informacijos apie Šekspyro kūrinius, išskyrus „Hamletą“, įveskite užklausą tokia forma: „Šekspyras-Hamletas“. Ir norėdami užtikrinti, kad tam tikros nuorodos būtinai būtų įtrauktos į paieškos rezultatus, naudokite „+“ simbolį. Taigi, norint rasti nuorodas apie automobilių pardavimą konkrečiai, reikia užklausos „išpardavimas + automobilis“. Norėdami padidinti paieškos efektyvumą ir tikslumą, naudokite šių simbolių derinius.
  • kiekvienoje nuorodoje paieškos rezultatų sąraše yra kelios rasto dokumento eilutės, tarp kurių yra jūsų raktiniai žodžiai. Prieš spustelėdami nuorodą įvertinkite fragmento atitikimą užklausos temai. Spustelėję nuorodą į konkrečią svetainę, atidžiai apžiūrėkite pagrindinį puslapį. Paprastai pakanka pirmo puslapio, kad suprastum, ar atėjai nurodytu adresu, ar ne. Jei taip, toliau ieškokite reikiamos informacijos pasirinktoje svetainėje (svetainės skyriuose), jei ne, grįžkite į paieškos rezultatus ir bandykite kitą nuorodą.
  • atminkite, kad paieškos sistemos negamina nepriklausomos informacijos (išskyrus paaiškinimus apie save). Paieškos sistema yra tik tarpininkas tarp informacijos (svetainės) savininko ir Jūsų. Duomenų bazės nuolat atnaujinamos, į jas įvedami nauji adresai, tačiau vis dar išlieka atsilikimas nuo realiai pasaulyje egzistuojančios informacijos. Tiesiog todėl, kad paieškos sistemos neveikia šviesos greičiu.

Garsiausios interneto paieškos sistemos yra Google, Yahoo, Alta Vista, Excite, Hot Bot, Lycos. Iš rusakalbių galima išskirti „Yandex“, „Rambler“, „Aport“.

Paieškos sistemos yra didžiausi ir vertingiausi, bet toli gražu ne vieninteliai informacijos šaltiniai internete, nes, be jų, yra ir kitų būdų ieškoti internete.

2.3 Katalogai

Interneto išteklių katalogas – tai nuolat atnaujinamas ir pildomas hierarchinis katalogas, kuriame yra daug kategorijų ir atskirų žiniatinklio serverių su trumpu jų turinio aprašymu.Katalogo paieškos metodas reiškia „slinkti laipteliais žemyn“, tai yra, pereiti nuo bendresnių kategorijų. prie konkretesnių. Vienas iš teminių katalogų privalumų yra tas, kad nuorodų paaiškinimus pateikia katalogo kūrėjai ir jie pilnai atspindi jo turinį, tai yra suteikia galimybę tiksliau nustatyti, kaip serverio turinys atitinka paskirtį. jūsų paieškos.

Teminio katalogo rusų kalba pavyzdys yra išteklius http://www.ulitka.ru/.

Pagrindiniame šios svetainės puslapyje yra teminė rubrika,

kurio pagalba vartotojas patenka į rubriką su nuorodomis į jį dominančius produktus.

Be to, kai kurie temų katalogai leidžia ieškoti pagal raktinius žodžius. Vartotojas paieškos juostoje įveda norimą raktinį žodį

ir gauna nuorodų sąrašą su svetainių, kurios labiausiai atitinka jo užklausą, aprašymais. Pažymėtina, kad ši paieška vyksta ne WWW serverių turinyje, o trumpuose jų aprašymuose, saugomuose kataloge.

Mūsų pavyzdyje katalogas taip pat turi galimybę rūšiuoti svetaines pagal apsilankymų skaičių, abėcėlės tvarka, pagal įvedimo datą.

Kiti rusakalbių katalogų pavyzdžiai:
[email protected]
Interneto sąrašas
Vsego.ru
Tarp katalogų anglų kalba yra:
http://www.DMOS.org
http://www.yahoo.com/
http://www.looksmart.com

2.4 Nuorodų rinkiniai

Nuorodų rinkiniai yra nuorodos, surūšiuotos pagal temas. Jie gana skiriasi vienas nuo kito savo turiniu, todėl norint rasti labiausiai savo pomėgius atitinkantį pasirinkimą, reikia jas pereiti pačiam, kad susidarytum savo nuomonę.

Kaip pavyzdį pateiksime nuorodų rinkinį „Interneto lobiai“ UAB „Relcom“

Vartotojas, spustelėjęs bet kurią jį dominančią skiltį

  • TURINYS

    Vairuotojams

    • Astronomija ir astrologija
    • Jūsų namas
    • Jūsų augintiniai
    • Vaikai yra gyvenimo gėlės
    • Laisvalaikis
    • Miestai internete
    • Sveikata ir medicina
    • Informacinės agentūros ir paslaugos
    • Kraštotyros muziejus ir kt.
    • Automobilių elektronika.
    • Antikvarinių automobilių muziejus.
    • Automobilių savininkų teisinės apsaugos valdyba.
    • sportdrive.

    Šio tipo paieškos įrankių pranašumas yra jų sutelktumas, dažniausiai pasirenkami reti interneto ištekliai, kuriuos pasirenka konkretus žiniatinklio valdytojas arba tinklalapio savininkas.

    2.5 Adresų duomenų bazės

    Adresų duomenų bazės yra specialūs paieškos serveriai, kurie paprastai naudoja klasifikacijas pagal veiklos rūšį, teikiamus produktus ir paslaugas bei geografiją. Kartais juos papildo paieška pagal abėcėlę. Duomenų bazės įrašuose saugoma informacija apie svetaines, kuriose už mokestį pateikiama informacija apie el. pašto adresą, organizaciją ir pašto adresą.

    Didžiausia adresų duomenų bazė anglų kalba gali būti skambinama: http://www.lookup.com/ -

    Patekęs į šiuos pakatalogius, vartotojas randa nuorodas į svetaines, kuriose pateikiama jį dominanti informacija.

    Plačiai prieinamos ir oficialios adresų duomenų bazės Rusijos Federacijoje mums nežinomos.

    2.6 Gopher archyvų paieška

    Gopher yra tarpusavyje sujungta serverių sistema (Gopher erdvė), platinama internetu.

    Turtingiausia literatūrinė biblioteka sukaupta „Gopher“ erdvėje, tačiau medžiaga nepasiekiama nuotoliniu būdu: vartotojas gali peržiūrėti tik hierarchiškai sutvarkytą turinį ir pasirinkti failą pagal pavadinimą. Specialios programos (Veronika) pagalba tokią paiešką galima atlikti ir automatiškai, naudojant užklausas pagal raktinius žodžius.

    Iki 1995 m. Gopher buvo dinamiškiausia interneto technologija: susijusių serverių skaičiaus augimo tempas viršijo visų kitų interneto tipų serverių augimo tempus. EUnet/Relcom tinkle Gopher serveriai nebuvo aktyviai plėtojami ir šiandien jų beveik niekas neprisimena.

    2.7 FTP failų paieškos sistema (FTP paieška)

    FTP paieškos sistema yra specialus interneto paieškos sistemos tipas, leidžiantis rasti failus, esančius „anoniminiuose“ FTP serveriuose. FTP protokolas skirtas failams perduoti tinkle, ir šia prasme tai yra savotiškas Gopher analogas.

    Pagrindinis paieškos kriterijus yra failo pavadinimas, nurodytas įvairiais būdais (tiksli atitiktis, poeilutė, reguliarioji išraiška ir kt.). Žinoma, tokio tipo paieška negali konkuruoti su paieškos sistemomis savo galimybėmis, nes atliekant paiešką niekaip neatsižvelgiama į failų turinį, o failams, kaip žinote, gali būti suteikti savavališki pavadinimai. Tačiau, jei jums reikia rasti kokią nors gerai žinomą programą ar standartinį aprašą, labai tikėtina, kad failas, kuriame jis yra, turės tinkamą pavadinimą ir jį galite rasti naudodami vieną iš FTP paieškos serverių:

    FileSearch ieško failų FTP serveriuose pagal pačių failų pavadinimus ir katalogus. Jei ieškote programos ar ko nors kito, greičiausiai WWW serveriuose rasite jų aprašymą, o iš FTP serverių galėsite juos atsisiųsti sau.

    2.8 Paieškos sistema Usenet naujienų konferencijose

    USENET NEWS yra interneto bendruomenės telekonferencijų sistema. Vakaruose ši paslauga vadinama naujienomis. Artimas telekonferencijų analogas yra vadinamieji „aidai“ FIDO tinkle.

    Telekonferencijos abonento požiūriu, USENET yra skelbimų lenta, kurioje yra skyriai, kuriuose galite rasti straipsnių apie viską nuo politikos iki sodininkystės. Šią skelbimų lentą galima pasiekti per kompiuterį, panašiai kaip el. paštu. Neišeidami iš kompiuterio galite skaityti ar skelbti straipsnius konkrečioje konferencijoje, rasti naudingų patarimų ar prisijungti prie diskusijų. Natūralu, kad dirbiniai užima vietą kompiuteriuose, todėl jie nėra saugomi amžinai, o periodiškai sunaikinami, atsiranda vietos naujiems. Visame pasaulyje geriausia paslauga ieškant informacijos apie Usenet konferencijas yra Google Groups serveris (Google Inc.).

    „Google Groups“ yra nemokama internetinė bendruomenė ir diskusijų grupių paslauga, siūlanti didžiausią „Usenet“ pranešimų archyvą internete (daugiau nei milijardą pranešimų). Norėdami gauti daugiau informacijos apie paslaugos naudojimo sąlygas, apsilankykite http://groups. google.com/intl/ru /googlegroups/tour/index.html

    Tarp rusakalbių išsiskiria USENET World System serveris ir Relcom telekonferencijos. Kaip ir kitose paieškos paslaugose, vartotojas įveda užklausos eilutę, o serveris sukuria konferencijų sąrašą su raktiniais žodžiais. Tada turite užsiprenumeruoti pasirinktas konferencijas naujienų programoje. Taip pat yra panašus rusiškas „FidoNet Online“ serveris: „Fido“ konferencijos WWW.

    2.9 Meta paieškos sistemos

    Norint greitai atlikti paiešką kelių paieškos sistemų duomenų bazėse vienu metu, geriau kreiptis į metapaieškos sistemas.

    Meta paieškos sistemos yra paieškos sistemos, kurios siunčia jūsų užklausą į daugybę skirtingų paieškos sistemų, tada apdoroja rezultatus, pašalina pasikartojančius išteklių adresus ir pateikia platesnį spektrą to, kas pateikiama internete.

    Populiariausias pasaulyje metapaieškos variklis yra Search.com.

    „Unified Search.com“ paieškos sistema iš CNET, Inc. apima beveik dvi dešimtis paieškos sistemų, kurių nuorodų gausu visame internete.

    Naudodamas tokio tipo paieškos priemones vartotojas gali ieškoti informacijos įvairiose paieškos sistemose, tačiau neigiama šių sistemų puse galima pavadinti jų nestabilumą.

    2.10 Žmonių paieškos sistemos

    Žmonių paieškos sistemos yra specialūs serveriai, leidžiantys ieškoti žmonių internete, vartotojas gali nurodyti pilną vardą. asmuo ir gauti jo el. pašto adresą bei URL. Tačiau reikia pažymėti, kad žmonių paieškos sistemos paprastai ima informaciją apie el. pašto adresus iš atvirų šaltinių, pvz., Usenet forumų. Tarp žinomiausių žmonių paieškos sistemų yra:

    El. pašto adresų paieška

    specialiuose kontaktinės informacijos paieškos laukeliuose (Vardas. Miestas, Pavardė, Telefono numeris) galite rasti jus dominančią informaciją.

    Žmonių paieškos sistemos yra tikrai dideli serveriai, jų duomenų bazėse yra apie 6 000 000 adresų.

    3. Išvada

    Apžvelgėme pagrindines informacijos paieškos internete technologijas ir bendrais bruožais pristatėme šiuo metu internete esančius paieškos įrankius, taip pat populiariausių rusakalbių ir anglų kalbų paieškos sistemų paieškos užklausų struktūrą, Apibendrinant tai, kas išdėstyta aukščiau, norime pažymėti, kad vienos optimalios schemos ieškant informacijos internete neegzistuoja. Atsižvelgdami į konkrečią jums reikalingą informaciją, galite naudoti atitinkamus paieškos įrankius ir paslaugas. O paieškos rezultatų kokybė priklauso nuo to, kaip kompetentingai parenkamos paieškos paslaugos.

  • Rasti reikiamą informaciją internete dažnai būna gana sunku. Internetas vystosi chaotiškai, neturi aiškiai apibrėžtos struktūros. Niekas negali garantuoti, kad viename domene bus tik tam tikro dalyko informacija, o kitame – kitokio, bet ir aiškiai apibrėžto dalyko informacija. Pavyzdžiui, .com domenuose galite rasti ne tik komercinės informacijos, bet, pavyzdžiui, įvairios programinės įrangos produktų dokumentacijos ar net juokelių.

    Jei domeno struktūra būtų panaši į katalogų struktūrą, pavyzdžiui, ru.comp.os.linux domene (kaip ir naujienų sistemoje) būtų visa informacija apie Linux operacinę sistemą rusų kalba ir kokia nors moderatorių organizacija įsitikintų kad kituose domenuose neskelbė informacijos apie Linux, tada paieška būtų daug lengvesnė. Juk žinotume, kur ieškoti. Atsidarote naršyklę, įvedate ru.comp.os.linux ir gaunate... milijonus skirtingų nuorodų į straipsnius, HOWTO dokumentus ir kitą informaciją, vienaip ar kitaip susijusią su Linux.

    Paieškos našumas

      Paieškos našumas priklauso nuo daugelio veiksnių:
    • Iš pačios informacijos – viena tema informacijos gali būti daug, kita – mažai. Kartais galima rasti daug informacijos tam tikra tema, tačiau šios paieškos efektyvumas bus artimas 0,0%, o nuorodų galima rasti tik 3-4, ir tai bus kaip tik tai, ko jums reikia. Tai taip pat apima žiniatinklio valdytojo galimybę teisingai pateikti informaciją, kad paieškos sistemos galėtų ją rasti, tarkime, kažkur labai toli yra jums reikalinga informacija, tačiau paieškos sistema apie tai nieko nežino. Galbūt informacija ką tik buvo paskelbta arba tiesiog žiniatinklio valdytojas, paskelbęs informaciją, net neįtaria, kad egzistuoja paieškos sistemos. Jūs ieškote informacijos naudodamiesi paieškos sistema. Jei ji „nežino“ jums reikalingos informacijos, vadinasi, jūs nieko ir apie ją nesužinosite.
    • Iš paieškos sistemos – paieškos sistemų yra daug ir jos visos skirtingos. Net jei jie yra to paties tipo (apie paieškos sistemų tipus pakalbėsime šiek tiek vėliau), žinoma, kiekviena iš jų turės savo algoritmą. Jei nerandate informacijos naudodami vieną paieškos variklį, pabandykite jos ieškoti naudodami kitą. Neužkibkite vienos paieškos sistemos, kad ir kaip jums tai patiktų.
    • Daug kas priklauso nuo gebėjimo naudotis paieškos sistema – kaip mokate naudotis paieškos sistema. Jei nežinote, kaip naudotis paieškos varikliu, jūsų paieška greičiausiai nebus veiksminga.

    Kaip ieškoti informacijos

    Kadangi dažniausiai iš paieškos sistemos katalogo pasirenkate ne jums reikalingą svetainę, o įvedate konkretų raktažodį (ar kelis raktinius žodžius), reikia kuo konkrečiau nurodyti būtent šį raktinį žodį. Kuo tiksliau apibrėžiate paieškos temą, tuo tikslesnis bus rezultatas. Paieškos sistema negali atspėti jūsų minčių, turite jai aiškiai nurodyti, ko ieškote.

    Kiekviena paieškos sistema turi savo sintaksę, kurią reikia žinoti. Šiame skyriuje bus aprašyta paieškos sistemų Google, Yandex ir Rambler sintaksė. Jei norite naudoti kitą paieškos programą, jos sintaksę galite rasti jos svetainėje (dažniausiai ji aprašoma išsamiai).

    Interneto paieškos sistemos

    Dabar pakalbėkime apie pačias paieškos sistemas.

    Remiantis „SpyLog“ („Openstat“), buvusios NVS teritorijoje populiariausi yra šie paieškos varikliai:

    • 1. „Yandex“ (www.yandex.ru);
    • 2. Google (www.google.com);
    • 3. [email protected] (go.mail.ru);
    • 3. Rambler (www.rambler.ru);
    • 5 Yahoo! (www.yahoo.com);
    • 6. AltaVista (www.altavista.com);
    • 7. Bing (www.bing.com).

    Paieškos sistemos pateikiamos mažėjančia populiarumo tvarka. Kaip matote, populiariausia mūsų paieškos sistema yra „Yandex.

    Paieškos sistemų tipai

      Yra du pagrindiniai paieškos sistemų tipai:
    • indeksas - Google, AltaVista, Rambler, HotBot, Yandex ir kt.;
    • klasifikacija (katalogas) - Rambler, Yahoo! ir kt.

    Nenustebkite, kad Rambler paieškos sistema įtraukta du kartus – tai buvo ir indeksas, ir klasifikacija vienu metu. Prie to grįšime vėliau, bet kol kas pakalbėkime apie šių dviejų sistemų skirtumus.

    Kaip veikia indekso paieškos sistema? Paieškos sistema paleidžia specialią programą, kuri nuskaito žiniatinklio serverių turinį, indeksuoja informaciją: į savo duomenų bazę įveda konkretaus tinklalapio raktinius žodžius, dalį informacijos iš tinklalapio.

    Trumpa „Google“ istorija

    Pradėkime nuo pavadinimo. „Google“ yra šiek tiek pakeista žodžio „googol“ versija (ji ne veltui dažnai vadinama „Google“). Savo ruožtu šį žodį įvedė Miltonas Sirota, garsaus matematiko Edvardo Kasnerio sūnėnas, o vėliau buvo išpopuliarintas Kasnerio ir Newmano knygoje „Matematika ir vaizduotė“. Žodis „googol“ rodo skaičių kaip vieną 1, po kurio seka 100 nulių. Pavadinimas „Google“ atspindi bandymą sutvarkyti didžiulį informacijos kiekį internete.

    Taigi, pradėkime nuo pat pradžių. Būsimi „Google“ kūrėjai Sergejus Brinas ir Laris Peidžas susitiko 1999 m. Stanfordo universitete. Tada Larry buvo 24 metai, o Sergejui - 23. Larry tuo metu buvo Mičigano universiteto studentas ir kelioms dienoms atvyko į Stanfordą. Sergejus buvo studentų grupėje, kuri turėjo supažindinti svečius su universitetu. Nuo pat pirmojo susitikimo Sergejus ir Laris, švelniai tariant, nemėgo vienas kito – jie ginčijosi dėl visko, dėl ko galima ginčytis. Nors galų gale tai pasirodė teigiamas dalykas, nes skirtingos jų nuomonės paskatino sukurti algoritmą, kaip išspręsti vieną iš opiausių kompiuterio problemų: rasti reikiamą informaciją tarp didžiulio duomenų kiekio. 1996 m. sausio mėn. Larry ir Sergejus pradėjo dirbti su „BackRub“ paieškos sistema, kuri turėjo analizuoti „atgal“ nuorodas, nukreipiančias į šią svetainę. Darbas šiame serveryje buvo vykdomas nuolat trūkstant lėšų - juk tuo metu Sergejus ir Laris buvo universiteto absolventai - jūs pats suprantate, kad magistrantai neturi labai daug pinigų. Beje, Laris pirmą kartą dalyvavo tokiame rimtame projekte, o prieš tai užsiiminėjo visokiais „nerimtais“, net kartais anekdotiškais projektais, pavyzdžiui, iš „Lego“ konstruktoriaus sukonstravo veikiantį spausdintuvą.

    Google paieškos algoritmai

    „Google“ sąsaja stebina savo paprastumu: įvesties laukas ir du mygtukai. Kaip sakoma, viskas išradinga yra paprasta.

    Google speciali (išplėstinė) sintaksė

    Be loginių operatorių, Google pateikia lentelėje nurodytus paieškos modifikatorius. Paieškos modifikatoriai vadinami specialia Google sintaksė. Į šią lentelę žiūrėkite rimtai: pabandę ko nors ieškoti naudodami modifikatorius, jų neatsisakysite.

    Google inurl modifikatorius

    Inurl modifikatorius naudojamas ieškant nurodyto URL. Ir skirtingai nei svetainės modifikatorius, leidžiantis ieškoti informacijos tik vienoje svetainėje arba domene, inurl modifikatorius leidžia ieškoti informacijos svetainės pakatalogiuose, pavyzdžiui:

    inurl: be siteskype-zvonim

    Inurl modifikatorius leidžia naudoti * simbolį domenui nurodyti, pavyzdžiui:
    inurl: "*.redhat.com"

    Geriausia naudoti inurl su svetaine. Ši užklausa ieškos informacijos domene gidmir.ru visuose jo padomeniuose, išskyrus www:
    svetainė: gidmir.ru inurl: "*.gidmir" -inurl: "www.gidmir.ru"

    Google paieškos kalba

    Google leidžia mišrią sintaksę, t.y. sintaksė, kuri užklausoje naudoja keletą specialių paieškos modifikatorių. Tai leidžia pasiekti geriausią rezultatą.

    Štai paprasčiausias mišrios sintaksės pavyzdys:
    svetainė: ru inurl: diskas

    Tokiu atveju paieška bus atliekama domeno svetainėse, o URL turi būti žodis diskas.

    Štai dar vienas pavyzdys:
    svetainė: ru -inurl: org.ua

    Paieška bus atliekama ru domeno svetainėse, tačiau paieškos rezultatuose nebus puslapių, esančių org.ua.

    Paieškos terminai Google

    Daugeliui paprastų „Google“ vartotojų 10 raktinių žodžių riba nėra pastebima. Tačiau ilgų užklausų mėgėjai tikriausiai pastebėjo, kad Google atsižvelgia tik į pirmuosius 10 raktinių žodžių, o į visus likusius tiesiog nepaisoma.

    Kam ieškoti ilgų frazių? Dažniausiai tai kūrinių ištraukos. Tarkime, mes ieškome kūrinio „Meistras ir Margarita“. Reikėtų pažymėti, kad pagrindinė frazė turėtų atrodyti kaip „Meistrė Margarita“, nes paieškos sistema ignoruoja žodžius ir, arba, ir, arba, I, a, ir kai kuriuos kitus. Jei norite priversti vieną iš šių žodžių įtraukti į paiešką, prieš žodį parašykite „+“ ženklą, pvz., +the.

    Peržengus 10 žodžių ribą, užklausa gali būti sudaryta teisingai. Šios rekomendacijos padės ne tik sutrumpinti užklausos trukmę, bet ir apskritai pagerinti paieškos efektyvumą.

    Išplėstinė Google paieška

    Naršyklės įvesties eilutėje įvedame adresą - www.google.ru/advanced_search ir einame į išplėstinę Google paiešką.

    Naudodami išplėstinę paiešką informacijos galite ieškoti beveik taip pat lanksčiai, kaip ir naudodami paieškos modifikatorius. Kodėl "beveik"? Išplėstinės paieškos sąsaja nesuteikia prieigos prie visų paieškos modifikatorių.

    „Google“ paieškos ypatybių nustatymas naršyklės slapukuose

    Nenoriu jūsų varginti techninėmis smulkmenomis, todėl trumpai papasakosiu, kas yra slapukai ir ne, su kuo jie nevalgomi, o kaip su jais reikia dirbti.

    Įsivaizduokite, kad turime tokią užduotį: turime parašyti individualią apsilankymo ataskaitą kiekvienam mūsų įmonės svetainės klientui. Tai yra, kad vartotojas nematytų bendro apsilankymų skaičiaus, žinotų, kiek kartų jis buvo mūsų svetainėje. Kiekvieno IP adreso įrašus turime laikyti vienoje lentelėje, kuri greičiausiai bus didelė, ir iš to išplaukia, kad neracionaliai naudojame procesoriaus laiką ir vietą diske. Būtų daug teisingiau šią erdvę išnaudoti su didesne nauda.

    Google paieškos rezultatas

    „Google“ paieškos rezultatas nėra tik nuorodų, atitinkančių nurodytus paieškos terminus, rinkinys. Tai yra kažkas daugiau, į ką reikia atsižvelgti atskirai. Įveskite žodį „rusopen“ ir spustelėkite „Google“ paieškos mygtuką.

    Viršuje matome bendrą rezultatų skaičių (883 000 000) ir bendrą paieškos laiką, ty 0,34 sekundės.

      Daugeliu atvejų rezultatas pateikiamas taip:
    • puslapio pavadinimas;
    • puslapio aprašymas;
    • Puslapio URL;
    • puslapio dydis;
    • paskutinio puslapio indeksavimo data;

    Google vaizdų paieška

    „Google“ vaizdų paslauga leidžia rasti įvairių vaizdų žiniatinklyje. Nors patys vaizdai negali būti indeksuojami, puslapiai, kuriuose yra šių vaizdų, yra indeksuojami. Įveskite vaizdo aprašymą ir gausite daug nuorodų, taip pat patys vaizdai, pateikti kaip galerija.

      Kad vaizdų paieška būtų efektyvesnė, turite naudoti šiuos paieškos modifikatorius:
    • intitle: - paieška puslapio pavadinime;
    • failo tipas: - leidžia nurodyti vaizdo tipą, galite nurodyti tokius tipus: JPEG ir GIF, o ne BMP, PNG, kitų tipų vaizdai neindeksuojami;
    • inurl: - ieškokite nurodyto URL, pavyzdžiui, inurl: www.gidmir.ru ;
    • svetainė: ieškokite nurodytame domene arba svetainėje, pavyzdžiui, svetainė: lt.

    Google paslaugos

    „Google“ yra galinga paieškos sistema, turinti daugiau nei 3 milijardus puslapių. Be įprastų tinklalapių, „Google“ indeksuoja „Word“, „Excel“, „PowerPoint“, PDF ir RTF failus. „Google“ taip pat gali būti naudojama paveikslėlių ir telefonų numerių paieškai: „Google“ vaizdai ir telefonų knygelė yra tam skirti atitinkamai. Šiame straipsnyje kalbėsime apie „Google Ad Hoc“ paslaugas.

    Google el

    Pabandykite naudoti „Google“ paštą. Reikėtų pažymėti, kad tai nėra visiškai įprastas žiniatinklio paštas.

      Tarp „Gmail“ funkcijų reikėtų pabrėžti:
    • didžiulis pašto dėžutės dydis - daugiau nei 7 GB;
    • užuot ištrynę laiškus, galite juos archyvuoti – tuomet užteks vietos ilgam, o laiškus, kuriuos gavote ar siuntėte prieš keletą metų, galėsite atkurti;
    • galimybė ieškoti pašto dėžutėje su Google efektyvumu;
    • patogus laiškų ir atsakymų į juos organizavimas: visi laiškai ir atsakymai sudaro vieną grandinę, kurią lengva sekti;
    • gera apsauga nuo šiukšlių;
    • įsimintinas adresas [email protected];
    • patogi sąsaja.

    Paieškos variklis „Rambler“ („Rambler“)

    Ramblerio istorija

    Viskas prasidėjo 1991 m. Puščino mieste, Maskvos srityje. Tais tolimais metais susirinko būrys bendraminčių, tarp kurių buvo Dmitrijus Kriukovas, Sergejus Lysakovas, Viktoras Voronkovas, Vladimiras Samoilovas, Jurijus Eršovas. Bendras šios grupės interesas buvo internetas. Tikriausiai 1991 m. nė vienas iš būsimų „Rambler“ kūrėjų net neįsivaizdavo, kad jie taps vienos didžiausių ir garsiausių „Runet“ paieškos sistemų kūrėjais. Juk prieš tai jie visi aptarnavo radijo įrenginius Rusijos mokslų akademijos Mikroorganizmų biochemijos ir fiziologijos institute. 1992 metais buvo įkurta įmonė „Stack“, kuriai vadovavo Sergejus Lysakovas. Įmonės profilis – vietiniai tinklai ir internetas. Tiesą sakant, bendrovė „Stack“ buvo interneto tiekėja. Bendrovė sukūrė intracity tinklą, tada prijungė Pushchino prie Maskvos, o per jį - prie interneto. Beje, tai buvo pirmasis IP kanalas, peržengęs Maskvos ribų. Ir tai 1992 m.! Dabar kanalo tiesimas yra gana problemiškas - visada yra daug niuansų, o tada kabelius reikėjo kloti savarankiškai, rankiniu būdu, po žeme, ir visa tai buvo daroma žiemą.

    Kaip veikė „Rambler“ paieška

    Internetas nuolat tobulėja: svetainių skaičius ir jų dydis kasdien didėja. Galų gale, tik įsivaizduokite: didelės svetainės atnaujinamos kiekvieną dieną, net jei atnaujinimų apimtis yra 1024 baitai (1 KB), tai jei darysime prielaidą, kad tokių svetainių yra 10 000, kiekvieną dieną paieškos sistema turi apdoroti (indeksuoti) 10 000 KB (grubiai tariant, 10 MB ) informacija. Skaičius 10 000 paimtas „iš lubų“ – dėl pavyzdžio. Jis gali būti didesnis arba mažesnis – juk net ir didelės svetainės neatnaujinamos kiekvieną dieną. Atnaujinimo dydis taip pat išgalvotas. Įsivaizduokite informacinę ir analitinę svetainę, kurioje beveik kasdien publikuojami nauji straipsniai arba perspausdinama medžiaga iš kitų svetainių. Tokiu atveju atnaujinimų dydis bus toli gražu ne 1 KB, bet ne mažiau kaip 10. Prie viso šito pridėkite dar naujienų ir kitos informacijos, ir paaiškės, kad esant 10 000 atnaujintų svetainių skaičiui, paieškos sistema turėtų indeksuoti 120 MB teksto. Ir visa tai paieškos sistema turėtų ne tik tiksliai rodyti paieškos rezultatus, bet ir tai padaryti kuo greičiau, kad vartotojui būtų patogu su ja dirbti. Kas nori laukti 10 minučių paieškos rezultatų? Žinoma, tai perdedu, bet asmeniškai nelaukčiau daugiau nei 30 sekundžių paieškos rezultatų (nuo to momento, kai spustelite mygtuką Rasti, kol pasirodys pirmieji dešimt rezultatų). Pasirodo, paieškos sistemos kūrėjai turi nuolat palaikyti reikiamame lygyje ne tik techninę įrangą, kuri turi gebėti apdoroti nuolat augančius informacijos kiekius, bet „matematikos“ taip pat negalima paimti vienu lygiu. Būtina nuolat tobulinti paieškos algoritmus, kad, padidėjus paieškos bazės apimčiai, paieškos laikas nepailgėtų (tai reiškia, kad laikas žymiai pailgėja – vartotojui nėra skirtumo, kiek laiko paieška truks 2,5 sekundės). arba 2,0555 sekundės, nes jis negali įvertinti šio laiko).

    „Rambler“ užklausos, „Rambler“ sintaksė

    Užklausą „Rambler“ gali sudaryti vienas ar daugiau žodžių, o užklausoje gali būti skyrybos ženklų. „Rambler“ kūrėjai sukūrė savo paieškos variklį maksimaliam vartotojo patogumui. „Rambler“ gali naudoti net nepatyręs vartotojas, kuris visai nėra susipažinęs su užklausos kalba. Jam tereikėjo įvesti užklausą, susidedančią iš kelių žodžių (pavyzdžiui, kokios nors frazės) ir be skyrybos ženklų – pats Rambleris susirado reikiamus dokumentus, ir padarė tai maksimaliai efektyviai. Žinoma, jei užklausos kalba buvo naudojama teisingai, efektyvumas gerokai išaugo, tačiau net ir visiškai nežinant užklausos kalbos, paieškos efektyvumas buvo aukšto lygio. Kaip jau buvo minėta, užklausos kalbos mokėjimas yra jūsų pačių interesas, jums tiesiog reikia daug greičiau rasti reikiamą informaciją.

    „Yandex“ paieškos sistema („Yandex“)

    Istorijos nuoroda

    Dar 1990 metais bendrovė „Arcadia“, kuriai vadovavo Arkadijus Borkovskis ir Arkadijus Voložas, pradėjo kurti paieškos programinę įrangą. Po šešerių metų pasirodė „Yandex“ svetainė. Bet kas nutiko per tuos šešerius metus?

    Dvejus metus buvo kuriamos dvi informacijos paieškos sistemos – „Tarptautinė išradimų klasifikatorius“ ir „Prekių ir paslaugų klasifikatorius“. Abi sistemos veikė DOS ir leido ieškoti žodžio iš nurodyto žodyno naudojant loginius operatorius.

    „Arcadia“ tapo „CompTek“ padaliniu 1993 m. Per 1993–1994 m. paieškos technologijos gerokai patobulėjo, pavyzdžiui, žodynas, teikiantis paiešką atsižvelgiant į rusų kalbos morfologiją, užėmė tik 300 KB, vadinasi, laisvai tilpo į RAM, o darbas su juo vyko labai greitai. Šios naujos technologijos pagrindu 1994 metais buvo sukurta „Biblijos kompiuterinė nuoroda“ – informacijos paieškos sistema, kuri veikia su Senojo ir Naujojo Testamentų vertimais.

    „Yandex“ kalbos paieška

    Kaip paieškos sistema interpretuos įvestą žodį?

      Dabar pakalbėsime apie tai:
    • Taisyklė 1. Pasirodo, sistema ją interpretuoja pagal rusų kalbos taisykles. Pavyzdys: jei įvesite žodį „automobilis“, taip pat gausite rezultatus su žodžiais „automobiliai“, „automobilis“ ir kt. Panašiai ir su veiksmažodžiais – užklausai „eiti“ gausite dokumentus, kuriuose yra žodžiai „eiti“, „eina“, „vaikščiojo“, „vaikščiojo“ ir kt. Kaip matote, paieškos sistema yra protingesnė, nei jūs manote – tai ne tik įrankis, leidžiantis duomenų bazėje ieškoti konkretaus žodžio.
    • Taisyklė 2. Ypatingas dėmesys skiriamas didžiosiomis raidėmis rašomiems žodžiams. Jei žodis rašomas didžiąja raide, o ne pirmas žodis sakinyje, bus rasti tik didžiosiomis raidėmis rašomi žodžiai. Priešingu atveju bus rasti žodžiai, parašyti tiek didžiosiomis, tiek mažosiomis raidėmis. Pavyzdys: paprašius "Taksas A." bus rasti dokumentai, kuriuose yra „taxa“ (mokestis) ir „taxa“ (pavardė), nes žodis „taxa“ nors ir rašomas didžiosiomis raidėmis, bet sakinyje jis yra pirmas. Tačiau užklausa „A. Taksas“ ras dokumentus, kuriuose yra tik žodis „Taksas“, parašytas didžiąja raide.

    „Yandex“ sintaksė

    Pagal numatytuosius nustatymus „Yandex“ naudoja loginį AND operatorių. Tai reiškia, kad jei įvesite užklausą „Samsung TV“, rezultatuose gausite dokumentus, kuriuose tame pačiame sakinyje bus žodžiai „TV“ ir „Samsung“. Jei norite aiškiai nurodyti operatorių IR, naudokite ampersando simbolį &. Kitaip tariant, „Samsung TV“ yra tas pats, kas „TV & Samsung“. Taip pat galite naudoti užklausą „TV + Samsung“.

    Jei norite priešingo efekto, t.y. Jei norite gauti dokumentus, kuriuose atskirai yra žodis „TV“ ir atskirai žodis „Samsung“, tuomet reikia naudoti OR operatorių (|), pavyzdžiui: „TV | Samsung“.

    „Yandex“ užklausos sintaksė

    Visi žodžiai dokumento tekste yra sunumeruoti pagal Yandex eilės tvarka. Atstumas tarp gretimų žodžių yra 1 (ne 0!), o atstumas tarp žodžių atvirkštine tvarka yra -1. Tas pats pasakytina ir apie pasiūlymus.

    Norėdami nurodyti atstumą tarp žodžių, dedamas ženklas /, po kurio iškart rašomas skaičius, o tai reiškia, kad tai yra atstumas tarp žodžių. Pavyzdžiui, užklausa „kūrėjo /2 programos“ ras dokumentus, kuriuose yra žodžiai „kūrėjas“ ir „programos“, o atstumas tarp žodžių turi būti ne didesnis kaip du žodžiai ir visi šie žodžiai turi būti viename sakinyje. Tokiu atveju bus rasti dokumentai, kuriuose yra "programinės programos kūrėjas", "sistemos programų kūrėjas" ir kt.

    Jei tiksliai žinome atstumą ir žodžių tvarką, galime naudoti / + n sintaksę. Pavyzdžiui, pateikus užklausą „raudona /+1 jojimo gaubta“ iškart po žodžio „raudona“ bus žodis „kepurėlė“. Užklausa „raudonakepuraitė“ duotų tą patį rezultatą.

    „Yandex“ paieškos operatoriai

    Skliaustai naudojami visai išraiškai užklausoje pavaizduoti. Pavyzdžiui, užklausa „(istorija | technologijos | programos)/+1 Linux“ ras dokumentus, kuriuose yra viena iš frazių „Linux istorija“, „Linux technologijos“, „Linux programos“.

    Zonos

    Zona yra vieta, kur rasti reikiamą informaciją. Galite nurodyti zoną, kurioje norite ieškoti – antraštes (pavadinimo zona), nuorodas (inkarus) arba adresą (adresas). Taip pat galite naudoti visų zoną – ieškoti visame dokumente.

    Sintaksė: $zone_name užklausa.

    Pavyzdžiui: užklausa $title "(!LANG:Microsoft" найдет все документы, в заголовках которых встречается точная фраза "Microsoft".!}

    Papildomos „Yandex“ paieškos parinktys

    „Google“ paieškos sistema leido apriboti paieškos vietą iki tam tikro serverių sąrašo arba, priešingai, pašalinti tam tikrus serverius iš paieškos sąrašo. Lygiai tokios pat galimybės yra ir „Yandex“ paieškos sistemoje. Taip pat galite ieškoti dokumentų, nurodančių konkrečius URL adresus arba vaizdus. Nurodydami failo kaukę (pavyzdžiui, paveikslėlį), galite naudoti simbolį *, kuris reiškia visus simbolius, pvz.: ”audi-*”.

    Sintaksė yra: #element_name="value".

    Pasauliniame internete galite rasti informacijos bet kuria dominančia tema. Tačiau pats sunkiausias dalykas dirbant su internetu yra rasti reikiamą informaciją. Kadangi internetas neturi aiškios centralizuotos struktūros, vystosi chaotiškai, o pasaulyje atsiranda vis daugiau naujų serverių, informacijos paieškos klausimai tampa itin aktualūs.

    Paieškos sistemos labai palengvina darbą internete ir padeda greitai rasti reikiamą informaciją didžiuliame interneto serverių masyve. Pasauliniame žiniatinklyje yra keli tūkstančiai paieškos sistemų, tarp kurių yra ir nusistovėjusių, ir mažiau žinomų.

    Populiariausios paieškos sistemos

    • Yandex— viso teksto informacijos gavimo įrankis, atsižvelgiant į rusų kalbos morfologiją; ieškokite svetainėse, kataloge, naujienose, produktuose, žemėlapiuose, žodynuose, tinklaraščiuose, paveikslėliuose, „Microsoft Office“ dokumentuose ir „Adobe Acrobat PDF“
      • Yandex
    • Rambler(OJSC "Rambler Internet Holding") - svetainės paieška atsižvelgiant į rusų ir anglų kalbų morfologiją; Taip pat yra katalogų paieškos sistema.
      • Rambler Lite: paieškos variklis- trumpa paieškos puslapio versija
    • Paieškos paslauga Sputnik(UAB "Rostelecom") - paieška svetainėse, viešosiose paslaugose ir kt.; Saugi paieška
    • NIGMa – išmani paieškos sistema(Lomonosovo Maskvos valstybinis universitetas ir Stanfordo universitetas) – ieškoti dokumentų, paveikslėlių, knygų, naujienų per Google, Yahoo, MSN, Yandex, Rambler, Altavista, Aport; sistema taip pat suteikia unikalią cheminių formulių ir reakcijų paiešką
    • Google — paieška pagal svetaines (galima ieškoti svetainių rusų kalba); ieškoti dokumentų adobe acrobat PDF, Microsoft Office, PostScript, Corel WordPerfect, Lotus 1-2-3 ir kt. formatais; vaizdų, vaizdo įrašų, naujienų paieška, žemėlapių paieška; galimybė ieškoti rusų ir rusiškose svetainėse; yra teksto vertimo į kitas kalbas sistema (49 kalbos)
    • bing(Microsoft Corp.) – svetainių, vaizdų ir vaizdo įrašų paieška; galimybė ieškoti rusų ir rusiškose svetainėse; yra teksto vertimo į kitas kalbas sistema (22 kalbos)
    • Yahoo!(Yahoo) – ieškokite svetainių, el. pašto adresų ir kt.

    Kiekviena iš paieškos sistemų turi savų privalumų ir trūkumų, kuriuos nulemia paieškos variklio veikimo principas, naudojimo paprastumas, jos dizainas, užklausos kalbos sudėtingumas, įvairių pažangių funkcijų buvimas (formato valdymas ir išvesties informacijos reitingavimas, rašybos klaidų ir klaidingų klaviatūros išdėstymų taisymas įvedant raktinius žodžius, puslapio vertimas į kitas kalbas ir pan.), darbo greitis ir kiti parametrai. Paieškos variklio pasirinkimas konkrečiai programai priklauso nuo paieškos tikslo, ieškomos informacijos pobūdžio, pageidaujamo išvesties formato ir atsekamų serverių adresų interneto pasaulyje.

    Raktažodžio Paieška. Paieškos variklio užklausos kalba

    Paieškos sistemoje dažniausiai yra raktažodžių įvedimo laukas, pagal kurį ji randa dokumentus, kuriuose yra šie raktiniai žodžiai. Kuo geresnė (kokybiškesnė) užklausa paieškos sistemai, tuo mažesnis bendras randamų dokumentų skaičius, o iš jų daugiau dokumentų atitinka tai, ko jums reikia. Jei užklausa labai paprasta arba neraštinga, paieškos sistema gali pateikti kelis milijonus dokumentų, kurių neperžiūrėsite per visą savo gyvenimą.

    Naudojant užklausos kalbą su loginėmis operacijomis (loginiais operatoriais IR, arba NE, skliausteliuose ir kt.), privalomo raktinių žodžių buvimo dokumente priešdėliai «+» ir «-» (ieškant labai specializuotų terminų, pageidautina jį naudoti), raktinių žodžių vieta dokumente šalia ar tam tikru atstumu ir pan.) ir kiti elementai bei didesnis susijusių raktinių žodžių skaičius gali žymiai susiaurinti paieškos sritį ir geriau sudaryti užklausą paieškos serveriui. Reikėtų nepamiršti, kad skirtingos paieškos sistemos gali turėti skirtingas užklausų kalbas ir labai panašias.

    Kai kurios paieškos sistemos taip pat turi funkciją Išplėstinė paieška, leidžia vartotojui tiksliau apibūdinti, ko jam konkrečiai reikia, nežinant užklausos kalbos. Išplėstinė paieškos funkcija yra, pavyzdžiui, paieškos sistemos Yandex ir Google.

    Pagrindiniai paieškos sistemų tipai. Kurią paieškos programą naudoti

    Yra 2 pagrindiniai interneto paieškos sistemų tipai: rodyklė ir klasifikacija (katalogas). Indekso paieškos sistemos (pavyzdžiui, „Yandex“, „Rambler“, „Sputnik“, Google, Bing ir kt.), dirbdami automatiniu savo informacijos atnaujinimo režimu, peržiūrėti serverių turinį internete, indeksuodami juose esančią informaciją ir į savo duomenų bazes įvesdami informaciją apie žodžių vietą svetainės puslapiuose. Katalogų paieškos sistemose (pavyzdžiui, „Rambler“, „Yahoo!“ ir kt.) yra teminės struktūros serverių katalogas ir dažniausiai jie papildomi rankiniu būdu. Paprastai klasifikavimo paieškos sistemos WWW puslapyje taip pat yra laukas raktiniams žodžiams įvesti paieškai savo duomenų bazėje. Katalogų paieškos sistemoje galite pradėti nuo didesnės teminės antraštės ir palaipsniui leistis toliau žemyn, kad patektumėte į jums reikalingą svetainę. Vienais atvejais patogiau naudotis pirmojo tipo paieškos sistemomis, kitais – antruoju. Yra paieškos sistemų, kurios sujungia abu darbo principus. Visų pirma, daugelis indeksų paieškos sistemų taip pat turi katalogų paieškos sistemą. Be to, paieškos sistemos gali naudoti kai kuriuos kitus paieškos metodų principus.

    Daugelis paieškos sistemų virto interneto portalais, kuriuose sujungiama daug išteklių ir paslaugų. Tokių portalų puslapiuose galite skaityti naujienas, susipažinti su televizijos programa, sužinoti apie orus, valiutų kursus, naudotis žemėlapių paslauga ir kt. kiti

    Populiariausios rusiškos paieškos sistemos turi paieškos galimybes, kurios atsižvelgia į rusų kalbos ypatumus.

    Norėdami vienu metu ieškoti keliose paieškos sistemose, galite naudoti vadinamąsias paieškos metamašinas, kurios vienu metu pasiekia kelias paieškos sistemas, pavyzdžiui, NIGMa.

    Taip pat yra paieškos sistemų, kurios specializuojasi ieškant vienos temos (pavyzdžiui, informacinės technologijos, muzika, ištekliai, gamta ir kt.)

    Yra žmonių, kurie tiesiog mėgsta naudoti daug gražių metaforų. Tai žmonės, kurie pasaulinį tinklą lygina su sąvartynu. Tarsi tinkle viskas suversta į didelę krūvą ir ten velnias gali koją susilaužyti. Atrodo, kad viskas yra internete, bet norint ką nors rasti, reikia iškasti didžiulius kalnus šiukšlių.

    Na, tai graži metafora. Bet tai nereiškia, kad ji teisi. Daugeliui žmonių iš pirmo žvilgsnio ant stalo sukrauta daugybė nenaudingų daiktų. Tačiau tiems žmonėms, kurie dirba prie šių stalų, dalykų išdėstymas atitinka labai aiškią logiką. Daiktai, kurių prireikia dažniausiai, pavyzdžiui, arbatos puodelis, yra ištiestos rankos atstumu. O tie dalykai, kurie ne visada reikalingi, yra toliau. Ir tai jokiu būdu nėra sąvartynas ar netvarka.

    Internetas taip pat turi savo logiką. Jei žinai keletą taisyklių ir naudosi jomis ieškant, bet kokia informacija iš interneto bus kaip arbatos puodelis ištiestos rankos atstumu, ir jausmas, kad Web – tai sąvartynas, iškart išnyks.

    Šiame straipsnyje kalbėsime apie paieškos variklius ir interneto paieškos taisykles.

    PAIEŠKOS VARIKLIO PRIETAISAS

    Pirmiausia – nedidelis lyrinis nukrypimas apie paieškos sistemos struktūrą. Jis taip sutvarkytas, kad vartotojas mato tik pačios sistemos sąsają, tai yra paieškos juostą, ir viskas, kas yra sistemos viduje, ten lieka.

    Pirmasis paieškos sistemos komponentas yra vadinamasis „voras“, paieškos robotas. Kokios jo funkcijos? Jis klaidžioja po visą internetą, naršo internete – puslapiuose, lanko nuorodas. Ir jis visa tai daro be perstojo. Voras klaidžioja ne savo malonumui. Jis įveda į paieškos variklio rodyklę absoliučiai visus puslapius, kuriuos peržiūrėjo. Įveda juos kaip prasmingus žodžius, kurie atsiranda puslapyje.

    Taigi paaiškėja, kad indeksas, antrasis paieškos sistemos komponentas, yra didžiulė duomenų bazė, kurios pagalba galima greitai sužinoti, kuriuose interneto puslapiuose yra ieškomas žodis. Informacija nuorodai - visas žinomo „Yandex“ paieškos variklio indekso tūris yra daugiau nei aštuoniasdešimt gigabaitų.

    Trečias komponentas po indekso yra pati paieškos sistema. Jos tikslas – indekse ieškoti tinkamų žodžių ar frazių. Atminkite, kad paieškos sistema neieško visame internete – ji to nedaro. Įsivaizduokite, kad tai tiesa: pavyzdžiui, visas indeksuotos informacijos kiekis „Yandex“ yra 269 gigabaitai. O jei įvedus užklausą indekso nebūtų, sistema turės parsisiųsti ir peržiūrėti 260 gigabaitų informacijos. Tai nerealu. Tik pagalvokite, kiek laiko užtruks vienos užklausos apdorojimas.

    Atsižvelgiant į tai, kad paieška vykdoma ne visame tinkle, o indekse, daromos dvi išvados. Pirma, jei paieškos variklis nerado tam tikros informacijos, tai visai nereiškia, kad šios informacijos nėra internete, jos nėra šios konkrečios paieškos sistemos indekse. Antra, informacijos paieškos sistemos tinkle viena nuo kitos skiriasi ne tik sąsaja, bet ir, pavyzdžiui, indeksu bei jos sudarymo metodais. Todėl jei vienoje paieškos sistemoje neradai reikiamos informacijos, jos reikia ieškoti kitoje.

    Indeksą sudarantis paieškos robotas visas svetaines naršo ratu ir labai reguliariai – taigi, indeksas visada teisingai parodo svetainėje įvykusius pokyčius. Svetainės, kurios ką tik pasirodė kaip „voras“, gali rastis pačios, pataikydamos jas į kitų svetainių nuorodą. Be to, svetainių autoriai gali pranešti „vorui“ apie savo svetainę.

    Paskutinis paieškos variklio komponentas yra pasaulinio tinklo serveris, kuris yra sistemos veidas. Tai sąsaja, per kurią vartotojai pateikia užklausas ir gauna į jas atsakymus. Pasaulio žiniatinklio serveris yra tik viena sistemos dalis, o ne pati didžiausia.

    PAIEŠKOS KALBOS

    Norint bendrauti su paieškos sistemomis, yra speciali kalba ir specialios taisyklės. Žinoma, būtų puiku, jei į jūsų klausimą būtų nedelsiant pateiktas išsamus atsakymas. Tačiau šiuo metu tai tik dirbama.

    Pirmiausia turite pabrėžti raktinius žodžius. Būtina nuspręsti, kurie keli žodžiai tiksliau apibūdins tai, ko ieškote, ir įveskite šiuos konkrečius žodžius. Sakysite, kad tai akivaizdu. Taip tai yra. Tačiau nustebsite sužinoję, ką daugelis žmonių įveda į paieškos juostą.

    „Yandex“ yra geras dalykas, vadinamas „tiesiogine transliacija“. Tai puslapis, kuriame galite matyti paskutines 20 ieškotų frazių ar žodžių. Žiūrėkite šį puslapį ilgiau ir patirsite daug įvairių jausmų. Kai kuriuos prašymus galima įrašyti į atskirą knygą – jie tokie nuostabūs. Žvelgdami į kai kuriuos prašymus suprasite, kad taip ieškoti tikrai NEbūtina.

    Paprastai didžiulis procentas užklausų neturi jokio aiškumo: „vaizdo įrašas“, „TV“, „atsisiųsti“ ir pan. Prašytojai mano, kad pati sistema turėtų atspėti, ko iš jos nori vartotojai. Aiškiau suformuokite paieškos užklausą ir kuo ji tikslesnė, tuo paieškos sistema duos mažiau nereikalingų rezultatų.

    Kai kurios paieškos sistemos išskiria tas pačias užklausas, bet pradedamas didžiąja arba mažąja raide. Pavyzdžiui, „Yandex“ pateiks skirtingą paieškos rezultatų skaičių, o „Google“ sistema ignoruoja didžiąsias ir mažąsias raides.

    Naudodami ženklus „+“ ir „-“ galite neįtraukti žodžių į paiešką arba padaryti juos privalomus. Šiuo atveju tarp ženklo ir žodžio neturėtų būti tarpo. Ši taisyklė galioja visoms paieškos sistemoms.

    Šioje užklausoje ieškome internetinių kompiuterinės technikos parduotuvių, kurios nesispecializuoja nešiojamuose kompiuteriuose, o kitoje, priešingai, tų parduotuvių, kuriose prekiaujama tais pačiais nešiojamaisiais kompiuteriais.

    Kaip matote, paieškos sistema tikrai davė skirtingus rezultatus.

    Jei jūsų užklausoje keli žodžiai yra tiesiog atskirti tarpais, tada paieškos sistema ieškos tų puslapių, kuriuose šie žodžiai yra vieno sakinio dalis. Na, o jei norite rasti dokumentą, kuriame yra bet kuris iš užklausoje nurodytų žodžių, turite naudoti ženklą „|“.

    „Yandex“ pateikė tik nepaprastai daug rezultatų ir viskas dėl to, kad dabar mes ieškome ne konkrečios frazės, o visų rezultatų, kuriuose yra bet kuris iš šių populiarių žodžių. Apskritai tokią užklausą patogiausia atlikti, jei yra daug sinonimų žodžių.

    Jei norite rasti stabilių frazių, įveskite jas kabutėse. Tai gali būti taikoma, jei, pavyzdžiui, ieškote eilučių iš kai kurių literatūros kūrinių ar citatų.

    Kaip matote, nurodę užklausą ir paieškos sistemai nurodę ieškoti būtent šio pasiūlymo, jau gavome pastebimai mažesnį skaičių rezultatų.

    IŠVADA

    Naudodami visus aukščiau išvardintus metodus galite lengvai rasti reikiamą informaciją. Laimei, paieškos sistemų yra pakankamai. Tačiau yra daugybė užduočių, kurių paieškos sistemos negali atlikti.

    Įsivaizduokime tokią situaciją: jums skubiai reikia geriausio sistemos administratoriaus mieste. Kaip tu jo ieškosi? Pavyzdžiui, galite reklamuotis laikraštyje ir kelis mėnesius atsakyti į daugybę telefono skambučių. Arba galite atvykti į specializuotą agentūrą ir greitai rasti ten tinkamą kandidatą.

    Panašiai ir su paieškos sistemomis – jos sukurtos taip, kad apimtų kuo daugiau informacijos. Jei jums reikia rasti ką nors ypatingo, prasminga naudoti specializuotas paieškos sistemas, kurios ieško įvairiose srityse.

    Baigdamas norėčiau duoti vieną patarimą. Šiame straipsnyje mes pateikėme tik apibendrintą informaciją apie paieškos užklausų sudarymą. Tiesą sakant, kiekviena paieškos sistema turi savo išplėstinę užklausų kalbą. Skirkite laiko savo mėgstamos paieškos variklio užklausos sintaksės galimybėms ištirti. Ateityje tai labai supaprastins reikalingų medžiagų paiešką. Norėdami padėti jums pateikti nuorodas į dviejų populiariausių paieškos sistemų informacinę medžiagą: