Zoeken naar informatie met behulp van zoekmachines. Als u op de exacte woordvorm wilt zoeken, plaatst u een uitroepteken voor het woord.

Zoeken naar informatie op internet

Zoeken naar informatie op internet

Informatie zoeken in veelgebruikte drie manieren(Zie Afb.1). Eerste van hen - zoeken op adres. Het wordt gebruikt wanneer de gebruiker het adres kent van een informatiebron die de informatie bevat die hij nodig heeft. Bij het organiseren van het zoeken naar informatie op adres (de vorm van het adres - IP, domein of URL - maakt in dit geval niet uit), hoeft de gebruiker alleen het adres van de bron in het daarvoor bestemde veld van de browser in te voeren - een programma ontworpen om toegang te bieden tot netwerkbronnen.

Rijst. 1. Manieren om informatie te zoeken in hypertext-databases

Tweede- zoeken met behulp van hyperlinknavigatie. Bij gebruik van dit type zoekopdracht moet de gebruiker eerst toegang krijgen tot de server die is gekoppeld aan de bijbehorende database. U kunt het document dan terugvinden via hyperlinks. Het is duidelijk dat deze methode handig is wanneer het adres van de bron onbekend is voor de gebruiker. Om te worden gebruikt als startpunt voor zoeken bij het implementeren van deze methode, zijn webportalen bedoeld - servers die directe toegang bieden tot een bepaalde set servers, inclusief informatiebronnen die erop zijn geïnstalleerd, evenals webtoepassingen die webservices implementeren die overeenkomen met de doel van het portaal. De servers die via het portaal toegankelijk zijn, kunnen verwijzen naar een specifiek systeem (bijvoorbeeld een bedrijf) of verschillende systemen en worden speciaal geselecteerd op basis van de specifieke, thematische of andere kenmerken van de documenten en gegevens op hun sites. Doorgaans combineren portals verschillende functies om de klant zo lang mogelijk te behouden. De dominante dienst van het portaal is de referentiedienst: zoeken, rubricators, financiële indexen, weersinformatie, enz. Terwijl websites meestal verzamelingen van statische webpagina's zijn, zijn portals verzamelingen van softwaretools en voor-ongestructureerde informatie die deze tools op verzoek van specifieke gebruikers omzetten in gestructureerde gegevens.

De derde de zoekmethode omvat het gebruik van internetzoekservers. Zoekservers zijn dedicated hosts - computers die databases met internetbronnen hosten. De gebruikersinterface van een dergelijke server heeft een veld voor het invoeren van trefwoorden die het onderwerp van interesse voor de gebruiker beschrijven (zie figuur 2).

Fig. 2. Weergave van het Yandex-zoekservervenster

De server beschouwt deze woorden als een informatieverzoek, in overeenstemming met het zoeken naar bronnen en presenteert een lijst met gevonden documenten aan de gebruiker. Het is duidelijk dat bij het implementeren van deze methode fouten van zowel de 1e (het missen van het doel) als de 2e soort (informatieruis) mogelijk zijn. Opgemerkt moet worden dat er twee groepen zoekservers worden onderscheiden: zoekmachines en onderwerpdirectories. Hun verschil is te wijten aan de methode van creatie en daaropvolgende aanvulling van de database met internetbronnen, waarmee deze server informatie ophaalt. Zoekmachines hebben dus in hun samenstelling een speciaal programma - een zoekrobot. Het houdt het netwerk voortdurend in de gaten, verzamelt informatie van webpagina's, indexeert ze en corrigeert hun zoekafbeelding in zijn database. In onderwerpcatalogi wordt een database met internetdocumenten "handmatig" gevormd door gespecialiseerde redacteuren. Aangezien er geen enkele administratie op internet is, veranderen de informatiebronnen voortdurend. Er kunnen nieuwe documenten in verschijnen en bestaande documenten kunnen verdwijnen. De frequentie van het bijwerken van informatie in documenten voor verschillende sites is verschillend: voor sommigen is het meerdere keren per uur, voor sommigen is het één keer per dag, dag, maand, enz. Daarom is het erg belangrijk om te begrijpen dat bij het gebruik van systemen voor het ophalen van informatie om informatie op internet te vinden, de zoekopdracht niet wordt uitgevoerd in de echte ruimte van de webdocumenten, maar in een bepaald model waarvan de inhoud aanzienlijk kan verschillen van de werkelijke inhoud van internet op het moment van zoeken. Afhankelijk van de mate van dekking van geïndexeerde bronnen, kunnen zoekmachines worden onderverdeeld in twee groepen: internationaal en Russisch. De voormalige indexeert alle op internet gepubliceerde documenten op een rij. De tweede indexeert bronnen die zich in domeinzones bevinden met een overwicht van de Russische taal. De lijst met de meest populaire systemen wordt gegeven in de tabel. een.

Tabblad. 1. Meest populaire zoekmachines

Internationale Russisch sprekenden
Google Yandex (44,4% van Runet)
Yahoo! Rambler (10,6% van Runet)
Bing Mail.ru (7,3% van Runet)
msn Nigma (0,5% Runet)
AltaVista Gogo.ru (0,3% Runet)
Vragen Apoort (0,2% Runet)

Opmerking: Runet is het Russisch sprekende deel van internet, dat domeinen met namen vormt ru en rf.

Er moet worden vermeld dat er een speciale categorie zoekmachines is - metazoekmachines. Hun fundamentele verschil met zoekmachines en onderwerpcatalogi is dat ze geen eigen indexdatabase hebben en daarom, na ontvangst van een gebruikersverzoek, deze naar verschillende zoekservers tegelijk doorsturen (zie figuur 3).

Rijst. 3. Het schema van het metazoeksysteem

De mogelijkheid om meerdere zoekmachines tegelijkertijd te gebruiken voor een enkel verzoek is een duidelijk voordeel van metazoekmachines. Op dit moment heeft het Metabot.ru-systeem een ​​brede toepassing gevonden, waarvan de interface wordt getoond in Fig. 4. Met dit systeem kunt u zowel internationale als Russischtalige zoekservers gebruiken om naar bronnen te zoeken.

1. Inleiding

Elk jaar neemt het volume van internet vele malen toe, waardoor de kans op het vinden van de benodigde informatie enorm toeneemt. Het internet verenigt miljoenen computers, veel verschillende netwerken, het aantal gebruikers neemt jaarlijks met 15-80% toe. En desalniettemin, steeds vaker bij toegang tot internet, is het grootste probleem niet het gebrek aan de vereiste informatie, maar de mogelijkheid om deze te vinden. In de regel kan of wil een gewoon persoon door verschillende omstandigheden niet meer dan 15-20 minuten zoeken naar het antwoord dat hij nodig heeft. Daarom is het vooral belangrijk om correct en competent te leren, zo lijkt het, een simpele zaak - waar en hoe te kijken om de GEWENSTE antwoorden te krijgen.

Om de informatie te vinden die je nodig hebt, moet je het adres vinden. Hiervoor zijn er gespecialiseerde zoekservers (indexrobots (zoekmachines), thematische internetgidsen, meta-zoeksystemen, personenzoekdiensten, enz.). Deze masterclass onthult de belangrijkste technologieën voor het zoeken naar informatie op internet, biedt gemeenschappelijke kenmerken van zoekhulpmiddelen, onderzoekt de structuur van zoekopdrachten voor de meest populaire Russischtalige en Engelstalige zoekmachines.

2. Zoektechnologieën

Webtechnologie World Wide Web (WWW) wordt beschouwd als een speciale technologie voor het voorbereiden en plaatsen van documenten op internet. Het WWW omvat webpagina's, elektronische bibliotheken, catalogi en zelfs virtuele musea! Met zo'n overvloed aan informatie rijst de vraag scherp: "Hoe navigeer je in zo'n enorme en grootschalige informatieruimte?"
Zoekhulpmiddelen komen te hulp bij het oplossen van dit probleem.

2.1 Zoekhulpmiddelen

Zoekhulpmiddelen zijn speciale software waarvan het belangrijkste doel is om internetgebruikers de meest optimale en hoogwaardige informatiezoekopdracht te bieden. Zoekhulpmiddelen worden gehost op speciale webservers, die elk een specifieke functie vervullen:

  1. Analyse van webpagina's en het invoeren van de resultaten van de analyse op een of ander niveau van de zoekserverdatabase.
  2. Zoeken naar informatie op verzoek van de gebruiker.
  3. Het bieden van een gebruiksvriendelijke interface voor het zoeken naar informatie en het bekijken van het zoekresultaat door de gebruiker.

De werkmethoden die worden gebruikt bij het werken met deze of andere zoekhulpmiddelen zijn bijna hetzelfde. Overweeg de volgende concepten voordat u ze gaat bespreken:

  1. De interface van de zoekfunctie wordt weergegeven als een pagina met hyperlinks, een zoekreeks (zoekreeks) en hulpprogramma's voor het activeren van zoekopdrachten.
  2. De zoekmachine-index is een informatiebank met het resultaat van de analyse van webpagina's, samengesteld volgens bepaalde regels.
  3. Een zoekopdracht is een trefwoord of woordgroep die de gebruiker in de zoekbalk invoert. Speciale tekens ("", ~), wiskundige symbolen (*, +, ?) worden gebruikt om verschillende zoekopdrachten te vormen.

Het schema voor het zoeken naar informatie op internet is eenvoudig. De gebruiker typt een trefwoord in en activeert de zoekopdracht, waarbij hij een selectie van documenten ontvangt volgens het geformuleerde (gegeven) verzoek. Deze lijst met documenten is gerangschikt volgens bepaalde criteria, zodat bovenaan de lijst de documenten staan ​​die het meest overeenkomen met de zoekopdracht van de gebruiker. Elk van de zoekhulpmiddelen gebruikt verschillende criteria voor het rangschikken van documenten, zowel bij de analyse van zoekresultaten als bij de vorming van de index (het vullen van de indexdatabase van webpagina's).

Als u dus een zoekopdracht met hetzelfde ontwerp opgeeft in de zoekreeks voor elk zoekhulpmiddel, kunt u verschillende zoekresultaten krijgen. Voor de gebruiker is het van groot belang welke documenten volgens de zoekresultaten in de eerste twee of drie dozijn documenten zullen verschijnen en in hoeverre deze documenten overeenkomen met de verwachtingen van de gebruiker.

De meeste zoekhulpmiddelen bieden twee manieren om te zoeken − eenvoudig zoeken(eenvoudig zoeken) en geavanceerd zoeken(geavanceerd zoeken) met en zonder een speciaal aanvraagformulier. Laten we beide soorten zoekopdrachten bekijken aan de hand van het voorbeeld van een Engelstalige zoekmachine.

AltaVista is bijvoorbeeld handig voor willekeurige zoekopdrachten, "Iets over online graden in informatietechnologie", terwijl u met de Yahoo-zoekfunctie wereldnieuws, wisselkoersinformatie of weersvoorspellingen kunt krijgen.

Door de criteria voor het verfijnen van de zoekopdracht en geavanceerde zoektechnieken te beheersen, kunt u de efficiëntie van de zoekopdracht verhogen en snel de nodige informatie vinden. Allereerst kunt u de zoekefficiëntie verhogen door logische operatoren (bewerkingen) Or, And, Near, Not, wiskundige en speciale symbolen in zoekopdrachten te gebruiken. Met behulp van operators en/of symbolen koppelt de gebruiker de trefwoorden in de gewenste volgorde om het meest geschikte zoekresultaat voor de zoekopdracht te krijgen. Aanvraagformulieren worden weergegeven in tabel 1.

tafel 1

Een simpele zoekopdracht geeft een aantal links naar documenten, want de lijst bevat documenten die een van de woorden bevatten die op het verzoek zijn ingevoerd, of een eenvoudige zin (zie tabel 1). Met de operator en kunt u specificeren dat alle trefwoorden in de documentinhoud moeten worden opgenomen. Het aantal documenten kan echter nog steeds groot zijn en het kan lang duren om ze te bekijken. Daarom is het in sommige gevallen veel handiger om de near-context-operator te gebruiken, die aangeeft dat de woorden voldoende dicht bij elkaar in het document moeten staan. Het gebruik van Near vermindert het aantal gevonden documenten aanzienlijk. De aanwezigheid van het symbool "*" in de zoekreeks betekent dat het woord zal worden gezocht op zijn masker. Laten we bijvoorbeeld een lijst met documenten krijgen die woorden bevatten die beginnen met "gov" als we "gov*" in de querytekenreeks schrijven. Dit kunnen de woorden regering, gouverneur, enz.

De even populaire zoekmachine Rambler houdt statistieken bij over linkverkeer vanuit zijn eigen database, dezelfde logische operatoren AND, OR, NOT, het metateken * (vergelijkbaar met het teken * in AltaVista dat het zoekbereik vergroot), coëfficiëntsymbolen + en - zijn ondersteund om significantiewoorden die in de zoekopdracht zijn ingevoerd te vergroten of te verkleinen.

Laten we eens kijken naar de meest populaire informatiezoektechnologieën op internet.

2.2 Zoekmachines

Webzoekmachines zijn servers met een enorme database van URL's die automatisch toegang krijgen tot WWW-pagina's op al deze adressen, de inhoud van deze pagina's onderzoeken, trefwoorden van de pagina's vormen en in hun database (indexpagina's) schrijven.

Bovendien volgen zoekmachinerobots de links die ze tegenkomen op de pagina's en indexeren ze opnieuw. Aangezien bijna elke WWW-pagina veel links naar andere pagina's heeft, kan de zoekmachine in het eindresultaat theoretisch alle sites op internet omzeilen.

Het is dit soort zoekhulpmiddelen dat het meest bekend en populair is onder alle internetgebruikers. Iedereen kent de namen van bekende webzoekmachines (zoekmachines) - Yandex, Rambler, Aport.

Om dit type zoekfunctie te gebruiken, moet je ernaartoe gaan en in de zoekbalk het trefwoord typen waarin je geïnteresseerd bent. Vervolgens ontvangt u een uitvoer van de links die zijn opgeslagen in de database van de zoekmachine die het dichtst bij uw zoekopdracht liggen. Om het zoeken zo effectief mogelijk te laten verlopen, let je vooraf op de volgende punten:

  • beslissen over het onderwerp van het verzoek. Waar ben je uiteindelijk precies naar op zoek?
  • let op taal, grammatica, gebruik van verschillende niet-alfabetische karakters, morfologie.Ook is het belangrijk om trefwoorden correct te formuleren en in te voeren. Elke zoekmachine heeft zijn eigen manier om een ​​verzoek in te dienen - het principe is hetzelfde, maar de gebruikte symbolen of operators kunnen verschillen. De vereiste aanvraagformulieren variëren ook afhankelijk van de complexiteit van de zoekmachinesoftware en de diensten die ze leveren. Op de een of andere manier heeft elke zoekmachine een sectie "Help" ("Help"), waar alle syntaxisregels, evenals aanbevelingen en tips voor zoeken, op een toegankelijke manier worden uitgelegd (screenshot van zoekmachinepagina's).
  • gebruik maken van de mogelijkheden van verschillende zoekmachines. Als je het niet kunt vinden op Yandex, probeer dan Google. Gebruik geavanceerde zoekservices.
  • om documenten die bepaalde termen bevatten uit te sluiten, gebruikt u het "-" teken voor elk dergelijk woord. Als u bijvoorbeeld informatie wilt over de werken van Shakespeare, met uitzondering van "Hamlet", voer dan de zoekopdracht in het formulier in: "Shakespeare-Hamlet". En om ervoor te zorgen dat bepaalde links noodzakelijkerwijs in de zoekresultaten worden opgenomen, gebruikt u het "+"-symbool. Dus om links over de verkoop van auto's specifiek te vinden, hebt u de zoekopdracht "verkoop + auto" nodig. Gebruik combinaties van deze tekens om de efficiëntie en nauwkeurigheid van uw zoekopdracht te vergroten.
  • elke link in de lijst met zoekresultaten bevat - verschillende regels uit het gevonden document, waaronder uw trefwoorden. Evalueer de relevantie van het fragment voor het onderwerp van het verzoek voordat u op de link klikt. Nadat u op de link naar een specifieke site heeft geklikt, kijkt u zorgvuldig rond op de hoofdpagina. In de regel is de eerste pagina voldoende om te begrijpen of u naar het adres bent gekomen of niet. Zo ja, zoek dan verder naar de benodigde informatie op de geselecteerde site (in secties van de site), zo niet, ga terug naar de zoekresultaten en probeer de volgende link.
  • onthoud dat zoekmachines geen onafhankelijke informatie produceren (behalve uitleg over zichzelf). De zoekmachine is slechts een tussenpersoon tussen de eigenaar van de informatie (website) en u. De databases worden voortdurend bijgewerkt, nieuwe adressen worden erin ingevoerd, maar de achterstand van de informatie die echt in de wereld bestaat, blijft bestaan. Simpelweg omdat zoekmachines niet met de snelheid van het licht werken.

De meest bekende webzoekmachines zijn Google, Yahoo, Alta Vista, Excite, Hot Bot, Lycos. Onder de Russischtaligen kan men Yandex, Rambler, Aport onderscheiden.

Zoekmachines zijn de grootste en meest waardevolle, maar verre van de enige informatiebronnen op het web, omdat er naast deze ook andere manieren zijn om op internet te zoeken.

2.3 Directory's

De catalogus met internetbronnen is een hiërarchische catalogus die voortdurend wordt bijgewerkt en aangevuld en die veel categorieën en afzonderlijke webservers bevat met een korte beschrijving van hun inhoud. De zoekmethode voor de catalogus houdt in dat u "de stappen naar beneden gaat", dat wil zeggen, het verplaatsen van meer algemene categorieën naar meer specifieke. Een van de voordelen van thematische mappen is dat de uitleg bij de links wordt gegeven door de makers van de map en de inhoud volledig weerspiegelt, dat wil zeggen, het geeft u de mogelijkheid om nauwkeuriger te bepalen hoe de inhoud van de server overeenkomt met het doel van uw zoekopdracht.

Een voorbeeld van een thematische catalogus in het Russisch is de bron http://www.ulitka.ru/.

Op de hoofdpagina van deze site staat een thematische rubricator,

met behulp waarvan de gebruiker de rubriek invoert met links naar de producten die voor hem interessant zijn.

Bovendien kunt u in sommige onderwerpdirectory's op trefwoorden zoeken. De gebruiker voert het gewenste trefwoord in de zoekbalk in

en ontvangt een lijst met links met beschrijvingen van sites die het meest overeenkomen met zijn verzoek. Opgemerkt moet worden dat deze zoekopdracht niet plaatsvindt in de inhoud van WWW-servers, maar in hun korte beschrijving die is opgeslagen in de directory.

In ons voorbeeld heeft de directory ook de mogelijkheid om sites te sorteren op het aantal bezoeken, alfabetisch, op datum van binnenkomst.

Andere voorbeelden van Russischtalige mappen:
[email protected]
Weblijst
Vsego.ru
Onder de Engelstalige mappen zijn:
http://www.DMOS.org
http://www.yahoo.com/
http://www.looksmart.com

2.4 Verzamelingen van links

Linkverzamelingen zijn links gesorteerd op onderwerp. Inhoudelijk verschillen ze nogal van elkaar, dus om een ​​selectie te vinden die het beste bij je interesses past, moet je ze zelf doorlopen om je eigen mening te vormen.

Als voorbeeld geven we een selectie van links "Treasures of the Internet" JSC "Relcom"

De gebruiker, door te klikken op een van de secties die voor hem van belang zijn

  • INHOUD

    Voor automobilisten

    • Astronomie en astrologie
    • Jouw huis
    • Uw huisdieren
    • Kinderen zijn de bloemen van het leven
    • Vrije tijd
    • Steden op internet
    • Gezondheid en medicijnen
    • Informatiebureaus en diensten
    • Museum van lokale overlevering, enz.,
    • Auto-elektronica.
    • Antiek Automobielmuseum.
    • College voor Rechtsbescherming van Autobezitters.
    • sportief rijden.

    Het voordeel van dit soort zoekhulpmiddelen is hun focus, meestal bevat de selectie zeldzame internetbronnen, geselecteerd door een specifieke webmaster of eigenaar van een webpagina.

    2.5 Adresdatabases

    Adresdatabases zijn speciale zoekservers die gewoonlijk classificaties gebruiken op type activiteit, op geleverde producten en diensten en op geografische locatie. Soms worden ze aangevuld met een alfabetische zoekopdracht. In de databaserecords wordt informatie opgeslagen over sites die tegen betaling informatie verstrekken over het e-mailadres, de organisatie en het postadres.

    De grootste Engelstalige adresdatabase is te noemen: http://www.lookup.com/ -

    Door in deze submappen te komen, vindt de gebruiker links naar sites die informatie bieden die voor hem van belang is.

    Wijdverbreide en officiële databases met adressen in de Russische Federatie zijn ons niet bekend.

    2.6 Zoeken in Gopher-archieven

    Gopher is een onderling verbonden systeem van servers (Gopher-ruimte) die via internet worden verspreid.

    De rijkste literaire bibliotheek wordt verzameld in de Gopher-ruimte, maar de materialen zijn niet beschikbaar voor weergave op afstand: de gebruiker kan alleen de hiërarchisch georganiseerde inhoudsopgave bekijken en een bestand op titel selecteren. Met behulp van een speciaal programma (Veronica) kan zo'n zoekopdracht automatisch worden gedaan met behulp van zoekopdrachten op basis van trefwoorden.

    Tot 1995 was Gopher de meest dynamische internettechnologie: het groeitempo van het aantal gerelateerde servers overtrof het groeitempo van servers van alle andere soorten internet. In het EUnet/Relcom-netwerk zijn Gopher-servers niet actief ontwikkeld en tegenwoordig herinnert bijna niemand ze zich.

    2.7 FTP-bestandszoeksysteem (FTP-zoekopdracht)

    Een FTP-bestandszoekmachine is een speciaal type internetzoekmachine waarmee u bestanden kunt vinden die beschikbaar zijn op "anonieme" FTP-servers. Het FTP-protocol is ontworpen om bestanden over een netwerk over te dragen, en in die zin is het functioneel een soort analoog van Gopher.

    Het belangrijkste zoekcriterium is de bestandsnaam die op verschillende manieren is opgegeven (exacte overeenkomst, subtekenreeks, reguliere expressie, enz.). Dit type zoekopdracht kan natuurlijk niet concurreren met zoekmachines in termen van mogelijkheden, aangezien de inhoud van bestanden op geen enkele manier in aanmerking wordt genomen tijdens het zoeken, en bestanden, zoals u weet, willekeurige namen kunnen krijgen. Als u echter een bekend programma of een standaardbeschrijving moet vinden, heeft het bestand dat het bevat met grote waarschijnlijkheid de juiste naam en kunt u het vinden met behulp van een van de FTP-zoekservers:

    FileSearch zoekt naar bestanden op FTP-servers op naam van de bestanden zelf en mappen. Als je op zoek bent naar een programma of iets anders, dan vind je op WWW-servers waarschijnlijk hun beschrijving en van FTP-servers kun je ze naar jezelf downloaden.

    2.8 Zoekmachine in Usenet Nieuwsconferenties

    USENET NEWS is het teleconferentiesysteem van de internetgemeenschap. In het Westen wordt deze dienst nieuws genoemd. Een nauw analoog van teleconferenties zijn de zogenaamde "echo's" in het FIDO-netwerk.

    Vanuit het oogpunt van een abonnee van een teleconferentie is USENET een prikbord met secties waar je artikelen kunt vinden over alles, van politiek tot tuinieren. Dit prikbord is toegankelijk via een computer, vergelijkbaar met e-mail. Zonder uw computer te verlaten, kunt u artikelen lezen of posten op een bepaalde conferentie, nuttig advies vinden of deelnemen aan discussies. Natuurlijk nemen artikelen ruimte in beslag op computers, dus ze worden niet voor altijd bewaard, maar worden periodiek vernietigd om plaats te maken voor nieuwe. Wereldwijd is de beste service voor het vinden van informatie in Usenet-conferenties de Google Groups-server (Google Inc.).

    Google Discussiegroepen is een gratis online community- en discussiegroepservice die het grootste archief van Usenet-berichten op internet biedt (meer dan een miljard berichten). Ga voor meer informatie over de gebruiksvoorwaarden van de service naar http://groups. google.com/intl/ru /googlegroups/tour/index.html

    Onder de Russisch-sprekenden vallen de USENET World System-server en Relcom-teleconferenties op. Net als bij andere zoekservices typt de gebruiker een queryreeks en genereert de server een lijst met conferenties die trefwoorden bevatten. Vervolgens moet u zich abonneren op de geselecteerde conferenties in het nieuwsprogramma. Er is ook een vergelijkbare Russische FidoNet Online-server: Fido-conferenties op het WWW.

    2.9 Meta-zoeksystemen

    Voor een snelle zoektocht in de databases van meerdere zoekmachines tegelijk kun je beter terecht bij meta-zoeksystemen.

    Meta-zoekmachines zijn zoekmachines die uw zoekopdracht naar een groot aantal verschillende zoekmachines sturen, vervolgens de resultaten verwerken, dubbele bronadressen verwijderen en een groter aanbod presenteren van wat op internet wordt gepresenteerd.

    De populairste meta-zoekmachine ter wereld is Search.com.

    Unified Search.com-zoekmachine van CNET, Inc. bevat bijna twee dozijn zoekmachines, waarnaar het hele internet vol staat.

    Met dit soort zoekhulpmiddelen kan de gebruiker informatie zoeken in verschillende zoekmachines, maar de negatieve kant van deze systemen kan hun instabiliteit worden genoemd.

    2.10 Personenzoeksystemen

    Personenzoeksystemen zijn speciale servers waarmee u mensen op internet kunt zoeken, de gebruiker kan de volledige naam opgeven. persoon en krijg hun e-mailadres en URL. Er moet echter worden opgemerkt dat zoekmachines voor mensen over het algemeen informatie over e-mailadressen uit open bronnen halen, zoals Usenet-forums. Een van de meest bekende zoeksystemen voor mensen zijn:

    E-mailadressen zoeken

    in speciale zoekvelden voor contactgegevens (Voornaam. Plaats, Achternaam, Telefoonnummer) kunt u de informatie vinden waarin u geïnteresseerd bent.

    Mensenzoekmachines zijn echt grote servers, hun databases bevatten ongeveer 6.000.000 adressen.

    3. Conclusie

    We hebben de belangrijkste technologieën voor het zoeken naar informatie op internet beoordeeld en in algemene termen de zoekhulpmiddelen gepresenteerd die momenteel op internet bestaan, evenals de structuur van zoekopdrachten voor de meest populaire Russischtalige en Engelstalige zoekmachines, en, het bovenstaande samenvattend, willen we opmerken dat een enkel optimaal schema voor het zoeken naar informatie op internet niet bestaat. Afhankelijk van de specifieke informatie die u nodig heeft, kunt u de juiste zoekhulpmiddelen en -services gebruiken. En de kwaliteit van de zoekresultaten hangt af van hoe vakkundig de zoekdiensten zijn geselecteerd.

  • Het vinden van de juiste informatie op internet is vaak best lastig. Het internet ontwikkelt zich chaotisch, het heeft geen duidelijk gedefinieerde structuur. Niemand kan garanderen dat er op het ene domein alleen informatie over een bepaald onderwerp staat, en op het andere - informatie over een ander, maar ook duidelijk omschreven onderwerp. Op .com-domeinen vind je bijvoorbeeld niet alleen commerciële informatie, maar bijvoorbeeld ook diverse documentatie over softwareproducten of zelfs grappen.

    Als de domeinstructuur vergelijkbaar zou zijn met de directorystructuur, bijvoorbeeld in het domein ru.comp.os.linux (zoals in het nieuwssysteem), zou er alle informatie over het Linux-besturingssysteem in het Russisch zijn en zou een moderatororganisatie ervoor zorgen dat in andere domeinen geen informatie over Linux plaatste, dan zou het zoeken veel gemakkelijker zijn. We zouden tenslotte weten waar we moesten zoeken. Je opent een browser, voert ru.comp.os.linux in en je krijgt... miljoenen verschillende links naar artikelen, HOWTO-documenten en andere informatie die op de een of andere manier met Linux te maken heeft.

    Zoekprestaties

      Zoekprestaties zijn afhankelijk van veel factoren:
    • Van de informatie zelf - er kan veel informatie zijn over het ene onderwerp, maar weinig over het andere. Soms kun je veel informatie over een bepaald onderwerp vinden, maar de efficiëntie van deze zoekopdracht zal dicht bij 0,0% liggen en je kunt slechts 3-4 links vinden, en dit is precies wat je nodig hebt. Dit omvat ook het vermogen van de webmaster om informatie correct in te voeren, zodat zoekmachines deze zelf kunnen vinden.Stel dat er ergens heel ver weg de informatie is die u nodig hebt, maar de zoekmachine weet er niets van. Misschien is de informatie zojuist gepubliceerd of vermoedt de webmaster die de informatie heeft gepubliceerd niet eens het bestaan ​​van zoekmachines. U zoekt informatie met behulp van een zoekmachine. Als zij de informatie die u nodig heeft niet "weet", dan weet u dus ook niets over haar.
    • Van de zoekmachine - er zijn veel zoekmachines en ze zijn allemaal verschillend. Zelfs als ze van hetzelfde type zijn (we zullen later over de typen zoekmachines praten), heeft elk van hen natuurlijk zijn eigen algoritme. Als je met de ene zoekmachine geen informatie kunt vinden, probeer er dan naar te zoeken met een andere. Blijf niet hangen in één zoekmachine, hoe leuk je het ook vindt.
    • Veel hangt af van het vermogen om een ​​zoekmachine te gebruiken - hoe u weet hoe u een zoekmachine moet gebruiken. Als u niet weet hoe u een zoekmachine moet gebruiken, is het onwaarschijnlijk dat uw zoekopdracht effectief is.

    Informatie zoeken

    Aangezien u de site die u nodig heeft meestal niet uit de directory van de zoekmachine selecteert, maar een specifiek trefwoord (of meerdere trefwoorden) invoert, moet u dit trefwoord zo specifiek mogelijk specificeren. Hoe nauwkeuriger u het onderwerp van de zoekopdracht definieert, hoe nauwkeuriger het resultaat zal zijn. De zoekmachine kan je gedachten niet raden, je moet hem duidelijk aangeven wat je zoekt.

    Elke zoekmachine heeft zijn eigen syntaxis die u moet kennen. Dit hoofdstuk beschrijft de syntaxis van de zoekmachines Google, Yandex en Rambler. Als u een andere zoekmachine wilt gebruiken, kunt u de syntaxis ervan vinden op zijn website (meestal wordt deze in detail beschreven).

    Internetzoekmachines

    Laten we het nu hebben over de zoekmachines zelf.

    Op het grondgebied van het voormalige CIS zijn volgens SpyLog (Openstat) de volgende zoekmachines het populairst:

    • 1. Yandex (www.yandex.ru);
    • 2. Google (www.google.com);
    • 3. [email protected] (go.mail.ru);
    • 3. Rambler (www.rambler.ru);
    • 5 Yahoo! (www.yahoo.com);
    • 6. AltaVista (www.altavista.com);
    • 7. Bing (www.bing.com).

    Zoekmachines worden weergegeven in afnemende volgorde van populariteit. Zoals u kunt zien, is onze populairste zoekmachine Yandex.

    Typen zoekmachines

      Er zijn twee hoofdtypen zoekmachines:
    • index - Google, AltaVista, Rambler, HotBot, Yandex, enz.;
    • classificatie (catalogus) - Rambler, Yahoo! en etc.

    Wees niet verbaasd dat de Rambler-zoekmachine twee keer wordt vermeld - het was zowel index als classificatie tegelijkertijd. We komen hier later op terug, maar laten we het nu hebben over de verschillen tussen deze twee systemen.

    Hoe werkt een indexzoekmachine? De zoekmachine start een speciaal programma dat de inhoud van webservers scant en informatie indexeert: het voert de trefwoorden van een bepaalde webpagina in zijn database in, wat informatie van de webpagina.

    Een korte geschiedenis van Google

    Laten we beginnen met de titel. Google is een licht gewijzigde versie van het woord googol (het wordt niet voor niets vaak "Google" genoemd). Dit woord werd op zijn beurt geïntroduceerd door Milton Sirota, neef van de beroemde wiskundige Edward Kasner, en werd vervolgens gepopulariseerd in het boek Mathematics and Imagination van Kasner en Newman. Het woord "googol" geeft het getal weer als één 1 gevolgd door 100 nullen. De naam 'Google' weerspiegelt een poging om de enorme hoeveelheid informatie op internet te ordenen.

    Laten we dus bij het begin beginnen. Toekomstige Google-ontwikkelaars Sergey Brin en Larry Page ontmoetten elkaar in 1999 aan de Stanford University. Toen was Larry 24 jaar oud en Sergey - 23. Larry was in die tijd een student aan de Universiteit van Michigan en kwam een ​​paar dagen naar Stanford. Sergei zat in een groep studenten die de gasten kennis moesten laten maken met de universiteit. Vanaf de eerste ontmoeting hielden Sergey en Larry, om het zacht uit te drukken, niet van elkaar - ze maakten ruzie over alles waarover ruzie kon worden gemaakt. Hoewel dit uiteindelijk positief uitpakte, aangezien hun verschillende meningen leidden tot het creëren van een algoritme voor het oplossen van een van de meest prangende computerproblemen: het vinden van de juiste informatie tussen een enorme hoeveelheid gegevens. In januari 1996 begonnen Larry en Sergey te werken aan de BackRub-zoekmachine, die de "terug"-links die naar deze website verwijzen, moest analyseren. Het werk aan deze server werd uitgevoerd in een constant gebrek aan geld - in die tijd waren Sergey en Larry immers afgestudeerde studenten van de universiteit - je begrijpt zelf dat afgestudeerde studenten niet veel geld hebben. Trouwens, Larry nam voor het eerst deel aan zo'n serieus project, en daarvoor was hij bezig met allerlei "frivole", zelfs soms anekdotische projecten, hij bouwde bijvoorbeeld een werkende printer van een Lego-constructeur.

    Google-zoekalgoritmen

    De interface van Google valt op door zijn eenvoud: een invoerveld en twee knoppen. Zoals ze zeggen, alles wat ingenieus is, is eenvoudig.

    Google speciale (uitgebreide) syntaxis

    Naast de logische operatoren biedt Google u de zoekmodifiers die in de tabel worden vermeld. Zoekmodifiers worden speciale Google-syntaxis genoemd. Neem deze tabel serieus: als je eenmaal iets probeert te zoeken met behulp van modifiers, zul je ze niet weigeren.

    Google inurl-modifier

    De inurl-modifier wordt gebruikt om naar de opgegeven URL te zoeken. En in tegenstelling tot de site-modifier, waarmee u informatie op slechts één site of domein kunt zoeken, kunt u met de inurl-modifier naar informatie zoeken in submappen van de site, bijvoorbeeld:

    inurl: siteskype-zvonim-free

    Met de inurl-modifier kunt u het *-teken gebruiken om een ​​domein op te geven, bijvoorbeeld:
    inurl: "*.redhat.com"

    Het is het beste om inurl met site te gebruiken. De volgende zoekopdracht zoekt naar informatie in het gidmir.ru-domein, op al zijn subdomeinen behalve www:
    site: gidmir.ru inurl: "*.gidmir" -inurl: "www.gidmir.ru"

    Google-zoektaal

    Google staat gemengde syntaxis toe, d.w.z. een syntaxis die verschillende speciale zoekmodifiers in een zoekopdracht gebruikt. Hierdoor bereik je het beste resultaat.

    Hier is het eenvoudigste voorbeeld van gemengde syntaxis:
    site: ru inurl: disc

    In dit geval wordt de zoekopdracht uitgevoerd op domeinsites en moet de URL het woord schijf bevatten.

    Hier is nog een voorbeeld:
    site: ru -inurl: org.ua

    De zoekopdracht wordt uitgevoerd op sites van het ru-domein, maar de zoekresultaten zullen geen pagina's bevatten die zich op org.ua bevinden.

    Zoektermen op Google

    Voor de meeste gewone Google-gebruikers is de limiet van 10 zoekwoorden niet merkbaar. Maar liefhebbers van lange zoekopdrachten hebben waarschijnlijk gemerkt dat Google alleen rekening houdt met de eerste 10 zoekwoorden, en de rest wordt gewoon genegeerd.

    Waarom zoeken naar lange zinnen? In de meeste gevallen zijn dit fragmenten uit werken. Stel dat we op zoek zijn naar het werk "Meester en Margarita". Opgemerkt moet worden dat de sleutelzin eruit moet zien als "Meester Margarita", omdat de woorden en, of, en, van, of, ik, a, de en enkele andere worden genegeerd door de zoekmachine. Als u wilt dat een van deze woorden wordt opgenomen in uw zoekopdracht, laat u het woord voorafgaan door een "+"-teken, zoals +de.

    Door de limiet van 10 woorden te overschrijden, kan de zoekopdracht correct worden opgebouwd. Met de volgende aanbevelingen kunt u niet alleen de lengte van de zoekopdracht verkorten, maar ook de efficiëntie van uw zoekopdracht in het algemeen verbeteren.

    Geavanceerd zoeken met Google

    We typen in de browserinvoerregel het adres - www.google.ru/advanced_search en gaan naar de geavanceerde Google-zoekopdracht.

    Met geavanceerd zoeken kunt u bijna net zo flexibel naar informatie zoeken als met zoekmodifiers. Waarom "bijna"? De geavanceerde zoekinterface biedt geen toegang tot alle zoekmodifiers.

    Google-zoekeigenschappen instellen in browsercookies

    Ik wil je niet lastig vallen met technische details, dus ik zal kort zeggen wat Cookies wel en niet zijn, waar ze niet mee gegeten worden, maar hoe er mee gewerkt moet worden.

    Stel je voor dat we de volgende taak hebben: we moeten een individueel bezoekrapport schrijven voor elke klant van de website van ons bedrijf. Dat wil zeggen, zodat de gebruiker niet het totale aantal bezoeken ziet, weet hoe vaak hij op onze site was. Voor elk IP-adres moeten we records in één tabel bewaren, die waarschijnlijk groot is, en hieruit volgt dat we irrationeel processortijd en schijfruimte gebruiken. Het zou veel correcter van ons zijn om deze ruimte met meer voordeel te gebruiken.

    Google-zoekresultaat

    Een Google-zoekresultaat is niet alleen een verzameling links die overeenkomen met opgegeven zoektermen. Dit is iets meer dat een aparte overweging verdient. Voer het woord "rusopen" in en klik op de Google Zoeken-knop.

    Bovenaan zien we het totaal aantal resultaten (883.000.000) en de totale zoektijd, namelijk 0,34 seconden.

      In de meeste gevallen wordt het resultaat weergegeven als:
    • paginanaam;
    • pagina beschrijving;
    • Pagina URL;
    • pagina grootte;
    • datum van de laatste indexering van de pagina;

    Google afbeeldingen zoeken

    Met de Google Afbeeldingen-service kunt u verschillende afbeeldingen op internet vinden. Hoewel de afbeeldingen zelf niet kunnen worden geïndexeerd, worden pagina's die deze afbeeldingen bevatten wel geïndexeerd. Voer een beschrijving voor de afbeelding in en u krijgt vele, vele links, evenals de afbeeldingen zelf gepresenteerd als een galerij.

      Voor een efficiëntere zoekactie naar afbeeldingen, moet u de volgende zoekmodifiers gebruiken:
    • intitle: - zoek in de paginatitel;
    • bestandstype: - hiermee kunt u het afbeeldingstype specificeren, u kunt de volgende typen specificeren: JPEG en GIF, niet BMP, PNG, afbeeldingen van andere typen worden niet geïndexeerd;
    • inurl: - zoek naar de opgegeven URL, bijvoorbeeld inurl: www.gidmir.ru;
    • site: zoek op het opgegeven domein of de opgegeven site, bijvoorbeeld site: com.

    Google-services

    Google is een krachtige zoekmachine met meer dan 3 miljard pagina's. Naast gewone webpagina's indexeert Google Word-, Excel-, PowerPoint-, PDF- en RTF-bestanden. Google kan ook worden gebruikt om afbeeldingen en telefoonnummers te zoeken: hiervoor zijn respectievelijk Google Afbeeldingen en Telefoonboek ontworpen. In dit artikel zullen we het hebben over Google Ad Hoc-services.

    Google e-mail

    Probeer e-mail van Google te gebruiken. Opgemerkt moet worden dat dit niet helemaal gewone webmail is.

      Onder de functies van Gmail moeten de volgende worden benadrukt:
    • enorme mailboxgrootte - meer dan 7 GB;
    • in plaats van brieven te verwijderen, kunt u ze archiveren - dan heeft u lang genoeg ruimte en kunt u brieven herstellen die u enkele jaren geleden hebt ontvangen of verzonden;
    • de mogelijkheid om in de mailbox te zoeken met de efficiëntie van Google;
    • handige organisatie van brieven en antwoorden daarop: alle brieven en antwoorden vormen één keten die gemakkelijk te volgen is;
    • goede spambescherming;
    • gedenkwaardig adres [email protected];
    • gebruiksvriendelijke interface.

    Zoekmachine Rambler (Rambler)

    Geschiedenis van Rambler

    Het begon allemaal in 1991 in de stad Pushchino, regio Moskou. In dat verre jaar verzamelde zich een groep gelijkgestemde mensen, waaronder Dmitry Kryukov, Sergey Lysakov, Viktor Voronkov, Vladimir Samoilov, Yuri Ershov. Het gemeenschappelijke belang van deze groep was het internet. Waarschijnlijk had geen van de toekomstige ontwikkelaars van Rambler in 1991 zelfs maar gedacht dat ze de makers zouden worden van een van de grootste en beroemdste zoekmachines op de Runet. Immers, daarvoor dienden ze allemaal radio-apparaten aan het Instituut voor Biochemie en Fysiologie van Micro-organismen van de Russische Academie van Wetenschappen. In 1992 werd het bedrijf "Stack" opgericht, geleid door Sergei Lysakov. Bedrijfsprofiel - lokale netwerken en internet. In feite was het bedrijf "Stack" een internetprovider. Het bedrijf creëerde een intrastedelijk netwerk en verbond vervolgens Pushchino met Moskou, en daardoor - met internet. Dit was trouwens het eerste IP-kanaal dat verder ging dan Moskou. En dit is in 1992! Nu is het leggen van een kanaal behoorlijk problematisch - er zijn altijd veel nuances, en toen moesten de kabels onafhankelijk, handmatig, ondergronds worden gelegd en dit alles werd in de winter gedaan.

    Hoe de Rambler-zoekopdracht werkte

    Het internet evolueert voortdurend: het aantal sites en hun omvang nemen elke dag toe. Stelt u zich eens voor: grote sites worden elke dag bijgewerkt, zelfs als het volume aan updates 1024 bytes (1 KB) is, als we aannemen dat er 10.000 van dergelijke sites zijn, moet de zoekmachine elke dag 10.000 verwerken (indexeren) KB (grofweg 10 MB) informatie. Het getal 10.000 is genomen "van het plafond" - omwille van een voorbeeld. Het kan hoger of lager zijn - zelfs grote sites worden immers niet elke dag bijgewerkt. De upgrade-grootte is ook gekunsteld. Stelt u zich een informatie- en analytische site voor waar bijna elke dag nieuwe artikelen worden gepubliceerd of materialen van andere sites worden herdrukt. In dit geval zal de grootte van de updates verre van 1 KB zijn, maar minstens 10. Voeg aan al dit meer nieuws en andere informatie toe, en het blijkt dat met het aantal bijgewerkte sites 10.000, de zoekmachine 120 zou moeten indexeren MB tekst. En met dit alles moet de zoekmachine niet alleen de zoekresultaten nauwkeurig weergeven, maar dit ook zo snel mogelijk doen, zodat de gebruiker er comfortabel mee kan werken. Wie wil er 10 minuten wachten op zoekresultaten? Ik overdrijf dit natuurlijk, maar persoonlijk zou ik niet langer dan 30 seconden wachten op zoekresultaten (vanaf het moment dat je op de knop Zoeken klikt tot de eerste tien resultaten verschijnen). Het blijkt dat de ontwikkelaars van de zoekmachine constant op het juiste niveau moeten blijven, niet alleen de hardware, die constant groeiende hoeveelheden informatie moet kunnen verwerken, maar je kunt de "wiskunde" ook niet met één strijkijzer nemen. Het is noodzakelijk om de zoekalgoritmen voortdurend te verbeteren, zodat met een toename van het volume van de zoekbasis de zoektijd niet toeneemt (wat een aanzienlijke toename van de tijd betekent - voor de gebruiker is er geen verschil hoe lang de zoekopdracht 2,5 seconden zal duren of 2.0555 seconden, aangezien hij deze tijd niet kan inschatten).

    Rambler-query's, Rambler-syntaxis

    Het verzoek aan Rambler kan bestaan ​​uit een of meer woorden en het verzoek kan leestekens bevatten. Rambler-ontwikkelaars hebben hun zoekmachine ontworpen voor maximaal gebruikersgemak. Rambler kan zelfs worden gebruikt door een onervaren gebruiker die helemaal niet bekend is met de zoektaal. Hij hoefde alleen maar een verzoek in te voeren dat uit meerdere woorden (bijvoorbeeld een woordgroep) en zonder leestekens bestond - Rambler vond zelf de benodigde documenten en deed het zo efficiënt mogelijk. Natuurlijk, als de zoektaal correct werd gebruikt, nam de efficiëntie aanzienlijk toe, maar zelfs met volledige onwetendheid van de zoektaal was de zoekefficiëntie op een hoog niveau. Zoals reeds opgemerkt, is kennis van de zoektaal in uw eigen belang, u kunt de informatie die u nodig heeft gewoon veel sneller vinden.

    Yandex-zoekmachine (Yandex)

    Geschiedenis referentie

    In 1990 begon het bedrijf Arcadia, onder leiding van Arkady Borkovsky en Arkady Volozh, met het ontwikkelen van zoeksoftware. Zes jaar later verscheen de Yandex-website. Maar wat gebeurde er in die zes jaar?

    Twee jaar lang werden twee systemen voor het ophalen van informatie gecreëerd - "Internationale classificatie van uitvindingen" en "classificatie van goederen en diensten". Beide systemen werkten onder DOS en maakten het zoeken naar een woord uit een bepaald woordenboek mogelijk met behulp van logische operatoren.

    Arcadia werd in 1993 een divisie van CompTek. In 1993-1994 zijn de zoektechnologieën aanzienlijk verbeterd, bijvoorbeeld een woordenboek dat zoeken mogelijk maakt, rekening houdend met de morfologie van de Russische taal, nam slechts 300 KB in beslag, wat betekent dat het vrij in het RAM paste, en het werken ermee gebeurde heel snel. Op basis van deze nieuwe technologie werd in 1994 de "Bible Computer Reference" gecreëerd - een systeem voor het ophalen van informatie dat werkt met vertalingen van het Oude en Nieuwe Testament.

    Zoeken in Yandex-taal

    Hoe interpreteert de zoekmachine het woord dat u invoert?

      Nu gaan we het hierover hebben:
    • Regel 1. Het blijkt dat het systeem het interpreteert volgens de regels van de Russische taal. Voorbeeld: als u het woord "auto" invoert, krijgt u ook resultaten met de woorden "auto's", "auto", enz. Evenzo, met werkwoorden - voor de zoekopdracht "go", ontvangt u documenten met de woorden "go", "goes", "liep", "liep", enz. Zoals u kunt zien, is de zoekmachine intelligenter dan u misschien denkt - het is niet alleen een hulpmiddel om een ​​bepaald woord in een database op te zoeken.
    • Regel 2. Bijzondere aandacht wordt besteed aan woorden met een hoofdletter. Als een woord een hoofdletter heeft en niet het eerste woord in een zin is, worden alleen woorden met een hoofdletter gevonden. Anders worden woorden gevonden die zowel met hoofdletters als met kleine letters zijn geschreven. Voorbeeld: op aanvraag "Teckel A." documenten die zowel "taxa" (vergoeding) als "taxa" (achternaam) bevatten, zullen worden gevonden, aangezien het woord "taxa", hoewel het met een hoofdletter is geschreven, het eerst in de zin staat. Maar de zoekopdracht "A. Dachshund" zal documenten vinden die alleen het woord "Dachshund" bevatten, geschreven met een hoofdletter.

    Yandex-syntaxis

    Yandex gebruikt standaard de logische operator AND. Dit betekent dat als u de zoekopdracht "Samsung TV" invoert, u documenten in de resultaten zult ontvangen waarin de woorden "TV" en "Samsung" in dezelfde zin zullen verschijnen. Als je de AND-operator expliciet wilt specificeren, gebruik dan het ampersand-symbool &. Met andere woorden, "Samsung TV" is hetzelfde als "TV & Samsung". U kunt ook de zoekopdracht "TV + Samsung" gebruiken.

    Als u het tegenovergestelde effect wilt, d.w.z. Als u documenten wilt ontvangen die het woord "TV" afzonderlijk en het woord "Samsung" afzonderlijk bevatten, moet u de OR-operator (|) gebruiken, bijvoorbeeld: "TV | Samsung".

    Yandex-querysyntaxis

    Alle woorden in de tekst van een document zijn op volgorde genummerd door Yandex. De afstand tussen aangrenzende woorden is 1 (niet 0!), en de afstand tussen woorden in omgekeerde volgorde is -1. Hetzelfde geldt voor aanbiedingen.

    Om de afstand tussen woorden aan te geven wordt het teken / gezet, direct gevolgd door een cijfer, wat betekent dat dit de afstand tussen woorden is. De zoekopdracht "ontwikkelaar /2 programma's" zal bijvoorbeeld documenten vinden die de woorden "ontwikkelaar" en "programma's" bevatten, en de afstand tussen woorden mag niet meer zijn dan twee woorden, en al deze woorden moeten in één zin staan. In dit geval zullen documenten worden gevonden die "ontwikkelaar van toepassingsprogramma's", "ontwikkelaar van systeemprogramma's" bevatten.

    Als we precies de afstand en woordvolgorde weten, kunnen we de / + n-syntaxis gebruiken. De zoekopdracht "rood /+1 riding hood" zal bijvoorbeeld resulteren in het woord "cap" onmiddellijk na het woord "red". De vraag "roodkapje" zou tot hetzelfde resultaat leiden.

    Yandex-zoekoperators

    Haakjes worden gebruikt om een ​​volledige uitdrukking in een query weer te geven. De zoekopdracht "(geschiedenis | technologieën | programma's)/+1 Linux" zal bijvoorbeeld documenten vinden die een van de termen "Linux-geschiedenis", "Linux-technologieën", "Linux-programma's" bevatten.

    Zones

    Een zone is een plek om de informatie te vinden die je nodig hebt. U kunt de zone specificeren waarin u wilt zoeken - koppen (Titelzone), links (ankers) of adres (Adres). U kunt ook de alle zone gebruiken - zoek door het hele document.

    Syntaxis: $zone_name-query.

    Bijvoorbeeld: verzoek $title "(!LANG:Microsoft" найдет все документы, в заголовках которых встречается точная фраза "Microsoft".!}

    Extra Yandex-zoekopties

    De Google-zoekmachine maakte het mogelijk om de zoeklocatie te beperken tot een specifieke lijst van servers, of juist om bepaalde servers uit te sluiten van de zoeklijst. Er zijn precies dezelfde mogelijkheden in de Yandex-zoekmachine. U kunt ook zoeken naar documenten die verwijzen naar specifieke URL's of afbeeldingen. Wanneer u een bestandsmasker opgeeft (bijvoorbeeld een afbeelding), kunt u het *-teken gebruiken, wat alle tekens betekent, bijvoorbeeld: ”audi-*”.

    De syntaxis is: #element_name=”waarde”.

    Op het wereldwijde internet kunt u informatie vinden over elk interessant onderwerp. Maar het moeilijkste bij het werken met internet is om de informatie te vinden die u nodig hebt. Omdat internet geen duidelijke gecentraliseerde structuur heeft, zich chaotisch ontwikkelt en er steeds meer nieuwe servers in de wereld verschijnen, worden problemen met het zoeken naar informatie zeer relevant.

    Zoekmachines vergemakkelijken het werk op internet enorm en helpen ons snel de informatie te vinden die we nodig hebben in een enorm scala aan internetservers. Er zijn enkele duizenden zoekmachines op het World Wide Web, waaronder zowel bekende als minder bekende.

    Meest populaire zoekmachines

    • Yandex— een hulpmiddel voor het ophalen van volledige tekst van informatie, rekening houdend met de morfologie van de Russische taal; zoeken op sites, uw catalogus, nieuws, producten, kaarten, woordenboeken, blogs, afbeeldingen, Microsoft Office-documenten en Adobe Acrobat PDF
      • Yandex
    • wandelaar(OJSC "Rambler Internet Holding") — zoeken naar sites waarbij rekening wordt gehouden met de morfologie van de Russische en Engelse taal; Het heeft ook een cataloguszoeksysteem.
      • Rambler Lite: zoekmachine- een korte versie van de zoekpagina
    • Zoekservice Spoetnik(JSC "Rostelecom") - zoeken op sites, openbare diensten, enz.; Veilige zoekopdracht
    • NIGMa - intelligente zoekmachine(Lomonosov Moscow State University en Stanford University) — zoek naar documenten, afbeeldingen, boeken, nieuws via Google, Yahoo, MSN, Yandex, Rambler, altavista, Aport; het systeem biedt ook een unieke zoektocht naar chemische formules en reacties
    • Google — zoeken op sites (het is mogelijk om naar sites in het Russisch te zoeken); zoeken naar documenten in Adobe Acrobat PDF, Microsoft Office, PostScript, Corel WordPerfect, Lotus 1-2-3, enz. formaten; zoeken naar afbeeldingen, video's, nieuws, zoeken op kaarten; de mogelijkheid om te zoeken op Russischtalige en Russische sites; er is een systeem om tekst in andere talen te vertalen (49 talen)
    • Bing(Microsoft Corp.) - zoeken naar sites, afbeeldingen en video's; de mogelijkheid om te zoeken op Russischtalige en Russische sites; er is een systeem om tekst in andere talen te vertalen (22 talen)
    • Yahoo!(Yahoo) - zoek naar sites, e-mailadressen, enz.

    Elk van de zoekmachines heeft zijn eigen voor- en nadelen, die worden bepaald door het werkingsprincipe van de zoekmachine, het gebruiksgemak, het ontwerp, de complexiteit van de zoektaal, de aanwezigheid van verschillende geavanceerde functies (besturing van het formaat en rangschikking van uitvoerinformatie, het corrigeren van spelfouten en foutieve toetsenbordindelingen bij het invoeren van trefwoorden, het vertalen van de pagina in andere talen, enz.), werksnelheid en andere parameters. De keuze van een zoekmachine voor een bepaalde toepassing wordt bepaald door het doel van de zoekopdracht, de aard van de gezochte informatie, het gewenste uitvoerformaat en de omvang van de traceerbare serveradressen in de internetwereld.

    Zoeken op sleutelwoorden. Taal voor zoekopdrachten in zoekmachines

    De zoekmachine heeft meestal een veld voor het invoeren van trefwoorden, waarmee het documenten vindt die deze trefwoorden bevatten. Hoe beter (hogere kwaliteit) de zoekopdracht naar de zoekmachine is, hoe lager het totale aantal gevonden documenten, en meer daarvan zijn documenten die overeenkomen met wat u nodig heeft. Als het verzoek heel eenvoudig of analfabeet is, kan de zoekmachine u enkele miljoenen documenten geven die u uw hele leven niet zult doorbladeren.

    Een querytaal gebruiken die logische bewerkingen bevat (logische operatoren) EN, of NIET, haakjes, enz.), voorvoegsels van verplichte aanwezigheid van trefwoorden in het document «+» en «-» (bij het zoeken naar zeer gespecialiseerde termen verdient het de voorkeur deze te gebruiken), de locatie van trefwoorden in een document dichtbij of op een bepaalde afstand, enz.), en andere elementen, en een groter aantal gerelateerde trefwoorden, kunnen de zoekgebied en een beter verzoek op te stellen aan de zoekserver. Houd er rekening mee dat verschillende zoekmachines zowel verschillende zoektalen als zeer vergelijkbare talen kunnen hebben.

    Sommige zoekmachines hebben bovendien een functie geavanceerd zoeken, waardoor de gebruiker nauwkeuriger kan beschrijven wat hij specifiek nodig heeft zonder de zoektaal te kennen. De geavanceerde zoekfunctie is bijvoorbeeld zoekmachines Yandex en Google.

    De belangrijkste soorten zoekmachines. Welke zoekmachine te gebruiken?

    Er zijn 2 hoofdtypen internetzoekmachines: index en classificatie (catalogus). Indexzoekmachines (bijvoorbeeld Yandex, Rambler, Sputnik, Google, Bing, enz.), werken in de automatische modus om hun informatie bij te werken, de inhoud van servers op internet te bekijken, de informatie die erop staat te indexeren en informatie over de locatie van woorden op sitepagina's in hun databases in te voeren. Directory-zoekmachines (bijvoorbeeld Rambler, Yahoo!, enz.) bevatten een thematisch gestructureerde catalogus van servers en worden meestal handmatig aangevuld. Typisch bevat de WWW-pagina van de classificatiezoekmachine ook een veld voor het invoeren van trefwoorden om te zoeken in zijn eigen database. In het cataloguszoeksysteem kunt u, beginnend met een grotere thematische rubriek, en geleidelijk verder afdalend langs de rubrieken, tot een link komen naar de site die u nodig heeft. In sommige gevallen is het handiger om het eerste type zoekmachines te gebruiken, in andere - de tweede. Er zijn zoekmachines die beide werkprincipes combineren. Met name veel indexzoekmachines hebben ook een cataloguszoeksysteem. Zoekmachines kunnen ook enkele andere principes van zoekmethoden gebruiken.

    Veel zoekmachines zijn getransformeerd tot internetportalen die een groot aantal bronnen en diensten combineren. Op de pagina's van dergelijke portals kunt u het nieuws lezen, kennis maken met het tv-programma, meer te weten komen over het weer, wisselkoersen, de kaartenservice gebruiken en meer. anderen

    De meest populaire Russische zoekmachines hebben zoekmogelijkheden die rekening houden met de eigenaardigheden van de Russische taal.

    Om gelijktijdig in meerdere zoekmachines te zoeken, kunt u de zogenaamde zoekmetamachines gebruiken die toegang hebben tot meerdere zoekmachines tegelijk, bijvoorbeeld NIGMa.

    Er zijn ook zoekmachines die gespecialiseerd zijn in het zoeken naar een enkel onderwerp (bijvoorbeeld informatietechnologie, muziek, bronnen, natuur, enz.)

    Er is een soort mensen die er gewoon van houden om veel mooie metaforen te gebruiken. Dit zijn de mensen die het World Wide Web vergelijken met een vuilnisbelt. Alsof op het netwerk alles op een grote hoop wordt gedumpt en de duivel daar een been kan breken. Het lijkt erop dat alles op het web staat, maar om iets te vinden, moet je enorme bergen afval opgraven.

    Nou, dat is een mooie metafoor. Maar dat betekent niet dat ze gelijk heeft. Voor veel mensen ligt er op het eerste gezicht een enorme hoeveelheid nutteloze dingen op tafel. Maar voor die mensen die aan deze tafels werken, leent de ordening van de dingen zich voor een zeer duidelijke logica. De dingen die het vaakst nodig zijn, zoals een theemok, zijn op armlengte afstand. En die dingen die niet altijd nodig zijn, bevinden zich verder. En dit is geenszins een puinhoop of een puinhoop.

    Het internet heeft ook zijn eigen logica. Als je een paar regels kent en ze gebruikt bij het zoeken, dan zal alle informatie van internet als een kopje thee op armlengte zijn en het gevoel dat het web een puinhoop is, zal onmiddellijk verdwijnen.

    In dit artikel zullen we het hebben over zoekmachines en internetzoekregels.

    APPARAAT ZOEKMOTOR

    Om te beginnen - een kleine lyrische uitweiding over de structuur van de zoekmachine. Het is zo ingericht dat de gebruiker alleen de interface van het systeem zelf ziet, dat wil zeggen de zoekbalk, en alles wat zich in het systeem bevindt, blijft daar.

    Het eerste onderdeel van de zoekmachine is de zogenaamde "spin", een zoekrobot. Wat zijn de functies? Hij zwerft over het hele web, bladert op internet - pagina's, bezoekt links. En hij doet het allemaal non-stop. De spin dwaalt niet rond voor zijn eigen plezier. Het voert absoluut alle pagina's in die het heeft bekeken in de index van de zoekmachine. Voert ze in in de vorm van betekenisvolle woorden die op de pagina voorkomen.

    Zo blijkt de index, het tweede onderdeel van de zoekmachine, een enorme database te zijn, met behulp waarvan snel te achterhalen is op welke pagina's op het web het zoekwoord voorkomt. Informatie ter referentie - het volledige volume van de index van de bekende Yandex-zoekmachine is meer dan tachtig gigabyte.

    Het derde onderdeel na de index is de zoekmachine zelf. Het doel is om te zoeken naar de juiste woorden of woordgroepen in de index. Onthoud dat een zoekmachine niet het hele internet doorzoekt - dat doet hij ook niet. Stelt u zich eens voor dat dit waar is: het volledige volume geïndexeerde informatie op Yandex is bijvoorbeeld 269 gigabyte. En als er geen index was na het invoeren van uw zoekopdracht, zou het systeem 260 gigabyte aan informatie moeten downloaden en bekijken. Het is onrealistisch. Bedenk eens hoe lang het duurt om één enkel verzoek te verwerken.

    Uit het feit dat de zoekopdracht niet in het hele Netwerk, maar in de index wordt uitgevoerd, komen twee conclusies naar voren. Ten eerste, als de zoekmachine bepaalde informatie niet heeft gevonden, betekent dit helemaal niet dat deze informatie niet op het web staat, maar niet in de index van deze specifieke zoekmachine. Ten tweede verschillen de systemen voor het ophalen van informatie in het netwerk van elkaar, niet alleen in de interface, maar bijvoorbeeld ook in de index en methoden om deze samen te stellen. Daarom, als u de informatie die u nodig heeft niet in de ene zoekmachine hebt gevonden, moet u deze in een andere zoeken.

    De zoekrobot die de index samenstelt, doorzoekt alle sites in een cirkel en zeer regelmatig - dus de index toont altijd correct de wijzigingen die op de site hebben plaatsgevonden. Sites die zojuist "spin" zijn verschenen, kunnen ze zelf vinden door ze op de link van andere sites te klikken. Ook kunnen site-auteurs de "spin" op de hoogte stellen van hun site.

    Het laatste onderdeel van een zoekmachine is de World Wide Web-server, het gezicht van het systeem. Dit is de interface waarmee gebruikers verzoeken indienen en hierop antwoorden ontvangen. De World Wide Web-server is slechts een onderdeel van het systeem en niet de grootste.

    ZOEK TAAL

    Om met zoekmachines te communiceren, is er een speciale taal en speciale regels. Het zou natuurlijk gewoon fijn zijn als je vraag meteen uitgebreid wordt beantwoord. Maar nu wordt er gewoon aan gewerkt.

    Eerst moet u de zoekwoorden markeren. Het is noodzakelijk om te beslissen welke paar woorden meer volledig zullen karakteriseren wat u zoekt en deze specifieke woorden in te voeren. U zult zeggen dat dit duidelijk is. Jawel. Maar u zult verrast zijn om te weten wat veel mensen in de zoekbalk invoeren.

    Er is iets goeds op Yandex dat "live-uitzending" wordt genoemd. Dit is een pagina waar u de laatste 20 gezochte zinnen of woorden kunt zien. Bekijk deze pagina langer en je zult veel verschillende gevoelens ervaren. Sommige verzoeken kunnen in een apart boek worden vastgelegd - ze zijn zo geweldig. Als je naar sommige verzoeken kijkt, zul je begrijpen dat het absoluut NIET nodig is om op deze manier te zoeken.

    Meestal is een enorm percentage van de verzoeken niet duidelijk: "video", "tv", "download" enzovoort. Aanvragers denken dat het systeem zelf moet raden wat gebruikers ervan willen. Formuleer een zoekopdracht duidelijker, en hoe specifieker deze is, hoe minder onnodige resultaten de zoekmachine zal geven.

    Sommige zoekmachines maken onderscheid tussen dezelfde zoekopdrachten, maar beginnend met een hoofdletter of een kleine letter. Yandex geeft bijvoorbeeld een ander aantal zoekresultaten, terwijl het Google-systeem hoofdletters negeert.

    Met de tekens "+" en "-" kunt u woorden uitsluiten van de zoekopdracht of ze verplicht stellen. In dit geval mag er geen spatie tussen het teken en het woord staan. Deze regel geldt voor alle zoekmachines.

    In deze zoekopdracht zijn we op zoek naar online winkels voor computerapparatuur die niet gespecialiseerd zijn in laptops, en in de volgende naar winkels die dezelfde laptops verkopen.

    Zoals je kunt zien, gaf de zoekmachine echt verschillende resultaten.

    Als in uw zoekopdracht meerdere woorden eenvoudig worden gescheiden door spaties, zoekt de zoekmachine naar die pagina's waarop deze woorden deel uitmaken van één zin. Welnu, als u een document wilt vinden dat een van de woorden bevat die u in de zoekopdracht hebt vermeld, moet u het teken "|" gebruiken.

    Yandex gaf slechts een monsterlijk aantal resultaten, en dat allemaal omdat we nu niet op zoek zijn naar een specifieke zin, maar alle resultaten die een van deze populaire woorden bevatten. Over het algemeen is zo'n zoekopdracht het handigst als er veel woorden van synoniemen zijn.

    Als je stabiele zinnen wilt vinden, typ ze dan tussen aanhalingstekens. Dit kan worden toegepast als u bijvoorbeeld regels zoekt uit enkele literaire werken of citaten.

    Zoals u kunt zien, hebben we na het specificeren van het verzoek en het instrueren van de zoekmachine om specifiek op deze aanbieding te zoeken, al een merkbaar kleiner aantal resultaten ontvangen.

    CONCLUSIE

    Met behulp van alle bovenstaande methoden kunt u gemakkelijk de informatie vinden die u nodig hebt. Gelukkig zijn er genoeg zoekmachines. Er zijn echter een groot aantal taken die zoekmachines niet kunnen uitvoeren.

    Stel je de volgende situatie eens voor: je hebt dringend de beste systeembeheerder van de stad nodig. Hoe ga je het zoeken? U kunt bijvoorbeeld adverteren in de krant en vervolgens een aantal maanden lang veel telefoontjes beantwoorden. Of u kunt naar een gespecialiseerd bureau komen en daar snel een geschikte kandidaat vinden.

    Evenzo, met zoekmachines - ze zijn ontworpen om zoveel mogelijk informatie te dekken. Als u iets speciaals moet vinden, is het logisch om gespecialiseerde zoekmachines te gebruiken die op verschillende gebieden zoeken.

    Tot slot wil ik nog een advies geven. In het kader van dit artikel hebben we u alleen algemene informatie gegeven over het samenstellen van zoekopdrachten. In feite heeft elke zoekmachine zijn eigen geavanceerde zoektaal. Neem de tijd om de mogelijkheden van de zoeksyntaxis van uw favoriete zoekmachine te verkennen. In de toekomst zal dit het zoeken naar de benodigde materialen aanzienlijk vereenvoudigen. Om u te helpen met links naar referentiemateriaal van de twee populairste zoekmachines: