Cerca informazioni utilizzando i motori di ricerca. Per eseguire una ricerca in base alla forma esatta della parola, è necessario inserire un punto esclamativo prima della parola

Ricerca di informazioni su Internet

Ricerca di informazioni su Internet

Per cercare informazioni in uso comune tre modi(Vedi Fig.1). Primo di loro - ricerca per indirizzo. Viene utilizzato quando l'utente conosce l'indirizzo di una risorsa informativa contenente le informazioni di cui ha bisogno. Quando si organizza la ricerca di informazioni per indirizzo (la forma dell'indirizzo - IP, dominio o URL - in questo caso non ha importanza), l'utente deve semplicemente inserire l'indirizzo della risorsa nell'apposito campo del browser - un programma progettato per fornire l'accesso alle risorse di rete.

Riso. 1. Modi per cercare informazioni nei database ipertestuali

Secondo- ricerca utilizzando la navigazione tramite collegamento ipertestuale. Quando si utilizza questo tipo di ricerca, l'utente deve prima accedere al server associato al database corrispondente. È quindi possibile trovare il documento utilizzando i collegamenti ipertestuali. Ovviamente, questo metodo è conveniente quando l'indirizzo della risorsa è sconosciuto all'utente. Per essere utilizzati come punto di partenza per la ricerca nell'implementazione di questo metodo, si intendono i portali Web, server che forniscono l'accesso diretto a un determinato insieme di server, comprese le risorse informative installate su di essi, nonché applicazioni Web che implementano servizi Web corrispondenti al scopo del portale. I server accessibili attraverso il portale possono fare riferimento a un sistema specifico (ad esempio, aziendale) o a sistemi diversi ed essere appositamente selezionati in base alle caratteristiche specifiche, tematiche o di altro tipo dei documenti e dei dati contenuti nei loro siti. Tipicamente, i portali combinano una varietà di funzioni per mantenere il cliente il più a lungo possibile. Il servizio dominante del portale è il servizio di riferimento: ricerca, rubricatori, indici finanziari, informazioni meteo, ecc. Mentre i siti Web sono per lo più raccolte di pagine Web statiche, i portali sono raccolte di strumenti software e informazioni pre-non strutturate che questi strumenti trasformano in dati strutturati su richiesta di utenti specifici.

Il terzo il metodo di ricerca prevede l'utilizzo di server di ricerca su Internet. I server di ricerca sono host dedicati, computer che ospitano database di risorse Internet. L'interfaccia utente di tale server ha un campo per l'immissione di parole chiave che descrivono l'argomento di interesse per l'utente (vedi Fig. 2).

Fig.2. Visualizzazione della finestra del server di ricerca Yandex

Il server percepisce queste parole come una richiesta di informazioni, in base alla quale ricerca le risorse e presenta all'utente un elenco di documenti trovati. Ovviamente, quando si implementa questo metodo, sono possibili errori sia di 1° (bersaglio mancante) che di 2° tipo (rumore di informazione). Va detto che si distinguono due gruppi di server di ricerca: i motori di ricerca e le directory dei soggetti. La loro differenza è dovuta al metodo di creazione e successivo rifornimento del database delle risorse Internet, che questo server esegue il recupero delle informazioni. Quindi, i motori di ricerca incorporano un programma speciale: un robot di ricerca. Monitora costantemente la rete, raccoglie informazioni dalle pagine Web, le indicizza e fissa la loro immagine di ricerca nel suo database. Nei cataloghi tematici, un database di documenti Internet viene formato "manualmente" da editori specializzati. Poiché non esiste un'unica amministrazione su Internet, le sue risorse informative sono in continua evoluzione. Nuovi documenti possono apparire in esso e i documenti esistenti possono scomparire. La frequenza di aggiornamento delle informazioni nei documenti per i diversi siti è diversa: per alcuni è più volte all'ora, per alcuni è una volta al giorno, giorno, mese, ecc. Pertanto, è molto importante capire che quando si utilizzano sistemi di reperimento di informazioni per trovare informazioni su Internet, la ricerca non viene eseguita nello spazio reale dei documenti Web, ma in alcuni modelli il cui contenuto può differire significativamente dal contenuto effettivo di Internet al momento della ricerca. In base al grado di copertura delle risorse indicizzate, i motori di ricerca possono essere divisi in due gruppi: internazionali e in lingua russa. Il primo indicizza di seguito tutti i documenti pubblicati su Internet. Il secondo indicizza le risorse situate in zone di dominio con predominanza della lingua russa. L'elenco dei sistemi più diffusi è riportato nella tabella. uno.

Tab. 1. Motori di ricerca più popolari

Internazionale di lingua russa
Google Yandex (44,4% di Runet)
Yahoo! Rambler (10,6% di Runet)
bing Mail.ru (7,3% di Runet)
msn Nigma (0,5% Runet)
AltaVista Gogo.ru (0,3% Runet)
Chiedere Aport (0,2% Runet)

Nota: Runet è la parte di Internet di lingua russa, che costituisce domini con nomi ru e rf.

Va detto che esiste una categoria speciale di motori di ricerca: i metamotori di ricerca. La loro differenza fondamentale rispetto ai motori di ricerca e ai cataloghi di argomenti è che non dispongono di un proprio database di indici e quindi, alla ricezione di una richiesta dell'utente, la reindirizzano a più server di ricerca contemporaneamente (vedi Fig. 3).

Riso. 3. Lo schema del sistema di metaricerca

La possibilità di utilizzare contemporaneamente più motori di ricerca per una singola richiesta è un ovvio vantaggio dei metamotori di ricerca. Allo stato attuale, il sistema Metabot.ru ha trovato ampia applicazione, la cui interfaccia è mostrata in Fig. 4. Questo sistema consente di utilizzare i server di ricerca internazionali e in lingua russa per cercare risorse.

1. Introduzione

Ogni anno il volume di Internet aumenta molte volte, quindi la probabilità di trovare le informazioni necessarie aumenta notevolmente. Internet unisce milioni di computer, molte reti diverse, il numero di utenti aumenta del 15-80% all'anno. E, tuttavia, sempre più spesso quando si accede a Internet, il problema principale non è la mancanza delle informazioni richieste, ma la capacità di trovarle. Di norma, una persona comune, a causa di varie circostanze, non può o non vuole dedicare più di 15-20 minuti alla ricerca della risposta di cui ha bisogno. Pertanto, è particolarmente importante imparare in modo corretto e competente, sembrerebbe, una cosa semplice: dove e come cercare per ottenere le risposte DESIDERATE.

Per trovare le informazioni di cui hai bisogno, devi trovare il suo indirizzo. Per questo, ci sono server di ricerca specializzati (robot di indicizzazione (motori di ricerca), directory Internet tematiche, sistemi di meta-ricerca, servizi di ricerca di persone, ecc.). Questa master class rivela le principali tecnologie per la ricerca di informazioni su Internet, fornisce caratteristiche comuni degli strumenti di ricerca, esamina la struttura delle query di ricerca per i motori di ricerca in lingua russa e inglese più popolari.

2. Tecnologie di ricerca

Tecnologia Web Il World Wide Web (WWW) è considerato una tecnologia speciale per la preparazione e il posizionamento di documenti su Internet. Il WWW include pagine web, biblioteche elettroniche, cataloghi e persino musei virtuali! Con una tale abbondanza di informazioni, la domanda sorge acuta: "Come navigare in uno spazio informativo così vasto e su larga scala?"
Gli strumenti di ricerca vengono in soccorso per risolvere questo problema.

2.1 Strumenti di ricerca

Gli strumenti di ricerca sono software speciali, il cui scopo principale è fornire la ricerca di informazioni più ottimale e di alta qualità per gli utenti di Internet. Gli strumenti di ricerca sono ospitati su appositi server web, ognuno dei quali svolge una specifica funzione:

  1. Analisi delle pagine Web e immissione dei risultati dell'analisi in uno o nell'altro livello del database del server di ricerca.
  2. Ricerca di informazioni su richiesta dell'utente.
  3. Fornitura di un'interfaccia di facile utilizzo per la ricerca di informazioni e la visualizzazione dei risultati di ricerca da parte dell'utente.

I metodi di lavoro utilizzati quando si lavora con questi o altri strumenti di ricerca sono quasi gli stessi. Prima di procedere alla loro discussione, considera i seguenti concetti:

  1. L'interfaccia dello strumento di ricerca si presenta come una pagina con collegamenti ipertestuali, una stringa di query (stringa di ricerca) e strumenti di attivazione della query.
  2. L'indice dei motori di ricerca è una base informativa contenente il risultato dell'analisi delle pagine web, compilata secondo determinate regole.
  3. Una query è una parola chiave o una frase che l'utente inserisce nella barra di ricerca. I caratteri speciali ("", ~), i simboli matematici (*, +, ?) vengono utilizzati per formare varie query.

Lo schema per la ricerca di informazioni su Internet è semplice. L'utente digita una frase chiave e attiva la ricerca, ricevendo così una selezione di documenti in base alla richiesta formulata (data). Questo elenco di documenti è classificato in base a determinati criteri in modo che in cima all'elenco ci siano i documenti che corrispondono di più alla query dell'utente. Ciascuno degli strumenti di ricerca utilizza criteri diversi per classificare i documenti, sia nell'analisi dei risultati della ricerca che nella formazione dell'indice (riempimento del database degli indici delle pagine web).

Pertanto, se specifichi una query dello stesso design nella stringa di ricerca per ciascuno strumento di ricerca, puoi ottenere risultati di ricerca diversi. Per l'utente, è di grande importanza quali documenti appariranno nelle prime due o tre dozzine di documenti in base ai risultati della ricerca e in che misura questi documenti corrispondano alle aspettative dell'utente.

La maggior parte degli strumenti di ricerca offre due modi per cercare − ricerca semplice(ricerca semplice) e Ricerca Avanzata(ricerca avanzata) con e senza apposito modulo di richiesta. Consideriamo entrambi i tipi di ricerca sull'esempio di un motore di ricerca in lingua inglese.

Ad esempio, AltaVista è utile per query arbitrarie, "Qualcosa sui diplomi online in tecnologia dell'informazione", mentre lo strumento di ricerca di Yahoo ti consente di ottenere notizie dal mondo, informazioni sui tassi di cambio o previsioni del tempo.

Padroneggiare i criteri per perfezionare la query e le tecniche di ricerca avanzate consente di aumentare l'efficienza della ricerca e di trovare rapidamente le informazioni necessarie. Prima di tutto, puoi aumentare l'efficienza della ricerca utilizzando gli operatori logici (operazioni) Or, And, Near, Not, simboli matematici e speciali nelle query. Con l'ausilio di operatori e/o simboli, l'utente collega le parole chiave nella sequenza desiderata in modo da ottenere il risultato di ricerca più appropriato per la query. I moduli di richiesta sono mostrati nella tabella 1.

Tabella 1

Una semplice query fornisce una serie di collegamenti a documenti, perché l'elenco comprende documenti contenenti una delle parole inserite nella richiesta, o una semplice frase (vedi tabella 1). L'operatore e consente di specificare che tutte le parole chiave devono essere incluse nel contenuto del documento. Tuttavia, il numero di documenti potrebbe essere ancora elevato e la revisione degli stessi potrebbe richiedere molto tempo. Pertanto, in alcuni casi è molto più conveniente utilizzare l'operatore di contesto vicino, che indica che le parole devono trovarsi in una distanza sufficiente nel documento. L'utilizzo di Near riduce notevolmente il numero di documenti trovati. La presenza del simbolo "*" nella stringa di query significa che la parola verrà ricercata tramite la sua maschera. Ad esempio, otteniamo un elenco di documenti contenenti parole che iniziano con "gov" se scriviamo "gov*" nella stringa di query. Queste possono essere le parole governo, governatore, ecc.

L'altrettanto popolare motore di ricerca Rambler mantiene le statistiche sulle presenze ai link dal proprio database, gli stessi operatori logici E, OR, NOT, il metacarattere * (simile al carattere * in AltaVista che amplia il range di query), i simboli del coefficiente + e - sono supportato per aumentare o diminuire le parole di significato immesse nella query.

Diamo un'occhiata alle tecnologie di ricerca delle informazioni più popolari su Internet.

2.2 Motori di ricerca

I motori di ricerca Web sono server con un enorme database di URL che accedono automaticamente alle pagine WWW a tutti questi indirizzi, esaminano il contenuto di queste pagine, formano e scrivono parole chiave dalle pagine nel loro database (pagine indice).

Inoltre, i robot dei motori di ricerca seguono i link che incontrano nelle pagine e li reindicizzano. Poiché quasi tutte le pagine WWW hanno molti collegamenti ad altre pagine, con tale lavoro, il motore di ricerca nel risultato finale può teoricamente bypassare tutti i siti su Internet.

È questo tipo di strumenti di ricerca che è il più famoso e popolare tra tutti gli utenti di Internet. Tutti conoscono i nomi di noti motori di ricerca web (motori di ricerca): Yandex, Rambler, Aport.

Per utilizzare questo tipo di strumento di ricerca, devi accedervi e digitare nella barra di ricerca la parola chiave che ti interessa. Successivamente, riceverai un output dai collegamenti memorizzati nel database del motore di ricerca più vicini alla tua query. Per rendere la ricerca più efficace, prestare attenzione ai seguenti punti in anticipo:

  • decidere sull'argomento della richiesta. Cosa cerchi esattamente?
  • prestare attenzione alla lingua, alla grammatica, all'uso di vari caratteri non alfabetici, alla morfologia, è importante anche formulare e inserire correttamente le parole chiave. Ogni motore di ricerca ha la propria modalità di richiesta: il principio è lo stesso, ma i simboli o gli operatori utilizzati possono differire. I moduli di richiesta richiesti variano anche a seconda della complessità del software del motore di ricerca e dei servizi che forniscono. In un modo o nell'altro, ogni motore di ricerca ha una sezione "Aiuto" ("Aiuto"), dove tutte le regole di sintassi, nonché i consigli e i suggerimenti per la ricerca, sono spiegati in modo accessibile (screenshot delle pagine dei motori di ricerca).
  • utilizzare le capacità di diversi motori di ricerca. Se non riesci a trovarlo su Yandex, prova Google. Utilizza servizi di ricerca avanzati.
  • per escludere documenti contenenti determinati termini, utilizzare il segno "-" prima di ciascuna di queste parole. Ad esempio, se desideri informazioni sulle opere di Shakespeare, ad eccezione di "Amleto", inserisci la query nel modulo: "Shakespeare-Hamlet". E per assicurarti che determinati link siano necessariamente inclusi nei risultati della ricerca, usa il simbolo "+". Quindi, per trovare i link sulla vendita di auto in particolare, è necessaria la query "vendita + auto". Per aumentare l'efficienza e la precisione della tua ricerca, usa le combinazioni di questi simboli.
  • ogni collegamento nell'elenco dei risultati della ricerca contiene - diverse righe del documento trovato, tra le quali ci sono le tue parole chiave. Prima di fare clic sul collegamento, valutare la pertinenza dello snippet rispetto all'argomento della richiesta. Dopo aver cliccato sul collegamento a un sito specifico, guarda attentamente la pagina principale. Di norma basta la prima pagina per capire se si è arrivati ​​all'indirizzo oppure no. In caso affermativo, eseguire ulteriori ricerche per le informazioni necessarie sul sito selezionato (nelle sezioni del sito), in caso contrario, tornare ai risultati della ricerca e provare il collegamento successivo.
  • ricorda che i motori di ricerca non producono informazioni indipendenti (tranne che per spiegazioni su se stessi). Il motore di ricerca è solo un intermediario tra il proprietario delle informazioni (sito web) e te. Le banche dati sono costantemente aggiornate, vi vengono inseriti nuovi indirizzi, ma resta ancora il backlog delle informazioni che realmente esistono nel mondo. Semplicemente perché i motori di ricerca non funzionano alla velocità della luce.

I motori di ricerca web più famosi includono Google, Yahoo, Alta Vista, Excite, Hot Bot, Lycos. Tra i russofoni, si possono individuare Yandex, Rambler, Aport.

I motori di ricerca sono i più grandi e preziosi, ma lontani dalle uniche fonti di informazione sul Web, perché ci sono altri modi per cercare in Internet oltre a loro.

2.3 Directory

Il catalogo delle risorse Internet è un catalogo gerarchico costantemente aggiornato e rifornito che contiene molte categorie e singoli server Web con una breve descrizione del loro contenuto.Il metodo di ricerca del catalogo implica “scendere i gradini”, ovvero passare da categorie più generali a più quelli specifici. Uno dei vantaggi delle directory tematiche è che le spiegazioni ai collegamenti sono fornite dai creatori della directory e ne riflettono pienamente il contenuto, ovvero ti dà l'opportunità di determinare con maggiore precisione come il contenuto del server corrisponde allo scopo della tua ricerca.

Un esempio di catalogo tematico in lingua russa è la risorsa http://www.ulitka.ru/.

Nella pagina principale di questo sito è presente un rubricatore tematico,

con l'ausilio del quale l'utente accede alla rubrica con i link ai prodotti di suo interesse.

Inoltre, alcune directory di argomenti consentono di eseguire ricerche per parole chiave. L'utente inserisce la parola chiave desiderata nella barra di ricerca

e riceve un elenco di link con le descrizioni dei siti che più si avvicinano alla sua richiesta. Va notato che questa ricerca non avviene nel contenuto dei server WWW, ma nella loro breve descrizione memorizzata nella directory.

Nel nostro esempio, la directory ha anche la possibilità di ordinare i siti in base al numero di visite, in ordine alfabetico, per data di ingresso.

Altri esempi di directory in lingua russa:
[email protected]
Elenco web
Vsego.ru
Tra le directory in lingua inglese ci sono:
http://www.DMOS.org
http://www.yahoo.com/
http://www.looksmart.com

2.4 Raccolte di link

Le raccolte di collegamenti sono collegamenti ordinati per argomento. Sono abbastanza diversi l'uno dall'altro in termini di contenuto, quindi per trovare una selezione che meglio si adatta ai tuoi interessi, devi esaminarli da solo per formarti la tua opinione.

Ad esempio, forniremo una selezione di collegamenti "Treasures of the Internet" JSC "Relcom"

L'utente, cliccando su una qualsiasi delle sezioni di suo interesse

  • CONTENUTO

    Per gli automobilisti

    • Astronomia e astrologia
    • La tua casa
    • I tuoi animali domestici
    • I bambini sono i fiori della vita
    • Tempo libero
    • Città su Internet
    • Salute e medicina
    • Agenzie e servizi di informazione
    • Museo delle tradizioni locali, ecc.,
    • Elettronica automobilistica.
    • Museo dell'Automobile Antico.
    • Consiglio di Tutela Legale dei Proprietari di Auto.
    • guida sportiva.

    Il vantaggio di questo tipo di strumenti di ricerca è la loro focalizzazione, di solito la selezione include risorse Internet rare, selezionate da uno specifico webmaster o proprietario di una pagina web.

    2.5 Database di indirizzi

    I database di indirizzi sono server di ricerca speciali che di solito utilizzano classificazioni per tipo di attività, per prodotti e servizi forniti e per area geografica. A volte sono integrati da una ricerca alfabetica. I record del database memorizzano informazioni sui siti che forniscono informazioni sull'indirizzo e-mail, l'organizzazione e l'indirizzo postale a pagamento.

    Il più grande database di indirizzi in lingua inglese può essere chiamato: http://www.lookup.com/ -

    Entrando in queste sottodirectory, l'utente trova collegamenti a siti che offrono informazioni di suo interesse.

    I database ampiamente disponibili e ufficiali degli indirizzi nella Federazione Russa ci sono sconosciuti.

    2.6 Ricerca negli archivi Gopher

    Gopher è un sistema interconnesso di server (spazio Gopher) distribuito su Internet.

    La biblioteca letteraria più ricca è raccolta nello spazio Gopher, ma i materiali non sono disponibili per la visualizzazione remota: l'utente può solo visualizzare un sommario organizzato gerarchicamente e selezionare un file per titolo. Con l'aiuto di un programma speciale (Veronica), tale ricerca può essere eseguita automaticamente utilizzando query basate su parole chiave.

    Fino al 1995, Gopher era la tecnologia Internet più dinamica: il tasso di crescita del numero di server correlati superava il tasso di crescita dei server di tutti gli altri tipi di Internet. Nella rete EUnet/Relcom, i server Gopher non hanno ricevuto uno sviluppo attivo e oggi quasi nessuno li ricorda.

    2.7 Sistema di ricerca file FTP (ricerca FTP)

    Un motore di ricerca file FTP è un tipo speciale di motore di ricerca Internet che consente di trovare file disponibili su server FTP "anonimi". Il protocollo FTP è progettato per trasferire file su una rete e, in questo senso, è funzionalmente una sorta di analogo di Gopher.

    Il principale criterio di ricerca è il nome del file specificato in vari modi (corrispondenza esatta, sottostringa, espressione regolare, ecc.). Questo tipo di ricerca, ovviamente, non può competere con i motori di ricerca in termini di capacità, poiché i contenuti dei file non vengono presi in considerazione in alcun modo durante la ricerca e ai file, come sapete, possono essere assegnati nomi arbitrari. Tuttavia, se hai bisogno di trovare qualche programma noto o una descrizione standard, allora con un alto grado di probabilità il file che lo contiene avrà il nome appropriato e puoi trovarlo utilizzando uno dei server di ricerca FTP:

    FileSearch ricerca i file sui server FTP in base ai nomi dei file stessi e delle directory. Se stai cercando un programma o qualcos'altro, molto probabilmente troverai la loro descrizione sui server WWW e dai server FTP puoi scaricarli da te.

    2.8 Motore di ricerca nelle conferenze di notizie Usenet

    USENET NEWS è il sistema di teleconferenza della comunità Internet. In Occidente, questo servizio si chiama notizie. Un analogo stretto della teleconferenza sono i cosiddetti "echi" nella rete FIDO.

    Dal punto di vista di un abbonato alla teleconferenza, USENET è una bacheca con sezioni in cui puoi trovare articoli su tutto, dalla politica al giardinaggio. Questa bacheca è accessibile tramite un computer, simile alla posta elettronica. Senza lasciare il computer, puoi leggere o pubblicare articoli in una particolare conferenza, trovare consigli utili o partecipare a discussioni. Naturalmente, gli articoli occupano spazio sui computer, quindi non vengono archiviati per sempre, ma vengono periodicamente distrutti, facendo spazio a nuovi. In tutto il mondo, il miglior servizio per trovare informazioni nelle conferenze Usenet è il server di Google Gruppi (Google Inc.).

    Google Gruppi è una comunità online gratuita e un servizio di gruppi di discussione che offre il più grande archivio di messaggi Usenet su Internet (più di un miliardo di messaggi). Per ulteriori informazioni sui termini di utilizzo del servizio, visitare http://groups. google.com/intl/ru /googlegroups/tour/index.html

    Tra i russofoni spiccano il server USENET World System e le teleconferenze Relcom. Proprio come in altri servizi di ricerca, l'utente digita una stringa di query e il server genera un elenco di conferenze contenente parole chiave. Successivamente, è necessario iscriversi alle conferenze selezionate nel programma di notizie. Esiste anche un server FidoNet online russo simile: le conferenze Fido sul WWW.

    2.9 Sistemi di meta-ricerca

    Per una rapida ricerca nei database di più motori di ricerca contemporaneamente, è meglio ricorrere a sistemi di meta-ricerca.

    I meta motori di ricerca sono motori di ricerca che inviano la tua query a un numero enorme di motori di ricerca diversi, quindi elaborano i risultati, rimuovono gli indirizzi di risorse duplicati e presentano una gamma più ampia di ciò che viene presentato su Internet.

    Il metamotore di ricerca più famoso al mondo è Search.com.

    Motore di ricerca unificato Search.com di CNET, Inc. include quasi due dozzine di motori di ricerca, i cui collegamenti sono pieni dell'intera Internet.

    Utilizzando questo tipo di strumenti di ricerca, l'utente può cercare informazioni in una varietà di motori di ricerca, ma il lato negativo di questi sistemi può essere definito la loro instabilità.

    2.10 Sistemi di ricerca di persone

    I sistemi di ricerca di persone sono server speciali che consentono di cercare persone su Internet, l'utente può specificare il nome completo. persona e ottenere il suo indirizzo e-mail e URL. Tuttavia, va notato che i motori di ricerca delle persone generalmente prendono informazioni sugli indirizzi e-mail da fonti aperte, come i forum Usenet. Tra i più famosi sistemi di ricerca di persone ci sono:

    Trovare indirizzi e-mail

    in appositi campi di ricerca per le informazioni di contatto (Nome. Città, Cognome, Numero di telefono), puoi trovare le informazioni che ti interessano.

    I motori di ricerca delle persone sono server davvero grandi, i loro database contengono circa 6.000.000 di indirizzi.

    3. Conclusione

    Abbiamo esaminato le principali tecnologie per la ricerca di informazioni su Internet e presentato in termini generali gli strumenti di ricerca attualmente esistenti su Internet, nonché la struttura delle query di ricerca per i motori di ricerca in lingua russa e inglese più popolari e, riassumendo quanto sopra, vogliamo notare che non esiste un unico schema ottimale per la ricerca di informazioni su Internet. A seconda delle informazioni specifiche di cui hai bisogno, puoi utilizzare gli strumenti e i servizi di ricerca appropriati. E la qualità dei risultati di ricerca dipende dalla competenza con cui vengono selezionati i servizi di ricerca.

  • Trovare le giuste informazioni su Internet è spesso piuttosto difficile. Internet si sta sviluppando in modo caotico, non ha una struttura ben definita. Nessuno può garantire che su un dominio ci siano solo informazioni di un determinato argomento e sull'altro informazioni di un argomento diverso, ma anche chiaramente definito. Ad esempio, sui domini .com puoi trovare non solo informazioni commerciali, ma, ad esempio, documentazione varia su prodotti software o anche battute.

    Se la struttura del dominio fosse simile alla struttura delle directory, ad esempio, nel dominio ru.comp.os.linux (come nel sistema di notizie) ci sarebbero tutte le informazioni sul sistema operativo Linux in russo e qualche organizzazione di moderatore si assicurerebbe che in altri domini non pubblicassero informazioni su Linux, quindi la ricerca sarebbe molto più semplice. Dopotutto, sapremmo dove cercare. Apri un browser, inserisci ru.comp.os.linux e ottieni... milioni di collegamenti diversi ad articoli, documenti HOWTO e altre informazioni relative a Linux in un modo o nell'altro.

    Prestazioni di ricerca

      Il rendimento della ricerca dipende da molti fattori:
    • Dalle informazioni stesse: possono esserci molte informazioni su un argomento, ma poche su un altro. A volte puoi trovare molte informazioni su un determinato argomento, ma l'efficienza di questa ricerca sarà vicina allo 0,0% e puoi trovare solo 3-4 link, e questo sarà proprio quello di cui hai bisogno. Ciò include anche la capacità del webmaster di inviare correttamente le informazioni in modo che i motori di ricerca stessi possano trovarle. Supponiamo che da qualche parte molto lontano ci siano le informazioni di cui hai bisogno, ma il motore di ricerca non ne sa nulla. Forse l'informazione è stata appena pubblicata, o solo il webmaster che ha pubblicato l'informazione non sospetta nemmeno l'esistenza dei motori di ricerca. Stai cercando informazioni utilizzando un motore di ricerca. Se lei non "conosce" le informazioni di cui hai bisogno, quindi non saprai nulla nemmeno di lei.
    • Dal motore di ricerca - ci sono molti motori di ricerca e sono tutti diversi. Anche se sono dello stesso tipo (parleremo dei tipi di motori di ricerca poco dopo), ovviamente ognuno di essi avrà il proprio algoritmo. Se non riesci a trovare informazioni con un motore di ricerca, prova a cercarle con un altro. Non rimanere bloccato su un motore di ricerca, non importa quanto ti piaccia.
    • Molto dipende dalla capacità di utilizzare un motore di ricerca: come sai come utilizzare un motore di ricerca. Se non sai come utilizzare un motore di ricerca, è improbabile che la tua ricerca sia efficace.

    Come cercare informazioni

    Poiché molto spesso non selezioni il sito di cui hai bisogno dalla directory del motore di ricerca, ma inserisci una parola chiave specifica (o più parole chiave), è necessario specificare questa stessa parola chiave nel modo più specifico possibile. Più precisamente definisci l'oggetto della ricerca, più accurato sarà il risultato. Il motore di ricerca non può indovinare i tuoi pensieri, devi indicargli chiaramente cosa stai cercando.

    Ogni motore di ricerca ha la sua sintassi che devi conoscere. Questo capitolo descriverà la sintassi dei motori di ricerca Google, Yandex e Rambler. Se desideri utilizzare un altro motore di ricerca, puoi trovare la sua sintassi sul proprio sito Web (di solito è descritto in dettaglio).

    Motori di ricerca su Internet

    Ora parliamo dei motori di ricerca stessi.

    Sul territorio dell'ex CSI, i seguenti motori di ricerca sono i più popolari, secondo SpyLog (Openstat):

    • 1. Yandex (www.yandex.ru);
    • 2. Google (www.google.com);
    • 3. [email protected] (go.mail.ru);
    • 3. Rambler (www.rambler.ru);
    • 5 Yahoo! (www.yahoo.com);
    • 6. AltaVista (www.altavista.com);
    • 7. Bing (www.bing.com).

    I motori di ricerca sono elencati in ordine decrescente di popolarità. Come puoi vedere, il nostro motore di ricerca più popolare è Yandex.

    Tipi di motori di ricerca

      Esistono due tipi principali di motori di ricerca:
    • indice - Google, AltaVista, Rambler, HotBot, Yandex, ecc.;
    • classificazione (catalogo) - Rambler, Yahoo! e così via.

    Non sorprenderti se il motore di ricerca Rambler è elencato due volte: era sia indice che classificazione allo stesso tempo. Su questo torneremo più avanti, ma per ora parliamo delle differenze tra questi due sistemi.

    Come funziona un motore di ricerca per indici? Il motore di ricerca lancia un apposito programma che scansiona i contenuti dei web server, indicizzando le informazioni: inserisce le parole chiave di una determinata pagina web nel suo database, alcune informazioni dalla pagina web.

    Una breve storia di Google

    Cominciamo dal nome. Google è una versione leggermente modificata della parola googol (spesso chiamata "Google" per un motivo). A sua volta, questa parola è stata introdotta da Milton Sirota, nipote del famoso matematico Edward Kasner, e poi è stata resa popolare nel libro di Kasner e Newman Mathematics and Imagination. La parola "googol" mostra il numero come uno 1 seguito da 100 zeri. Il nome "Google" riflette un tentativo di organizzare la grande quantità di informazioni sul Web.

    Quindi, cominciamo proprio dall'inizio. I futuri sviluppatori di Google Sergey Brin e Larry Page si sono incontrati nel 1999 alla Stanford University. Poi Larry aveva 24 anni e Sergey - 23. Larry a quel tempo era uno studente all'Università del Michigan e venne a Stanford per alcuni giorni. Sergei era in un gruppo di studenti che avrebbero dovuto far conoscere agli ospiti l'università. Dal primo incontro, Sergey e Larry, per usare un eufemismo, non si sono piaciuti: hanno discusso su tutto ciò di cui si potrebbe discutere. Anche se alla fine questa si è rivelata una cosa positiva, dal momento che le loro diverse opinioni hanno portato alla creazione di un algoritmo per risolvere uno dei problemi informatici più urgenti: trovare le informazioni giuste tra un'enorme quantità di dati. Nel gennaio 1996, Larry e Sergey hanno iniziato a lavorare sul motore di ricerca BackRub, che avrebbe dovuto analizzare i link "indietro" che puntavano a questo sito web. Il lavoro su questo server è stato svolto in una costante mancanza di fondi - dopotutto, a quel tempo Sergey e Larry erano studenti laureati dell'università - tu stesso capisci che gli studenti laureati non hanno molti soldi. A proposito, era la prima volta che Larry prendeva parte a un progetto così serio, e prima di allora era impegnato in tutti i tipi di progetti "frivoli", anche a volte aneddotici, ad esempio costruì una stampante funzionante da un costruttore Lego.

    Algoritmi di ricerca di Google

    L'interfaccia di Google colpisce per la sua semplicità: un campo di input e due pulsanti. Come si suol dire, tutto ciò che è geniale è semplice.

    Sintassi speciale (estesa) di Google

    Oltre agli operatori logici, Google ti fornisce i modificatori di ricerca elencati nella tabella. I modificatori di ricerca sono chiamati sintassi speciale di Google. Prendi sul serio questa tabella: una volta che proverai a cercare qualcosa usando i modificatori, non li rifiuterai.

    Modificatore inurl di Google

    Il modificatore inurl viene utilizzato per cercare l'URL specificato. E a differenza del modificatore del sito, che consente di cercare informazioni su un solo sito o dominio, il modificatore inurl consente di cercare informazioni nelle sottodirectory del sito, ad esempio:

    inurl: siteskype-zvonim-free

    Il modificatore inurl consente di utilizzare il carattere * per specificare un dominio, ad esempio:
    inurl: "*.redhat.com"

    È meglio usare inurl con il sito. La seguente query cercherà informazioni nel dominio gidmir.ru, su tutti i suoi sottodomini ad eccezione di www:
    sito: gidmir.ru inurl: "*.gidmir" -inurl: "www.gidmir.ru"

    Lingua di ricerca di Google

    Google consente una sintassi mista, ad es. una sintassi che utilizza diversi modificatori di ricerca speciali in una query. Questo ti permette di ottenere il miglior risultato.

    Ecco l'esempio più semplice di sintassi mista:
    sito: ru inurl: disco

    In questo caso, la ricerca verrà eseguita sui siti di dominio e l'URL deve contenere la parola disco.

    Ecco un altro esempio:
    sito: ru -inurl: org.ua

    La ricerca verrà effettuata sui siti del dominio ru, ma i risultati della ricerca non conterranno pagine che si trovano su org.ua.

    Termini di ricerca su Google

    Per la maggior parte degli utenti ordinari di Google, il limite di 10 parole chiave non è evidente. Ma gli amanti delle query lunghe, probabilmente hanno notato che Google tiene conto solo delle prime 10 parole chiave e tutto il resto viene semplicemente ignorato.

    Perché cercare frasi lunghe? Nella maggior parte dei casi si tratta di estratti di opere. Supponiamo di cercare l'opera "Maestro e Margherita". Va notato che la frase chiave dovrebbe assomigliare a "Maestro Margarita", poiché le parole e, o, e, di, o, I, a, the e alcune altre vengono ignorate dal motore di ricerca. Se vuoi forzare l'inclusione di una di queste parole nella tua ricerca, fai precedere la parola con un segno "+", ad esempio +il.

    Il superamento del limite di 10 parole consente la corretta costruzione della query. I seguenti consigli ti aiuteranno non solo a ridurre la lunghezza della query, ma anche a migliorare l'efficienza della tua ricerca in generale.

    Ricerca Google avanzata

    Digitiamo nella riga di input del browser l'indirizzo - www.google.ru/advanced_search e andiamo alla ricerca avanzata di Google.

    Con la ricerca avanzata, puoi cercare informazioni in modo flessibile quasi quanto con i modificatori di ricerca. Perché "quasi"? L'interfaccia di ricerca avanzata non fornisce l'accesso a tutti i modificatori di ricerca.

    Impostazione delle proprietà di ricerca di Google nei cookie del browser

    Non voglio disturbarti con i dettagli tecnici, quindi ti dirò brevemente cosa sono i Cookie e non, con cosa non vengono mangiati, ma come devono essere lavorati.

    Immagina di avere il seguente compito: dobbiamo scrivere un rapporto di visita individuale per ogni cliente del sito web della nostra azienda. Cioè, in modo che l'utente non veda il numero totale di visite, sappia quante volte è stato sul nostro sito. Per ogni indirizzo IP, dobbiamo conservare i record in una tabella, che probabilmente sarà grande, e da ciò ne consegue che stiamo usando irrazionalmente il tempo del processore e lo spazio su disco. Sarebbe molto più corretto da parte nostra utilizzare questo spazio con maggiore beneficio.

    Risultato di ricerca di Google

    Un risultato di ricerca di Google non è solo una raccolta di link che corrispondono a termini di ricerca specificati. Questo è qualcosa di più che merita una considerazione separata. Inserisci la parola "rusopen" e fai clic sul pulsante Ricerca Google.

    In alto, vediamo il numero totale di risultati (883.000.000) e il tempo totale impiegato dalla ricerca, ovvero 0,34 secondi.

      Nella maggior parte dei casi, il risultato si presenta come:
    • nome della pagina;
    • descrizione della pagina;
    • URL della pagina;
    • dimensioni della pagina;
    • data dell'ultima indicizzazione della pagina;

    Ricerca immagini di Google

    Il servizio Google Immagini ti permette di trovare diverse immagini sul web. Sebbene le immagini stesse non possano essere indicizzate, le pagine che contengono tali immagini vengono indicizzate. Inserisci una descrizione per l'immagine e otterrai molti, molti collegamenti, oltre alle immagini stesse presentate come una galleria.

      Per una ricerca di immagini più efficiente, è necessario utilizzare i seguenti modificatori di ricerca:
    • intitle: - cerca nel titolo della pagina;
    • filetype: - permette di specificare il tipo di immagine, è possibile specificare i seguenti tipi: JPEG e GIF, non BMP, PNG, le immagini di altri tipi non sono indicizzate;
    • inurl: - cerca l'URL specificato, ad esempio inurl: www.gidmir.ru ;
    • site: ricerca nel dominio o nel sito specificato, ad esempio site: com.

    Servizi Google

    Google è un potente motore di ricerca con oltre 3 miliardi di pagine. Oltre alle normali pagine Web, Google indicizza file Word, Excel, PowerPoint, PDF e RTF. Google può essere utilizzato anche per cercare immagini e numeri di telefono: Google Immagini e Rubrica sono progettati rispettivamente per questo. In questo articolo parleremo dei Servizi Ad Hoc di Google.

    E-mail di Google

    Prova a utilizzare la posta di Google. Va notato che questa non è una webmail del tutto normale.

      Tra le funzionalità di Gmail, vanno evidenziate le seguenti:
    • enorme dimensione della casella di posta - più di 7 GB;
    • invece di eliminare le lettere, puoi archiviarle, quindi avrai spazio sufficiente per molto tempo e sarai in grado di ripristinare le lettere che sono state ricevute o inviate da te diversi anni fa;
    • la possibilità di effettuare ricerche nella casella di posta con l'efficienza di Google;
    • comoda organizzazione di lettere e risposte: tutte le lettere e le risposte formano un'unica catena facile da rintracciare;
    • buona protezione antispam;
    • indirizzo memorabile [email protected];
    • interfaccia intuitiva.

    Motore di ricerca Rambler (Rambler)

    Storia di Rambler

    Tutto è iniziato nel 1991 nella città di Pushchino, nella regione di Mosca. In quell'anno lontano si riunì un gruppo di persone che la pensano allo stesso modo, tra cui Dmitry Kryukov, Sergey Lysakov, Viktor Voronkov, Vladimir Samoilov, Yuri Ershov. L'interesse comune di questo gruppo era Internet. Probabilmente, nel 1991, nessuno dei futuri sviluppatori di Rambler immaginava che sarebbero diventati i creatori di uno dei più grandi e famosi motori di ricerca su Runet. Dopotutto, prima di allora, tutti servivano dispositivi radio presso l'Istituto di biochimica e fisiologia dei microrganismi dell'Accademia delle scienze russa. Nel 1992 è stata creata la società "Stack", guidata da Sergei Lysakov. Profilo aziendale - reti locali e Internet. In effetti, la società "Stack" era un provider Internet. L'azienda ha creato una rete intracity, quindi ha collegato Pushchino a Mosca e, attraverso di essa, a Internet. A proposito, questo è stato il primo canale IP che è andato oltre Mosca. E questo è nel 1992! Ora la posa di un canale è piuttosto problematica: ci sono sempre molte sfumature, quindi i cavi dovevano essere posati indipendentemente, manualmente, sottoterra, e tutto questo veniva fatto in inverno.

    Come ha funzionato la ricerca di Rambler

    Internet è in continua evoluzione: il numero dei siti e le loro dimensioni aumentano ogni giorno. Dopotutto, immagina: i siti di grandi dimensioni vengono aggiornati ogni giorno, anche se il volume degli aggiornamenti è di 1024 byte (1 KB), quindi se assumiamo che ci siano 10.000 di questi siti, ogni giorno il motore di ricerca deve elaborare (indicizzare) 10.000 Informazioni KB (approssimativamente, 10 MB). Il numero 10.000 è preso "dal soffitto" - per esempio. Può essere superiore o inferiore: dopotutto, anche i siti di grandi dimensioni non vengono aggiornati ogni giorno. Anche la dimensione dell'aggiornamento è artificiosa. Immagina un sito di informazioni e analisi in cui nuovi articoli vengono pubblicati quasi ogni giorno o materiali vengono ristampati da altri siti. In questo caso, la dimensione degli aggiornamenti sarà lontana da 1 KB, ma almeno 10. A tutto questo si aggiungono altre notizie e altre informazioni, e si scopre che con il numero di siti aggiornati 10.000, il motore di ricerca dovrebbe indicizzare 120 MB di testo. E con tutto ciò, il motore di ricerca non dovrebbe solo visualizzare accuratamente i risultati della ricerca, ma anche farlo il più rapidamente possibile in modo che l'utente si senta a proprio agio nel lavorarci. Chi vuole aspettare 10 minuti per i risultati della ricerca? Sto esagerando, ovviamente, ma personalmente non aspetterei più di 30 secondi per i risultati della ricerca (dal momento in cui fai clic sul pulsante Trova fino alla comparsa dei primi dieci risultati). Si scopre che gli sviluppatori del motore di ricerca devono mantenere costantemente al giusto livello non solo l'hardware, che deve essere in grado di elaborare quantità di informazioni in costante crescita, ma non puoi nemmeno prendere la "matematica" con un ferro da stiro. È necessario migliorare costantemente gli algoritmi di ricerca in modo che con un aumento del volume della base di ricerca, il tempo di ricerca non aumenti (il che significa un aumento significativo del tempo - per l'utente non c'è differenza per quanto tempo la ricerca sarà di 2,5 secondi o 2,0555 secondi, poiché non è in grado di stimare questo tempo).

    Query Rambler, sintassi Rambler

    La richiesta a Rambler potrebbe consistere in una o più parole e la richiesta potrebbe contenere segni di punteggiatura. Gli sviluppatori di Rambler hanno progettato il loro motore di ricerca per la massima comodità dell'utente. Rambler potrebbe essere utilizzato anche da un utente inesperto che non ha alcuna familiarità con il linguaggio di query. Tutto quello che doveva fare era inserire una richiesta composta da più parole (ad esempio una frase) e senza segni di punteggiatura: lo stesso Rambler ha trovato i documenti necessari e lo ha fatto nel modo più efficiente possibile. Naturalmente, se il linguaggio di query è stato utilizzato correttamente, l'efficienza è aumentata in modo significativo, ma anche con la completa ignoranza del linguaggio di query, l'efficienza della ricerca è stata di alto livello. Come già notato, la conoscenza del linguaggio di query è nel tuo interesse, puoi semplicemente trovare le informazioni di cui hai bisogno molto più velocemente.

    Motore di ricerca Yandex (Yandex)

    Riferimento storico

    Nel 1990, la società Arcadia, guidata da Arkady Borkovsky e Arkady Volozh, iniziò a sviluppare software di ricerca. Sei anni dopo, è apparso il sito Web Yandex. Ma cosa è successo in quei sei anni?

    Per due anni sono stati creati due sistemi di recupero delle informazioni: "Classificazione internazionale delle invenzioni" e "Classificatore di beni e servizi". Entrambi i sistemi funzionavano sotto DOS e consentivano la ricerca di una parola da un determinato dizionario utilizzando operatori logici.

    Arcadia è diventata una divisione di CompTek nel 1993. Nel periodo 1993-1994, le tecnologie di ricerca sono migliorate in modo significativo, ad esempio un dizionario che fornisce ricerche tenendo conto della morfologia della lingua russa occupava solo 300 KB, il che significa che si adattava liberamente alla RAM e lavorava con esso molto rapidamente. Sulla base di questa nuova tecnologia, nel 1994, è stato creato il "Bible Computer Reference", un sistema di recupero delle informazioni che funziona con le traduzioni dell'Antico e del Nuovo Testamento.

    Ricerca lingua Yandex

    Come interpreterà il motore di ricerca la parola inserita?

      Ora parleremo di questo:
    • Regola 1. Si scopre che il sistema lo interpreta secondo le regole della lingua russa. Esempio: se inserisci la parola "auto", otterrai anche risultati contenenti le parole "auto", "auto", ecc. Allo stesso modo, con i verbi - per la query "go", riceverai documenti contenenti le parole "go", "goes", "walked", "walked", ecc. Come puoi vedere, il motore di ricerca è più intelligente di quanto potresti pensare: non è solo uno strumento per cercare una parola particolare in un database.
    • Regola 2. Particolare attenzione è riservata alle parole in maiuscolo. Se una parola è in maiuscolo e non è la prima parola di una frase, verranno trovate solo le parole in maiuscolo. In caso contrario, verranno trovate le parole scritte sia con lettere maiuscole che minuscole. Esempio: su richiesta "Basso A." si troveranno documenti contenenti sia "taxa" (quota) che "taxa" (cognome), poiché la parola "taxa" pur essendo in maiuscolo, è al primo posto nella frase. Ma la query "A. Dachshund" troverà documenti contenenti solo la parola "Dachshund", scritta con la lettera maiuscola.

    Sintassi Yandex

    Per impostazione predefinita, Yandex utilizza l'operatore logico AND.Ciò significa che se inserisci la query "Samsung TV", riceverai documenti nei risultati in cui le parole "TV" e "Samsung" appariranno nella stessa frase. Se si desidera specificare l'operatore AND in modo esplicito, utilizzare il simbolo e commerciale &. In altre parole, "Samsung TV" è lo stesso di "TV e Samsung". Puoi anche utilizzare la query "TV + Samsung".

    Se vuoi l'effetto opposto, cioè Se desideri ottenere documenti che contengono la parola "TV" separatamente e la parola "Samsung" separatamente, devi utilizzare l'operatore OR (|), ad esempio: "TV | Samsung".

    Sintassi della query Yandex

    Tutte le parole nel testo di un documento sono numerate da Yandex in ordine. La distanza tra parole adiacenti è 1 (non 0!) e la distanza tra parole in ordine inverso è -1. Lo stesso vale per le offerte.

    Per indicare la distanza tra le parole, viene inserito il segno /, seguito immediatamente da un numero, il che significa che questa è la distanza tra le parole. Ad esempio, la query "sviluppatore /2 programmi" troverà documenti che contengono le parole "sviluppatore" e "programmi" e la distanza tra le parole non dovrebbe essere superiore a due parole e tutte queste parole dovrebbero essere in una frase. In questo caso verranno trovati documenti contenenti "sviluppatore di programmi applicativi", "sviluppatore di programmi di sistema", ecc.

    Se conosciamo esattamente la distanza e l'ordine delle parole, possiamo usare la sintassi / + n. Ad esempio, la query "red /+1 riding hood" risulterà nella parola "cap" immediatamente dopo la parola "red". La query "cappuccetto rosso" porterebbe allo stesso risultato.

    Operatori di ricerca Yandex

    Le parentesi vengono utilizzate per rappresentare un'intera espressione in una query. Ad esempio, la query "(cronologia | tecnologie | programmi)/+1 Linux" troverà documenti contenenti una delle frasi "Cronologia Linux", "Tecnologie Linux", "Programmi Linux".

    Zone

    Una zona è un luogo in cui trovare le informazioni di cui hai bisogno. È possibile specificare la zona in cui si desidera effettuare la ricerca: intestazioni (zona titolo), collegamenti (ancoraggi) o indirizzo (indirizzo). Puoi anche utilizzare la zona tutto: cerca nell'intero documento.

    Sintassi: query $nome_zona.

    Ad esempio: request $title "(!LANG:Microsoft" найдет все документы, в заголовках которых встречается точная фраза "Microsoft".!}

    Opzioni di ricerca Yandex aggiuntive

    Il motore di ricerca Google ha consentito di limitare il percorso di ricerca a un elenco specifico di server o, al contrario, di escludere determinati server dall'elenco di ricerca. Ci sono esattamente le stesse opportunità nel motore di ricerca Yandex. Puoi anche cercare documenti che rimandano a URL o immagini specifici. Quando si specifica una maschera di file (ad esempio un'immagine), è possibile utilizzare il carattere *, che indica tutti i caratteri, ad esempio: ”audi-*”.

    La sintassi è: #nome_elemento="valore".

    In Internet globale, puoi trovare informazioni su qualsiasi argomento di interesse. Ma la cosa più difficile nel lavorare con Internet è trovare le informazioni di cui hai bisogno. Poiché Internet non ha una chiara struttura centralizzata, si sviluppa in modo caotico e nel mondo compaiono sempre più nuovi server, i problemi di ricerca delle informazioni diventano molto rilevanti.

    I motori di ricerca facilitano notevolmente il lavoro su Internet e ci aiutano a trovare rapidamente le informazioni di cui abbiamo bisogno in una vasta gamma di server Internet. Ci sono diverse migliaia di motori di ricerca sul World Wide Web, tra i quali ci sono sia quelli consolidati che quelli meno conosciuti.

    I motori di ricerca più diffusi

    • Yandex— uno strumento per il reperimento di informazioni full-text, tenendo conto della morfologia della lingua russa; ricerca su siti, catalogo, notizie, prodotti, mappe, dizionari, blog, immagini, documenti di Microsoft Office e Adobe Acrobat PDF
      • Yandex
    • Rambler(OJSC "Rambler Internet Holding") — ricerca nel sito tenendo conto della morfologia delle lingue russa e inglese; Ha anche un sistema di ricerca nel catalogo.
      • Rambler Lite: motore di ricerca- una versione breve della pagina di ricerca
    • Servizio di ricerca Sputnik(JSC "Rostelecom") - ricerca su siti, servizi pubblici, ecc.; Ricerca sicura
    • NIGMa - motore di ricerca intelligente(Lomonosov Moscow State University e Stanford University) — ricerca di documenti, immagini, libri, notizie tramite Google, Yahoo, MSN, Yandex, Rambler, altavista, Aport; il sistema fornisce anche una ricerca unica di formule e reazioni chimiche
    • Google — ricerca per siti (è possibile cercare siti in lingua russa); cercare documenti nei formati Adobe Acrobat PDF, Microsoft Office, PostScript, Corel WordPerfect, Lotus 1-2-3, ecc.; ricerca di immagini, video, notizie, ricerca su mappa; la possibilità di cercare su siti in lingua russa e russi; esiste un sistema per tradurre il testo in altre lingue (49 lingue)
    • bing(Microsoft Corp.) - ricerca di siti, immagini e video; la possibilità di cercare su siti in lingua russa e russi; esiste un sistema per tradurre il testo in altre lingue (22 lingue)
    • Yahoo!(Yahoo) - cerca siti, indirizzi e-mail, ecc.

    Ciascuno dei motori di ricerca ha i suoi vantaggi e svantaggi, che sono determinati dal principio di funzionamento del motore di ricerca, dalla facilità d'uso, dal suo design, dalla complessità del linguaggio di query, dalla presenza di varie funzioni avanzate (controllo del formato e classificazione delle informazioni di output, correzione di errori di ortografia e layout errati della tastiera durante l'immissione di parole chiave, traduzione della pagina in altre lingue, ecc.), velocità di lavoro e altri parametri. La scelta del motore di ricerca per una particolare applicazione è determinata dallo scopo della ricerca, dalla natura delle informazioni ricercate, dal formato di output desiderato e dall'ampiezza degli indirizzi dei server tracciabili nel mondo di Internet.

    Ricerca per parole chiave. Linguaggio di query dei motori di ricerca

    Il motore di ricerca di solito ha un campo per l'immissione di parole chiave, tramite il quale trova i documenti contenenti queste parole chiave. Migliore (qualità superiore) è la query al motore di ricerca, minore è il numero totale di documenti trovati e più di questi sono documenti che corrispondono a ciò di cui hai bisogno. Se la richiesta è molto semplice o analfabeta, il motore di ricerca può fornirti diversi milioni di documenti che non guarderai per tutta la vita.

    Utilizzo di un linguaggio di query contenente operazioni logiche (operatori logici E, o NON, parentesi quadre, ecc.), prefissi di presenza obbligatoria di parole chiave nel documento «+» e «-» (quando si ricercano termini altamente specializzati, è preferibile utilizzarlo), la posizione delle parole chiave in un documento vicino o a una certa distanza, ecc.), e altri elementi, e un numero maggiore di parole chiave correlate, possono restringere significativamente il area di ricerca e comporre meglio la richiesta al server di ricerca. Va tenuto presente che diversi motori di ricerca possono avere sia linguaggi di query diversi che molto simili.

    Alcuni motori di ricerca hanno anche una funzione Ricerca Avanzata, consentendo all'utente di descrivere in modo più accurato ciò di cui ha specificamente bisogno senza conoscere il linguaggio di query. La funzione di ricerca avanzata è, ad esempio, i motori di ricerca Yandex e Google.

    I principali tipi di motori di ricerca. Quale motore di ricerca utilizzare

    Esistono 2 tipi principali di motori di ricerca su Internet: indice e classificazione (catalogo). Motori di ricerca per indici (ad esempio Yandex, Rambler, Sputnik, Google, Bing, ecc.), operando in modalità automatica aggiornando le proprie informazioni, visualizzando i contenuti dei server su Internet, indicizzando le informazioni in essi contenute e inserendo nei loro database le informazioni sulla posizione delle parole nelle pagine del sito. I motori di ricerca delle directory (ad esempio Rambler, Yahoo!, ecc.) contengono un catalogo di server strutturato in modo tematico e il più delle volte vengono riforniti manualmente. Tipicamente, la pagina WWW del motore di ricerca di classificazione contiene anche un campo per l'inserimento di parole chiave per la ricerca nel proprio database. Nel sistema di ricerca del catalogo, puoi iniziare con un'intestazione tematica più ampia e scendere gradualmente più in basso lungo le intestazioni, per arrivare al collegamento al sito di cui hai bisogno. In alcuni casi è più conveniente utilizzare il primo tipo di motori di ricerca, in altri il secondo. Esistono motori di ricerca che combinano entrambi i principi di lavoro. In particolare, molti motori di ricerca per indici dispongono anche di un sistema di ricerca per catalogo. Inoltre, i motori di ricerca possono utilizzare alcuni altri principi dei metodi di ricerca.

    Molti motori di ricerca si sono trasformati in portali Internet che combinano un gran numero di risorse e servizi. Sulle pagine di tali portali è possibile leggere le notizie, conoscere il programma TV, conoscere il tempo, i tassi di cambio, utilizzare il servizio di mappatura e altro ancora. altri

    I motori di ricerca russi più popolari hanno capacità di ricerca che tengono conto delle peculiarità della lingua russa.

    Per cercare contemporaneamente in più motori di ricerca, è possibile utilizzare le cosiddette metamacchine di ricerca che accedono a più motori di ricerca contemporaneamente, ad esempio NIGMa.

    Esistono anche motori di ricerca specializzati nella ricerca di un singolo argomento (ad esempio informatica, musica, risorse, natura, ecc.)

    C'è un tipo di persone che amano usare molte belle metafore. Queste sono le persone che paragonano il World Wide Web a una discarica. Come se in rete tutto venisse scaricato in un grande mucchio e lì il diavolo potesse rompersi una gamba. Sembra che tutto sia sul web, ma per trovare qualcosa devi scavare enormi montagne di spazzatura.

    Bene, questa è una bella metafora. Ma questo non significa che abbia ragione. Per molte persone, a prima vista, un'enorme quantità di cose inutili è ammucchiata sul tavolo. Ma per chi lavora a questi tavoli, la disposizione delle cose si presta a una logica ben precisa. Quelle cose che sono necessarie più spesso, come una tazza da tè, sono a portata di mano. E quelle cose che non sono sempre necessarie si trovano più lontano. E questo non è affatto una discarica o un pasticcio.

    Anche Internet ha una sua logica. Se conosci alcune regole e le usi durante la ricerca, qualsiasi informazione da Internet sarà come una tazza di tè a portata di mano e la sensazione che il Web sia una discarica scomparirà immediatamente.

    In questo articolo parleremo di motori di ricerca e regole di ricerca su Internet.

    DISPOSITIVO MOTORE DI RICERCA

    Per cominciare - una piccola digressione lirica sulla struttura del motore di ricerca. È organizzato in modo che l'utente veda solo l'interfaccia del sistema stesso, ovvero la barra di ricerca, e tutto ciò che è all'interno del sistema rimane lì.

    Il primo componente del motore di ricerca è il cosiddetto "spider", un robot di ricerca. Quali sono le sue funzioni? Vaga per tutto il Web, navigando in Internet - pagine, visitando collegamenti. E fa tutto senza sosta. Il ragno non vaga per il proprio piacere. Inserisce assolutamente tutte le pagine che ha visualizzato nell'indice del motore di ricerca. Le inserisce sotto forma di parole significative che compaiono sulla pagina.

    Pertanto, si scopre che l'indice, il secondo componente del motore di ricerca, è un enorme database, con l'aiuto del quale è possibile scoprire rapidamente su quali pagine del Web si trova la parola di ricerca. Informazioni di riferimento: l'intero volume dell'indice del noto motore di ricerca Yandex è di oltre ottanta gigabyte.

    Il terzo componente dopo l'indice è il motore di ricerca stesso. Il suo scopo è cercare le parole o le frasi giuste nell'indice. Ricorda che un motore di ricerca non effettua ricerche in tutto Internet, ma non lo fa. Immagina che sia vero: ad esempio, l'intero volume di informazioni indicizzate su Yandex è di 269 gigabyte. E se non ci fosse un indice dopo aver inserito la tua richiesta, il sistema dovrebbe scaricare e visualizzare 260 gigabyte di informazioni. Non è realistico. Pensa quanto tempo ci vorrà per elaborare una singola richiesta.

    A seguito del fatto che la ricerca viene effettuata non nell'intera Rete, ma nell'indice, emergono due conclusioni. In primo luogo, se il motore di ricerca non ha trovato alcune informazioni, ciò non significa affatto che queste informazioni non siano sul Web, non siano nell'indice di questo particolare motore di ricerca. In secondo luogo, i sistemi di recupero delle informazioni nella rete differiscono l'uno dall'altro non solo nell'interfaccia, ma anche, ad esempio, nell'indice e nei metodi di compilazione. Pertanto, se non hai trovato le informazioni di cui hai bisogno in un motore di ricerca, devi cercarle in un altro.

    Il robot di ricerca che compila l'indice esegue la scansione di tutti i siti in un cerchio e molto regolarmente, quindi l'indice mostra sempre correttamente le modifiche che si sono verificate sul sito. I siti che sono appena apparsi "ragno" possono trovarsi da soli, colpendoli sul collegamento di altri siti. Inoltre, gli autori del sito possono informare il "ragno" del loro sito.

    L'ultimo componente di un motore di ricerca è il suo server World Wide Web, che è la faccia del sistema. Questa è l'interfaccia attraverso la quale gli utenti effettuano richieste e ricevono risposte ad esse. Il server World Wide Web è solo una parte del sistema e non il più grande.

    CERCA LINGUA

    Per comunicare con i motori di ricerca, c'è un linguaggio speciale e regole speciali. Naturalmente, sarebbe semplicemente fantastico se alla tua domanda ricevesse immediatamente una risposta esauriente. Ma in questo momento, si sta solo lavorando.

    Per prima cosa devi evidenziare le parole chiave. È necessario decidere quali poche parole caratterizzeranno in modo più completo ciò che stai cercando e inserire queste parole particolari. Dirai che questo è ovvio. Sì. Ma sarai sorpreso di sapere cosa inseriscono molte persone nella barra di ricerca.

    C'è una cosa buona su Yandex chiamata "trasmissione in diretta". Questa è una pagina in cui puoi vedere le ultime 20 frasi o parole cercate. Guarda questa pagina più a lungo e sperimenterai molte sensazioni diverse. Alcune richieste possono essere registrate in un libro separato: sono così sorprendenti. Guardando alcune richieste, capirai che NON è assolutamente necessario cercare in questo modo.

    Solitamente un'enorme percentuale di richieste non porta alcuna chiarezza: "video", "tv", "download" e così via. I richiedenti pensano che il sistema stesso dovrebbe indovinare ciò che gli utenti vogliono da esso. Crea una query di ricerca in modo più chiaro e più è specifica, meno risultati non necessari verranno forniti dal motore di ricerca.

    Alcuni motori di ricerca distinguono tra le stesse query, ma iniziano con una lettera maiuscola o minuscola. Ad esempio, Yandex fornirà un numero diverso di risultati di ricerca, mentre il sistema di Google ignora le maiuscole e minuscole.

    Utilizzando i segni "+" e "-", puoi escludere le parole dalla ricerca o renderle obbligatorie. In questo caso, non dovrebbe esserci uno spazio tra il segno e la parola. Questa regola si applica a tutti i motori di ricerca.

    In questa query, stiamo cercando negozi di apparecchiature informatiche online che non sono specializzati in laptop e in quello successivo, al contrario, quei negozi che vendono questi stessi laptop.

    Come puoi vedere, il motore di ricerca ha dato risultati davvero diversi.

    Se nella tua richiesta più parole sono semplicemente separate da spazi, il motore di ricerca cercherà quelle pagine in cui queste parole fanno parte di una frase. Bene, se vuoi trovare un documento che contenga una delle parole che hai elencato nella query, devi usare il segno "|".

    Yandex ha fornito solo un numero mostruoso di risultati, e tutto perché ora non stiamo cercando una frase specifica, ma tutti i risultati contenenti una di queste parole popolari. In generale, una query del genere è più conveniente se sono presenti molte parole di sinonimi.

    Se vuoi trovare frasi stabili, inseriscile tra virgolette. Questo può essere applicato se, ad esempio, stai cercando versi da alcune opere letterarie o citazioni.

    Come puoi vedere, dopo aver specificato la richiesta e aver incaricato il motore di ricerca di cercare specificamente questa offerta, abbiamo già ricevuto un numero di risultati notevolmente inferiore.

    CONCLUSIONE

    Utilizzando tutti i metodi di cui sopra, puoi trovare facilmente le informazioni di cui hai bisogno. Fortunatamente, ci sono abbastanza motori di ricerca. Tuttavia, ci sono un numero enorme di attività che i motori di ricerca non possono eseguire.

    Immaginiamo la seguente situazione: hai urgente bisogno del miglior amministratore di sistema della città. Come lo cercherai? Ad esempio, puoi fare pubblicità sul giornale e poi rispondere a molte telefonate per diversi mesi. Oppure puoi rivolgerti a un'agenzia specializzata e trovare rapidamente un candidato adatto.

    Allo stesso modo, con i motori di ricerca, sono progettati per coprire quante più informazioni possibili. Se hai bisogno di trovare qualcosa di speciale, allora ha senso utilizzare motori di ricerca specializzati che effettuano ricerche in varie aree.

    In conclusione, vorrei dare un consiglio. Nell'ambito di questo articolo, abbiamo fornito solo informazioni generali sulla compilazione delle query di ricerca. Ogni motore di ricerca dispone infatti di un proprio linguaggio di query avanzato. Prenditi il ​​tempo per esplorare le possibilità della sintassi delle query del tuo motore di ricerca preferito. In futuro, ciò semplificherà notevolmente la ricerca dei materiali necessari. Per aiutarti a linkare i materiali di riferimento dei due motori di ricerca più popolari: