جستجوی اطلاعات با استفاده از موتورهای جستجو برای جستجو بر اساس شکل دقیق کلمه، قبل از کلمه یک علامت تعجب قرار دهید.

جستجوی اطلاعات در اینترنت

جستجوی اطلاعات در اینترنت

برای جستجوی اطلاعاتدر معمولا استفاده می شود سه راه(شکل 1 را ببینید). اولیناز آنها - جستجو بر اساس آدرس. زمانی استفاده می شود که کاربر آدرس یک منبع اطلاعاتی حاوی اطلاعات مورد نیاز خود را بداند. هنگام سازماندهی جستجوی اطلاعات بر اساس آدرس (شکل آدرس - IP، دامنه یا URL - در این مورد مهم نیست)، کاربر فقط باید آدرس منبع را در قسمت مناسب مرورگر وارد کند - یک برنامه طراحی شده برای دسترسی به منابع شبکه.

برنج. 1. راه های جستجوی اطلاعات در پایگاه داده های فرامتن

دومین- جستجو با استفاده از ناوبری هایپرلینک. هنگام استفاده از این نوع جستجو، کاربر ابتدا باید به سرور مرتبط با پایگاه داده مربوطه دسترسی داشته باشد. سپس می توانید سند را با استفاده از لینک ها پیدا کنید. بدیهی است که این روش زمانی راحت است که آدرس منبع برای کاربر ناشناخته باشد. برای استفاده به عنوان نقطه شروع برای جستجو در هنگام اجرای این روش، پورتال های وب در نظر گرفته شده اند - سرورهایی که دسترسی مستقیم به مجموعه خاصی از سرورها، از جمله منابع اطلاعاتی نصب شده بر روی آنها، و همچنین برنامه های کاربردی وب که خدمات وب را مطابق با هدف از پورتال سرورهای قابل دسترسی از طریق پورتال ممکن است به یک سیستم خاص (مثلاً شرکتی) یا سیستم‌های مختلف اشاره داشته باشند و به طور خاص با توجه به ویژگی‌های خاص، موضوعی یا سایر ویژگی‌های اسناد و داده‌های موجود در سایت‌هایشان انتخاب شوند. به طور معمول، پورتال ها عملکردهای مختلفی را با هم ترکیب می کنند تا مشتری را تا زمانی که ممکن است حفظ کنند. سرویس غالب پورتال سرویس مرجع است: جستجو، روبراتورها، شاخص های مالی، اطلاعات آب و هوا و غیره. در حالی که وب سایت ها عمدتاً مجموعه ای از صفحات وب ثابت هستند، پورتال ها مجموعه ای از ابزارهای نرم افزاری و اطلاعات از پیش ساختاریافته هستند که این ابزارها به درخواست کاربران خاص به داده های ساختاریافته تبدیل می شوند.

سومینروش جستجو شامل استفاده از سرورهای جستجوی اینترنتی است. سرورهای جستجو میزبان های اختصاصی هستند - رایانه هایی که پایگاه های داده منابع اینترنتی را میزبانی می کنند. رابط کاربری چنین سروری دارای یک فیلد برای وارد کردن کلمات کلیدی است که موضوع مورد علاقه کاربر را توصیف می کند (شکل 2 را ببینید).

شکل 2. نمای پنجره سرور جستجوی Yandex

سرور این کلمات را به عنوان یک درخواست اطلاعاتی درک می کند که مطابق آن منابع را جستجو می کند و لیستی از اسناد پیدا شده را به کاربر ارائه می دهد. بدیهی است که هنگام اجرای این روش، خطاهای هر دو نوع اول (از دست دادن هدف) و نوع دوم (نویز اطلاعات) امکان پذیر است. لازم به ذکر است که دو گروه از سرورهای جستجوگر متمایز می شوند: موتورهای جستجو و دایرکتوری موضوعی. تفاوت آنها به دلیل روش ایجاد و تکمیل مجدد پایگاه داده منابع اینترنتی است که این سرور بازیابی اطلاعات را انجام می دهد. بنابراین، موتورهای جستجو در ترکیب خود یک برنامه ویژه دارند - یک ربات جستجو. دائماً شبکه را رصد می کند، اطلاعات صفحات وب را جمع آوری می کند، آنها را فهرست می کند و تصویر جستجوی آنها را در پایگاه داده خود اصلاح می کند. در کاتالوگ های موضوعی، پایگاه داده ای از اسناد اینترنتی به صورت "دستی" توسط ویراستاران متخصص تشکیل می شود. از آنجایی که هیچ اداره واحدی در اینترنت وجود ندارد، منابع اطلاعاتی آن به طور مداوم در حال تغییر است. اسناد جدید می توانند در آن ظاهر شوند و اسناد موجود می توانند ناپدید شوند. دفعات به روز رسانی اطلاعات در اسناد برای سایت های مختلف متفاوت است: برای برخی چندین بار در ساعت، برای برخی یک بار در روز، روز، ماه و غیره است. بنابراین، درک این نکته بسیار مهم است که هنگام استفاده از سیستم‌های بازیابی اطلاعات برای یافتن اطلاعات در اینترنت، جستجو نه در فضای واقعی اسناد وب، بلکه در برخی مدل‌ها انجام می‌شود که محتوای آن ممکن است به طور قابل‌توجهی با محتوای آن متفاوت باشد. محتوای واقعی اینترنت در زمان جستجو با توجه به میزان پوشش منابع نمایه شده، موتورهای جستجو را می توان به دو گروه بین المللی و روسی زبان تقسیم کرد. اولی تمام اسناد منتشر شده در اینترنت را در یک ردیف فهرست می کند. دوم منابع واقع در مناطق دامنه با غالب زبان روسی را نمایه می کند. لیست محبوب ترین سیستم ها در جدول آورده شده است. یکی

برگه 1. محبوب ترین موتورهای جستجو

بین المللی روسی زبانان
گوگل Yandex (44.4٪ از Runet)
یاهو Rambler (10.6٪ از Runet)
بینگ Mail.ru (7.3٪ از Runet)
msn Nigma (0.5% Runet)
AltaVista Gogo.ru (0.3٪ Runet)
پرسیدن Aport (0.2% Runet)

توجه: Runet بخش روسی زبان اینترنت است که دامنه هایی را با نام تشکیل می دهد ru و rf.

لازم به ذکر است که دسته خاصی از موتورهای جستجو وجود دارد - موتورهای متاجستجو. تفاوت اساسی آنها با موتورهای جستجو و کاتالوگ های موضوعی این است که پایگاه داده فهرست خود را ندارند، و بنابراین، پس از دریافت درخواست کاربر، آن را به طور همزمان به چندین سرور جستجو هدایت می کنند (شکل 3 را ببینید).

برنج. 3. طرح سیستم فراجستجو

توانایی استفاده همزمان از چندین موتور جستجو برای یک درخواست، مزیت آشکار موتورهای متاجستجو است. در حال حاضر، سیستم Metabot.ru کاربرد گسترده ای پیدا کرده است که رابط کاربری آن در شکل نشان داده شده است. 4. این سیستم به شما امکان می دهد از سرورهای جستجوی بین المللی و روسی زبان برای جستجوی منابع استفاده کنید.

1. معرفی

هر ساله حجم اینترنت چندین برابر می شود، بنابراین احتمال یافتن اطلاعات لازم به طور چشمگیری افزایش می یابد. اینترنت میلیون ها کامپیوتر، بسیاری از شبکه های مختلف را متحد می کند، تعداد کاربران سالانه 15-80٪ افزایش می یابد. و با این وجود، بیشتر و بیشتر هنگام دسترسی به اینترنت، مشکل اصلی کمبود اطلاعات مورد نیاز نیست، بلکه توانایی یافتن آن است. به عنوان یک قاعده، یک فرد عادی، به دلیل شرایط مختلف، نمی تواند یا نمی خواهد بیش از 15-20 دقیقه را صرف جستجوی پاسخ مورد نیاز خود کند. بنابراین ، به نظر می رسد یادگیری صحیح و شایسته یک چیز ساده بسیار مهم است - کجا و چگونه برای دریافت پاسخ های مورد نظر جستجو کنید.

برای یافتن اطلاعات مورد نیاز، باید آدرس آن را پیدا کنید. برای این کار، سرورهای جستجوی تخصصی (روبات های شاخص (موتورهای جستجو)، فهرست های اینترنتی موضوعی، سیستم های متا جستجو، خدمات جستجوی افراد و غیره وجود دارد. این کلاس کارشناسی ارشد فناوری های اصلی جستجوی اطلاعات در اینترنت را نشان می دهد، ویژگی های مشترک ابزارهای جستجو را ارائه می دهد، ساختار جستجوهای جستجو را برای محبوب ترین موتورهای جستجوی روسی و انگلیسی زبان بررسی می کند.

2. فن آوری های جستجو

وب فناوری وب جهانی وب (WWW) یک فناوری ویژه برای تهیه و قرار دادن اسناد در اینترنت در نظر گرفته می شود. WWW شامل صفحات وب، کتابخانه های الکترونیکی، کاتالوگ ها و حتی موزه های مجازی است! با چنین فراوانی اطلاعات، این سوال به شدت مطرح می شود: "چگونه در چنین فضای اطلاعاتی عظیم و بزرگی حرکت کنیم؟"
ابزارهای جستجو در حل این مشکل به کمک می آیند.

2.1 ابزارهای جستجو

ابزارهای جستجو نرم افزارهای ویژه ای هستند که هدف اصلی آن ارائه بهینه ترین و باکیفیت ترین جستجوی اطلاعات برای کاربران اینترنت است. ابزارهای جستجو بر روی وب سرورهای خاصی میزبانی می شوند که هر کدام عملکرد خاصی را انجام می دهند:

  1. تجزیه و تحلیل صفحات وب و وارد کردن نتایج تجزیه و تحلیل به یک سطح از پایگاه داده سرور جستجو.
  2. جستجوی اطلاعات به درخواست کاربر
  3. ارائه یک رابط کاربر پسند برای جستجوی اطلاعات و مشاهده نتیجه جستجو توسط کاربر.

روش های کار مورد استفاده در هنگام کار با این یا سایر ابزارهای جستجو تقریباً یکسان است. قبل از شروع به بحث در مورد آنها، مفاهیم زیر را در نظر بگیرید:

  1. رابط ابزار جستجو به صورت صفحه ای با لینک ها، رشته پرس و جو (رشته جستجو) و ابزارهای فعال سازی پرس و جو ارائه می شود.
  2. فهرست موتور جستجو یک پایگاه اطلاعاتی است که حاوی نتایج تجزیه و تحلیل صفحات وب است که طبق قوانین خاصی گردآوری شده است.
  3. پرس و جو کلمه یا عبارتی کلیدی است که کاربر در نوار جستجو وارد می کند. کاراکترهای ویژه (""، ~)، نمادهای ریاضی (*، +، ?) برای تشکیل پرس و جوهای مختلف استفاده می شود.

طرح جستجوی اطلاعات در اینترنت ساده است. کاربر یک عبارت کلیدی را تایپ می کند و جستجو را فعال می کند، در نتیجه مجموعه ای از اسناد را مطابق درخواست فرموله شده (داده شده) دریافت می کند. این فهرست اسناد بر اساس معیارهای خاصی رتبه بندی می شود به طوری که در بالای لیست آن دسته از اسنادی قرار می گیرند که بیشترین مطابقت را با درخواست کاربر دارند. هر یک از ابزارهای جستجو از معیارهای مختلفی برای رتبه بندی اسناد استفاده می کنند، هم در تجزیه و تحلیل نتایج جستجو و هم در شکل گیری شاخص (پر کردن پایگاه داده فهرست صفحات وب).

بنابراین، اگر برای هر ابزار جستجو یک پرس و جو با طرح یکسان در رشته جستجو مشخص کنید، می توانید نتایج جستجوی متفاوتی دریافت کنید. برای کاربر، این مهم است که کدام اسناد در دو یا سه ده سند اول با توجه به نتایج جستجو ظاهر می شوند و تا چه اندازه این اسناد با انتظارات کاربر مطابقت دارد.

اکثر ابزارهای جستجو دو راه را برای جستجو ارائه می دهند - جستجوی ساده(جستجوی ساده) و جستجوی پیشرفته(جستجوی پیشرفته) با و بدون فرم درخواست خاص. بیایید هر دو نوع جستجو را به عنوان مثال یک موتور جستجوی انگلیسی زبان در نظر بگیریم.

به عنوان مثال، AltaVista برای سوالات دلخواه، "چیزی در مورد مدرک آنلاین در فناوری اطلاعات" مفید است، در حالی که ابزار جستجوی یاهو به شما امکان می دهد اخبار جهان، اطلاعات نرخ ارز یا پیش بینی آب و هوا را دریافت کنید.

تسلط بر معیارهای اصلاح پرس و جو و تکنیک های جستجوی پیشرفته به شما امکان می دهد کارایی جستجو را افزایش دهید و به سرعت اطلاعات لازم را پیدا کنید. اول از همه، می توانید با استفاده از عملگرهای منطقی (عملیات) یا، And، Near، Not، ریاضی و نمادهای خاص در کوئری ها، کارایی جستجو را افزایش دهید. با کمک عملگرها و / یا نمادها، کاربر کلمات کلیدی را به ترتیب دلخواه پیوند می دهد تا مناسب ترین نتیجه جستجو را برای پرس و جو به دست آورد. فرم های درخواست در جدول 1 نشان داده شده است.

میز 1

یک پرس و جو ساده تعدادی پیوند به اسناد می دهد، زیرا این فهرست شامل اسنادی است که شامل یکی از کلمات وارد شده در درخواست یا یک عبارت ساده است (جدول 1 را ببینید). عملگر و به شما امکان می دهد تعیین کنید که همه کلمات کلیدی باید در محتوای سند گنجانده شوند. با این حال، ممکن است تعداد اسناد همچنان زیاد باشد و بررسی آنها زمان زیادی طول بکشد. بنابراین، در برخی موارد استفاده از عملگر زمینه نزدیک بسیار راحت تر است، که نشان می دهد کلمات باید در مجاورت کافی در سند قرار گیرند. استفاده از نزدیک تعداد اسناد یافت شده را تا حد زیادی کاهش می دهد. وجود علامت "*" در رشته پرس و جو به این معنی است که کلمه با ماسک آن جستجو می شود. به عنوان مثال، بیایید لیستی از اسناد حاوی کلماتی که با "gov" شروع می شوند را دریافت کنیم اگر در رشته query "gov*" بنویسیم. اینها می توانند کلمات دولت، فرماندار و غیره باشند.

موتور جستجوی به همان اندازه محبوب Rambler آمار ترافیک پیوندها را از پایگاه داده خود، همان عملگرهای منطقی AND، OR، NOT، متاکاراکتر * (شبیه به کاراکتر * در AltaVista که محدوده پرس و جو را گسترش می دهد)، نمادهای ضرایب + و - را حفظ می کند. برای افزایش یا کاهش اهمیت کلمات وارد شده در پرس و جو پشتیبانی می شود.

بیایید به محبوب ترین فناوری های جستجوی اطلاعات در اینترنت نگاه کنیم.

2.2 موتورهای جستجو

موتورهای جستجوی وب سرورهایی با پایگاه داده عظیمی از URL ها هستند که به طور خودکار به صفحات WWW در تمام این آدرس ها دسترسی پیدا می کنند، محتویات این صفحات را بررسی می کنند، کلمات کلیدی را از صفحات در پایگاه داده خود (صفحات فهرست) تشکیل می دهند و می نویسند.

علاوه بر این، ربات‌های موتورهای جستجو، پیوندهایی را که در صفحات با آن‌ها مواجه می‌شوند، دنبال می‌کنند و دوباره آن‌ها را فهرست می‌کنند. از آنجایی که تقریباً هر صفحه WWW پیوندهای زیادی به صفحات دیگر دارد، با چنین کاری، موتور جستجو در نتیجه نهایی می تواند از نظر تئوری همه سایت های موجود در اینترنت را دور بزند.

این نوع از ابزارهای جستجو هستند که در بین تمام کاربران اینترنت مشهورترین و محبوب ترین هستند. همه نام موتورهای جستجوی وب معروف (موتورهای جستجو) - Yandex، Rambler، Aport را می دانند.

برای استفاده از این نوع ابزار جستجو، باید به آن بروید و کلمه کلیدی مورد نظر خود را در نوار جستجو تایپ کنید. در مرحله بعد، یک خروجی از پیوندهای ذخیره شده در پایگاه داده موتور جستجو دریافت خواهید کرد که نزدیکترین آنها به درخواست شما هستند. برای اینکه جستجو موثرتر باشد، از قبل به نکات زیر توجه کنید:

  • در مورد موضوع درخواست تصمیم بگیرید دقیقا به دنبال چه چیزی می گردید؟
  • به زبان، گرامر، استفاده از حروف غیر الفبایی مختلف، ریخت شناسی توجه کنید همچنین فرمول بندی و وارد کردن صحیح کلمات کلیدی مهم است. هر موتور جستجو فرم خاص خود را برای درخواست دارد - اصل یکسان است، اما نمادها یا عملگرهای مورد استفاده ممکن است متفاوت باشند. فرم های درخواست مورد نیاز نیز بسته به پیچیدگی نرم افزار موتور جستجو و خدماتی که ارائه می دهند متفاوت است. به هر حال، هر موتور جستجو دارای یک بخش "Help" ("Help") است که در آن تمام قوانین نحوی و همچنین توصیه ها و نکاتی برای جستجو به روشی قابل دسترس توضیح داده شده است (عکس از صفحات موتور جستجو).
  • از قابلیت های موتورهای جستجوی مختلف استفاده کنید. اگر نتوانستید آن را در Yandex پیدا کنید، گوگل را امتحان کنید. از خدمات جستجوی پیشرفته استفاده کنید.
  • برای حذف اسناد حاوی عبارات خاص، قبل از هر کلمه از علامت "-" استفاده کنید. به عنوان مثال، اگر اطلاعاتی در مورد آثار شکسپیر، به استثنای «هملت» می‌خواهید، سؤال را به شکل: «Shakespeare-Hamlet» وارد کنید. و برای اطمینان از اینکه پیوندهای خاصی لزوماً در نتایج جستجو گنجانده شده اند، از نماد "+" استفاده کنید. بنابراین، برای یافتن پیوندهایی در مورد فروش خودرو به طور خاص، به عبارت "فروش + خودرو" نیاز دارید. برای افزایش کارایی و دقت جستجوی خود، از ترکیب این نمادها استفاده کنید.
  • هر پیوند در لیست نتایج جستجو شامل چندین خط از سند یافت شده است که در میان آنها کلمات کلیدی شما وجود دارد. قبل از کلیک بر روی پیوند، ارتباط قطعه را با موضوع درخواست ارزیابی کنید. پس از کلیک بر روی لینک یک سایت خاص، صفحه اصلی را با دقت نگاه کنید. به عنوان یک قاعده، صفحه اول برای درک اینکه آیا به آدرس آمده اید یا نه کافی است. اگر بله، جستجوهای بیشتری را برای اطلاعات لازم در سایت انتخاب شده (در بخش‌های سایت) انجام دهید، اگر نه، به نتایج جستجو برگردید و پیوند بعدی را امتحان کنید.
  • به یاد داشته باشید که موتورهای جستجو اطلاعات مستقلی تولید نمی کنند (به جز توضیحاتی در مورد خودشان). موتور جستجو فقط یک واسطه بین صاحب اطلاعات (وب سایت) و شماست. پایگاه‌های اطلاعاتی دائماً به‌روزرسانی می‌شوند، آدرس‌های جدیدی در آنها وارد می‌شوند، اما عقب ماندگی از اطلاعاتی که واقعاً در جهان وجود دارد هنوز باقی مانده است. صرفاً به این دلیل که موتورهای جستجو با سرعت نور کار نمی کنند.

معروف ترین موتورهای جستجوی وب عبارتند از: Google، Yahoo، Alta Vista، Excite، Hot Bot، Lycos. از میان سخنرانان روسی می توان Yandex، Rambler، Aport را متمایز کرد.

موتورهای جستجو بزرگترین و با ارزش ترین هستند، اما به دور از تنها منابع اطلاعاتی در وب هستند، زیرا غیر از آنها راه های دیگری برای جستجو در اینترنت وجود دارد.

2.3 دایرکتوری ها

کاتالوگ منابع اینترنتی یک کاتالوگ سلسله مراتبی است که به طور مداوم به روز می شود و دوباره پر می شود و شامل دسته بندی ها و سرورهای وب منفرد با شرح مختصری از محتویات آنهاست.روش جستجوی کاتالوگ به معنای حرکت به سمت پایین پله ها است، یعنی حرکت از دسته های کلی تر. به موارد خاص تر یکی از مزایای دایرکتوری های موضوعی این است که توضیحات لینک ها توسط سازندگان دایرکتوری ارائه می شود و به طور کامل محتوای آن را منعکس می کند، یعنی به شما این امکان را می دهد که با دقت بیشتری تعیین کنید که محتوای سرور چگونه با هدف مطابقت دارد. از جستجوی شما

نمونه ای از کاتالوگ موضوعی به زبان روسی منبع http://www.ulitka.ru/ است.

در صفحه اصلی این سایت یک روبریکاتور موضوعی وجود دارد،

با کمک آن کاربر وارد روبریک با پیوندهایی به محصولات مورد علاقه خود می شود.

علاوه بر این، برخی از دایرکتوری های موضوعی به شما امکان جستجو بر اساس کلمات کلیدی را می دهند. کاربر کلمه کلیدی مورد نظر را در نوار جستجو وارد می کند

و لیستی از پیوندها را با توضیحات سایت هایی دریافت می کند که بیشتر با درخواست او مطابقت دارند. لازم به ذکر است که این جستجو در محتوای سرورهای WWW انجام نمی شود، بلکه در توضیحات مختصری که در دایرکتوری ذخیره شده است انجام می شود.

در مثال ما، دایرکتوری همچنین این قابلیت را دارد که سایت ها را بر اساس تعداد بازدیدها، بر اساس حروف الفبا، بر اساس تاریخ ورود مرتب کند.

نمونه های دیگر دایرکتوری های روسی زبان:
[email protected]
فهرست وب
Vsego.ru
از جمله فهرست های انگلیسی زبان عبارتند از:
http://www.DMOS.org
http://www.yahoo.com/
http://www.looksmart.com

2.4 مجموعه پیوندها

مجموعه پیوندها پیوندهایی هستند که بر اساس موضوع مرتب شده اند. آنها از نظر محتوا کاملاً با یکدیگر متفاوت هستند، بنابراین برای یافتن انتخابی که به بهترین وجه با علایق شما مطابقت دارد، باید خودتان آنها را مرور کنید تا نظر خود را ایجاد کنید.

به عنوان مثال، ما مجموعه ای از پیوندهای "گنجینه های اینترنت" JSC "Relcom" را ارائه خواهیم داد.

کاربر، با کلیک بر روی هر یک از بخش های مورد علاقه خود

  • محتوا

    برای رانندگان

    • نجوم و طالع بینی
    • خانه شما
    • حیوانات خانگی شما
    • کودکان گلهای زندگی هستند
    • اوقات فراغت
    • شهرها در اینترنت
    • بهداشت و پزشکی
    • آژانس ها و خدمات اطلاعاتی
    • موزه فرهنگ های محلی و غیره
    • الکترونیک خودرو.
    • موزه خودروهای عتیقه
    • هیئت حمایت قانونی از مالکان خودرو.
    • ورزش درایو

    مزیت این نوع ابزارهای جستجو تمرکز آنها است، معمولاً انتخاب شامل منابع اینترنتی کمیاب است که توسط یک وب مستر خاص یا صاحب یک صفحه وب انتخاب شده است.

    2.5 پایگاه داده آدرس

    پایگاه داده های آدرس، سرورهای جستجوی ویژه ای هستند که معمولاً از طبقه بندی بر اساس نوع فعالیت، محصولات و خدمات ارائه شده و جغرافیا استفاده می کنند. گاهی اوقات آنها با جستجوی حروف الفبا تکمیل می شوند. سوابق پایگاه داده اطلاعات مربوط به سایت هایی را ذخیره می کند که اطلاعات مربوط به آدرس ایمیل، سازمان و آدرس پستی را با پرداخت هزینه ارائه می دهند.

    بزرگترین پایگاه داده آدرس انگلیسی زبان را می توان نامید: http://www.lookup.com/ -

    با ورود به این زیر شاخه ها، کاربر پیوندهایی به سایت هایی پیدا می کند که اطلاعات مورد علاقه او را ارائه می دهند.

    پایگاه‌های اطلاعاتی رسمی و گسترده آدرس‌ها در فدراسیون روسیه برای ما ناشناخته است.

    2.6 جستجوی آرشیو Gopher

    Gopher یک سیستم به هم پیوسته از سرورها (فضای Gopher) است که از طریق اینترنت توزیع شده است.

    غنی ترین کتابخانه ادبی در فضای Gopher جمع آوری شده است، اما مواد برای مشاهده از راه دور در دسترس نیستند: کاربر فقط می تواند فهرست مطالب مرتب شده به صورت سلسله مراتبی را مشاهده کند و یک فایل را بر اساس عنوان انتخاب کند. با کمک یک برنامه خاص (ورونیکا) می توان چنین جستجویی را به صورت خودکار و با استفاده از پرس و جوهای مبتنی بر کلمات کلیدی انجام داد.

    تا سال 1995، Gopher پویاترین فناوری اینترنت بود: نرخ رشد تعداد سرورهای مرتبط از نرخ رشد سرورهای سایر انواع اینترنت پیشی گرفت. در شبکه EUnet/Relcom، سرورهای Gopher توسعه فعالی دریافت نکرده اند و امروزه تقریباً هیچکس آنها را به خاطر نمی آورد.

    2.7 سیستم جستجوی فایل FTP (جستجوی FTP)

    موتور جستجوی FTP نوع خاصی از موتور جستجوی اینترنتی است که به شما امکان می دهد فایل های موجود در سرورهای FTP "ناشناس" را پیدا کنید. پروتکل FTP برای انتقال فایل ها از طریق شبکه طراحی شده است و از این نظر از نظر عملکردی نوعی آنالوگ Gopher است.

    معیار اصلی جستجو، نام فایل است که به طرق مختلف (تطابق دقیق، زیر رشته، عبارت منظم و غیره) مشخص شده است. این نوع جستجو البته از نظر قابلیت نمی تواند با موتورهای جستجو رقابت کند، زیرا در هنگام جستجو به هیچ وجه به محتویات فایل ها توجه نمی شود و همانطور که می دانید می توان نام های دلخواه را بر روی فایل ها گذاشت. با این حال، اگر نیاز به یافتن برخی از برنامه های شناخته شده یا توضیحات استاندارد دارید، به احتمال زیاد فایل حاوی آن نام مناسبی خواهد داشت و می توانید آن را با استفاده از یکی از سرورهای جستجوی FTP پیدا کنید:

    FileSearch فایل ها را در سرورهای FTP با نام خود فایل ها و فهرست ها جستجو می کند. اگر به دنبال برنامه یا چیز دیگری هستید، به احتمال زیاد در سرورهای WWW توضیحات آنها را خواهید یافت و از سرورهای FTP می توانید آنها را برای خود بارگیری کنید.

    2.8 موتور جستجو در کنفرانس های خبری Usenet

    USENET NEWS یک سیستم کنفرانس از راه دور جامعه اینترنتی است. در غرب به این سرویس اخبار می گویند. آنالوگ نزدیک کنفرانس از راه دور، به اصطلاح "پژواک" در شبکه FIDO است.

    از دیدگاه مشترکین کنفرانس از راه دور، USENET یک تابلوی اعلانات است که دارای بخش هایی است که در آن می توانید مقالاتی در مورد همه چیز از سیاست گرفته تا باغبانی پیدا کنید. این تابلوی اعلانات مانند ایمیل از طریق رایانه قابل دسترسی است. بدون ترک رایانه، می‌توانید مقالاتی را برای یک کنفرانس خاص بخوانید یا پست کنید، توصیه‌های مفیدی بیابید یا به بحث‌ها بپیوندید. به طور طبیعی، مقالات فضایی را در رایانه اشغال می کنند، بنابراین برای همیشه ذخیره نمی شوند، بلکه به طور دوره ای از بین می روند و فضا را برای مقالات جدید باز می کنند. در سرتاسر جهان، بهترین سرویس برای یافتن اطلاعات در کنفرانس‌های Usenet سرور Google Groups (Google Inc.) است.

    Google Groups یک جامعه آنلاین رایگان و سرویس گروه بحث و گفتگو است که بزرگترین آرشیو پیام‌های Usenet را در اینترنت (بیش از یک میلیارد پیام) ارائه می‌کند. برای اطلاعات بیشتر در مورد شرایط استفاده از این سرویس، لطفاً از http://groups دیدن کنید. google.com/intl/ru /googlegroups/tour/index.html

    در میان روسی زبانان، سرور سیستم جهانی USENET و کنفرانس های راه دور Relcom برجسته هستند. درست مانند سایر سرویس های جستجو، کاربر یک رشته پرس و جو را تایپ می کند و سرور لیستی از کنفرانس ها حاوی کلمات کلیدی را تولید می کند. در مرحله بعد، شما باید در کنفرانس های منتخب در برنامه خبری مشترک شوید. همچنین یک سرور روسی FidoNet Online مشابه وجود دارد: کنفرانس‌های Fido در WWW.

    2.9 سیستم های جستجوی متا

    برای جستجوی سریع در پایگاه داده های چندین موتور جستجو به طور همزمان، بهتر است به سیستم های متا جستجو مراجعه کنید.

    موتورهای جستجوی متا موتورهای جستجویی هستند که درخواست شما را به تعداد زیادی از موتورهای جستجوی مختلف ارسال می‌کنند، سپس نتایج را پردازش می‌کنند، آدرس‌های منابع تکراری را حذف می‌کنند و طیف وسیع‌تری از آنچه در اینترنت ارائه می‌شود را ارائه می‌دهند.

    محبوب ترین متا موتور جستجوی جهان Search.com است.

    موتور جستجوی Unified Search.com از CNET, Inc. شامل تقریباً دوجین موتور جستجو است که پیوندهای آنها مملو از کل اینترنت است.

    با استفاده از این نوع ابزارهای جستجو، کاربر می تواند اطلاعات را در انواع موتورهای جستجو جستجو کند، اما جنبه منفی این سیستم ها را می توان ناپایداری آنها نامید.

    2.10 سیستم های جستجوی افراد

    سیستم های جستجوی افراد سرورهای خاصی هستند که به شما امکان می دهند افراد را در اینترنت جستجو کنید، کاربر می تواند نام کامل را مشخص کند. شخص و آدرس ایمیل و URL آنها را دریافت کنید. با این حال، باید توجه داشت که موتورهای جستجوی افراد عموماً اطلاعات مربوط به آدرس های ایمیل را از منابع باز مانند انجمن های Usenet دریافت می کنند. از جمله معروف ترین سیستم های جستجوی افراد عبارتند از:

    پیدا کردن آدرس های ایمیل

    در قسمت های جستجوی ویژه اطلاعات تماس (نام. شهر، نام خانوادگی، شماره تلفن)، می توانید اطلاعات مورد نظر خود را بیابید.

    موتورهای جستجوی مردم واقعاً سرورهای بزرگی هستند، پایگاه داده های آنها شامل حدود 6000000 آدرس است.

    3. نتیجه گیری

    ما فن‌آوری‌های اصلی برای جستجوی اطلاعات در اینترنت را بررسی کردیم و ابزارهای جستجوی موجود در اینترنت و همچنین ساختار جستجوی جستجو برای محبوب‌ترین موتورهای جستجوی روسی و انگلیسی زبان را به‌طور کلی ارائه کردیم، و با جمع بندی موارد فوق، می خواهیم متذکر شویم که یک طرح بهینه برای جستجوی اطلاعات در اینترنت وجود ندارد. بسته به اطلاعات خاصی که نیاز دارید، می توانید از ابزارها و خدمات جستجوی مناسب استفاده کنید. و کیفیت نتایج جستجو به میزان شایسته انتخاب خدمات جستجو بستگی دارد.

  • یافتن اطلاعات مناسب در اینترنت اغلب بسیار دشوار است. اینترنت به طور آشفته در حال توسعه است، ساختار مشخصی ندارد. هیچ کس نمی تواند تضمین کند که در یک دامنه فقط اطلاعات یک موضوع خاص وجود خواهد داشت و در طرف دیگر - اطلاعات یک موضوع متفاوت، اما همچنین به وضوح تعریف شده است. به عنوان مثال، در دامنه های .com شما می توانید نه تنها اطلاعات تجاری، بلکه، به عنوان مثال، اسناد مختلف در مورد محصولات نرم افزاری یا حتی جوک ها را بیابید.

    اگر ساختار دامنه مشابه ساختار دایرکتوری بود، به عنوان مثال، در دامنه ru.comp.os.linux (مانند سیستم خبری) همه اطلاعات مربوط به سیستم عامل لینوکس به زبان روسی وجود داشت و برخی از سازمان های ناظر مطمئن می شدند. که در سایر دامنه ها اطلاعاتی در مورد لینوکس ارسال نمی شود، پس جستجو بسیار آسان تر خواهد بود. پس از همه، ما می دانیم که به کجا نگاه کنیم. شما یک مرورگر را باز می‌کنید، ru.comp.os.linux را وارد می‌کنید و... میلیون‌ها لینک مختلف به مقالات، اسناد HOWTO و سایر اطلاعات مرتبط با لینوکس به هر طریقی دریافت می‌کنید.

    عملکرد جستجو

      عملکرد جستجو به عوامل زیادی بستگی دارد:
    • از خود اطلاعات - می تواند اطلاعات زیادی در مورد یک موضوع وجود داشته باشد، اما اطلاعات کمی در مورد موضوع دیگر وجود دارد. گاهی اوقات شما می توانید اطلاعات زیادی در مورد یک موضوع خاص پیدا کنید، اما بازده این جستجو نزدیک به 0.0٪ خواهد بود و شما می توانید فقط 3-4 پیوند را پیدا کنید، و این همان چیزی است که شما نیاز دارید. این همچنین شامل توانایی مدیر وب سایت برای ارسال صحیح اطلاعات می شود تا خود موتورهای جستجو بتوانند آن را پیدا کنند. فرض کنید در جایی بسیار دور اطلاعات مورد نیاز شما وجود دارد، اما موتور جستجو چیزی در مورد آن نمی داند. شاید این اطلاعات به تازگی منتشر شده باشد یا فقط مدیر وب سایتی که اطلاعات را منتشر کرده است حتی به وجود موتورهای جستجو مشکوک نباشد. شما با استفاده از موتور جستجو به دنبال اطلاعات هستید. اگر او اطلاعات مورد نیاز شما را "نمی داند"، بنابراین، شما نیز چیزی در مورد او نمی دانید.
    • از موتور جستجو - موتورهای جستجوی زیادی وجود دارد و همه آنها متفاوت هستند. حتی اگر از یک نوع باشند (کمی بعد در مورد انواع موتورهای جستجو صحبت خواهیم کرد)، البته هر کدام از آنها الگوریتم خاص خود را خواهند داشت. اگر نمی توانید اطلاعاتی را با یک موتور جستجو پیدا کنید، سعی کنید آن را با موتور جستجوی دیگری جستجو کنید. هرچقدر هم که از یک موتور جستجو خوشتان می آید، تلفن را معلق نکنید.
    • خیلی به توانایی استفاده از موتور جستجو بستگی دارد - چگونه می دانید چگونه از موتور جستجو استفاده کنید. اگر نمی دانید چگونه از موتور جستجو استفاده کنید، بعید است که جستجوی شما موثر باشد.

    نحوه جستجوی اطلاعات

    از آنجایی که اغلب سایت مورد نیاز خود را از فهرست راهنمای موتور جستجو انتخاب نمی کنید، بلکه یک کلمه کلیدی خاص (یا چندین کلمه کلیدی) را وارد می کنید، باید این کلمه کلیدی را تا حد امکان به طور خاص مشخص کنید. هرچه موضوع جستجو را دقیق‌تر تعریف کنید، نتیجه دقیق‌تر خواهد بود. موتور جستجو نمی تواند افکار شما را حدس بزند، شما باید آنچه را که به دنبال آن هستید به وضوح به آن نشان دهید.

    هر موتور جستجو سینتکس مخصوص به خود را دارد که باید بدانید. در این فصل سینتکس موتورهای جستجو گوگل، یاندکس و رامبلر توضیح داده می شود. اگر می‌خواهید از موتور جستجوی دیگری استفاده کنید، می‌توانید نحو آن را در وب‌سایت آن پیدا کنید (معمولاً با جزئیات توضیح داده می‌شود).

    موتورهای جستجوی اینترنتی

    حالا بیایید در مورد خود موتورهای جستجو صحبت کنیم.

    بر اساس گزارش SpyLog (Openstat) در قلمرو CIS سابق، موتورهای جستجوی زیر محبوب ترین هستند:

    • 1. Yandex (www.yandex.ru)؛
    • 2. گوگل (www.google.com)؛
    • 3. [email protected] (go.mail.ru);
    • 3. Rambler (www.rambler.ru);
    • 5 یاهو (www.yahoo.com)؛
    • 6. AltaVista (www.altavista.com);
    • 7. بینگ (www.bing.com).

    موتورهای جستجو به ترتیب محبوبیت فهرست شده اند. همانطور که می بینید، محبوب ترین موتور جستجوی ما Yandex است.

    انواع موتورهای جستجو

      دو نوع اصلی از موتورهای جستجو وجود دارد:
    • فهرست - Google، AltaVista، Rambler، HotBot، Yandex و غیره؛
    • طبقه بندی (کاتالوگ) - Rambler، Yahoo! و غیره.

    تعجب نکنید که موتور جستجوی Rambler دو بار فهرست شده است - این موتور جستجو در همان زمان هم فهرست و هم طبقه بندی بود. بعداً به این موضوع باز خواهیم گشت، اما فعلاً بیایید در مورد تفاوت های این دو سیستم صحبت کنیم.

    یک موتور جستجوی فهرست چگونه کار می کند؟ موتور جستجو برنامه خاصی را راه اندازی می کند که محتویات سرورهای وب را اسکن می کند و اطلاعات را فهرست می کند: کلمات کلیدی یک صفحه وب خاص را در پایگاه داده خود وارد می کند، برخی از اطلاعات را از صفحه وب.

    تاریخچه مختصری از گوگل

    بیایید با عنوان شروع کنیم. گوگل یک نسخه کمی تغییر یافته از کلمه googol است (به دلیلی اغلب به آن "گوگل" می گویند). این کلمه به نوبه خود توسط میلتون سیروتا، برادرزاده ادوارد کاسنر، ریاضیدان معروف معرفی شد و سپس در کتاب ریاضیات و تخیل کاسنر و نیومن رایج شد. کلمه "googol" عدد را به صورت یک 1 و به دنبال آن 100 صفر نشان می دهد. نام «گوگل» نشان دهنده تلاشی برای سازماندهی حجم وسیعی از اطلاعات در وب است.

    بنابراین، اجازه دهید از همان ابتدا شروع کنیم. توسعه دهندگان آینده گوگل سرگی برین و لری پیج در سال 1999 در دانشگاه استنفورد ملاقات کردند. لری 24 ساله بود و سرگی - 23 ساله. لری در آن زمان دانشجوی دانشگاه میشیگان بود و برای چند روز به استنفورد آمد. سرگئی در جمعی از دانشجویان بود که قرار بود مهمانان را با دانشگاه آشنا کند. از اولین ملاقات، سرگئی و لری، به بیان ملایم، یکدیگر را دوست نداشتند - آنها در مورد هر چیزی که می شد بحث کرد بحث کردند. اگرچه در نهایت این امر مثبتی بود، زیرا نظرات متفاوت آنها منجر به ایجاد الگوریتمی برای حل یکی از مهم ترین مشکلات رایانه شد: یافتن اطلاعات مناسب در میان حجم عظیمی از داده ها. در ژانویه 1996، لری و سرگئی کار خود را بر روی موتور جستجوی BackRub آغاز کردند، که قرار بود پیوندهای "بازگشت" را که به این وب سایت اشاره می کنند، تجزیه و تحلیل کند. کار بر روی این سرور با کمبود مداوم بودجه انجام شد - از این گذشته ، در آن زمان سرگئی و لری دانشجویان فارغ التحصیل دانشگاه بودند - شما خودتان می فهمید که دانشجویان تحصیلات تکمیلی پول زیادی ندارند. به هر حال، اولین بار بود که لری در چنین پروژه جدی شرکت می کرد و قبل از آن درگیر انواع پروژه های "بیهوده"، حتی گاهی اوقات حکایتی بود، به عنوان مثال، او یک چاپگر کار از یک سازنده لگو ساخت.

    الگوریتم های جستجوی گوگل

    رابط کاربری گوگل از نظر سادگی قابل توجه است: یک فیلد ورودی و دو دکمه. همانطور که می گویند، همه چیز مبتکرانه ساده است.

    نحو خاص (گسترده) گوگل

    گوگل علاوه بر عملگرهای منطقی، اصلاح کننده های جستجوی فهرست شده در جدول را در اختیار شما قرار می دهد. به اصلاح کننده های جستجو، نحو خاص گوگل گفته می شود. این جدول را جدی بگیرید: هنگامی که سعی می کنید چیزی را با استفاده از اصلاح کننده ها جستجو کنید، آنها را رد نمی کنید.

    اصلاح کننده Google inurl

    اصلاح کننده inurl برای جستجوی URL مشخص شده استفاده می شود. و بر خلاف اصلاح کننده سایت که به شما اجازه می دهد اطلاعات را فقط در یک سایت یا دامنه جستجو کنید، اصلاح کننده inurl به شما امکان می دهد اطلاعات را در زیر شاخه های سایت جستجو کنید، به عنوان مثال:

    inurl: siteskype-zvonim-free

    اصلاح کننده inurl به شما امکان می دهد از کاراکتر * برای تعیین دامنه استفاده کنید، به عنوان مثال:
    inurl: "*.redhat.com"

    بهتر است از inurl با سایت استفاده کنید. پرس و جوی زیر اطلاعات دامنه gidmir.ru را در همه زیر دامنه های آن به جز www جستجو می کند:
    سایت: gidmir.ru inurl: "*.gidmir" -inurl: "www.gidmir.ru"

    زبان جستجوی گوگل

    گوگل دستور ترکیبی را می دهد، یعنی. نحوی که از چندین اصلاح کننده جستجوی خاص در یک پرس و جو استفاده می کند. این به شما امکان می دهد بهترین نتیجه را بدست آورید.

    در اینجا ساده ترین مثال از نحو ترکیبی است:
    سایت: ru inurl: دیسک

    در این صورت جستجو در سایت های دامنه انجام می شود و URL باید حاوی کلمه دیسک باشد.

    در اینجا یک مثال دیگر وجود دارد:
    سایت: ru -inurl: org.ua

    جستجو در سایت‌های دامنه ru انجام می‌شود، اما نتایج جستجو شامل صفحات واقع در org.ua نخواهد بود.

    عبارات را در گوگل جستجو کنید

    برای اکثر کاربران عادی گوگل، محدودیت 10 کلمه کلیدی قابل توجه نیست. اما دوستداران پرس و جوهای طولانی، احتمالا متوجه شده اند که گوگل فقط 10 کلمه کلیدی اول را در نظر می گیرد و بقیه به سادگی نادیده گرفته می شوند.

    چرا عبارات طولانی را جستجو کنید؟ در بیشتر موارد، اینها گزیده ای از آثار هستند. فرض کنید به دنبال اثر «استاد و مارگاریتا» هستیم. لازم به ذکر است که عبارت کلیدی باید شبیه "استاد مارگاریتا" باشد، زیرا کلمات و، یا، و، از، یا، من، a، و برخی دیگر توسط موتور جستجو نادیده گرفته می شوند. اگر می خواهید یکی از این کلمات را مجبور کنید تا در جستجوی شما گنجانده شود، قبل از کلمه علامت "+" مانند +the قرار دهید.

    غلبه بر محدودیت 10 کلمه امکان ساخت صحیح پرس و جو را فراهم می کند. توصیه های زیر به شما کمک می کند نه تنها طول پرس و جو را کاهش دهید، بلکه کارایی جستجوی خود را به طور کلی بهبود بخشید.

    جستجوی پیشرفته گوگل

    آدرس www.google.ru/advanced_search را در خط ورودی مرورگر تایپ می کنیم و به جستجوی پیشرفته گوگل می رویم.

    با جستجوی پیشرفته، می‌توانید اطلاعات را تقریباً با انعطاف‌پذیری مانند اصلاح‌کننده‌های جستجو جستجو کنید. چرا "تقریبا"؟ رابط جستجوی پیشرفته دسترسی به همه اصلاح کننده های جستجو را فراهم نمی کند.

    تنظیم ویژگی‌های جستجوی Google در کوکی‌های مرورگر

    من نمی خواهم شما را با جزئیات فنی آزار دهم، بنابراین به طور خلاصه می گویم که کوکی ها چیست و نه، با چه چیزی خورده نمی شود، اما چگونه باید با آنها کار کرد.

    تصور کنید که ما وظیفه زیر را داریم: باید یک گزارش بازدید فردی برای هر مشتری از وب سایت شرکت خود بنویسیم. یعنی برای اینکه کاربر تعداد کل بازدیدها را نبیند، بداند چند بار در سایت ما بوده است. برای هر آدرس IP، باید رکوردها را در یک جدول نگهداری کنیم که احتمالاً بزرگ است، و از این نتیجه می‌شود که به طور غیرمنطقی از زمان پردازنده و فضای دیسک استفاده می‌کنیم. بسیار درست تر است که از این فضا با سود بیشتر استفاده کنیم.

    نتیجه جستجوی گوگل

    نتیجه جستجوی گوگل فقط مجموعه ای از پیوندهایی نیست که با عبارات جستجوی مشخص مطابقت دارند. این چیزی بیشتر است که شایسته بررسی جداگانه است. کلمه "rusopen" را وارد کرده و روی دکمه جستجوی گوگل کلیک کنید.

    در بالا، تعداد کل نتایج (883,000,000) و کل زمان جستجو را مشاهده می کنیم، یعنی 0.34 ثانیه.

      در بیشتر موارد، نتیجه به صورت زیر ارائه می شود:
    • نام صفحه؛
    • توضیحات صفحه؛
    • آدرس صفحه؛
    • اندازه صفحه؛
    • تاریخ آخرین نمایه سازی صفحه؛

    جستجوی تصویر در گوگل

    سرویس Google Images به شما امکان می دهد تصاویر مختلفی را در وب پیدا کنید. در حالی که خود تصاویر نمی توانند ایندکس شوند، صفحاتی که حاوی آن تصاویر هستند ایندکس می شوند. توضیحاتی را برای تصویر وارد کنید و پیوندهای بسیار بسیار زیادی و همچنین تصاویری که به عنوان یک گالری ارائه شده اند دریافت خواهید کرد.

      برای جستجوی تصویر کارآمدتر، باید از اصلاح کننده های جستجوی زیر استفاده کنید:
    • intitle: - جستجو در عنوان صفحه؛
    • نوع فایل: - به شما امکان می دهد نوع تصویر را مشخص کنید، می توانید انواع زیر را مشخص کنید: JPEG و GIF، نه BMP، PNG، تصاویر انواع دیگر ایندکس نمی شوند.
    • inurl: - URL مشخص شده را جستجو کنید، به عنوان مثال inurl: www.gidmir.ru ;
    • سایت: جستجو در دامنه یا سایت مشخص شده، به عنوان مثال، سایت: com.

    خدمات گوگل

    گوگل یک موتور جستجوی قدرتمند با بیش از 3 میلیارد صفحه است. گوگل علاوه بر صفحات وب معمولی، فایل های Word، Excel، PowerPoint، PDF و RTF را فهرست می کند. گوگل همچنین می تواند برای جستجوی تصاویر و شماره تلفن استفاده شود: تصاویر گوگل و دفترچه تلفن به ترتیب برای این کار طراحی شده اند. در این مقاله در مورد سرویس های Ad Hoc گوگل صحبت خواهیم کرد.

    ایمیل گوگل

    سعی کنید از ایمیل های گوگل استفاده کنید. لازم به ذکر است که این ایمیل کاملاً معمولی وب نیست.

      از جمله ویژگی های جیمیل می توان به موارد زیر اشاره کرد:
    • اندازه صندوق پستی بزرگ - بیش از 7 گیگابایت؛
    • به جای حذف نامه ها، می توانید آنها را بایگانی کنید - سپس برای مدت طولانی فضای کافی خواهید داشت و می توانید نامه هایی را که چندین سال پیش توسط شما دریافت یا ارسال شده است بازیابی کنید.
    • امکان جستجو در صندوق پستی با کارایی گوگل؛
    • سازماندهی راحت نامه ها و پاسخ ها به آنها: همه نامه ها و پاسخ ها یک زنجیره را تشکیل می دهند که ردیابی آسان است.
    • حفاظت از هرزنامه خوب؛
    • آدرس خاطره انگیز [email protected];
    • رابط کاربر پسند

    موتور جستجو Rambler (Rambler)

    تاریخچه رامبلر

    همه چیز در سال 1991 در شهر پوشچینو، منطقه مسکو آغاز شد. در آن سال دور، گروهی از افراد همفکر جمع شدند که در میان آنها دیمیتری کریوکوف، سرگئی لیساکوف، ویکتور ورونکوف، ولادیمیر سامویلوف، یوری ارشوف بودند. منافع مشترک این گروه اینترنت بود. احتمالاً در سال 1991 هیچ یک از توسعه دهندگان آینده Rambler حتی تصور نمی کردند که خالق یکی از بزرگترین و مشهورترین موتورهای جستجو در Runet شوند. از این گذشته ، قبل از آن ، همه آنها دستگاه های رادیویی را در موسسه بیوشیمی و فیزیولوژی میکروارگانیسم های آکادمی علوم روسیه خدمت می کردند. در سال 1992 ، شرکت "Stack" به سرپرستی سرگئی لیساکوف ایجاد شد. مشخصات شرکت - شبکه های محلی و اینترنت. در واقع شرکت "Stack" یک ارائه دهنده اینترنت بود. این شرکت یک شبکه درون شهری ایجاد کرد، سپس پوشچینو را به مسکو و از طریق آن به اینترنت متصل کرد. به هر حال، این اولین کانال IP بود که فراتر از مسکو رفت. و این در سال 1992 است! اکنون گذاشتن کانال کاملاً مشکل است - همیشه تفاوت های ظریف زیادی وجود دارد و سپس کابل ها باید به طور مستقل، دستی، زیرزمینی گذاشته می شدند و همه اینها در زمستان انجام می شد.

    جستجوی Rambler چگونه کار کرد

    اینترنت دائما در حال پیشرفت است: تعداد سایت ها و اندازه آنها هر روز در حال افزایش است. پس از همه، فقط تصور کنید: سایت های بزرگ هر روز به روز می شوند، حتی اگر حجم به روز رسانی ها 1024 بایت (1 کیلوبایت) باشد، پس اگر فرض کنیم که 10000 سایت از این قبیل وجود دارد، موتور جستجو باید هر روز 10000 سایت را پردازش کند (ایندکس) KB (تقریباً 10 مگابایت) اطلاعات. عدد 10000 "از سقف" گرفته شده است - به عنوان مثال. می تواند بالاتر یا پایین تر باشد - از این گذشته ، حتی سایت های بزرگ هر روز به روز نمی شوند. اندازه ارتقا نیز ساخته شده است. یک سایت اطلاعاتی و تحلیلی را تصور کنید که تقریباً هر روز مقالات جدیدی در آن منتشر می شود یا مطالبی از سایت های دیگر تجدید چاپ می شود. در این صورت حجم آپدیت ها از 1 کیلوبایت فاصله دارد اما حداقل 10. به همه اینها اخبار و اطلاعات دیگر را اضافه کنید، معلوم می شود که با تعداد سایت های به روز شده 10000، موتور جستجو باید 120 ایندکس کند. مگابایت متن و با همه اینها، موتور جستجو نه تنها باید نتایج جستجو را به دقت نمایش دهد، بلکه باید این کار را در سریع ترین زمان ممکن انجام دهد تا کاربر از کار با آن راحت باشد. چه کسی می خواهد 10 دقیقه برای نتایج جستجو صبر کند؟ البته در این مورد اغراق می کنم، اما شخصاً برای نتایج جستجو بیشتر از 30 ثانیه صبر نمی کنم (از لحظه ای که روی دکمه Find کلیک می کنید تا ده نتیجه اول ظاهر می شود). به نظر می رسد که توسعه دهندگان موتور جستجو باید به طور مداوم نه تنها سخت افزار را در سطح مناسب نگه دارند، که باید قادر به پردازش مقادیر مداوم اطلاعات باشد، بلکه شما نمی توانید "ریاضیات" را با یک آهن نیز تحمل کنید. لازم است به طور مداوم الگوریتم های جستجو را بهبود بخشید تا با افزایش حجم پایگاه جستجو، زمان جستجو افزایش پیدا نکند (به معنای افزایش قابل توجه زمان - برای کاربر تفاوتی وجود ندارد که مدت جستجو 2.5 ثانیه باشد. یا 2.0555 ثانیه، زیرا او قادر به تخمین این زمان نیست).

    پرس و جوهای Rambler، نحو Rambler

    درخواست به Rambler می‌تواند شامل یک یا چند کلمه باشد و درخواست می‌تواند حاوی علائم نگارشی باشد. توسعه دهندگان Rambler موتور جستجوی خود را برای حداکثر راحتی کاربر طراحی کرده اند. Rambler می تواند حتی توسط یک کاربر بی تجربه که اصلاً با زبان پرس و جو آشنا نیست استفاده شود. تنها کاری که او باید انجام می داد این بود که درخواستی متشکل از چندین کلمه (مثلاً یک عبارت) و بدون علائم نگارشی وارد کند - خود رامبلر اسناد لازم را پیدا کرد و این کار را تا حد امکان به بهترین شکل ممکن انجام داد. البته اگر از زبان پرس و جو به درستی استفاده می شد، کارایی به میزان قابل توجهی افزایش می یافت، اما حتی با ناآگاهی کامل از زبان پرس و جو، بازده جستجو در سطح بالایی بود. همانطور که قبلا ذکر شد، دانش زبان پرس و جو به نفع شماست، شما به سادگی می توانید اطلاعات مورد نیاز خود را بسیار سریعتر پیدا کنید.

    موتور جستجوی Yandex (Yandex)

    مرجع تاریخ

    در سال 1990، شرکت Arcadia به سرپرستی Arkady Borkovsky و Arkady Volozh شروع به توسعه نرم افزار جستجو کرد. شش سال بعد، وب سایت Yandex ظاهر شد. اما در این شش سال چه اتفاقی افتاد؟

    به مدت دو سال دو سیستم بازیابی اطلاعات ایجاد شد - "طبقه بندی بین المللی اختراعات" و "طبقه بندی کننده کالاها و خدمات". هر دو سیستم تحت DOS کار می‌کردند و امکان جستجوی کلمه‌ای از یک فرهنگ لغت با استفاده از عملگرهای منطقی را فراهم می‌کردند.

    Arcadia در سال 1993 به یکی از بخش های CompTek تبدیل شد. در طی سال های 1993-1994، فناوری های جستجو به طور قابل توجهی بهبود یافتند، به عنوان مثال، دیکشنری که جستجو را با در نظر گرفتن مورفولوژی زبان روسی ارائه می دهد، تنها 300 کیلوبایت را اشغال می کند، به این معنی که آزادانه در RAM قرار می گیرد و کار با آن بسیار سریع اتفاق می افتد. بر اساس این فناوری جدید، در سال 1994، "مرجع کامپیوتر کتاب مقدس" ایجاد شد - یک سیستم بازیابی اطلاعات که با ترجمه های عهد عتیق و جدید کار می کند.

    جستجوی زبان Yandex

    موتور جستجو کلمه ای را که وارد می کنید چگونه تفسیر می کند؟

      حالا در این مورد صحبت می کنیم:
    • قانون 1. معلوم می شود که سیستم آن را مطابق قوانین زبان روسی تفسیر می کند. مثال: اگر کلمه "ماشین" را وارد کنید، نتایج حاوی کلمات "ماشین"، "ماشین" و غیره را نیز دریافت خواهید کرد. به طور مشابه، با افعال - برای درخواست "go"، اسنادی حاوی کلمات "go"، "goes"، "walked"، "walked" و غیره دریافت خواهید کرد. همانطور که می بینید، موتور جستجو هوشمندتر از آن چیزی است که فکر می کنید - این فقط ابزاری برای جستجوی یک کلمه خاص در پایگاه داده نیست.
    • قانون 2. توجه ویژه ای به کلمات بزرگ می شود. اگر کلمه ای با حروف بزرگ نوشته شود و اولین کلمه در یک جمله نباشد، فقط کلمات با حروف بزرگ پیدا می شوند. در غیر این صورت کلماتی که هم با حروف بزرگ و هم با حروف کوچک نوشته می شوند پیدا می شوند. مثال: در صورت درخواست "Dachshund A." اسناد حاوی هر دو "taxa" (هزینه) و "taxa" (نام خانوادگی) یافت می شود، زیرا کلمه "taxa" اگرچه با حروف بزرگ نوشته شده است، اما در جمله اول است. اما پرس و جو "A. Dachshund" اسنادی را پیدا می کند که فقط حاوی کلمه "Dachshund" هستند که با حروف بزرگ نوشته شده است.

    نحو Yandex

    به طور پیش فرض، Yandex از عملگر منطقی AND استفاده می کند، به این معنی که اگر عبارت "Samsung TV" را وارد کنید، اسنادی را در نتایج دریافت خواهید کرد که در آن کلمات "TV" و "Samsung" در یک جمله ظاهر می شوند. اگر می خواهید عملگر AND را به صراحت مشخص کنید، از علامت آمپر و & استفاده کنید. به عبارت دیگر تلویزیون سامسونگ همان تلویزیون و سامسونگ است. همچنین می توانید از عبارت "TV + Samsung" استفاده کنید.

    اگر می خواهید اثر معکوس داشته باشید، یعنی. اگر می خواهید اسنادی را دریافت کنید که شامل کلمه "TV" به طور جداگانه و کلمه "Samsung" به طور جداگانه است، باید از عملگر OR (|) استفاده کنید، به عنوان مثال: "TV | Samsung".

    نحو پرس و جو Yandex

    تمام کلمات موجود در متن یک سند به ترتیب توسط Yandex شماره گذاری می شوند. فاصله بین کلمات مجاور 1 است (نه 0!) و فاصله بین کلمات به ترتیب معکوس 1- است. همین امر در مورد پیشنهادات نیز صدق می کند.

    برای نشان دادن فاصله بین کلمات، علامت / و بلافاصله بعد از یک عدد قرار داده می شود، یعنی این فاصله بین کلمات است. به عنوان مثال، پرس و جو "توسعه دهنده /2 برنامه ها" اسنادی را پیدا می کند که حاوی کلمات "توسعه دهنده" و "برنامه ها" هستند و فاصله بین کلمات نباید بیشتر از دو کلمه باشد و همه این کلمات باید در یک جمله باشند. در این صورت اسنادی حاوی «توسعه‌دهنده برنامه کاربردی»، «توسعه‌دهنده برنامه سیستم» و ... یافت می‌شوند.

    اگر دقیقاً فاصله و ترتیب کلمات را بدانیم، می توانیم از دستور / + n استفاده کنیم. به عنوان مثال، عبارت "red /+1 riding hood" بلافاصله پس از کلمه "red" به کلمه "cap" منجر می شود. پرس و جو "کلاه قرمز کوچولو" به همین نتیجه منجر می شود.

    اپراتورهای جستجوی Yandex

    پرانتز برای نمایش کل عبارت در یک پرس و جو استفاده می شود. به عنوان مثال، پرس و جو "(history | technology | programs)/+1 Linux" اسنادی را پیدا می کند که حاوی یکی از عبارات "Linux history"، "Linux technology"، "Linux programs" است.

    مناطق

    منطقه مکانی برای یافتن اطلاعات مورد نیاز است. می توانید منطقه ای را که می خواهید در آن جستجو کنید - عناوین (منطقه عنوان)، پیوندها (لنگرها) یا آدرس (آدرس) را مشخص کنید. همچنین می توانید از منطقه همه استفاده کنید - در کل سند جستجو کنید.

    نحو: پرس و جو $zone_name.

    به عنوان مثال: درخواست $title "(!LANG:Microsoft" найдет все документы, в заголовках которых встречается точная фраза "Microsoft".!}

    گزینه های اضافی جستجوی Yandex

    موتور جستجوی گوگل این امکان را فراهم کرد که مکان جستجو را به لیست خاصی از سرورها محدود کند یا برعکس، سرورهای خاصی را از لیست جستجو حذف کند. دقیقاً همان فرصت ها در موتور جستجوی Yandex وجود دارد. همچنین می توانید اسنادی را جستجو کنید که به URL ها یا تصاویر خاصی پیوند دارند. هنگام تعیین یک ماسک فایل (به عنوان مثال، یک تصویر)، می توانید از کاراکتر * استفاده کنید که به معنای همه کاراکترها است، به عنوان مثال: "audi-*".

    نحو عبارت است از: #element_name=”value”.

    در اینترنت جهانی، می توانید اطلاعاتی در مورد هر موضوع مورد علاقه پیدا کنید. اما سخت ترین کار در کار با اینترنت این است که اطلاعات مورد نیاز خود را پیدا کنید. از آنجایی که اینترنت ساختار متمرکز مشخصی ندارد، به طور آشفته توسعه می یابد و سرورهای جدید بیشتری در جهان ظاهر می شوند، مسائل جستجوی اطلاعات بسیار مرتبط می شوند.

    موتورهای جستجو کار در اینترنت را تا حد زیادی تسهیل می کنند و به ما کمک می کنند تا به سرعت اطلاعات مورد نیاز خود را در مجموعه عظیمی از سرورهای اینترنتی پیدا کنیم. چندین هزار موتور جستجو در شبکه جهانی وب وجود دارد که در بین آنها هم موتورهای معتبر و هم کمتر شناخته شده هستند.

    محبوب ترین موتورهای جستجو

    • یاندکس- ابزاری برای بازیابی اطلاعات متن کامل با در نظر گرفتن ریخت شناسی زبان روسی. جستجو در سایت ها، کاتالوگ خود، اخبار، محصولات، نقشه ها، فرهنگ لغت، وبلاگ ها، تصاویر، اسناد Microsoft Office و adobe acrobat PDF
      • یاندکس
    • رامبلر(OJSC "Rambler Internet Holding") - جستجوی سایت با در نظر گرفتن مورفولوژی زبان های روسی و انگلیسی؛ همچنین دارای سیستم جستجوی کاتالوگ است.
      • Rambler Lite: موتور جستجو- نسخه کوتاهی از صفحه جستجو
    • سرویس جستجوی اسپوتنیک(JSC "Rostelecom") - جستجو در سایت ها، خدمات عمومی و غیره؛ جستجوی امن
    • NIGMa - موتور جستجوی هوشمند(دانشگاه دولتی لومونوسوف مسکو و دانشگاه استنفورد) - جستجوی اسناد، تصاویر، کتاب ها، اخبار از طریق Google، Yahoo، MSN، Yandex، Rambler، altavista، Aport. این سیستم همچنین یک جستجوی منحصر به فرد برای فرمول ها و واکنش های شیمیایی ارائه می دهد
    • گوگل - جستجو بر اساس سایت ها (امکان جستجو برای سایت های روسی زبان)؛ جستجوی اسناد در فرمت های adobe acrobat PDF، Microsoft Office، PostScript، Corel WordPerfect، Lotus 1-2-3، و غیره. جستجو برای تصاویر، فیلم ها، اخبار، جستجوی نقشه. امکان جستجو در سایت های روسی زبان و روسی؛ سیستمی برای ترجمه متن به زبان های دیگر وجود دارد (49 زبان)
    • بینگ(Microsoft Corp.) - جستجو برای سایت ها، تصاویر و فیلم ها. امکان جستجو در سایت های روسی زبان و روسی؛ سیستمی برای ترجمه متن به زبان های دیگر وجود دارد (22 زبان)
    • یاهو(Yahoo) - جستجو برای سایت ها، آدرس های ایمیل، و غیره.

    هر یک از موتورهای جستجو دارای مزایا و معایب خاص خود هستند که با توجه به اصل عملکرد موتور جستجو، سهولت استفاده، طراحی آن، پیچیدگی زبان پرس و جو، وجود توابع مختلف پیشرفته (کنترل قالب و رتبه بندی اطلاعات خروجی، تصحیح غلط های املایی و چیدمان های اشتباه صفحه کلید هنگام وارد کردن کلمات کلیدی، ترجمه صفحه به زبان های دیگر و غیره)، سرعت کار و سایر پارامترها. انتخاب موتور جستجو برای یک برنامه خاص با هدف جستجو، ماهیت اطلاعات جستجو شده، فرمت خروجی مورد نظر و وسعت آدرس های سرور قابل ردیابی در دنیای اینترنت تعیین می شود.

    جستجوی کلمه کلیدی زبان درخواست موتور جستجو

    موتور جستجو معمولاً یک فیلد برای وارد کردن کلمات کلیدی دارد که توسط آن اسناد حاوی این کلمات کلیدی را پیدا می کند. هرچه جستجوی موتور جستجو بهتر (کیفیت بالاتر) باشد، تعداد کل اسناد یافت شده کمتر است و تعداد بیشتری از آنها اسنادی هستند که مطابق با آنچه شما نیاز دارید هستند. اگر درخواست بسیار ساده یا بی سواد باشد، موتور جستجو می تواند چندین میلیون سند را در اختیار شما قرار دهد که در تمام زندگی خود به آنها نگاه نخواهید کرد.

    استفاده از زبان پرس و جو حاوی عملیات منطقی (عملگرهای منطقی و، یا نه،براکت و غیره)، پیشوندهای حضور اجباری کلمات کلیدی در سند «+» و «-» (هنگام جستجوی عبارات بسیار تخصصی، استفاده از آن ترجیح داده می شود)، مکان کلمات کلیدی در یک سند در نزدیکی یا فاصله معین و غیره) و سایر عناصر و تعداد بیشتری از کلمات کلیدی مرتبط می توانند به میزان قابل توجهی محدودیت را کاهش دهند. منطقه جستجو و نوشتن درخواست بهتر به سرور جستجو. باید در نظر داشت که موتورهای جستجوی مختلف می توانند هم زبان پرس و جو متفاوت و هم زبان های بسیار مشابه داشته باشند.

    برخی از موتورهای جستجو علاوه بر این، یک عملکرد نیز دارند جستجوی پیشرفته،به کاربر این امکان را می دهد تا بدون دانستن زبان پرس و جو، آنچه را که به طور خاص به آن نیاز دارد، با دقت بیشتری توصیف کند. عملکرد جستجوی پیشرفته، به عنوان مثال، موتورهای جستجو Yandex و گوگل.

    انواع اصلی موتورهای جستجو از کدام موتور جستجو استفاده کنید

    2 نوع اصلی موتورهای جستجوی اینترنتی وجود دارد: فهرست و طبقه بندی (کاتالوگ). موتورهای جستجوی فهرست (به عنوان مثال، Yandex، Rambler، Sputnik، گوگل، بینگ و غیره)، در حالت خودکار به روز رسانی اطلاعات خود کار می کنند، محتویات سرورها را در اینترنت مشاهده می کنند، اطلاعات موجود در آنها را فهرست می کنند و اطلاعات مربوط به مکان کلمات در صفحات سایت را در پایگاه داده خود وارد می کنند. موتورهای جستجوی دایرکتوری (به عنوان مثال Rambler، Yahoo!، و غیره) حاوی یک کاتالوگ ساختاری موضوعی از سرورها هستند و اغلب به صورت دستی تکمیل می شوند. به طور معمول، صفحه WWW موتور جستجوی طبقه‌بندی حاوی فیلدی برای وارد کردن کلمات کلیدی برای جستجو در پایگاه داده خود است. در سیستم جستجوی کاتالوگ، می توانید با یک عنوان موضوعی بزرگتر شروع کنید و به تدریج در امتداد سرفصل ها پایین تر بروید تا به لینک سایت مورد نیاز خود برسید. در برخی موارد استفاده از نوع اول موتورهای جستجو راحت تر است، در برخی دیگر - دوم. موتورهای جستجویی هستند که هر دو اصل کار را با هم ترکیب می کنند. به ویژه، بسیاری از موتورهای جستجوی فهرست دارای یک سیستم جستجوی کاتالوگ نیز هستند. همچنین موتورهای جستجو می توانند از برخی اصول دیگر روش های جستجو استفاده کنند.

    بسیاری از موتورهای جستجو به درگاه های اینترنتی تبدیل شده اند که تعداد زیادی از منابع و خدمات را ترکیب می کنند. در صفحات این گونه پورتال ها می توانید اخبار را بخوانید، با برنامه تلویزیونی آشنا شوید، از آب و هوا، نرخ ارز، استفاده از سرویس نقشه برداری و ... مطلع شوید. دیگران

    محبوب ترین موتورهای جستجوی روسی دارای قابلیت های جستجو هستند که ویژگی های زبان روسی را در نظر می گیرند.

    برای جستجوی همزمان در چندین موتور جستجو، می توانید از متاماشین های به اصطلاح جستجو استفاده کنید که به چندین موتور جستجو به طور همزمان دسترسی دارند، به عنوان مثال NIGMA.

    همچنین موتورهای جستجویی وجود دارند که در جستجوی یک موضوع واحد (مثلاً فناوری اطلاعات، موسیقی، منابع، طبیعت و غیره) تخصص دارند.

    نوعی از افراد وجود دارند که فقط دوست دارند از استعاره های زیبا زیادی استفاده کنند. اینها کسانی هستند که وب جهانی را با یک زباله دان مقایسه می کنند. انگار در شبکه همه چیز در یک تپه بزرگ ریخته می شود و شیطان می تواند یک پا را در آنجا بشکند. به نظر می رسد که همه چیز در وب است، اما برای پیدا کردن چیزی، باید کوه های عظیمی از زباله را حفر کنید.

    خب، این استعاره خوبی است. اما این به این معنی نیست که حق با اوست. برای بسیاری از مردم، در نگاه اول، حجم عظیمی از چیزهای بی فایده روی میز انباشته می شود. اما برای آن دسته از افرادی که در این میزها کار می کنند، چیدمان چیزها به یک منطق کاملا مشخص کمک می کند. چیزهایی که بیشتر مورد نیاز هستند، مانند یک لیوان چای، در کنار هم هستند. و چیزهایی که همیشه ضروری نیستند بیشتر قرار دارند. و این به هیچ وجه زباله و یا آشفتگی نیست.

    اینترنت هم منطق خودش را دارد. اگر چند قانون را بدانید و در هنگام جستجو از آنها استفاده کنید، هر اطلاعاتی از اینترنت مانند لیوانی برای چای در امتداد بازو خواهد بود و این احساس که وب زباله است بلافاصله ناپدید می شود.

    در این مقاله در مورد موتورهای جستجو و قوانین جستجوی اینترنتی صحبت خواهیم کرد.

    دستگاه موتور جستجو

    برای شروع - یک انحراف غزلی کوچک در مورد ساختار موتور جستجو. طوری چیده شده که کاربر فقط رابط خود سیستم یعنی نوار جستجو را می بیند و هر چیزی که داخل سیستم است در آنجا باقی می ماند.

    اولین جزء از موتور جستجو، به اصطلاح "عنکبوت"، یک ربات جستجو است. توابع آن چیست؟ او در سراسر وب سرگردان است، در اینترنت - صفحات و پیوندها را مرور می کند. و او همه این کارها را بدون وقفه انجام می دهد. عنکبوت برای لذت خودش سرگردان نیست. کاملاً تمام صفحاتی را که مشاهده کرده است وارد فهرست موتورهای جستجو می کند. آنها را در قالب کلمات معنی دار که در صفحه وجود دارد وارد می کند.

    بنابراین، معلوم می شود که ایندکس، دومین جزء موتور جستجو، یک پایگاه داده عظیم است که با کمک آن می توان به سرعت دریابید که کلمه جستجو در کدام صفحات وب وجود دارد. اطلاعات برای مرجع - کل حجم فهرست موتور جستجوی معروف Yandex بیش از هشتاد گیگابایت است.

    سومین جزء بعد از فهرست، خود موتور جستجو است. هدف آن جستجوی کلمات یا عبارات مناسب در فهرست است. به یاد داشته باشید که یک موتور جستجو کل اینترنت را جستجو نمی کند - این کار را نمی کند. فقط تصور کنید که این درست است: به عنوان مثال، کل حجم اطلاعات نمایه شده در Yandex 269 گیگابایت است. و اگر پس از وارد کردن پرس و جو شما ایندکس وجود نداشت، سیستم باید 260 گیگابایت اطلاعات را دانلود و مشاهده کند. غیر واقعی است. فقط فکر کنید که چقدر طول می کشد تا یک درخواست واحد پردازش شود.

    به دنبال این واقعیت که جستجو نه در کل شبکه، بلکه در فهرست انجام می شود، دو نتیجه حاصل می شود. اولاً، اگر موتور جستجو اطلاعاتی را پیدا نکرد، این به هیچ وجه به این معنی نیست که این اطلاعات در وب نیست، در فهرست این موتور جستجوی خاص نیست. ثانیاً، سیستم های بازیابی اطلاعات در شبکه نه تنها در رابط، بلکه به عنوان مثال، در شاخص و روش های کامپایل آن با یکدیگر متفاوت هستند. بنابراین، اگر اطلاعات مورد نیاز خود را در یک موتور جستجو پیدا نکردید، باید آن را در موتور جستجوی دیگری جستجو کنید.

    ربات جستجویی که فهرست را کامپایل می کند، همه سایت ها را در یک دایره و به طور منظم می خزد - بنابراین، ایندکس همیشه تغییراتی را که در سایت رخ داده است به درستی نشان می دهد. سایت‌هایی که به تازگی «عنکبوت» ظاهر شده‌اند، می‌توانند به تنهایی پیدا کنند و آنها را روی پیوند سایت‌های دیگر قرار دهند. همچنین، نویسندگان سایت می توانند به "عنکبوت" در مورد سایت خود اطلاع دهند.

    آخرین جزء یک موتور جستجو، سرور وب جهانی آن است که چهره سیستم است. این رابطی است که کاربران از طریق آن درخواست می کنند و به آنها پاسخ می گیرند. سرور جهانی وب تنها بخشی از سیستم است و بزرگترین آن نیست.

    زبان جستجو

    برای برقراری ارتباط با موتورهای جستجو، زبان و قوانین خاصی وجود دارد. البته اگر به سوال شما بلافاصله پاسخ جامع داده شود بسیار عالی خواهد بود. اما در حال حاضر، فقط روی آن کار می شود.

    ابتدا باید کلمات کلیدی را برجسته کنید. لازم است تصمیم بگیرید که کدام چند کلمه به طور کامل تری چیزی را که به دنبال آن هستید مشخص می کند و این کلمات خاص را وارد کنید. شما خواهید گفت که این واضح است. بله همینطور است. اما از دانستن آنچه بسیاری از افراد در نوار جستجو وارد می کنند شگفت زده خواهید شد.

    یک چیز خوب در Yandex به نام "پخش زنده" وجود دارد. این صفحه ای است که می توانید 20 عبارت یا کلمه آخر جستجو شده را ببینید. این صفحه را بیشتر تماشا کنید و احساسات متفاوتی را تجربه خواهید کرد. برخی از درخواست ها را می توان در یک کتاب جداگانه ثبت کرد - آنها بسیار شگفت انگیز هستند. با نگاهی به برخی از درخواست ها، متوجه خواهید شد که قطعاً جستجوی اینگونه ضروری نیست.

    معمولاً درصد زیادی از درخواست ها هیچ وضوحی ندارند: "ویدئو"، "تلویزیون"، "دانلود" و غیره. درخواست کنندگان فکر می کنند که خود سیستم باید حدس بزند که کاربران از آن چه می خواهند. پرس و جوی جستجو را واضح تر تشکیل دهید، و هر چه دقیق تر باشد، موتور جستجو نتایج غیرضروری کمتری خواهد داد.

    برخی از موتورهای جستجو بین همان جستارها، اما با حروف بزرگ یا کوچک شروع می شوند، تمایز قائل می شوند. به عنوان مثال، Yandex تعداد متفاوتی از نتایج جستجو را ارائه می دهد، در حالی که سیستم Google حروف بزرگ را نادیده می گیرد.

    با استفاده از علائم "+" و "-"، می توانید کلمات را از جستجو حذف کنید یا آنها را اجباری کنید. در این صورت نباید بین علامت و کلمه فاصله باشد. این قانون برای همه موتورهای جستجو اعمال می شود.

    در این پرس و جو به دنبال فروشگاه های آنلاین تجهیزات کامپیوتری هستیم که در زمینه لپ تاپ تخصص ندارند و در مورد بعدی، برعکس، به دنبال فروشگاه هایی هستیم که همین لپ تاپ ها را می فروشند.

    همانطور که می بینید، موتور جستجو واقعاً نتایج متفاوتی ارائه می دهد.

    اگر در درخواست شما چندین کلمه به سادگی با فاصله از هم جدا شده باشند، موتور جستجو به دنبال صفحاتی می گردد که این کلمات بخشی از یک جمله هستند. خوب، اگر می خواهید سندی را پیدا کنید که حاوی هر یک از کلماتی است که در پرس و جو لیست کرده اید، باید از علامت "|" استفاده کنید.

    Yandex فقط تعداد وحشتناکی از نتایج را ارائه کرد و همه به این دلیل است که اکنون ما به دنبال یک عبارت خاص نیستیم، بلکه همه نتایج حاوی هر یک از این کلمات محبوب هستند. به طور کلی، اگر کلمات مترادف زیادی وجود داشته باشد، چنین پرس و جوی راحت تر است.

    اگر می‌خواهید عبارات پایداری پیدا کنید، آن‌ها را در گیومه وارد کنید. برای مثال، اگر به دنبال خطوطی از برخی آثار ادبی یا نقل قول هستید، این می تواند اعمال شود.

    همانطور که می بینید، با مشخص کردن درخواست و دستور به موتور جستجو برای جستجوی خاص این پیشنهاد، ما قبلاً تعداد قابل توجهی کمتری از نتایج را دریافت کرده ایم.

    نتیجه

    با استفاده از تمام روش های فوق می توانید به راحتی اطلاعات مورد نیاز خود را پیدا کنید. خوشبختانه، موتورهای جستجو به اندازه کافی وجود دارد. با این حال، تعداد زیادی کار وجود دارد که موتورهای جستجو نمی توانند انجام دهند.

    بیایید وضعیت زیر را تصور کنیم: شما فوراً به بهترین مدیر سیستم در شهر نیاز دارید. چگونه آن را جستجو خواهید کرد؟ مثلاً می توانید در روزنامه تبلیغ کنید و سپس چندین ماه به تماس های تلفنی زیادی پاسخ دهید. یا می توانید به یک آژانس تخصصی مراجعه کنید و سریعاً یک نامزد مناسب را در آنجا پیدا کنید.

    به طور مشابه، با موتورهای جستجو - آنها طراحی شده اند تا حداکثر اطلاعات را پوشش دهند. اگر نیاز به یافتن چیز خاصی دارید، استفاده از موتورهای جستجوی تخصصی که در زمینه های مختلف جستجو می کنند منطقی است.

    در خاتمه، من می خواهم یک توصیه را ارائه دهم. در چارچوب این مقاله، ما فقط اطلاعات کلی در مورد گردآوری عبارت های جستجو را در اختیار شما قرار داده ایم. در واقع، هر موتور جستجو زبان جستجوی پیشرفته خود را دارد. برای بررسی احتمالات نحو پرس و جو موتور جستجوی مورد علاقه خود وقت بگذارید. در آینده، این امر جستجو برای مواد لازم را بسیار ساده می کند. برای کمک به شما پیوندهایی به مواد مرجع دو موتور جستجوی محبوب: