موتورجستجو چیست و چگونه کار می‌کند؟ (بخش دوم)

موتور جستجوگر چیست

طراحی و اجرای جستجوگرها یکی از سخت‌ترین و هیجان‌انگیزترین پروژه‌های دنیای آی‌تی و وب به‌شمار می‌رود. به همین دلیل سعی داریم شما را در این مقاله دو قسمتی با تکنولوژی آن‌ها بیشتر آشنا کنیم.در قسمت اول مقاله، به بررسی مفهوم موتورهای جستجوگر و چگونگی عملکرد آن‌ها پرداختیم. در ادامه این مطلب، در بخش دوم با ما همراه باشید تا با نحوه‌ی رتبه‌بندی اطلاعات توسط موتورهای جستجوگر آشنا شویم.

چنان‏كه در قسمت اول مقاله بيان شد، یک موتور جستجوگر برای پاسخگویی به کاربر ، با استفاده از خزنده‌ها به تمامی صفحات وب مراجعه می‌کند، محتوای آن‌ها را می‌خواند و اطلاعات موردنیاز را جمع‌آوری می‌کند. پس از آن، اطلاعات به ایندکسر تحویل داده می‌شود. ایندکسر اطلاعات را تجزیه و تحلیل کرده و آن را بر اساس یک  سری پارامترها دسته‌بندی و نمایه‌سازی می‌کند. سپس اطلاعات طبقه‌بندی شده، به یک بانک اطلاعاتی داده شده و در آن‌جا، اطلاعات پس از فشرده‌سازی ذخیره می‌گردد. در این مرحله موتورجستجو آماده‌ی پاسخگویی به کاربر می‌شود و سیستم رتبه‌بندی موتور جستجو وارد عمل می‌شود.

سیستم رتبه بندی در جستجوگرها

چگونه نتایج در جستجوگرها رتبه‌بندی می‌شوند؟

زمانی‌که کاربر، عبارت موردنظر خود را جستجو می‌کند، موتور جستجو تمام صفحات مرتبط با عبارت جستجو شده را از میان میلیون‌ها صفحه‌ی موجود در بانک اطلاعاتی خود، بازیابی می‌کند و بر اساس الگوریتم‌ها و سیستم رتبه‌بندی خود، صفحات یافت‌شده را با توجه به میزان ارتباط آن‌ها، به ترتیب در اختیار کاربر قرار می‌دهد. همه‌ی این مراحل در یک چشم‌به‌هم‌زدن و در کسری از ثانیه اتفاق می‌افتد.

رتبه‌بندی صفحات یافت‌شده‌ی مرتبط با موضوع جستجو، عامل مهمی در موفقیت یک موتور جستجو و رضایت کاربران آن است.

در حقیقت موتورهای جستجوی مختلف از یک سری الگوریتم‌‌ها که تقریبا محرمانه و خاص خودشان است، استفاده می‌کنند. اما چیزی که مشخص است، این است که همه‌ی آن‌ها از فاکتورها و معیارهای نسبتا مشابهی برای طراحی الگوریتم‌های رتبه‌بندی خود بهره می‌گیرند.

باید توجه داشت که الگوریتم‌های رتبه‌بندی جستجوگرها در چند سال اخیر دست‌خوش تغییرات زیاده شده است که بسیاری از آن‌ها برای مقابله با تکنیک‌هایی است که در صدد فریب موتور جستجو و سیستم رتبه‌بندی آن هستند. در ادامه مقاله بیشتر با تکنیک‌های عام رتبه‌بندی آشنا خواهید شد که بدون تردید به‌تنهایی و بدون الگوریتم‌های مقابله با فریب، کارایی کاملی ندارند.

عوامل مهم در نحوه رتبه‌بندی جستجوگرها

معیارهای فراوانی در رتبه‌بندی نتایج در جستجوگرها تاثیر دارند که بنابر اهمیت و وزن خود می‌توانند رتبه نتایج مختلف را تعیین کنند. گوگل در توضیح جستجوگر خود، از ۲۰۰ عامل برای رتبه‌بندی یاد می‌کند که نشان از پیچیدگی بسیار فراوان این بخش از موتور جستجو دارد. از جمله‌ی مهم‌ترین این معیارها می‌توان به تعداد واژگان منطبق شده با واژگان عبارت مورد جستجو، نزدیکی واژگان، محل قرار گرفتن واژگان در صفحه، تعداد تکرار واژگان در کل صفحه( بسامد واژه)، تعداد کل کلمات موجود در صفحه، کلمات موجود در عنوان و متاتگ، تعداد و نوع لینک‌ها و ارجاعات صفحه اشاره کرد.

موارد دیگری همچون حضور واژگان کلیدی در URL، سرعت بالاآمدن سایت، کدنویسی صحیح، حضور در شبکه‌های اجتماعی، ایجاد تجربه کاربری مناسب، نمایش صحیح در گوشی‌ها و تبلت‌های هوشمند و تازه و بکر بودن محتوا هم از دیگر عوامل تاثیر گذار در رتبه‌بندی یاد می‌شوند.

فاکتورهای مهم در رتبه بندی موتورهای جستجو

تعداد تکرار و جایگاه واژه‌ها

تعداد تکرار و جایگاه واژه‌ها را می‌توان به عنوان عامل اولیه رتبه‌‌بندی یک موتورجستجو در نظر گرفت. صفحاتی که تعداد تکرار بیشتری از کلمات مورد جستجو در آن‌ها وجود دارد، وزن بیشتری به خود اختصاص می‌دهند و در رتبه‌ی بالاتری نسبت به بقیه‌ی صفحات قرار می‌گیرند. تعداد تکرار کلمات در کل صفحات یک سایت، هم بر این مسئله تاثیر می‌گذارد. علاوه بر این، تعداد تکرار کلمه نسبت به تعداد کل کلمات موجود در صفحه نیز در نظر گرفته می‌شود؛ زمانی که تعداد تکرار کلمه برابر باشد، صفحات با تعداد کلمات کمتر نسبت به صفحات با تعداد کلمات بیشتر در رتبه‌ی بالاتری قرار می‌گیرند چرا که نسبت تعداد کلمات کلیدی به تعداد کل کلمات در این صفحات بیشتر است.

عنوان صفحه یا متاتگ

وجود واژه‌ی جستجوشده در عنوان صفحه یا متاتگ‌ها نسبت به زمانی که در کل متن صفحه وجود دارند، وزن و ارزش بیشتری به صفحه در رتبه‌بندی می‌دهد.

در استفاده از این معیارها مشکلی اساسی وجود دارد و آن هم سوءاستفاده‌ی مدیران وبگاه‌ها برای جلب ملاقات‌کنندگان بیشتر و وارد کردن متاتگ‌ها و کلمات کلیدی پرطرفدار اما نامربوط است، که موجب نمایش صفحه‌ای غیرمرتبط با عبارت موردجستجو در نتایج جستجوگر می‌شود. بنابراین موتورهای جستجوگر برای رفع این مشکل، توصیفات و کلمات را از چند خط ابتدای متن در صفحه‌ی سایت می‌گیرد و همچنین محتوای متن صفحه را برای واژگان مرتبط تحلیل می‌کنند. این‌کار بر اساس روش‌هایی که استخراج مفهومی هوشمند نامیده می‌شود، انجام می‌پذیرد.

لینک و پیوند

از دیگر معیار‌های رتبه‌بندی نتایج جستجو، رتبه‌بندی بر اساس میزان ارجاعات و لینک‌ها است. لینک‌ها و پیوندها،  که در تحلیل رتبه‌بندی صفحات، به عوامل خارج از صفحه  مشهورند، به عنوان نقطه‌ی مهمی برای متن و صفحه‌ی حاضر به شمار می‌آید. هر لینک یا ارجاعی که از دیگر صفحات اینترنتی به صفحه مورد نظر ما داده شود، به عنوان یک امتیاز مثبت برای صفحه ما محسوب می‌گردد و رتبه آن را در نتایج جستجوگر بالاتر می‌برد؛ بدین معنا که هر صفحه‌ی وبی که لینک‌های بیشتری به آن وارد ‌گردد، به رتبه بالاتری در نتایج جستجوگر دست پیدا می‌کند.

این موضوع آن‌طور که به نظر می‌رسد، به سادگی انجام نمی‌شود و متغیرهای بسیاری در آن دخیلند. ارزش‌گذاری صفحاتی که به صفحه‌ی ما لینک داشته باشند، به یک میزان و یک اندازه نیست. در این مورد، ارزش لینک با توجه به لینک‌های صفحه‌ی ما و صفحاتی که صفحه‌ی ما جزو لینک‌های آن‌ قرار گرفته است، تعیین می‌گردد.

لینک و پیوند

عامل مهم دیگری که در تعیین الگوریتم‌های رتبه‌بندی تاثیر گذار است، میزان لینک‌های دیگری است که از صفحه‌ای که به صفحه‌ی ما لینک دارد، خارج می‌گردد. یک مثال در نظر می‌گیریم:

اگر قرار باشد ما رتبه‌ی صفحه‌ی خودمان با نام "الف" را محاسبه کنیم و صفحه‌ی "ب" نیز به صفحه‌ی "الف" لینک داده باشد، چنانچه صفحه‌ی "ب" به تنها صفحه‌ای که لینک داده صفحه‌ی "الف" باشد، رتبه‌ی بیشتری به صفحه‌ی ما تعلق می‌گیرد نسبت به زمانی‌که از صفحه‌ی "ب" ۲۰ لینک دیگر هم خارج شده و لینک به صفحه‌ی "الف" یکی از آن ۲۰ لینک است.

بنابراین،  رتبه‌ی هر سند به رتبه‌ی اسناد دیگری بستگی دارد که به آن لینک می‌دهند و از آن لینک می‌شوند و رتبه‌ی آن اسناد هم به همین صورت مشخص می‌شود. این چرخه به همین صورت ادامه می‌یابد تا این‌که در نهایت رتبه‌ی هر سند در وب مشخص می‌شود. بنابراین الگوریتم رتبه‌بندی، ارزش‌گذاری صفحات را بر اساس میزان و کیفیت لینک‌ها قرار داده و کمیت و کیفیت را بر پایه‌ی منطق ریاضی و یکسری فرمول‌ها محاسبه می‌کند.

سخن پایانی

آن‌چنان که در این مقاله ذکر شد، رتبه‌بندی و ارزش‌گذاری صفحات وب توسط الگوریتم‌های رتبه‌بندی امری حیاتی، مهم و البته بسیار دشوار برای سنجش میزان قابل اعتماد بودن و محبوبیت بین کاربران یک موتور جستجو است. نکته‌ی شایان ذکر در این‌جا، این است که موتورهای جستجوگر باید با تحلیل دقیق هم از لحاظ فنی و هم عملی و صرف هزینه و زمان بسیار زیاد به بررسی روش‌های به روز و کارآمد برای تعیین روش‌ها و الگوریتم‌های رتبه‌بندی صفحات و جلوگیری از تقلب و فریب بپردازند تا به یک موتور جستجوگر موفق تبدیل شوند.

در مجموع موضوع موتورهای جستجو اگر چه در ظاهر مفهوم ساده‌ای دارد و شاید خیلی‌ها تصور کنند همه چیز خیلی سریع و ساده اتفاق می‌افتد. ولی در واقع این طور نیست و برای رسیدن به نتایج مطلوب، موتورهای جستجو از روش‌های پیچیده‌ای استفاده می‌کنند. اما چون موتورهای جستجو با توجه به قدرت خود، نتایج را در کمترین زمان ممکن به شما ارائه می‌کنند، این تصور در ذهن شما تداعی می‌شود که جستجو کردن در اینترنت خیلی ساده رخ می‌دهد.

در این مقاله دو قسمتی تلاش کردیم نگاه کلی به نحوه‌ی عملکرد یک موتور جستجوگر داشته باشیم. تلاش داریم تا در مقالات دیگری به بررسی جزییات بیشتری از نحوه کار موتور جستجوها بپردازیم.

اگر به موضوع خاصی در جستجوگرها علاقه دارید آن را در بخش دیدگاه‌ها به ما پیشنهاد دهید.

علاقه داریم تا پیشنهادات و انتقادات شما را درباره این دسته از مقالات تهیه شده در پرس‌وجو بدانیم، پس با ما در ارتباط باشید.

مجموع رتبه (1)
5 از 5 ستاره

ارسال دیدگاه به عنوان مهمان

پیوست ها

امتیاز این آیتم :
0
  • مهمان - محمد

    سلام لطفا مطالبی در مورد جویشگر های بومی دیگر کشور ها مقاله بزارید مثل مقاله ای که در مورد یاندکس نوشتید یکی هم در مورد بایدو بنویسید و در مورد سرویس های پارسی جو مطالب بیشتر بزارید;)

    دارای رتبه 5 از 5 ستاره
  • مهمان - محمد

    سلام. ممنون از نظرتون. درباره همه این موارد به زودی مطالب جالبی که نظرتون را جلب کنه منتشر می شه. به ما هر روز سر بزنید

خبرهای یک هفته گذشته

هیچ مطلبی پیدا نشد!