موتور جستجوگر فارسی آری یا نه
من قبلا با جستجوی عبارتی از مطلب خودم در جستجو اول میامدم اما اخیر سایتی که موتور جستجوی فارسی است در جستجو بالاتر از من قرار میگیرد چکار باید کرد تا این مشکل پیش نیاید
مطرح شده از طرف رحیم مقدم naslefarda.blogfa.com
جدیدا موجی از عملکرد غلط سایتهای جستجو در ایران شروع شده که شدیدا پهنای باند سایتها را می خورند و از آن بدتر اینکه در سرچ گوگل اختلال ایجاد میکنند و سایتهایی که دارای اصل مطلب هستند بعد از این سایتها قرار میگیرند و مهمترین دلیل آن این است که اصول موتورهای جستجو را راعایت نمی کنند
اینکه موتور جستجو چه ویژگی هایی باید داشته باشد بماند اما یکی از فاکتورهای مهم این موتور ها حفظ حقوق معنوی نویسندگان مطلب است
در موتورهای جستجوی فارسی به جای نشان دادن مطلب به کاربر آن هم در زمان جستجو، این مطالب را بصورت همیشگی قسمتی از صفحات خود میکنند که ضمن نقض آشکار قوانین کپی رایت خود را مالک مطلب به گوگل معرفی می کنند که این تبعاتی برای سایتی که مالک اصلی مطلب است در پی دارد از جمله پایین آمدن رنکینگ گوگل(بدلیل داپلیکیت) و رتبه جستجو در گوگل است مشکلی که من خودم مدتی درگیر آن بوده ام البته قبول دارم که این عملکرد را نباید با کار وب انگل هایی مثل سایت وبزیست یا webzist.com یکی دانست (هر چند من شخصا دوست دارم موتورهای اینچنینی را که قوانین کپی رایت را زیر پا میگذارند انگل وب بنامم)در صدر موتوروهای جستجوی فارسی با عملکرد غلط چند سایت هستند که پهنای باند زیادی را نسبت به سایرین می گیرندشما در اینترنت هرچیزی را که جستجو کنید در لیست ظاهر میشوند تا آنجا که حتی در لیست آلکسا هم دارای رنکینگ بالا هستند
این سایتها برای مطرح شدن از دیتابیس شان استفاده نابجا میکنندبعنوان مثال لینک به صفحه ای مثل نتایج انجام شده دارند مثلا در http://mahcd.net که مطالب شم را در آن صفحه قرار داده که اصلا در موتورهای جستجو رایج نیست( یعنی اصل اجازه قانونی برای اینکار ندارند) و با این کار موتورهای جستجو را به دنبال خود میکشند و برای ترافیک این صفحات هم بنرهای تبلیغاتی میگیرند و از این راه کسب درآمد میکنند که باز کسب درآمد موتورهای جستجو از این راه اصولی نیست به هرحال من ارزش جستجو گر برای آنها قایل نیستم و حال سوال من این است پس چرا هیچ وقت با جستجوی مثلا "میهن آگهی" در گوگل اسم سایتهای یاهو،آلتاویستا،اسک و... در لیست جستجو نمی ایند
حال به فرض محال که این سایت ها را به عنوان موتور جستجو به رسمیت بشناسیم ب توجه به اینکه حتی نیم درصد از جستجو های منجر به ورود به سایت را در بر نمی گیرند سوال من این است که آیا منطقی است اجازه مصرف پهنای باند و گرفتن رتبه جستجو مان را به آنها بدهیم
نه خیر این سایتها اسم موتورجستجو هستند ولی کار دیگه ای انجام میدهند بهرحال من نیازی نمی بینم موتورجستجو نبودن این سایتها ر ثابت می کنم بلکه یک توصیه بود.وتوصیه می شود از دسترسی آنها به صفحات خودمان جلوگیری کنیم چون علاوه بر پهنای باند زیاد نتایج جستجو را هم از سایتهای ما میدزدند (به دلیل نوع کارشان آپدیت بیشتری دارند و برای گوگل مهم تر هستند) شما با یک سرچ ساده حتم آنها را در لیست جستجوی گوگل می بینید در زیر اسامی و آی پی هرکدام آورده شده است
آدرس | آی پی |
mahcd.net | 76.76.21.99 |
gamavista.com | 76.76.21.102 |
agahinameh.info | 76.76.5.157 |
iranwebshop.info | 76.76.5.157 |
taksearch.com | 69.59.27.249 |
www.jasjoo.com | 174.133.202.236 |
daraje1.com | 74.81.165.180 |
www.googel.ir | 173.45.76.131 |
mashhadonline.ir | 72.18.141.155 |
webdarweb.com | 74.55.16.19 |
مثلا با قرار دادن تکه فایل زیر در htaccess سایت خودتان (به شرط لینوکس بودن) میتوانید به این مهم برسید
Deny from mahcd.net
Deny from gamavista.com
Deny from iranwebshop.info
Deny from agahinameh.info
Deny from taksearch.com
Deny from jasjoo.com
Deny from daraje1.com
Deny from mashhadonline.ir
Deny from behdasht.gov.ir
Deny from webdarweb.com
Deny from 76.76.21.99
Deny from 76.76.21.102
Deny from 69.59.27.249
Deny from 174.133.202.236
Deny from 74.81.165.180
Deny from 173.45.76.131
Deny from 72.18.141.155
Deny from 212.95.158.242
Deny from 72.52.129.59
Deny from 78.129.146.185
Deny from 67.19.84.46
در پستهای بعدی به این سوال پاسخ می دهیم که
آیا میشه از چند دیتا بیس مختلف سرچ کنه؟ساختن دیتا بیس چه جوریه؟یعنی باید تمام اون اطلاعات رو داشته باشی؟