جستوجو گر ملی از آغاز تا رقابت با غولهای جهانی
میهن صنعت : پروژه جستوجوگر ملی در دولت دهم برای رقابت با جستوجوگرهای بزرگ دنیا ولی بر بستر اینترانت کشو در دستور کار وزارت ارتباطات و فناوری اطلاعات دولت دهم قرار گرفت.
به گزارش پایگاه خبری تحلیلی «میهن صنعت»، در مردادماه سال 89، رضا تقیپور، وزیر ارتباطات و فناوری اطلاعات وقت از راهاندازی موتور جستوجوگر ملی خبر داد و اعلام کرد که ایران برای جوابگویی به نیازهای داخلی میخواهد موتور جستجوگر ملی راه اندازی کند.
موتور جستوجوی بومی در ابتدا قرار بود عناوین مختلفی از جمله "یاحق" داشته باشد و اولین اولویت برای ارائه خدمات دستگاههای دولتی و غیردولتی با هدف تسهیل در ارائه اطلاعات سریع به مردم معرفی شود.
در آن زمان مدیرکل تحقیق و توسعه سازمان فناوری اطلاعات ایران در تشریح آغاز به کار این پروژه گفت: پیشنهاداتی در مورد نام این طرح ارائه شده که وزیر ارتباطات از عنوان "یاحق" برای نام این موتور جستوجوگر یاد کرده است؛ اما با گذشت حدود یک سال از اعلام این پروژه به نظر میرسد سیاست وزارت ارتباطات و فناوری اطلاعات برای اجرای این موتور تغییر یافته و این وزارتخانه قصد دارد نسبت به ارتقای موتورهای جستوجوگر داخلی موجود اقدام کند و تنها به یک موتور جستوجوی ملی واحد بسنده نکند.
علاوه بر آن یکی از مسوولان سازمان فناوری اطلاعات ایران در آن زمان، آغاز به کار این پروژه موتورهای جستوجوگر ملی را صرفا در مورد کاربران ایرانی داخل کشور و فقط برای ارائه خدمات دستگاههای دولتی و اجرایی دانست.
چرا جستوجوگر ملی؟
در این پروژه به اهمیت خط و زبان فارسی در محیط اینترنت اشاره شده است، اما با وجود رقابت سنگینی که با جستجوگرهای بزرگ دنیا وجود دارد، باید با برنامه منسجم تعیین شود که جستوجوگر ملی چگونه میتواند با حفظ زبان رسمی با دیگر موتورهای جستوجو هم رقابت کند.
دریافت اطلاعات به صورت طبقهبندی از نکات مثبت موتور جستوجوگر ملی است. هادی ملکپرست – مدیر کل تحقیق و توسعه سازمان فناوری اطلاعات ایران – در این رابطه میگوید: در جستوجوگرهای کنونی کاربران میتوانند موضوع مورد نظر خود را کلاسهبندی و در یک محدوده خاصی جستوجو کنند. اما این که موتور جستوجوگر ملی چگونه فعالیت خواهد کرد، جزو خروجیهای فاز پژوهشی است در واقع پس از پایان مرحله پژوهش، اعلام میشود اگر این موتور جستوجو میخواهد قابلیتهای خاصی داشته باشد نیازمند چه نوع معماری است.
پارسی جو اولین موتورجستجوی ملی
سال گذشته مقرر شد برای ایجاد قابت داخلی در این عرصه، چندین موتور جستوجوی بومی راه اندازی و معرفی شود. براین اساس سازمان فناوری اطلاعات ایران موضوع حمایت از موتورهای جستوجوی بومی و رتبهبندی آنها را در دستور کار قرار داد. تنها یک موتور جستوجوی بومی به نام «پارسی جو» مورد تایید وزارتخانه هم هست که فعالیت خود را شروع و در مدت تقریبا یک ساله از آغاز فعالیتش توانسته به گفته مدیران پروژه روزانه ۸۰ هزار مراجعهکننده داشته باشد.
نسخه آزمایشی "پارسیجو" از دی ماه سال 91 شروع بکار کرده و برروی وب به آدرس www.parsijoo.ir قابل دسترس است .نسخه آزمایشی این موتور بیش از 120 میلیون سند اطلاعاتی روی وب را پوشش میدهد و برنامه آن افزایش تدریجی تعداد فایلهای اطلاعاتی بود که به سرورهای قویتر نیاز داشت.
براساس اطلاعاتی که در سایت پارسی جو وجود دارد، این سامانه با تلاشهای یک تیم 20 نفره در مرکز تحقیقات مهندسی دانشگاه یزد و شرکت پارسیجو پیاده سازی شده و با صرف حداقل هزینه و تجهیزات به رشد و توسعه خود ادامه میدهد. در حال حاضر موتور پارسیجو بر روی یک بستر توزیع شده شامل 30 سیستم اجرا میشود و تاکنون در حدود 200 میلیون صفحه فارسی (از 500 میلیون سند) را نمایهسازی کرده و در حال سرویسدهی به بیش از 20 هزار کاربر فارسیزبان در روز است.
طبق گزارش پژوهشگاه ICT، مراحل توسعه و تکمیل و افزایش پوشش تعداد صفحات مورد جستجوی آن، با فراهم سازی سخت افزار و پهنای باند مورد نیاز در مقیاس بالا توسط این پژوهشگاه در دست اقدام است. همچنین این سامانه مجهز به پردازشگر و خطایاب هوشمند فارسی است. بخشی از پروژه با حمایت پژوهشگاه فضای مجازی انجام شده است.
پارسیجو موتور جستوجویی مستقل و بومی است که شامل سه بخش اصلی خزشگر (crawler)، نمایه ساز، بخش بازیابی و جستوجو است.
نسخه دوم آن نیز با پوشش 500 میلیون سند فارسی حاوی سرویسهایی نظیر ترجمه ماشینی، جستوجوی اخبار، جستوجوی علمی و جستوجوی دو زبانه و برخی از سرویسهای مربوط به نقشه، خرداد ماه سال 92 در معرض عموم قرار خواهد گرفت.
اما در کنار موتور جستوجوگر «پارسیجو»، در اردیبهشت سال ۹۱، موتور جستوجوی بومی دیگری به نام «پارسی یاب» نیز پا به عرصه گذاشت. موتور جستوجوگری که در حال حاضر نسخه آزمایشی آن با ده هزار سند اینترنتی به بهرهبرداری رسیده است.
به گفته رضا ابراهیمی ایده اولیه برای طراحی این موتور جستوجو با توجه به امکانات محدود دانشجویی، تجمیع اطلاعات رسانههای داخلی کشور در بستر اینترانت ملی بود، اما با گسترش طرح، بستری برای راهاندازی یک موتور جستوجوی جامع فراهم شد.
برخی از امکانات و نقاط قوت فعلی موتور جستوجو پارسییاب شامل مدیریت پردازش موازی بیش از ۱۰ خزنده به طور همزمان، قابلیت پردازش دستهای اسناد به طور آنلاین و آفلاین، سرعت قابل توجه در درخت پردازش، معناگرایی با تکیه بر زبان فارسی، ساختار نمایه گذار (ایندکسر) معناگرا، ادغام سرویس رتبهبندی با سرویس نمایه گذار (ایندکسر) و پشتیبانی از زبانهای فارسی، انگلیسی، عربی و ترکی میشود
میزان مراجعه کاربران ایرانی به گوگل
براساس گزارشی که سال گذشته از سوی مجمع فعالان فناوری اطلاعات و رسانههای دیجیتال انقلاب اسلامی منتشر شد، کل سود موتور جستوجوی گوگل در سال ۲۰۱۱ حدود ۳۶ میلیارد دلار بوده که سود این موتور جستوجو از کاربران ایرانی در سال۹۰، ۴۴۳ میلیارد تومان تخمین زده شده است.
براین اساس هر ایرانی روزانه به طور میانگین ۵ بار در گوگل جستوجو میکند و میانگین سالانه تعداد دفعات جستوجو در گوگل توسط کاربران ایرانی یکهزار و ۸۲۵ بار اعلام شده است. در این بررسیها مشخص شده که ۴۰ درصد کلیک کاربران ایرانی برروی لینکهای تبلیغاتی ظاهر شده در نتایج جستوجو است و ۳/۷ بار تعداد دفعاتی است که کاربران ایرانی در سال برروی لینکهای تبلیغاتی کلیک میکنند.
براین اساس میانگین درآمد گوگل به ازای هر کلیک بر لینکهای تبلیغاتی ۰۴/۱ دلار و میانگین درآمد سالانه گوگل از هر کاربر ۳/۷ دلار است و در مجموع این موتور جستوجو از کاربران ایرانی طی یک سال۲۷۷ میلیون دلار درآمد کسب کرده است.
اما هدف مهمی که از آغاز موجب مطرح شدن جستوجوگر ملی شد، ایجاد امکان برای جستوجوی اطلاعات ایرانیان در پایگاه و بینیازی به موتورهای جستوجوی جهانی با رفع نیاز داخلی است.