میهن صنعت :

جست‌وجو گر ملی از آغاز تا رقابت با غول‌های جهانی

میهن صنعت : پروژه جست‌وجوگر ملی در دولت دهم برای رقابت با جست‌وجوگرهای بزرگ دنیا ولی بر بستر اینترانت کشو در دستور کار وزارت ارتباطات و فناوری اطلاعات دولت دهم قرار گرفت.

به گزارش پایگاه خبری تحلیلی «میهن صنعت»، در مردادماه سال 89، رضا تقی‌پور، وزیر ارتباطات و فناوری اطلاعات وقت از راه‌اندازی موتور جست‌وجوگر ملی خبر داد و اعلام کرد که ایران برای جوابگویی به نیازهای داخلی می‌خواهد موتور جستجوگر ملی راه اندازی کند.

 

موتور جست‌وجوی بومی در ابتدا قرار بود عناوین مختلفی از جمله "یاحق" داشته باشد و اولین اولویت برای ارائه خدمات دستگاه‌های دولتی و غیردولتی با هدف تسهیل در ارائه اطلاعات سریع به مردم معرفی شود.

 

در آن زمان مدیرکل تحقیق و توسعه سازمان فناوری اطلاعات ایران در تشریح آغاز به کار این پروژه گفت: پیشنهاداتی در مورد نام این طرح ارائه شده که وزیر ارتباطات از عنوان "یاحق" برای نام این موتور جست‌وجوگر یاد کرده است؛ اما با گذشت حدود یک سال از اعلام این پروژه به نظر می‌رسد سیاست وزارت ارتباطات و فناوری اطلاعات برای اجرای این موتور تغییر یافته و این وزارتخانه قصد دارد نسبت به ارتقای موتورهای جست‌وجوگر داخلی موجود اقدام کند و تنها به یک موتور جست‌وجوی ملی واحد بسنده نکند.

 

علاوه بر آن یکی از مسوولان سازمان فناوری اطلاعات ایران در آن زمان، آغاز به کار این پروژه موتورهای جست‌وجوگر ملی را صرفا در مورد کاربران ایرانی داخل کشور و فقط برای ارائه خدمات دستگاه‌های دولتی و اجرایی دانست.

 

چرا جست‌وجوگر ملی؟

 

در این پروژه به اهمیت خط و زبان فارسی در محیط اینترنت اشاره شده است، اما با وجود رقابت سنگینی که با جستجوگرهای بزرگ دنیا وجود دارد، باید با برنامه منسجم تعیین شود که جست‌وجوگر ملی چگونه می‌تواند با حفظ زبان رسمی با دیگر موتورهای جست‌وجو هم رقابت کند.

 

دریافت اطلاعات به صورت طبقه‌بندی از نکات مثبت موتور جست‌وجوگر ملی است. هادی ملک‌پرست – مدیر کل تحقیق و توسعه سازمان فناوری اطلاعات ایران – در این رابطه می‌گوید: در جست‌وجوگرهای کنونی کاربران می‌توانند موضوع مورد نظر خود را کلاسه‌بندی و در یک محدوده خاصی جست‌وجو کنند. اما این که موتور جست‌وجوگر ملی چگونه فعالیت خواهد کرد، جزو خروجی‌های فاز پژوهشی است در واقع پس از پایان مرحله پژوهش، اعلام می‌شود اگر این موتور جست‌وجو می‌خواهد قابلیت‌های خاصی داشته باشد نیازمند چه نوع معماری‌ است.

 

پارسی جو اولین موتورجستجوی ملی

 

سال گذشته مقرر شد برای ایجاد قابت داخلی در این عرصه، چندین موتور جست‌وجوی بومی راه اندازی و معرفی شود. براین اساس سازمان فناوری اطلاعات ایران موضوع حمایت از موتورهای جست‌وجوی بومی و رتبه‌بندی آنها را در دستور کار قرار داد. تنها یک موتور جست‌وجوی بومی به نام «پارسی جو» مورد تایید وزارتخانه هم هست که فعالیت خود را شروع و در مدت تقریبا یک ساله از آغاز فعالیتش توانسته به گفته مدیران پروژه روزانه ۸۰ هزار مراجعه‌کننده داشته باشد.

 

نسخه آزمایشی "پارسی‌جو" از دی ماه سال 91 شروع بکار کرده و برروی وب به آدرس www.parsijoo.ir قابل دسترس است .نسخه آزمایشی این موتور بیش از 120 میلیون سند اطلاعاتی روی وب را پوشش می‌دهد و برنامه آن افزایش تدریجی تعداد فایلهای اطلاعاتی بود که به سرورهای قوی‌تر نیاز داشت.

 

براساس اطلاعاتی که در سایت پارسی جو وجود دارد، این سامانه با تلاشهای یک تیم 20 نفره در مرکز تحقیقات مهندسی دانشگاه یزد و شرکت پارسی‌جو پیاده سازی شده و با صرف حداقل هزینه و تجهیزات به رشد و توسعه خود ادامه می‌دهد. در حال حاضر موتور پارسی‌جو بر روی یک بستر توزیع شده شامل 30 سیستم اجرا می‌شود و تاکنون در حدود 200 میلیون صفحه فارسی (از 500 میلیون سند) را نمایه‌سازی کرده و در حال سرویس‌دهی به بیش از 20 هزار کاربر فارسی‌زبان در روز است.

 

طبق گزارش پژوهشگاه ICT، مراحل توسعه و تکمیل و افزایش پوشش تعداد صفحات مورد جستجوی آن، با فراهم سازی سخت افزار و پهنای باند مورد نیاز در مقیاس بالا توسط این پژوهشگاه در دست اقدام است. همچنین این سامانه مجهز به پردازشگر و خطایاب هوشمند فارسی است. بخشی از پروژه با حمایت پژوهشگاه فضای مجازی انجام شده است.

 

پارسی‌جو موتور جست‌وجویی مستقل و بومی است که شامل سه بخش اصلی خزشگر (crawler)، نمایه ساز، بخش بازیابی و جست‌وجو است.

 

نسخه دوم آن نیز با پوشش 500 میلیون سند فارسی حاوی سرویس‌هایی نظیر ترجمه ماشینی، جست‌وجوی اخبار، جست‌وجوی علمی و جست‌وجوی دو زبانه و برخی از سرویس‌های مربوط به نقشه، خرداد ماه سال 92 در معرض عموم قرار خواهد گرفت.

 

اما در کنار موتور جست‌وجوگر «پارسی‌جو»، در اردیبهشت سال ۹۱، موتور جست‌وجوی بومی دیگری به نام «پارسی یاب» نیز پا به عرصه گذاشت. موتور جست‌وجوگری که در حال حاضر نسخه آزمایشی آن با ده هزار سند اینترنتی به بهره‌برداری رسیده است.

 

به گفته رضا ابراهیمی ایده اولیه برای طراحی این موتور جست‌وجو با توجه به امکانات محدود دانشجویی، تجمیع اطلاعات رسانه‌های داخلی کشور در بستر اینترانت ملی بود، اما با گسترش طرح، بستری برای راه‌اندازی یک موتور جست‌وجوی جامع فراهم شد.

 

برخی از امکانات و نقاط قوت فعلی موتور جست‌وجو پارسی‌یاب شامل مدیریت پردازش موازی بیش از ۱۰ خزنده به طور همزمان، قابلیت پردازش دسته‌ای اسناد به طور آنلاین و آفلاین، سرعت قابل توجه در درخت پردازش، معناگرایی با تکیه بر زبان فارسی، ساختار نمایه گذار (ایندکسر) معناگرا، ادغام سرویس رتبه‌بندی با سرویس نمایه گذار (ایندکسر) و پشتیبانی از زبان‌های فارسی، انگلیسی، عربی و ترکی می‌شود

 

میزان مراجعه کاربران ایرانی به گوگل

 

براساس گزارشی که سال گذشته از سوی مجمع فعالان فناوری اطلاعات و رسانه‌های دیجیتال انقلاب اسلامی منتشر شد، کل سود موتور جست‌وجوی گوگل در سال ۲۰۱۱ حدود ۳۶ میلیارد دلار بوده که سود این موتور جست‌وجو از کاربران ایرانی در سال۹۰، ۴۴۳ میلیارد تومان تخمین زده شده است.

 

براین اساس هر ایرانی روزانه به طور میانگین ۵ بار در گوگل جست‌وجو می‌کند و میانگین سالانه تعداد دفعات جست‌وجو در گوگل توسط کاربران ایرانی یک‌هزار و ۸۲۵ بار اعلام شده است. در این بررسی‌ها مشخص شده که ۴۰ درصد کلیک کاربران ایرانی برروی لینک‌های تبلیغاتی ظاهر شده در نتایج جست‌وجو است و ۳/۷ بار تعداد دفعاتی است که کاربران ایرانی در سال برروی لینک‌های تبلیغاتی کلیک می‌کنند.

 

براین اساس میانگین درآمد گوگل به ازای هر کلیک بر لینک‌های تبلیغاتی ۰۴/۱ دلار و میانگین درآمد سالانه گوگل از هر کاربر ۳/۷ دلار است و در مجموع این موتور جست‌وجو از کاربران ایرانی طی یک سال۲۷۷ میلیون دلار درآمد کسب کرده است.

 

اما هدف مهمی که از آغاز موجب مطرح شدن جست‌وجوگر ملی شد، ایجاد امکان برای جست‌وجوی اطلاعات ایرانیان در پایگاه و بی‌نیازی به موتورهای جست‌وجوی جهانی با رفع نیاز داخلی است.

لینک کوتاه خبر: https://mihansanat.ir/?p=21154
برچسب‌ها :

دیدگاه شما

0 دیدگاه