soft

جزئیات موتور جستجوی جدید پارسی یاب

گزارش شبکه ایران درباره موتور جستجوی پارسی یاب
آنگونه که مدیر پروژه می گوید ایده طراحی موتور جستجوی پارسی یاب از اردیبهشت امسال کلید خورده، ایده اولیه برای طراحی این موتور جستجو با توجه به امکانات محدود دانشجویی، تجمیع اطلاعات رسانه های داخلی کشور در بستر اینترانت ملی بود. این گرایش به رسانه به علت نزدیکی و مشاوره دوستان همکار در رسانه های مختلف و معتبر کشور بود.
 

اما با گسترش طرح، بستری برای راه اندازی یک موتور جستجوی کامل و جامع فراهم شد. این بستر جهت گسترش طرح در ابعاد مختلفی بوده که در ادامه بیان خواهد شد. فاز مطالعاتی اولیه، به جهت آشنایی اعضای گروه با معماری موتور های جستجو، به سرعت و در بازه 3 ماهه انجام شد. از مرداد 91 طرح های مطالعاتی به مرحله طراحی معماری رسید و پیاده سازی بخش های مختلف آن از قبیل خزنده، پایگاه های داده، ارتباطات وب، نمایه گذار(ایندکسر)، پردازنده پرس و جو، رتبه بندی، مدیریت ذخیره سازی، کنترلر، فرهنگ لغات، انباره تصاویر، پارسر، قوانین بهینه سازی (SEO)، بستر های زبانی، خودکار سازی، توزیع های ذخیره سازی و طراحی رابط کاربر به طور همروند آغاز شد.
مهران علیدوست نیا، طراح و مدیر پروژه موتور جستجوی پارسی یاب با خبرنگار شبکه ایران به گفتگو نشست که مشروح آن را در زیر می خوانید:
- لطفا درباره تیم نرم افزاری دانشگاه گیلان بیشتر توضیح دهید.
ایده تیم نرم افزاری دانشکده فنی نخستین بار در سال 89 به صورت کاملا دانشجویی مطرح گردید. بنده و چند نفر دیگر از دانشجویان رشته مهندسی کامپیوتر به تجمیع افراد با استعداد در این زمینه پرداختیم. این تیم با اهداف دراز مدت ایجاد و به کار خود ادامه داد. رشته مهندسی کامپیوتر به علت نو پا بودن در دانشگاه گیلان، سابقه چندانی برای اجرای پروژه های عظیم نرم افزاری نداشت. لذا ابتدا به دور هم جمع کردن افراد علاقه مند در زمینه های نرم افزاری پرداختیم و سپس کار آموزش این جوانان را در کار گروه های مختلف ادامه دادیم. هم اکنون قوی ترین کارگروه ما، در زمینه فناوری های وب فعال است. در سال 90 و با شروع فعالیت آموزش های الکترونیک در دانشگاه، از این تیم دعوت به همکاری شد تا به عنوان پشتیبان نرم افزاری مرکز آموزش های الکترونیک فعالیت نماید. در آن زمان دکتر خداپرست سرپرست آموزش های مجازی و دکتر ابراهیمی دیر کار گروه فنی بود. به علت آشنایی ایشان با بنده مسئولیت کار به تیم نرم افزاری واگذار گردید. نکته مهم اعتماد مسئولین دانشکده به نیرو های نرم افزاری جوان و کم تجربه بود. برآیند این کار راه اندازی و پشتیبانی نرم افزاری سامانه آموزش های الکترونیکی دانشگاه گیلان بود که کاملا بومی و توسط تیم نرم افزاری دانشگاه تغذیه می شد. هم اکنون نیز مسئولیت پشتیبانی فنی این مرکز بر عهده ی تیم نرم افزاری دانشگاه و تحت سرپرستی دکتر ابراهیمی است. در ابتدای سال 91 رسما دفتر تیم نرم افزاری دانشگاه گیلان در دانشکده فنی تاسیس شد. با در اختیار داشتن این دفتر در کنار فعالیت های نرم افزاری ذکر شده در دانشگاه، پروژه های پژوهشی به طور کاملا دانشجویی توسط بنده تعریف و دانشجویان علاقمند روی آنها کار می کنند. یکی از خروجی های این پژوهش ها موتور جستجوی پارسی یاب است که فاز اولیه آن در دهه فجر امسال در دانشگاه گیلان رونمایی شد.

- با وجود نهاد های علمی دانشگاه چه نیازی به تاسیس تیم نرم افزاری بود؟
همان طور که بیان شد تیم نرم افزاری به صورت کاملا دانشجویی شروع به کار کرده و اداره می شود. بنده و بسیاری دیگر از دانشجویان نرم افزار در انجمن های علمی دانشگاه عضو بوده و هستیم اما انجمن های علمی و سایر نهاد های علمی بستر لازم را برای طرح های نرم افزاری ایجاد نکرده اند. به عنوان مثال اگر طرحی خروجی فیزیکی داشته باشد به خوبی از آن حمایت می شود. مثلا پروژه های سخت افزاری و رباتیک اما پروژه های نرم افزاری متاسفانه در این تشکل ها مورد حمایت قرار نمی گیرند. خوشبختانه در دانشگاه هنوز هم مسئولان به دنبال پیشرفت نرم افزاری و مجازی سازی فعالیت های دانشگاه هستند. این نکته مثبتی بود که از ایده تیم نرم افزاری حمایت نمود. البته وجود اساتیدی که نام آنها را ذکر کردم به پیشرفت سریع نرم افزاری کمک بسیاری می کند.
- این موتور جستجو نسبت به موتور های موجود دیگر چه برتری هایی دارد؟
اگر به طور خلاصه چند موتور جستجوی حال حاضر را در مراحل اولیه کار خود مقایسه کنیم، با توجه به امکانات موجود برای تیم های یاد شده، پیشرفت پارسی یاب در بازه زمانی 9 ماهه بسیار سریع بوده است. برای مثال موتور جستجوی پارسی جو که تحت حمایت مادی و معنوی دانشگاه یزد و پژوهشگاه ارتباطات و فناوری ‌اطلاعات از سال 1387 کار خود را شروع کرده، فاز مطالعاتی آن بیش از 1 سال یعنی از شهریور 87 تا مهر 88 به طول انجامیده است و نسخه اولیه آن بعد از گذشت حدود 2 سال در سال 89 با پوشش یک میلیون سند اینترنتی رونمایی شده است. این در حالی است که در پردازش های مورد نظر در این موتور جستجو، از حدود 30 کامپیوتر به صورت توزیع شده در دیتا سنتر آن استفاده شده است.
برخی از امکانات و نقاط قوت فعلی موتور جستجو پارسی یاب
• مدیریت پردازش موازی بیش از 10 خزنده به طور همزمان
• قابلیت پردازش دسته ای اسناد به طور آنلاین و آفلاین
• سرعت قابل توجه در درخت پردازش
• معناگرایی با تکیه بر زبان فارسی
• ساختار نمایه گذار (ایندکسر) معناگرا
• ادغام سرویس رتبه بندی با سرویس نمایه گذار (ایندکسر)
• پشتیبانی از زبان های فارسی، انگلیسی، عربی و ترکی

- چطور شد که در دانشگاه گیلان این طرح را پیاده سازی و اجرا کردید؟ 
به هر حال ما گیلانی هستیم و اولویت اول ما همواره محل زندگی و تحصیل ماست. فاز اولیه، به علت اینکه نیاز به بستر سخت افزاری چندانی نداشت به طور کاملا دانشجویی اجرا گردید. ما در این طرح بیش از 30 جلسه تخصصی و رفع اشکال با اعضای تیم داشتیم. سرعت بالای کار به علت علاقه و عشق دوستان به طراحی این پروژه بود. چرا که این پروژه بدون هر گونه پشتیبانی مالی انجام گردیده و از این حیث نیز حائز اهمیت می باشد. حتی برای پردازش های موازی و سطح بالای آن گاها از تجمیع قدرت سیستم های شخصی و به شکلی کاملا خلاقانه استفاده می شد. با تمام این وجود فاز اول آن پیاده سازی و اجرا شد و کار را متوقف نکرده ایم. اما در فاز دوم نیازمند بستر های سخت افزاری و نظام مند کردن مراحل پروژه هستیم. از مسئولان دانشگاه قول همکاری گرفته ایم و در صورت حمایت ایشان حتما فاز های بعدی را در دانشگاه گیلان طراحی و پیاده سازی می کنیم اما تحت هیچ شرایطی کار متوقف نخواهد شد.
- اعضای گروه پیاده سازی و اجرا چطور انتخاب شدند و خود شما چه نقشی داشتید؟
تیم طراحی و پیاده سازی ما از تمامی پتانسیل های موجود دانشجویی در زمینه های مربوط استفاده کرده است. برای مثال ما حتی در تیم توسعه خود از گروه مکانیک هم عضو داریم. این به علت تخصص افراد است. صرفا دانشجوی کامپیوتر بودن دلیل بر توانایی افراد نیست.

اعضای تیم طراحی آقایان سجاد سروری، علی تورانی، علی انصاری، آذین میربستانی، یاسین عزت دوست و هیراد اسیمی هستند. بنده به عنوان طراح و مدیر پروژه در تمامی مراحل پیاده سازی و اجرای آن حضور داشتم. این به دلیل آشنایی با معماری موتور های جستجو بوده است. البته ایده اولیه آن با مشاوره دوستان رسانه ای بود. آقای فرج الله حسن پور به عنوان مشاور رسانه ای و فنی پروژه مرحله به مرحله در توسعه آن به ما کمک می کرد. همچنین حضور دکتر اکبر خداپرست حقی به عنوان مشاور تیم نرم افزاری و دکتر ابراهیمی آتانی به عنوان سرپرست تیم نرم افزاری کمک زیادی به ما کرد. دوستان ما در طراحی و پیاده سازی این پروژه وقت زیادی را صرف کردند. حتی خاطرم هست که روز های ماه مبارک رمضان را هم از صبح تا غروب در دانشگاه مشغول تکمیل قسمت های مختلف بودند. به هر حال باید از همه این دوستان تشکر کنم که پارسی یاب به وجود آمد. هم اکنون لینک نسخه آزمایشی این موتور جستجو نیز در آدرسی parsiab.guilan.ac.ir قابل دسترسی است.

در پایان ضمن تشکر باید اعلام کنم که از حمایت هر سازمان و یا نهاد دولتی و خصوصی که به این طرح علاقه دارند، استقبال می نماییم.

لینک کاملمصاحبه

Copyright © 2011- 2013
کلیه حقوق این سایت متعلق به انجمن علمی رمز دانشگاه گیلان می باشد .