به گزارش پایگاه 598 به نقل از فارس/
گروه مهندسي کامپيوتر دانشگاه گيلان مشغول به توسعه نرمافزاري حاوي متن
توضيحالمسائلها است که پاسخ دقيق سوال شرعي را از طريق نرمافزار ارائه
ميکند.
احتمالا براي شما هم پيش آمده است که براي يافتن پاسخ
سوالات خود در مورد مسائل شرعي به عالمان ديني و رسالههاي توضيحالمسائل
مراجعه کنيد. احتمالاً از نرمافزارهاي رايانهاي هم براي جستجو در متن
توضيحالمسائلها استفاده کردهايد. اما نرمافزاري که دکتر ابوالقاسم
ميرروشندل و دانشجويان وي در گروه مهندسي کامپيوتر دانشگاه گيلان مشغول به
توسعه آن هستند با برنامههاي موجود متفاوت است. سوال شرعي از شما، پاسخ
دقيق از نرمافزار. در همين خصوص گفتگوي کوتاهي با اين استاد جوان دانشگاه
انجام دادهايم که گزارش آن را در ادامه ميخوانيد.
«سامانه پرسش و پاسخ احکام» نام پروژهاي است که در حال انجام هستيد، درباره نرمافزار حاصل از اين پروژه برايمان بگوييد.
امروزه
نسل جديد از خواندن کتاب گريزان هستند و رو به منابع ديجيتالي آوردهاند.
عمل به شيوه سنتي در موضوعاتي چون آموزش احکام مانع يادگيري مسائل در اين
حوزه ميشود. يکي از کارکردهاي اصلي اين نرمافزار اين است که اگر افراد و
به خصوص جوانان حال و حوصله مراجعه به کتابهايي چون توضيحالمسائل را
ندارند، سوالات شرعي خود را به راحتي از اين نرمافزار بپرسند و پاسخ آن را
دريافت نمايند، حکم فلان مسئله چيست، آيا اين کار حلال است يا حرام و
سوالاتي از اين قبيل.
تفاوت پرسش و پاسخ خودکار با جستجوهاي معمولي چيست؟
جستجوهاي
معمولي عموماً بر اساس ظاهر کلمات انجام ميپذيرد. يک کلمه يا در منابع
مورد جستجو وجود دارد يا ندارد. براي مثال شخصي ممکن است عبارت «نماز در
مسجدالحرام» را جستجو کند. براي بازگرداندن نتايج جستجو بايد همان کلمات به
همان ترتيب وجود داشته باشد، اما اگر شما کلمات مشابه را جستجو کنيد،
مثلاً به جاي «نماز در مسجدالحرام» عبارت «نماز در مسجد مکه» را جستجو
نماييد، سيستم جوابي را برنميگرداند. مضاف بر اينکه موتورهاي جستجوي فهرست
بلندي از نتايج را نمايش ميدهند که ممکن است بسياري از آنها بيربط
باشند. اما در پرسش و پاسخ خودکار با استفاده از هوش مصنوعي و يادگيري
ماشين پاسخ دقيق و گاهي يک کلمهاي را برميگردانيم. در اين سيستمها نقش
ارتباطات معنايي را لحاظ ميکنيم، کلمات مشابه را در نظر ميگيريم،
باهمآيي کلمات را بررسي ميکنيم – ممکن است يک کلمه هنگامي که کنار کلمات
ديگر قرار ميگيرد معناي خاصي داشته باشد – سيستم چنين موارد را يکجا
ميبيند و سعي ميکند مرتبطترين مطلب به سوال پرسيده شده را برگرداند. به
زبان ساده ميتوان گفت، پرسش و پاسخ نوعي جستجوي هوشمند خصوصيسازيشده است
و نسبت به جستجويهاي معمول بسيار دقيقتر عمل ميکند.
از
سيستمهاي پرسش و پاسخ پيشرفته مانند سيستم واتسون آيبيام در حوزههاي
حساسي مانند تشخيص پزشکي استفاده ميشود. حال، بحث مسائل ديني هم
حساسيتهاي خاص خود را دارد، از آن جهت که براي مثال مقلدين بايد احکام
ديني را به درستي انجام دهند، آيا ملاحظاتي در اين زمينه وجود دارد؟
همينطور
است، اين مسئله حساس است و اين سيستم به نوعي با اعتقادات افراد طرف است.
ما براي اين مسئله کارهاي مختلفي انجام دادهايم. اول اينکه براي مثال
هنگامي که کاربر سوال ميکند «حکم خواندن نماز در مکان غصبي چيست؟» هم جواب
دقيق و تککلمهاي آن را برميگردانيم مثلاً ميگوييم «حرام است»، هم در
سطح ديگر پاراگراف و به عبارتي مسئلهاي که سيستم جواب تککلمهاي را از آن
استنباط کرده است را بر ميگرداند، به عبارتي مسئله فرضاً 1550 نيز به
عنوان پشتيبان براي جواب تککلمهاي سيستم نمايش داده ميشود و مرتبطترين
عبارت يا جمله در مسئله نيز برجسته ميشود تا کاربر با مطالعه آن اطمينان
صددرصد حاصل نمايد. علاوه بر اين، همانطور که گفته شد سيستم پرسش و پاسخ
مانند سيستمهاي جستجوي معمولي فهرست بلند و بالايي از جوابها را بر
نميگرداند اما به خاطر همين بحث حساس بودن، دو سه مسئله به ترتيب احتمال
درستي آنها به عنوان پاسخ نمايش داده ميشوند. ضمناً ما به دنبال اين
هستيم که حدي از اطمينان را مشخص کنيم که اگر سيستم به آن حد نرسيد، به جاي
آن که پاسخ غلط بازگرداند پاسخ دهد «نميدانم!».
دشواريهاي
فني اين کار چيست؟ آيا مواد اوليه، يعني زيرساختهاي نرمافزاري و
سختافزاري و دانش لازم براي انجام چنين پروژههايي در دسترس است؟
از
نظر دانش و بحث فني واقعاً مشکلي نداريم، تعدادي از بهترين دانشجويانم با
نظارت مستقيم بنده در اين پروژه مشغول هستند و از اين لحاظ مشکلي را احساس
نميکنيم. اما يکي از مسائل اصلي همان بحث مواد اوليه است. براي انجام اين
کار مرکز تحقيقات کامپيوتري علوم اسلامي يک پيکره ارزشمند که شامل سوال و
جوابهاي شرعي است در اختيار ما قرار داد، اما اين پيکره تمام جزئياتي که
مد نظر ماست را ندارد. اطلاعاتي چون نوع و سطح دشواري سوالات. بنابراين
بخشي از زمان ما صرف ايجاد استاندارد و نرمافزار براي توسعه و برچسبگذاري
اين پيکره شد. بحث ديگري که وجود دارد، فقدان اطلاعات معنايي است. در زبان
فارسي شبکههاي معنايي عمومي وجود دارد، اما شايد نياز باشد که ما وردنت
مخصوصي را براي اهداف مد نظر در اين پروژه ايجاد نماييم. در سطح نحو هم خدا
را شکر کار خوبي با عنوان پيکره وابستگي نحوي زبان فارسي با حمايت شوراي
عالي اطلاعرساني عرضه شده است، اما بايد ما بررسي کنيم که آيا اين پيکره
که يک پيکره عمومي است در حوزه متون ديني هم به خوبي جواب ميدهد يا خير.
اگر بخواهم وارد جزئيات شوم بايد بگويم در سطوح اوليهاي چون تشخيص مرز
کلمات هم دشواريهاي فراواني در زبان فارسي وجود دارد، مثلاً در مواردي که
کلمات چندبخشي که با فاصله يا نيمفاصله از هم جدا ميشوند. به عبارتي از
پائينترين سطح تا سطح معنا مشکلاتي براي پردازش زبان فارسي وجود دارد که
ما پيشرفت خوبي در اين زمينه داشتهايم. در حال حاضر سيستم پرسش و پاسخ ما
مسئلههاي حاوي جواب را باز ميگرداند اما براي رسيدن به پاسخهاي
تککلمهاي بايد هنوز کار شود. در چنين سيستمهايي آنچه اهميت دارد بالا
بردن دقت پاسخگويي است که توليد دادههاي مناسب کمک شاياني به اين موضوع
خواهد کرد.
سيستمهاي پرسش و پاسخ خودکار چه کاربردهاي ديگري ميتوانند داشته باشند؟
کلاً
سيستمهاي پرسش و پاسخ يکي از سيستمهاي سطح بالا در کنار سيستمهاي ديگري
چون خلاصهسازها و مترجمهاي ماشيني هستند که سيستمهاي سطح پايينتر چون
تحليلگرهاي صرفي و نحوي در جهت بالا بردن کيفيت اينها توسعه مييابند.
مطلبي که در خصوص نحوه توسعه سيستم ما وجود دارد اين است که ما ميتوانيم
با اعمال تغييرات جزئي، در حد 20 تا 30 درصد، اين سيستم را در حوزههاي
ديگر نيز به کار ببريم. براي مثال – اگر بخواهم در همين علوم اسلامي مثال
بزنم – اين سيستم را ميتوان در مورد احاديث و قرآن هم به کار برد. به طور
کلي ميتوان گفت که در دنياي امروز ميزان قابل توجهي از اطلاعات به شکل
ديجيتال موجود است. پيدا کردن اطلاعات خاص مورد نياز ما مهمترين کاري است
که بايد بر روي آن تمرکز کنيم. جستجوهاي عادي براي دسترسي به اطلاعات مورد
نظر کافي نيستند و سيستمهاي پرسش و پاسخ هستند که ميتوانند اطلاعات مدنظر
کاربران را از ميان حجم انبوه اطلاعات به صورت، دقيق، خلاصه، مختصر و مفيد
در اختيار آنّها بگذارند. در همين مرکز تحقيقات نور کلي کتاب داريم که
اکنون به صورت ديجيتال موجوداند، مانند کتب تفسير، احاديث و غيره که با
داشتن يک سيستم پرسش و پاسخ خوب ميتوانيم به سوالات مربوط به تمام اينها
پاسخ دهيم. مثالي ديگري که به ذهنم ميرسد تفسير قرآن به قرآن به صورت
خودکار است، يعني استفاده از بخشي از قرآن براي ارائه توضيح در مورد بخش
ديگر. افرادي چون علامه طباطبايي (ره) با تسلط کامل به قرآن قادر به انجام
چنين کاري بودند. با توسعه يک سيستم پرسش و پاسخ قرآني ميتوان با کنار هم
قرار دادن آيههاي مرتبط، تفسيري از يک موضوع قرآني ارائه کرد.
ديگر فعاليتهايتان در گروه مهندسي نرمافزار دانشگاه گيلان چيست؟
من
نزديک به دو سال است که در دانشگاه گيلان مشغول به فعاليت شدهام. حدود يک
سال پيش گروه پردازش زبان طبيعي را راهاندازي کردهايم که با مراجعه به
آدرس nlp.guilan.ac.ir ميتوانيد با فعاليتهاي ما آشنا شويد. يکي از
فعاليتهاي اصلي ما در زمينه تحليل خودکار احساسات است. اگر بخواهم با يک
مثال اين مورد را توضيح دهم، امروزه سايتهاي فراواني هستند که محصولاتي را
معرفي ميکنند و يا خبري را درج ميکنند و کاربران نظرات خود را در خصوص
آن محصول و يا خبر در سايت ثبت ميکنند. براي مثال کاربري در زير صفحه
معرفي يک دوربين مينويسد «من استفاده کردم و راضيام». گاهي صدها نظر در
خصوص مطلبي نوشته ميشوند و ميخواهيم در خصوص نظر کل کاربران يک جمعبندي
داشته باشيم. اينجاست که سيستم آناليز احساس به کار ميآيد. اين سيستم با
تحليل نظرات به ما ميگويد که کاربران نسبت به اين خبر يا اين محصول حس
مثبت دارند يا منفي. براي اين منظور ما پيکرهاي را توسعه دادهايم که
پيکره بزرگ و جامعي است. انشاءالله پس از انتشار مقاله مرتبط با اين
پيکره، آن را به صورت رايگان از طريق مرجع دادگان زبان فارسي منتشر خواهيم
کرد. فعاليت ديگر ما در گروه پردازش زبان ايجاد خودکار هستانشناسي فارسي
است که از صفحات ويکيپيديا به اين منظور استفاده ميکنيم. دامنه فعلي که در
ايجاد هستانشناسي استفاده ميکنيم، دامنه جانورشناسي است که نتايج خوبي
در اين زمينه هم بدست آوردهايم. از کارهاي ديگر ميتوان به سيستمهاي سطح
پايين مانند تجزيهگرهاي نحوي و استخراج روابط بين کلمات که به درد
سيستمهاي سطوح بالاتر ميخورد اشاره کرد. همچنين علاقهمنديم که روي بحث
خلاصهسازي خودکار متون فارسي هم کار کنيم.
اخيراً فعاليتهاي خوبي
در زمينه توليد داده براي براي پردازش زبان فارسي انجام گرفته است و اين
موضوع واقعاً جاي سرمايهگذاري دارد چرا که همانطور که گفتم در کشور ما و
حتي در مجموعههاي کوچکي مانند گروه ما در دانشگاه گيلان دانش فني خوبي
داريم و ايجاد چنين منابعي موجب حمايت از فعاليتهاي محققان خواهد بود و ما
ميتوانيم کارهايي را در زمينه پردازش زبان فارسي انجام دهيم که هيچ کم از
نمونههاي مشابه خارجي ندارد، چرا که تسلطي که ما به زبان خودمان داريم
خارجيها ندارند. اين مسئله بسيار مهم است چرا که در آيندهاي نه چندان دور
بخش عمدهاي از فرهنگ و اعتقادات ما از طريق همين اطلاعاتي که در
کامپيوترها موجود است ساخته ميشود و به همين خاطر بايد تلاش کنيم که
بتوانيم اطلاعات را درست استخراج کنيم و درست در اختيار همه قرار دهيم.