فصل اول: کلیات
1-1- مقدمه
آنچه که بین تمام علوم مشترک است، حجم وسیعی از اطلاعات و داده به شکلهای مختلف است، که همراه با پیشرفت و وسعت علوم بزرگتر و ارزشمندتر میشود. با رشد سریع علوم کامپیوتر و استفاده از آن در چند دهه اخیر، تقریبا همه سازمانها در پروژههای مختلف خود حجم عظیمی داده در پایگاههای داده ذخیره میکنند. این سازمانها و کسانی که به نوعی در پروژهها سهیم هستند به فهم این دادهها و بهتر بگوییم کشف دانش نهفته در آن نیازمندند. این نیاز، باعث بهوجود آمدن حوزه جدید میان رشتهای کشف دانش و دادهکاوی[1] شده است، که حوزههای مختلف همچون پایگاه داده، آمار، یادگیری ماشین را برای کشف دانش ارزشمند نهفته در اطلاعات و دادهها را با هم تلفیق میکند. اصطلاح Data Mining همانطور که از ترجمه آن به معنی دادهکاوی مشخص میشود، به مفهوم استخراج اطلاعات نهان، و یا الگوها وروابط مشخص در حجم زیادی از دادهها در یک یا چند بانک اطلاعاتی بزرگ است.
هر نرمافزار در طول فرآیندتولید و پس از آن، انبوهی از اطلاعات و مستندات دارد که قابل کاوش و استفاده مفید است. این دادهها معمولا در پایگاه دادههایی بهنام مخازن نرمافزاری[2] ذخیره و نگهداری میشوند. مخازن نرمافزاری نمایش دقیقی از مسیرتولید یک سیستم نرمافزاری ارائه میدهند]1 .[هدف ازکاوش مخازن نرمافزاری[3]MSR استفاده هوشمند از تحلیل دادههای نهفته در آنها برای کمک به تصمیمگیری های بهتر و سریعتر در پروژه تولید و پشتیبانی آنها است. آنچه که در اینجا مورد توجه این تحقیق است، استخراج اطلاعات مهم برای همه ذینفعان پروژه نرمافزاری است. این اطلاعات از مجموعه دادههای مرتبط با خطاهای رخ داده در طول تولید و پشتیبانی پروژه استخراج می شود.
در سالهای گذشته مدلهای مختلفی با استفاده از الگوریتمهای دادهکاوی، تشابه متن و دستهبندی و خوشهبندی دادهها ارائه شده. اما از آنجا که جستجو و استخراج اطلاعات از میان دادههای متنی نیازمند روشی هوشمند برای تطبیق جنبههای معنایی و دستوری است، نیاز به مدلهایی که از الگوریتمها معنایی استفادهکنند وجود دارد.در تحقیقهای مورد مطالعه این نیاز حس میشود.
سعی بر این شده که با استفاده از الگوریتم معنایی برپایه مجموعه تشابه جملات[4]بر پایه LCS[5]]3[ و تشابه کلمات (SOC-PMI[6] )]3[، روی مستندات ذخیره شده در مخازن خطای نرمافزار، مانند راهحلهای ارائه شده برای خطاهای مشابه مدلهای قبلی را تکمیلکرده و جوابی بهینه و سریعتر برای خطای پیش آمده پیدا کنیم. همچنین میتوان زمانی تخمینی نیز برای تصحیح خطا پیشبینی کرد تا راهنمای تیم توسعه و ذینفعان دیگر نرمافزار باشد. همچنین دید بهتری نسبت به روند پیشرفت و تکامل نرمافزار مورد نظر ارائه شود.
برای دانلود متن کامل پایان نامه اینجا کلیک کنید
لینک بالا اشتباه است
:: بازدید از این مطلب : 957
|
امتیاز مطلب : 5
|
تعداد امتیازدهندگان : 1
|
مجموع امتیاز : 1