РЕФЕРАТИВНА БАЗА ДАНИХ "УКРАЇНІКА НАУКОВА"
Abstract database «Ukrainica Scientific»


Бази даних


Реферативна база даних - результати пошуку


Вид пошуку
Пошуковий запит: (<.>ID=REF-0000831598<.>)
Загальна кількість знайдених документів : 1

Yakovyna V. S. 
Towards a software defect proneness model: feature selection = Побудова моделі дефектності програм: вибір метрик / V. S. Yakovyna, I. I. Symets // Appl. Aspects of Inform. Technology. - 2021. - 4, № 4. - С. 354-365. - Бібліогр.: 23 назв. - англ.

Мета роботи - вдосконалення статичних моделей надійності програмного забезпечення (ПЗ) за рахунок використання методів машинного навчання для вибору метрик коду ПЗ, що найсильніше впливають на його надійність. У дослідженні використано злитий датасет із репозиторію PROMISE Software Engineering, який містив дані про тестування програмних модулів п'яти програм (KC1, KC2, PC1, CM1, JM1) і 21 метрику коду. Для підготовленої вибірки здійснено вибір найважливіших ознак, які впливають на якість програмного коду за допомогою наступних методів вибору ознак: Boruta, Step-wise selection, Exhaustive Feature Selection, Random Forest Importance, LightGBM Importance, Genetic Algorithms, Principal Component Analysis, Xverse python. На підставі голосування за результатами роботи методів вибору ознак побудовано статичну (детерміністичну) модель надійності ПЗ, яка встановлює взаємозв'язок між імовірністю появи дефекту в програмному модулі та метриками його коду. Показано, що в цю модель входять такі метрики коду як кількість гілок програми, кількість рядків коду та цикломатична складність за МакКейбом, загальна кількість операторів та операндів, інтелект, обсяг і кількість зусиль за Холстедом. Здійснено порівняння ефективності роботи різних методів вибору ознак, зокрема проведено дослідження впливу методу вибору ознак на точність класифікації з використанням наступних класифікаторів: Random Forest, Support Vector Machine, k-Nearest Neighbor, Decision Tree classifier, AdaBoost classifier, Gradient Boosting for classification. Показано, що використання будь-якого методу вибору ознак підвищує точність класифікації принаймні на 10 процентів у порівнянні з початковим датасетом, що підтверджує важливість цієї процедури для прогнозування дефектів ПЗ на основі метричних датасетів, які містять значну кількість сильно корелюючих метрик коду ПЗ. Установлено, що найкращу для більшості класифікаторів точність прогнозу вдалось отримати з використанням набору ознак, отриманого з запропонованої статичної моделі надійності ПЗ. Крім того, показано, що можливим також є використання окремих методів, таких як Autoencoder, Exhaustive Feature Selection та Principal Component Analysis із незначною втратою точності класифікації та прогнозування.



Шифр НБУВ: Ж101736 Пошук видання у каталогах НБУВ 
Повний текст  Наукова періодика України 
  Якщо, ви не знайшли інформацію про автора(ів) публікації, маєте бажання виправити або відобразити більш докладну інформацію про науковців України запрошуємо заповнити "Анкету науковця"
 
Національна бібліотека України імені В. І. Вернадського
Відділ наукового формування національних реферативних ресурсів
Інститут проблем реєстрації інформації НАН України

Всі права захищені © Національна бібліотека України імені В. І. Вернадського