Mezentseva O. O. Optimization of analysis and minimization of information losses in Text Mining = Оптимізація аналізу та мінімізація інформаційних втрат у Text Mining / O. O. Mezentseva, A. S. Kolomiiets // Herald of Advanced Inform. Technology. - 2020. - 3, № 1. - С. 373-382. - Бібліогр.: 18 назв. - англ.Мета роботи - провести аналіз сучасних підходів до аналізу та обробки даних; вивчити основні алгоритми для аналізу та обробки даних; на основі застосування новітніх технологій створити програму, яка буде збирати дані, проектувати архітектуру програми для більш ефективного використання; очистити дані, застосовуючи методи мінімізації інформаційних втрат; проаналізувати отримані очищені дані застосовуючи підходи до аналізу та обробки текстових даних; зробити висновки за результатами всіх вищезгаданих робіт. Існує досить велика кількість різновидів перерахованих завдань, а також методів їх вирішення. Інформація є одним із найважливіших ресурсів сучасного бізнес-середовища. Для будь-якої компанії важко досягти успіху, не маючи достатньої інформації про своїх клієнтів, співробітників та інших ключових зацікавлених сторін. Щодня компанії отримують неструктурований і структурований текст із різних джерел, таких як результати опитування, твіти, нотатки до коллцентру, телефонні розсилки, онлайн-відгуки клієнтів, записані взаємодії, листи та інші документи. Ці джерела надають необроблений текст, який нелегко зрозуміти без використання правильного інструменту аналізу тексту. Можна виконувати аналітику тексту вручну, але процес вручну є неефективним. Традиційні системи використовують ключові слова і не можуть читати та розуміти мову в електронних листах, твітах, веб-сторінках і текстових документах. Із цих причин компанії використовують програмне забезпечення для аналізу текстів великих обсягів текстових даних. Програмне забезпечення допомагає користувачам отримувати інформацію з текстових даних, щоб діяти відповідно. В даний час найбільш поширене ручне анотування, до переваг якого можна віднести, безумовно, високу якість складання анотації та її "осмисленість". Типові недоліки ручних систем анотування, систем аналізу текстової інформації - це високі матеріальні витрати та притаманна їм низька швидкість роботи. Мета роботи - дослідження методів за допомогою яких можна ефективно анотувати відгуки про різноманітні товари з найбільшого торгівельного майданчику України; методів і засобів за допомогою яких можна мінімізувати інформаційні втрати при аналізі та обробці текстових даних. Об'єктом дослідження є процес мінімізації інформаційних втрат при аналізі та обробці текстових даних. В ході дослідження проведено аналіз останніх досліджень з аналізу та обробки текстової інформації та методів обробки текстової інформації та алгоритми Data Mining. Індекс рубрикатора НБУВ: З970.5-018.2
Рубрики:
Шифр НБУВ: Ж101737 Пошук видання у каталогах НБУВ Повний текст Наукова періодика України
Якщо, ви не знайшли інформацію про автора(ів) публікації, маєте бажання виправити або відобразити більш докладну інформацію про науковців України запрошуємо заповнити "Анкету науковця"
|