XS
SM
MD
LG
Державний університет інформаційно-комунікаційних технологій

(Державний університет телекомунікацій)


Адреса:
03110, Україна
м. Київ, вул. Солом'янська, 7
Контактна інформація:
Державний університет інформаційно-комунікаційних технологій

(Державний університет телекомунікацій)

Вітаємо переможців всеукраїнського конкурсу студентських наукових робіт з спеціальності «інженерія програмного забезпечення» 2019!

10:00, 19-04-2019

Команда кафедри Комп’ютерних наук Державного університету телекомунікацій у складі студентів першого курсу групи М.Г Шелега і Н.Ю Бабія під науковим керівництвом І.С Щербини, к.т.н., доц. зайняла перше місце на всеукраїнському конкурсі студентських наукових робіт з спеціальності «інженерія програмного забезпечення», який проводився на факультеті Інформаційних технологій Київського національного університету імені Тараса Шевченко. Вони представляли проект «Розрахунок координат критичних точок знятих з безпілотного літального апарату», шифр «ФОТО-БПЛА». Захист роботи відбувся 3 квітня 2019 року.

Робота відрізняється від інших науковою новизною та конкретним практичним використанням робочого програмного забезпечення. В роботі розроблено комп’ютерну програму для швидкого знаходження невідомих слів іноземною мовою. Для цього використано алгоритми Machine Learning. Дані алгоритми можуть навчатися на основі прикладів, які підготовлені окремими користувачами, тим самим зменшувати свою похибку. Спочатку програма не знає, які слова відомі користувачу. Користувач зможе пройти тест на визначення словникового запасу.

Основні завдання роботи: проведення аналізу існуючих POS Tagging алгоритмів; розробка набору початкових даних з тренувальними та тестовими реченнями; розробка математичної моделі; створення прототипу системи. Для вирішення конфліктів в роботі розглядаються POS Tagging алгоритми. Вирішено використовувати «стохастичний теггер», бо він використовує ймовірності послідовності тегів і вимірювання частоти слів. Для цього використано різновид HMMs, а саме CRF. CRF необхідний для сегментації та маркування даних. Це неорієнтована модель графа, що кодує умовний розподіл з заданим набором ознак.

Вхідними даними є розмічений Brown Corpus dataset. Математична модель включає згорткову нейронну мережу (CNN), що представлена на рівні символів (character-level representation).

На наступному етапі поєднуються представлення рівня символів (character-level) і слів (word-level) і подаються у двонапрямлений LSTM (BLSTM) для моделювання контекстної інформації кожного слова.

Крім BLSTM, ми використовуємо послідовний CRF, щоб спільно декодувати labels для всіх речень. Ми тренуємо та валідуємо нашу модель POS-Tagger на Brown Corpus датасеті.

В результаті роботи розроблено програмне забезпечення, що зможе легко і швидко ділити вхідний текст на частини мови та пропонувати його переклад. Також дана система навчається з кожним новим запитом.

Результати даної роботи дають можливість виключити необхідність ручної обробки інформації та автоматизує процес перекладу тексту.

Читайте також
Бажаєте дізнаватись про особливості вступу у 2024 році?
Підписуйтесь на спільноти спеціальності "122 Комп’ютерні науки" кафедри Комп’ютерних наук та першим отримуйте новини, сповіщення про важливі події, підготовчі курси, дні відкритих дверей та багато цікавого.

Отримати консультацію

Ваш запит на зворотній дзвінок отримає завідуючий кафедрою
Надіслати запит

Абітурієнту

Освітня програма: Комп’ютерні науки

За освітньою програмою Комп’ютерні науки, спеціальність 122 Комп’ютерні науки (англ. Computer Science, CS) готуються фахівці, що здатні виконувати функції розробника-програміста, спеціаліста по мережах, адміністратора баз даних, системного адміністратора, DevOps Engineer, спеціаліста по тестуванню програм, IT-архітектора. Вони володіють навичками алгоритмічного мислення, уявлення інформації, програмування і проектування комп’ютерних систем. Основні розділи: алгоритми і структури даних, мови програмування, архітектура комп'ютерів, операційні системи і комп'ютерні мережі, розробка програмного забезпечення, сервери і бази даних, штучний інтелект та робототехніка, комп'ютерна графіка, взаємодія людини і комп'ютера та ін.

Освітня програма: Комп’ютерні науки

За освітньою програмою Комп’ютерні науки, спеціальність 122 Комп’ютерні науки (англ. Computer Science, CS) готуються фахівці, що здатні виконувати функції розробника-програміста, спеціаліста по мережах, адміністратора баз даних, системного адміністратора, DevOps Engineer, спеціаліста по тестуванню програм, IT-архітектора. Вони володіють навичками алгоритмічного мислення, уявлення інформації, програмування і проектування комп’ютерних систем. Основні розділи: алгоритми і структури даних, мови програмування, архітектура комп'ютерів, операційні системи і комп'ютерні мережі, розробка програмного забезпечення, сервери і бази даних, штучний інтелект та робототехніка, комп'ютерна графіка, взаємодія людини і комп'ютера та ін.

Переглядів: 3 858