Державний університет
інформаційно-комунікаційних
технологій

(Державний університет телекомунікацій)

Укр.

Eng.

Адреса:

03110, Україна

м. Київ, вул. Солом'янська, 7

Приймальна комісія працює:

Пн-Пт: 08:00 - 17:00

Сб-Нд: 08:00 - 13:00

Контактна інформація:

Вступ 2024 - спеціальності для вступу:

Спеціальність 172: Електронні комунікації та радіотехніка

Кафедра Телекомунікаційних систем та мереж інституту телекомунікацій

Спеціальність 172: Електронні комунікації та радіотехніка

Кафедра Мобільних та відеоінформаційних технологій

Спеціальність 172 Електронні комунікації та радіотехніка

Кафедра Інтернет-технологій

Спеціальність 172 Електронні комунікації та радіотехніка

Кафедра Робототехніки та технічних систем

Спеціальність 124: Системний аналіз

Кафедра Системного аналізу

Спеціальність 122: Комп’ютерні науки

Кафедра Комп’ютерних наук

Спеціальність 122: Комп’ютерні науки

Кафедра Штучного інтелекту

Спеціальність 123: Комп’ютерна інженерія

Кафедра Комп’ютерної інженерії

Спеціальність 121: Інженерія програмного забезпечення

Кафедра Інженерії програмного забезпечення

Спеціальність 121: Інженерія програмного забезпечення

Кафедра Технологій цифрового розвитку

Спеціальність 126: Інформаційні системи та технології

Кафедра Інженерії програмного забезпечення автоматизованих систем

Спеціальність 125: Кібербезпека

Кафедра Інформаційної та кібернетичної безпеки

Спеціальність 125: Кібербезпека

Кафедра Систем інформаційного та кібернетичного захисту

Спеціальність 125: Кібербезпека

Кафедра Управління інформаційною та кібернетичною безпекою

Спеціальність 281: Публічне управління та адміністрування

Кафедра Публічного управління та адміністрування

Спеціальність 029: Інформаційна бібліотечна та архівна справа

Кафедра Документознавства та інформаційної діяльності

Спеціальність 073: Менеджмент

Кафедра Менеджменту

Спеціальність 075: Маркетинг

Кафедра Маркетингу

Спеціальність 076: Підприємництво, торгівля та біржова діяльність

Кафедра Підприємництва, торгівлі та біржової діяльності

Спеціальність 051: Економіка

Кафедра Економіки

Вітаємо команду кафедри Комп’ютерних наук - переможців всеукраїнського конкурсу студентських наукових робіт з спеціальності «Інженерія програмного забезпечення» 2020!

16:48, 31-05-2020

Команда кафедри Комп’ютерних наук Державного університету телекомунікацій у складі групи студентів Шелега М. Г. і Шипілової А. О. під науковим керівництвом С. М. Іщерякова, к.т.н., доц. зайняла перше місце на всеукраїнському конкурсі студентських наукових робіт з спеціальності «інженерія програмного забезпечення», який проводився на факультеті Інформаційних технологій Київського національного університету імені Тараса Шевченко. Вони представляли проект «Онлайн помічник з медичних питань», шифр «RoboDoc». Захист роботи відбувся онлайн 27 травня 2020 року.

Робота відрізняється від інших науковою новизною та конкретним практичним використанням робочого програмного забезпечення. В роботі розроблено Telegram бот та Deep Learning Quesion Answering модель для відповіді на медицинські питання. Для цього використано алгоритми Machine Learning, а саме модель BERT та faiss для векторного пошуку.

Основні завдання роботи: проведення аналізу існуючих Question Answering алгоритмів (Rule-based, статистичні, RNN, BERT); збір або знаходження датасету; удосконалення вже існуючої математичної моделі; створення прототипу системи. Було обрано саме BERT через гарне розуміння контексту.

Вхідними даними є питання англійською мовою. Математична модель включає в себе: BioBERT(BERT натренований на PubMed), FCNN та faiss для векторного пошуку.

Під час тренування ми робимо такі кроки:

Переводимо питання та відповіді в векторний простір, створюючи embedding за допомогою BioBERT.
Створюємо similarity embedding (наскільки питання та відповідь схожі) за допомогою Fully Connected Neural Network (Повнозв’язна Нейронна Мережа).
Поелементно множимо similarity embedding (вектор) питання та відповіді між собою, утворюючи матрицю, яку передаємо Cross Entropy Loss. Вона порівнює відповіді дані моделлю з оригінальними та змінєю ваги, що дозволяє зменшувати похибку з кожною епохою тренування.

Існуюча модель DocProduct була удосконалена дотреннуванням на нових даних (з американських медичних форумів та порталів NIH - більш наукові та кваліфіковані відповіді). На питаннях без відповіді використовувалась техніка pseudo-labeling, щоб збільшити кількість тренувальних даних. Вище описані дії дали можливість удосконалити відповіді моделі та зробити їх більш детальними.

Етап inference (передбачення вже натренованої моделі) працює таким чином:

Використовуючи натреновану модель створюємо embedding.
Шукаємо найближчу відповідь за допомогою faiss.
Повертаємо її в Telegram Bot.

Бот підтримує українську та перекладає питання англійською, проходить всі кроки і перекладає відповідь українською.

В результаті, роботи розроблено програмне забезпечення, що може відповідати на питання саме для медичних працівників (діючих лікарів та інтернів), бо самолікування звичайними людьми може бути шкідливим. Таким чином лікар зможе провалідувати відповідь та отримати корисну інформацію, відносно випадка пацієнта.

Код Telegram бота та API з DL моделью знаходиться на Github. Більше деталей Ви зможете знайти в презентації.

Оцінити новину:

Розповісти друзям:

(Державний університет телекомунікацій)

(Державний університет телекомунікацій)

(Державний університет телекомунікацій)

Державний університетінформаційно-комунікаційнихтехнологій

(Державний університет телекомунікацій)

Ключові слова

Державний університет
інформаційно-комунікаційних
технологій