Університет Короля Данила

Багаторівневий підхід виявлення та розпізнавання небезпечних предметів за допомогою БПЛА із застосуванням комп’ютерного зору

Show simple item record

dc.contributor.author Роботько, Сергій Павлович
dc.contributor.author Луцак, Дмитро Любомирович
dc.date.accessioned 2026-03-05T06:55:52Z
dc.date.available 2026-03-05T06:55:52Z
dc.date.issued 2025
dc.identifier.citation Роботько С. П., Луцак Д. Л. Багаторівневий підхід виявлення та розпізнавання небезпечних предметів за допомогою БПЛА із застосуванням комп’ютерного зору = Multilevel approach to uav-based detection of anti-personnel mines using computer vision // Вісник Харківського національного автомобільно-дорожнього університету: зб. наук. праць. Серія: Комп’ютерні науки та інформаційні технології, 2025. № 111. С. 203-210. uk_UA
dc.identifier.issn DOI: 10.30977/BUL.2219-5548.2025.111.0.203
dc.identifier.other УДК 629.341
dc.identifier.uri http://repository.ukd.edu.ua/xmlui/handle/123456789/2042
dc.description Роботько С. П., Луцак Д. Л. Багаторівневий підхід виявлення та розпізнавання небезпечних предметів за допомогою БПЛА із застосуванням комп’ютерного зору = Multilevel approach to uav-based detection of anti-personnel mines using computer vision // Вісник Харківського національного автомобільно-дорожнього університету: зб. наук. праць. Серія: Комп’ютерні науки та інформаційні технології, 2025. № 111. С. 203-210. uk_UA
dc.description.abstract Запропоновано багаторівневу систему виявлення мін за допомогою безпілотного літального апарата (БПЛА) зі швидкою детекцією YOLOv8n на наземній станції та хмарній семантичній верифікації ChatGPT-4o Vision із проміжною впевненістю. Відео 1080p з Raspberry Pi синхронізується з телеметрією Pixhawk 6C й геоприв‟язується, після чого контейнеризація та повне логування гарантують відтворювання. Запропонована схема прийняття рішень дозволяє зберігати високу повноту на етапі YOLOv8 і скорочувати хибні спрацьовування завдяки семантичній перевірці проблемних ділянок зображення в хмарі без істотного впливу на середню затримку та смугу каналу. Develop and validate a multilevel edge→ground→cloud decision pipeline for UAV- based detection of small anti-personnel mines (PFM-1), combining a fast visual detector with on-demand semantic verification. The objective is to maximize recall at a controlled false-alarm rate while preserving low latency, narrow bandwidth, and full temporal/geospatial traceability for audit and reproducibili-ty. Methodology. The edge (Raspberry Pi) records 1080 p video time-aligned with Pixhawk 6C telemetry and forwards segments reliably (store-and-forward). The ground station runs Ultralytics YOLOv8n with frame-level inference, temporal aggregation of con-fidences (sY), and WGS-84 georeferencing. Events with intermediate confidence are escalated to the cloud, where a vision-language model (ChatGPT-4o Vision) returns a semantic score sC under a con-strained YES/NO prompt. Final decisions use cali-brated fusion Pfinal=λYsY+λCsC with thresholding (generalizing AND/OR and k-of-n rules). All modules are containerized; timestamps, model versions, thre-sholds, and checksums are logged, with a unified GPS/NTP time axis. Field trials at ≈2–3 m altitude over heterogeneous backgrounds with PFM-1 mock-ups yielded Precision 0.957, Recall 1.000, mAP@0.5 0.981, mAP@0.5:0.95 0.688 at ≈36 FPS on a field laptop. Selective escalation of ROI crops reduced false positives with negligible added latency and bandwidth. Originality. We provide the first reproducible end-to-end architecture that links detector confidence to a semantic VLM signal via an explicit escalation rule and probabilistic calibration (Platt/temperature scaling), under an auditable data plane. The design formalizes timing and bandwidth budgets, remains resilient to link loss, and unifies temporal alignment, georeferencing, and provenance via containerized modules and machine-readable logs. Practical value. The system enables near-real- time post-flight analysis on commodity hardware, preserves high recall while suppressing clutter-driven false alarms, and reduces operator workload. By transmitting only ROI crops, it lowers communi-cation energy demands and eases deployment in bandwidth-constrained field settings. The methodology supports governance and evidence through verifiable logs and is readily extensible to multi-class detection and to fusion with a metal detector within the same probabilistic framework, facilitating technology transfer to humanitarian demining workflows. uk_UA
dc.language.iso other uk_UA
dc.publisher Харків: ХНАДУ uk_UA
dc.relation.ispartofseries Комп’ютерні науки та інформаційні технології;№ 111
dc.subject гуманітарне розмінування uk_UA
dc.subject БПЛА uk_UA
dc.subject візуально-мовні моделі uk_UA
dc.subject бездротова комп'ютерна мережа uk_UA
dc.subject комп'ютерний зір uk_UA
dc.subject YOLOv8 uk_UA
dc.subject геоприв'язка uk_UA
dc.subject багаторівневий аналіз зображення uk_UA
dc.subject ChatGPT uk_UA
dc.subject humanitarian demining uk_UA
dc.subject UAV uk_UA
dc.subject vision- language models uk_UA
dc.subject wireless computer network uk_UA
dc.subject computer vision uk_UA
dc.subject YOLOv8 uk_UA
dc.subject georeferencing uk_UA
dc.subject multilevel image analysis uk_UA
dc.subject ChatGPT uk_UA
dc.title Багаторівневий підхід виявлення та розпізнавання небезпечних предметів за допомогою БПЛА із застосуванням комп’ютерного зору uk_UA
dc.title.alternative Multilevel approach to uav-based detection of anti-personnel mines using computer vision uk_UA
dc.type Article uk_UA


Files in this item

This item appears in the following Collection(s)

Show simple item record

Search DSpace


Browse

My Account