Electronic Repository

Використання афінних перетворень для корекції зображень з подальшим використанням у системах розпізнавання

Show simple item record

dc.contributor.author Марчук, Д.К.
dc.contributor.author Marchuk, D.K.
dc.date.accessioned 2024-03-05T09:28:39Z
dc.date.available 2024-03-05T09:28:39Z
dc.date.issued 2023
dc.identifier.uri http://eztuir.ztu.edu.ua/123456789/8390
dc.description.abstract Нині нейронні мережі набувають все більшої популярності і все частіше використовуються в різних галузях життя. Їх застосовують для аналізу даних, кластеризації, класифікації, виявлення об’єктів або схованих закономірностей. Все частіше зустрічаються варіанти застосування нейронних мереж у завданнях бізнес-прогнозування. Системи комп’ютерного зору не є винятком. Важливою складовою цих процесів є попередня обробка зображень. Відомо, що зображення, отримані з відеокамер, можуть виявляти перспективні спотворення, що походять від неідеальних кутів розташування камери. Зазвичай техніка афінного перетворення використовується для корекції геометричних спотворень або деформацій, таких як масштабування, переміщення, зсув, обертання. В роботі були проведені дослідження особливостей афінних перетворень і їх застосування з нейронними мережами. Розглянуто методи розпізнавання геометричних параметрів під час трансформації та переміщення зображень. Увагу приділено елементарним перетворенням, які враховують перенесення, масштабування, зсув, обертання. Розроблено математичну модель перетворення зображень для систем комп’ютерного зору. На базі запропонованого методу побудовано алгоритм перспективних перетворень зображень, отриманих з відеокамер, які знаходяться на автостоянках або парковках міста, що значно полегшує в подальшому виявлення, сегментацію і класифікацію об’єктів. Для покращення роботи класичної Mask R-CNN було проведено дослідження, в якому було додано блок з афінними перетвореннями до згорткової нейронної мережі. Афінні трансформації застосовано для корекції перспективного сходження ліній у кадрі, паралельних у реальності. uk_UA
dc.language.iso uk uk_UA
dc.publisher Державний університет "Житомирська політехніка" uk_UA
dc.relation.ispartofseries Технічна інженерія;2(92)
dc.subject відеозображення uk_UA
dc.subject геометричні параметри uk_UA
dc.subject комп’ютеризована система uk_UA
dc.subject афінні перетворення uk_UA
dc.subject нейронні мережі uk_UA
dc.subject video images uk_UA
dc.subject geometric parameters uk_UA
dc.subject computerized system uk_UA
dc.subject affine transformations uk_UA
dc.subject neural networks uk_UA
dc.title Використання афінних перетворень для корекції зображень з подальшим використанням у системах розпізнавання uk_UA
dc.title.alternative The use of affine transformations for image correction with further use in recognition systems uk_UA
dc.type Article uk_UA
dc.description.abstracten Today, neural networks are gaining popularity and are increasingly used in various fields of life. They are used for data analysis, clustering, classification, object detection, or hidden patterns. Neural networks are increasingly used in business forecasting tasks. Computer vision systems are no exception. An important component of these processes is image preprocessing. It is known that images obtained from video cameras can exhibit perspective distortions originating from imperfect camera angles. Usually, the affine transform technique is used to correct geometric distortions or deformations, such as scaling, moving, shifting, rotating. In this paper, we study the features of affine transforms and their application with neural networks. Methods for recognizing geometric parameters in image transformation and moving are considered. Attention is paid to elementary transformations, which include transfer, scaling, shift, rotation. A mathematical model of image transformation for computer vision systems is developed. On the basis of the proposed method, an algorithm for perspective transformations of images obtained from video cameras located in parking lots or city parking lots is built, which greatly facilitates the further detection, segmentation and classification of objects. To improve the performance of the classical Mask R-CNN, a study was conducted in which a block with affine transformations was added to the convolutional neural network. Affine transformations are used to correct the perspective convergence of lines in the frame that are parallel in reality. uk_UA


Files in this item

This item appears in the following Collection(s)

Show simple item record

Search DSpace


Browse

My Account