Використання афінних перетворень для корекції зображень з подальшим використанням у системах розпізнавання

Марчук, Д.К.; Marchuk, D.K.

dc.contributor.author	Марчук, Д.К.
dc.contributor.author	Marchuk, D.K.
dc.date.accessioned	2024-03-05T09:28:39Z
dc.date.available	2024-03-05T09:28:39Z
dc.date.issued	2023
dc.identifier.uri	http://eztuir.ztu.edu.ua/123456789/8390
dc.description.abstract	Нині нейронні мережі набувають все більшої популярності і все частіше використовуються в різних галузях життя. Їх застосовують для аналізу даних, кластеризації, класифікації, виявлення об’єктів або схованих закономірностей. Все частіше зустрічаються варіанти застосування нейронних мереж у завданнях бізнес-прогнозування. Системи комп’ютерного зору не є винятком. Важливою складовою цих процесів є попередня обробка зображень. Відомо, що зображення, отримані з відеокамер, можуть виявляти перспективні спотворення, що походять від неідеальних кутів розташування камери. Зазвичай техніка афінного перетворення використовується для корекції геометричних спотворень або деформацій, таких як масштабування, переміщення, зсув, обертання. В роботі були проведені дослідження особливостей афінних перетворень і їх застосування з нейронними мережами. Розглянуто методи розпізнавання геометричних параметрів під час трансформації та переміщення зображень. Увагу приділено елементарним перетворенням, які враховують перенесення, масштабування, зсув, обертання. Розроблено математичну модель перетворення зображень для систем комп’ютерного зору. На базі запропонованого методу побудовано алгоритм перспективних перетворень зображень, отриманих з відеокамер, які знаходяться на автостоянках або парковках міста, що значно полегшує в подальшому виявлення, сегментацію і класифікацію об’єктів. Для покращення роботи класичної Mask R-CNN було проведено дослідження, в якому було додано блок з афінними перетвореннями до згорткової нейронної мережі. Афінні трансформації застосовано для корекції перспективного сходження ліній у кадрі, паралельних у реальності.	uk_UA
dc.language.iso	uk	uk_UA
dc.publisher	Державний університет "Житомирська політехніка"	uk_UA
dc.relation.ispartofseries	Технічна інженерія;2(92)
dc.subject	відеозображення	uk_UA
dc.subject	геометричні параметри	uk_UA
dc.subject	комп’ютеризована система	uk_UA
dc.subject	афінні перетворення	uk_UA
dc.subject	нейронні мережі	uk_UA
dc.subject	video images	uk_UA
dc.subject	geometric parameters	uk_UA
dc.subject	computerized system	uk_UA
dc.subject	affine transformations	uk_UA
dc.subject	neural networks	uk_UA
dc.title	Використання афінних перетворень для корекції зображень з подальшим використанням у системах розпізнавання	uk_UA
dc.title.alternative	The use of affine transformations for image correction with further use in recognition systems	uk_UA
dc.type	Article	uk_UA
dc.description.abstracten	Today, neural networks are gaining popularity and are increasingly used in various fields of life. They are used for data analysis, clustering, classification, object detection, or hidden patterns. Neural networks are increasingly used in business forecasting tasks. Computer vision systems are no exception. An important component of these processes is image preprocessing. It is known that images obtained from video cameras can exhibit perspective distortions originating from imperfect camera angles. Usually, the affine transform technique is used to correct geometric distortions or deformations, such as scaling, moving, shifting, rotating. In this paper, we study the features of affine transforms and their application with neural networks. Methods for recognizing geometric parameters in image transformation and moving are considered. Attention is paid to elementary transformations, which include transfer, scaling, shift, rotation. A mathematical model of image transformation for computer vision systems is developed. On the basis of the proposed method, an algorithm for perspective transformations of images obtained from video cameras located in parking lots or city parking lots is built, which greatly facilitates the further detection, segmentation and classification of objects. To improve the performance of the classical Mask R-CNN, a study was conducted in which a block with affine transformations was added to the convolutional neural network. Affine transformations are used to correct the perspective convergence of lines in the frame that are parallel in reality.	uk_UA