Electronic Repository

Використання згорткових нейронних мереж у задачах розпізнавання та класифікації об’єктів зображень

Show simple item record

dc.contributor.author Кушнір, Н.О.
dc.contributor.author Локтікова, Т.М.
dc.contributor.author Морозов, А.В.
dc.contributor.author Юрченко, В.О.
dc.contributor.author Kushnir, N.O.
dc.contributor.author Loktikova, T.M.
dc.contributor.author Morozov, A.V.
dc.contributor.author Yurchenko, V.O.
dc.date.accessioned 2022-07-18T07:25:31Z
dc.date.available 2022-07-18T07:25:31Z
dc.date.issued 2022
dc.identifier.uri http://eztuir.ztu.edu.ua/123456789/8007
dc.description.abstract Досліджується застосування штучних нейронних мереж у задачах розпізнавання та класифікації об’єктів зображень. Розглядається класична задача класифікації об’єктів на зображенні, а саме визначення статі особи за її обличчям. Це зумовлено тим, що існує вдалий набір даних, який складається з 47009 зображень облич чоловіків та жінок для навчання та 11649 зображень облич для тестування штучної нейронної мережі. Запропоновано використання згорткової нейронної мережі. Такий підхід дозволяє зменшити обсяг інформації, що зберігається у пам’яті, а також ієрархічно виділити та агрегувати ознаки вхідних даних. Згорткова нейронна мережа складається з декількох блоків згорткових й агрегувального шарів, шару вирівнювання, шарів повнозв’язних нейронів, вихідного нейрона. Пороговою активаційною функцію для всіх нейронів, окрім вихідного, обрано функцію «ReLU». Активаційною функцією вихідного нейрона є сигмоїдальна. Здійснено побудову нейронної мережі, її навчання та тестування із застосуванням бібліотеки «TensorFlow», API «Keras.NET», а також розробленої бібліотеки методів на базі платформи «.NET Standard 2.0». Для візуального відображення налаштування відповідних процесів розроблено віконний додаток на базі платформ «.NET 6.0» та «WPF». Для побудови необхідних графіків використано бібліотеку «OxyPlot». Досліджено якість роботи пропонованої згорткової нейронної мережі залежно від кількості блоків та розмірів фільтра згортки. Найкращі результати роботи досягаються із 3 блоками згорткових та агрегувального шарів та розмірами фільтра згортки 3 x 3 пікселів. Оптимальної точності класифікації об’єктів зображень мережа набуває при її навчанні протягом 14 епох. uk_UA
dc.language.iso uk uk_UA
dc.publisher Державний університет "Житомирська політехніка" uk_UA
dc.relation.ispartofseries Технічна інженерія;1(89)
dc.subject нейрон uk_UA
dc.subject штучна нейронна мережа uk_UA
dc.subject зображення uk_UA
dc.subject класифікація об’єктів uk_UA
dc.subject згортка uk_UA
dc.subject neuron uk_UA
dc.subject artificial neural network uk_UA
dc.subject image uk_UA
dc.subject classification of objects uk_UA
dc.subject convolution uk_UA
dc.title Використання згорткових нейронних мереж у задачах розпізнавання та класифікації об’єктів зображень uk_UA
dc.title.alternative Using convolutional neural networks in image object recognition and classification tasks uk_UA
dc.type Article uk_UA
dc.description.abstracten The usage of artificial neural networks in the tasks of object recognition and classification is studied. The classical problem of classifying objects in an image is considered, namely - determining the sex of a person by face. This is due to the fact that there is a successful set of data, which consists of 47,009 images of faces of men and women and 11,649 images of faces for training and testing artificial neural networks. It is suggested to use convolutional neural networks. This approach reduces the amount of information stored in memory, as well as hierarchically separates and aggregates features of the input data. Convolutional neural network consists of several blocks of convolutional and aggregating layers, alignment layer, layers of fully connected neurons, source neuron. The "ReLU" function was selected as the threshold activation function for all neurons except the original one. The activation function of the original neuron is sigmoidal. The neural network was built, trained and tested using the library "TensorFlow", API "Keras.NET", as well as the developed library of methods based on the platform ".NET Standart 2.0». and «WPF». The OxyPlot library was used to build the necessary graphs. The quality of work of the convolutional neural network that depends on the number of blocks and the sizes of the convolution filter has been investigated. The best results are achieved with 3 blocks of convolutional and aggregation layers and a convolutional filter size of 3x3 pixels. The optimum accuracy of image object classification is obtained by training the network for 14 epochs. uk_UA


Files in this item

This item appears in the following Collection(s)

Show simple item record

Search DSpace


Browse

My Account