Використання згорткових нейронних мереж у задачах розпізнавання та класифікації об’єктів зображень

Кушнір, Н.О.; Локтікова, Т.М.; Морозов, А.В.; Юрченко, В.О.; Kushnir, N.O.; Loktikova, T.M.; Morozov, A.V.; Yurchenko, V.O.

dc.contributor.author	Кушнір, Н.О.
dc.contributor.author	Локтікова, Т.М.
dc.contributor.author	Морозов, А.В.
dc.contributor.author	Юрченко, В.О.
dc.contributor.author	Kushnir, N.O.
dc.contributor.author	Loktikova, T.M.
dc.contributor.author	Morozov, A.V.
dc.contributor.author	Yurchenko, V.O.
dc.date.accessioned	2022-07-18T07:25:31Z
dc.date.available	2022-07-18T07:25:31Z
dc.date.issued	2022
dc.identifier.uri	http://eztuir.ztu.edu.ua/123456789/8007
dc.description.abstract	Досліджується застосування штучних нейронних мереж у задачах розпізнавання та класифікації об’єктів зображень. Розглядається класична задача класифікації об’єктів на зображенні, а саме визначення статі особи за її обличчям. Це зумовлено тим, що існує вдалий набір даних, який складається з 47009 зображень облич чоловіків та жінок для навчання та 11649 зображень облич для тестування штучної нейронної мережі. Запропоновано використання згорткової нейронної мережі. Такий підхід дозволяє зменшити обсяг інформації, що зберігається у пам’яті, а також ієрархічно виділити та агрегувати ознаки вхідних даних. Згорткова нейронна мережа складається з декількох блоків згорткових й агрегувального шарів, шару вирівнювання, шарів повнозв’язних нейронів, вихідного нейрона. Пороговою активаційною функцію для всіх нейронів, окрім вихідного, обрано функцію «ReLU». Активаційною функцією вихідного нейрона є сигмоїдальна. Здійснено побудову нейронної мережі, її навчання та тестування із застосуванням бібліотеки «TensorFlow», API «Keras.NET», а також розробленої бібліотеки методів на базі платформи «.NET Standard 2.0». Для візуального відображення налаштування відповідних процесів розроблено віконний додаток на базі платформ «.NET 6.0» та «WPF». Для побудови необхідних графіків використано бібліотеку «OxyPlot». Досліджено якість роботи пропонованої згорткової нейронної мережі залежно від кількості блоків та розмірів фільтра згортки. Найкращі результати роботи досягаються із 3 блоками згорткових та агрегувального шарів та розмірами фільтра згортки 3 x 3 пікселів. Оптимальної точності класифікації об’єктів зображень мережа набуває при її навчанні протягом 14 епох.	uk_UA
dc.language.iso	uk	uk_UA
dc.publisher	Державний університет "Житомирська політехніка"	uk_UA
dc.relation.ispartofseries	Технічна інженерія;1(89)
dc.subject	нейрон	uk_UA
dc.subject	штучна нейронна мережа	uk_UA
dc.subject	зображення	uk_UA
dc.subject	класифікація об’єктів	uk_UA
dc.subject	згортка	uk_UA
dc.subject	neuron	uk_UA
dc.subject	artificial neural network	uk_UA
dc.subject	image	uk_UA
dc.subject	classification of objects	uk_UA
dc.subject	convolution	uk_UA
dc.title	Використання згорткових нейронних мереж у задачах розпізнавання та класифікації об’єктів зображень	uk_UA
dc.title.alternative	Using convolutional neural networks in image object recognition and classification tasks	uk_UA
dc.type	Article	uk_UA
dc.description.abstracten	The usage of artificial neural networks in the tasks of object recognition and classification is studied. The classical problem of classifying objects in an image is considered, namely - determining the sex of a person by face. This is due to the fact that there is a successful set of data, which consists of 47,009 images of faces of men and women and 11,649 images of faces for training and testing artificial neural networks. It is suggested to use convolutional neural networks. This approach reduces the amount of information stored in memory, as well as hierarchically separates and aggregates features of the input data. Convolutional neural network consists of several blocks of convolutional and aggregating layers, alignment layer, layers of fully connected neurons, source neuron. The "ReLU" function was selected as the threshold activation function for all neurons except the original one. The activation function of the original neuron is sigmoidal. The neural network was built, trained and tested using the library "TensorFlow", API "Keras.NET", as well as the developed library of methods based on the platform ".NET Standart 2.0». and «WPF». The OxyPlot library was used to build the necessary graphs. The quality of work of the convolutional neural network that depends on the number of blocks and the sizes of the convolution filter has been investigated. The best results are achieved with 3 blocks of convolutional and aggregation layers and a convolutional filter size of 3x3 pixels. The optimum accuracy of image object classification is obtained by training the network for 14 epochs.	uk_UA