Abstract (ukr):
У статті розглянуто одну з областей штучного інтелекту – нейронні мережі, що застосовуються у різних галузях суспільства. Функціонування будь-якої системи стає набагато ефективніше за допомогою розв’язання задач на основі нейронних мереж. Класи задач, які можна розв’язувати за допомогою нейронних мереж, визначаються тим, як вони працюють і навчаються. Метою роботи є дослідження потенційних можливостей різних алгоритмів розпізнавання рукописних символів, зокрема цифр. Написання бібліотеки для роботи з нейронними мережами та розробка програмного додатка, який дасть можливість створювати, зберігати, тренувати та тестувати різні моделі нейронних мереж.
Результатом дослідження визначено перевірку спроєктованої моделі нейронної мережі з мінімальною кількістю шарів та аналіз якості розпізнавання.
У роботі проаналізовані різні моделі нейронних мереж, а саме мережі прямого поширення (feed forward neural networks) або багатошаровий персептрон (perceptrons). Досліджено найвідоміший алгоритм навчання – так званий алгоритм зворотного поширення (back propagation). Проведено аналіз порогової та сигмоїдальної функції активації. Для знаходження мінімуму функції використовувався градієнт.
Застосовано набір даних MNIST (Modified National Institute of Standards and Technology database) – це велика база рукописних цифр, яка зазвичай використовується для навчання різних систем обробки зображень. Побудована бібліотека для роботи з нейронною мережею, яка разом з набором тренувальних даних MNIST дала акуратність близько 98 %.
Методи, продемонстровані у роботі, є основою для побудови більш складних систем. Розроблений програмний додаток дає можливість створювати, зберігати, тренувати та тестувати нейронні мережі.
Abstract (eng):
The article presents one of the areas of artificial intelligence i.e. neural networks used in various sectors of society. The operation of any system becomes much more efficient using neural network based on problem solving. The classes of tasks that can be solved using neural networks are determined by how the network works and how it learns. The purpose of the work was to explore the potentialities of different handwriting recognition algorithms, in particular numbers. Writing a library for working with neural networks and developing a software application that will allow creating, saving, training and testing different models of neural networks.
The result of the study determined the verification of the designed model of the neural network with the minimum number of layers and the analysis of recognition quality.
In paper various models of neural networks are analyzed, namely feed forward neural networks, or multilayer perceptrons (perceptrons). The most famous learning algorithm - back propagation algorithm – is investigated (back propagation). The analysis was performed threshold and sigmoid activation function were analyzed. A gradient was used to find the minimum of the function.
The MNIST (Modified National Institute of Standards and Technology database) dataset was applied. This is a large database of handwritten numbers that is commonly used to teach different image processing systems. A neural network library was built, which, together with the MNIST training dataset, yielded an accuracy of about 98 %.
The methods demonstrated in this paper are the basis for building more complex systems. The developed software application allows creating, storing, training and testing neural networks.