СИСТЕМА ПОРІВНЯЛЬНОГО АНАЛІЗУ ТЕКСТОВИХ ДОКУМЕНТІВ

Вавіленкова, Анастасія Ігорівна; Vavilenkova, А.I.

СИСТЕМА ПОРІВНЯЛЬНОГО АНАЛІЗУ ТЕКСТОВИХ ДОКУМЕНТІВ

Вавіленкова, Анастасія Ігорівна; Vavilenkova, А.I.

URI: http://eztuir.ztu.edu.ua/123456789/4301

Date: 2015

Abstract (ukr):

У матеріалах статті проаналізовано роботу існуючих інтелектуальних систем порівняльного аналізу електронних текстових документів, наведено порівняльну характеристику їх основних функціональних можливостей. Запропоновано інтелектуальну систему порівняльного аналізу текстових документів, що використовує нову методику пошуку текстових збігів, в основі якої лежить побудова логіко-лінгвістичних моделей текстової інформації. Розроблена система складається з п’яти блоків функціонування. Перший блок відповідає за подачу текстів на вхід системи. Другий – за ідентифікацію складових логіко-лінгвістичних моделей текстів, що передбачає створення множини логіко-лінгвістичних моделей усіх речень природної мови, що утворюють кожен текст. У третьому блоці для кожного з двох текстів будується його логіко- лінгвістична модель, що складається з лінгвістичної та семантико-синтаксичної складових. Далі відбувається об’єднання та заміна структурних компонентів логіко-лінгвістичних моделей, отриманих на попередньому блоці функціонування системи. П’ятий блок присвячено порівнянню логіко-лінгвістичних моделей текстових документів, внаслідок якого знаходиться відсоток збігу за стилістикою, за структурою складних синтаксичних частин, схожістю ключових слів та словосполучень, тематикою та унікальністю.

Abstract (eng):

The article analyzes the work of existing intellectual systems of comparative analysis of electronic text documents and description of their basic features. The study proposes an intelligent system of comparative analysis of text documents using a new method for text matches based on construction of logic and linguistic models of text information. The system consists of five functional units. First unit is responsible for the text input into system. The second one is identification of components of logic and linguistic models of texts, which requires construction of the set of logic and linguistic models of all natural language sentences, which in its turn build every text. The aim of the third unit is to construct for each of two texts logic and linguistic model that has linguistic and semantic-syntactic components. Then consolidation and replacement of structural components of logic and linguistic models obtained on the previous stage of the system functioning are performed. The fifth unit is devoted to comparison of logic and linguistic models of text documents. As a result, we obtain the percentage match by style, by structure of complex syntactic units, by similarity of keywords and phrases, by topic and uniqueness.

Show full item record