Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс:
http://dspace.tnpu.edu.ua/handle/123456789/36045
Название: | Автоматизоване формування технічної документації в галузі ІТ із використанням великих мовних моделей |
Другие названия: | AUTOMATED GENERATION OF TECHNICAL DOCUMENTATION IN THE IT INDUSTRY USING LARGE LANGUAGE MODELS |
Авторы: | Пасічник, Володимир Яромич, Максим |
Библиографическое описание: | Пасічник В., Яромич М. Автоматизоване формування технічної документації в галузі ІТ із використанням великих мовних моделей // Studia Methodologica. Тернопіль ; Кєльце : Гельветика, 2025. Вип. 59. С. 250-272. DOI https://doi.org/10.32782/2307-1222.2025-59-22 |
Дата публикации: | 2025 |
Издательство: | Гельветика |
Ключевые слова: | автоматизація технічна документація великі мовні моделі онтології генерація тексту структуризація знань automation technical documentation large language models ontologies text generation knowledge structuring |
Краткий осмотр (реферат): | Автоматизоване формування технічної документації є однією із ключових про-
блем сучасної ІТ-галузі, оскільки якісна й актуальна документація необхідна для
ефективної роботи розробників, тестувальників і кінцевих користувачів. У статті
розглянуто можливості використання великих мовних моделей (LLM) для гене-
рації технічної документації, оцінено потенціал онтологічного підходу у структу-
ризації процесу документування.
Відзначено, що традиційні методи створення документації супроводжуються
низкою труднощів, зокрема великим обсягом ручної праці, складністю підтримки
актуальності текстів та забезпечення узгодженості між різними розділами доку-
ментації. Неналежна інтеграція документації із процесами розроблення програм-
ного забезпечення призводить до застарівання матеріалів і ускладнює їх онов-
лення. Також наголошено, що в умовах швидких циклів розроблення фахівці
часто приділяють не досить уваги документації, що ускладнює її підтримку в
актуальному стані.
Особлива увага приділена концептуальній інтеграції великих мовних моде-
лей з онтологічними підходами, що дозволяє не лише генерувати тексти, а й
забезпечувати їхню структурованість відповідно до формальних моделей знань.
Використання онтологій сприяє підвищенню точності документації, зменшенню
помилок, а також створенню єдиного стандарту оформлення текстів. У статті
представлено огляд підходів до інтеграції великих мовних моделей з онтологі-
ями, зокрема й методи автоматизованого витягування знань із текстів, застосу-
вання онтологічного моделювання для структуризації документації. У дослідженні також проаналізовано переваги й обмеження автоматизованого
підходу. До основних переваг належать швидкість створення документації, забез-
печення стандартизації, зменшення навантаження на розробників і зниження
кількості людських помилок. Водночас відзначаються такі виклики, як необхід-
ність навчання моделей на специфічних доменних корпусах, контроль точності
згенерованого тексту й інтеграція великих мовних моделей у процеси життєвого
циклу розробки.
Окремий розділ статті присвячено аналізу практичних кейсів застосування
великих мовних моделей для генерації документації. Наведено приклад автома-
тичного створення документації для відкритого програмного продукту, реалізова-
ного мовою Python, де GPT-4 генерувала технічні описи й інструкції користувача.
Отримані результати показали, що використання мовних моделей дозволяє значно
покращити якість документації, забезпечити чітку структуру, правильне формату-
вання та відповідність загальноприйнятим стандартам. Водночас зазначено, що
для повної відповідності офіційним вимогам може знадобитися додаткове редагу-
вання текстів і включення більш детальних описів параметрів і змінних.
Також розглянуто перспективи розвитку автоматизації документації, зокрема
використання гібридних підходів, які поєднують мовні моделі, онтології та алго-
ритми контролю якості тексту. Зазначено можливість подальшої інтеграції вели-
ких мовних моделей у середовища розробки (IDE), що дозволить автоматично
оновлювати документацію під час змін у кодовій базі.
Підкреслено, що автоматизація створення технічної документації за допомо-
гою великих мовних моделей і онтологій є перспективним напрямом, що дозво-
ляє значно підвищити ефективність роботи розробників, мінімізувати помилки
та зменшити витрати часу на підтримку документації. Проте для забезпечення
високої точності та відповідності технічним стандартам необхідні подальші
дослідження у сфері адаптації мовних моделей до конкретних галузей, розро-
блення методів контролю точності текстів та інтеграції автоматичних систем
документації з наявними інструментами DevOps та керування кодом. Automated generation of technical documentation is one of the key challenges in the modern IT industry, as high-quality and up-to-date documentation is essential for the effective work of developers, testers, and end users. This paper explores the potential of using large language models (LLMs) for generating technical documentation and evaluates the role of the ontological approach in structuring the documentation process. It has been noted that traditional methods of documentation creation face several difficulties, including a significant amount of manual labor, challenges in maintaining content relevance, and ensuring consistency across different sections. The lack of integration between documentation and software development processes leads to outdated materials and complicates their updates. Additionally, it is emphasized that in fast-paced development cycles, developers often pay insufficient attention to documentation, making it difficult to keep it up to date. Special attention is given to the conceptual integration of LLMs with ontological approaches, which allows not only the generation of texts but also ensures their structured organization according to formal knowledge models. The use of ontologies enhances documentation accuracy, reduces errors, and helps establish a unified documentation standard. This study presents an overview of approaches to integrating LLMs with ontologies, including automated knowledge extraction methods and the application of ontological modeling to documentation structuring. The research also analyzes the advantages and limitations of automated documentation generation. Key benefits include faster document creation, standardization, reduced workload for developers, and fewer human errors. However, several challenges are identified, such as the need for model training on domain-specific corpora, ensuring text accuracy, and integrating LLMs into the software development lifecycle. A separate section of the study is dedicated to analyzing practical cases of using LLMs for documentation generation. An example is presented of automatically creating documentation for an open-source software project written in Python, where GPT-4 was used to generate technical descriptions and user instructions. The results indicate that language models significantly improve documentation quality by ensuring a clear structure, proper formatting, and compliance with widely accepted standards. However, it is noted that for full compliance with official requirements, additional text editing and the inclusion of more detailed descriptions of parameters and variables may be necessary. The paper also discusses the future prospects of documentation automation, particularly through hybrid approaches that combine language models, ontologies, and quality control algorithms. It highlights the potential integration of LLMs into development environments (IDEs), which would allow automatic updates to documentation as code changes occur. It is emphasized that automating technical documentation generation using LLMs and ontologies is a promising direction that significantly increases developer efficiency, minimizes errors, and reduces the time required to maintain documentation. However, to ensure high accuracy and compliance with technical standards, further research is required in adapting language models to specific domains, developing methods for text accuracy control, and integrating automatic documentation systems with existing DevOps and code management tools. |
URI (Унифицированный идентификатор ресурса): | http://dspace.tnpu.edu.ua/handle/123456789/36045 |
ISSN: | 2307-1222 |
URL-ссылки связанного материала: | https://journals.tnpu.ternopil.ua/index.php/sm/issue/view/155 |
Располагается в коллекциях: | Studia Methodologica. Вип. 59 |
Файлы этого ресурса:
Файл | Описание | Размер | Формат | |
---|---|---|---|---|
PASICHNYK.pdf | 584,61 kB | Adobe PDF | Просмотреть/Открыть |
Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.