METHODS OF CONCEPT EXTRACTION IN LITERARY WORKS

KUNANETS, Nataliia; YAROMYCH, Maksym

Please use this identifier to cite or link to this item: http://dspace.tnpu.edu.ua/handle/123456789/40000

Title:	METHODS OF CONCEPT EXTRACTION IN LITERARY WORKS
Other Titles:	Методи виділення концептів у літературних творах
Authors:	KUNANETS, Nataliia YAROMYCH, Maksym
Bibliographic description (Ukraine):	KUNANETS N., YAROMYCH M. METHODS OF CONCEPT EXTRACTION IN LITERARY WORKS // Studia Methodologica. Тернопіль ; Кєльце : Гельветика, 2025. Вип. 60. С. 333-351. DOI : https://doi.org/10.32782/2307-1222.2025-60-30
Issue Date:	2025
Publisher:	Гельветика
Keywords:	conceptual analysis large language models automated concept extraction ontological modeling BERT natural language processing концептуальний аналіз великі мовні моделі автоматизоване виділення концептів онтологічне моделювання опрацювання природної мови
Abstract:	The article explores both traditional and contemporary approaches to concept extraction in literary texts, with a particular focus on lexical analysis, semantic parsing, ontological modeling, and automated techniques based on large language models. Traditional manual methods are valued for their ability to capture nuanced literary meanings – such as symbolism, metaphor, and intertextual references – while taking into account cultural and stylistic context. However, their reliance on intensive human interpretation makes them difficult to apply to large text corpora and comparative studies. Modern automated approaches, especially those utilizing transformer architectures like BERT, introduce significant advantages in processing speed and scalability. Through mechanisms such as self-attention, these models effectively identify long-range contextual relationships and latent patterns within texts, enabling rapid detection and classification of key concepts across extensive datasets. Yet, the article emphasizes that these systems still face limitations when dealing with the figurative richness and semantic ambiguity inherent in literary discourse. The practical component of the research involves an experimental analysis of the concept of tolerance in articles from major English-language media outlets, including The New York Times, BBC News, and The Guardian. Automated extraction methods demonstrated strong potential for identifying general trends and conceptual usage patterns. Nonetheless, the findings underscore the need for expert interpretation to refine outputs, especially in cases involving subtle semantic shifts or interdisciplinary cultural references. In conclusion, the article proposes an integrative methodological framework that combines automated processing with human expertise. Automated tools are recommended for the preliminary structuring and classification of large volumes of textual data, while expert scholars are responsible for interpretative depth and validation. Future research directions include enhancing LLM adaptation for literary texts, building specialized training corpora, and incorporating ontological models to improve conceptual precision and reliability in literary studies. Стаття досліджує як традиційні, так і сучасні підходи до виокремлення концептів у літературних текстах, приділяючи особливу увагу лексичному аналізу, семантичному розбору, онтологічному моделюванню та автоматизованим технікам на основі великих мовних моделей. Традиційні ручні методи цінуються за їхню здатність охоплювати нюансові літературні значення, такі як символізм, метафора та інтертекстуальні відсилання, з урахуванням культурного й стильового контексту. Однак їхня залежність від інтенсивної людської інтерпретації робить їх складними для застосування до великих корпусів текстів і порівняльних досліджень. Сучасні автоматизовані підходи, особливо ті, що використовують архітектури трансформерів, як-от BERT, забезпечують значні переваги у швидкості обробки та масштабованості. Завдяки механізмам самоуваги ці моделі ефективно виявляють довготривалі контекстуальні зв’язки та приховані патерни в текстах, даючи змогу швидко визначати й класифікувати ключові концепти у великих наборах даних. Водночас наголошено, що такі системи досі мають обмеження під час роботи з образною насиченістю та семантичною неоднозначністю, притаманними літературному дискурсу. Практична частина дослідження включає експериментальний аналіз концепту толерантності у публікаціях провідних англомовних медіа, зокрема The New York Times, BBC News та The Guardian. Автоматизовані методи виокремлення продемонстрували значний потенціал у виявленні загальних тенденцій і патернів використання концептів. Проте результати підкреслюють необхідність експертної інтерпретації для уточнення отриманих даних, особливо у разі тонких семантичних зсувів або міждисциплінарних культурних відсилань. У підсумку стаття пропонує інтегративну методологічну рамку, яка поєднує автоматизовану обробку з людською експертизою. Автоматичні інструменти рекомендується використовувати на початковому етапі для структурування та класифікації великих обсягів текстових даних, тоді як експертні дослідники відповідають за інтерпретаційну глибину та валідацію. Подальші напрями досліджень включають удосконалення адаптації LLM до літературних текстів, створення спеціалізованих навчальних корпусів та інтеграцію онтологічних моделей із метою підвищення точності та надійності концептуального аналізу в літературознавстві.
URI:	https://journals.tnpu.ternopil.ua/index.php/sm/issue/view/159 http://dspace.tnpu.edu.ua/handle/123456789/40000
ISSN:	2307-1222
Appears in Collections:	Studia Methodologica. Вип. 60

Files in This Item:

File	Description	Size	Format
29_KUNANETs_YaROMYCh.pdf		443,86 kB	Adobe PDF	View/Open

Show full item record