УДК: 
DOI: 
10.22389/0016-7126-2025-1019-5-9-15
1 Колесников А.А.
2 Жданов С.С.
Год: 
№: 
1019
Страницы: 
9-15

Языковой центр «Лингва» Новосибирского государственного технического университета

1, 
2, 
Аннотация:
В статье описана связь травелога с пространственными данными, показана важность использования этого вида художественных произведений, в том числе для создания картографических материалов. Кроме ручной обработки текстов травелогов, для автоматизации можно использовать алгоритмы и методы обработки естественного языка. Рассмотрены существующие примеры обработки документов, содержащих географические наименования, и интеграция результатов в базы данных геоинформационных систем. В исследовании проанализированы степень автоматизации с помощью технологий обработки естественного языка и точность создания базы данных маршрутов для произвольного набора документов. Предложено расширение параметров объекта события действия движения и количественная оценка их релевантности среди близких по значениям элементов. Анализируемый набор документов содержит 150 текстов, написанных в период XVIII–XX вв., общим объемом 46 тыс. слов (среднее количество слов на документ: 308, включая адреса). Приведены результаты сравнения нескольких вариантов предобученных нейронных сетей (в том числе больших языковых моделей) с точки зрения итоговой точности определения маршрутов передвижения по приведенным текстам, в том числе и дообученных с помощью дополнительного набора данных
Статья подготовлена в рамках выполнения гранта РНФ № 24-28-01431 «Репрезентация пространства Украины в русской культуре конца XVIII-XIX вв. (на материале отечественных травелогов): дискурсы, нарративы, топосы» (https://rscf.ru/project/24-28-01431/)

Список литературы: 
1.   Карпик А.П., Лисицкий Д.В., Мусихин И.А. Развитие геопространственной деятельности в России: стратегические направления и первоочередные задачи // Геодезия и картография. – 2023. – № 12. – С. 49-58. DOI: 10.22389/0016-7126-2023-1002-12-49-58.
2.   Кублицкая О. В. Субъектная структура путешествий «массового сентиментализма» (на материале «Путешествия в Малороссию» П. И. Шаликова) // Научный диалог. – 2022. – Т. 11. – № 7. – С. 284–303. DOI: 10.24224/2227-1295-2022-11-7-284-303.
3.   Куликова А. А. Путевая проза в русской литературе конца XVIII начала XIX века // Ученые записки Российского государственного социального университета. – 2008. – № 4 (60). – С. 241–243.
4.   Майга А. А. Литературный травелог: специфика жанра // Филология и культура. – 2014. – № 3 (37). – С. 254–259.
5.   Русский травелог XVIII–XX веков: маршруты, топосы, жанры и нарративы / Под ред. Т. И. Печерской, Н. В. Константиновой. – Новосибирск: Изд-во НГПУ, – 2016. – 462 c.
6.   Степанов В. К., Маджумдер М. Ш., Бегунова Д. Д. Методика применения большой языковой модели ChatGPT в библиотечно-библиографической деятельности // Научные и технические библиотеки. – 2024. – № 4. – С. 86–108. DOI: 10.33186/1027-3689-2024-4-86-108.
7.   Bourgonje P., Schneider J.M., Rehm G., Sasaki F. (2016) Processing document collections to automatically extract linked data: semantic storytelling technologies for smart curation workflows. Proceedings of the 2nd International Workshop on Natural Language Generation and the Semantic Web (WebNLG) ACL, Edinburgh, UK, pp. 13–16.
8.   Gervas P. (2014) Metrics for desired structural features for narrative renderings of game logs // Entertainment Computing. 5 (4), pp. 245–250. DOI: 10.1016/j.entcom.2014.08.001.
9.   Moreno-Schneider J., Bourgonje P., Rehm G. (2017) Towards User Interfaces for Semantic Storytelling. In: Yamamoto S. (eds) Human Interface and the Management of Information: Supporting Learning, Decision-Making and Collaboration. HIMI 2017. Lecture Notes in Computer Science, 10274. Springer, Cham pp. 403–421. DOI: 10.1007/978-3-319-58524-6_32.
10.   Nothman J., Ringland N., Radford W., Murphy T., Curran J. R. (2012) Learning multilingual named entity recognition from Wikipedia // Artificial Intelligence. 194, pp. 151–175. DOI: 10.1016/J.ARTINT.2012.03.006.
11.   Poulakos S., Kapadia M., Schupfer A., Zund F., Sumner R., Gross M. (2015) Towards an accessible interface for story world building. AAAI Conference on Artificial Intelligence and Interactive Digital Entertainment pp. 42–48.
12.   Rehm G., Moreno-Schneider J. ћ., Bourgonje P., Srivastava A., Nehring J., Berger A., Kоnig L., Rаuchle S., Gerth J. (2017) Event detection and semantic storytelling: generating a travelogue from a large collection of personal letters. Events and Stories in the News Workshop Association for Computational Linguistics, Vancouver, Canada, pp. 42–51. DOI: 10.18653/v1/W17-2707.
13.   Turner S. R. (2014) The Creative Process: A Computer Model of Storytelling and Creativity Taylor and Francis, 308 p.
14.   Wood M. D. (2008) Exploiting semantics for personalized story creation. 2008 IEEE International Conference on Semantic Computing. IEEE Computer Society (ICSC Т08). Washington, DC pp. 402–409. DOI: 10.1109/ICSC.2008.10.
15.   Yang B., Mitchell T. (2016) Joint extraction of events and entities within a document context. 2016 Conf. of the North American Chapter of the ACL: Human Language Technologies. ACL pp. 289–299. DOI: 10.48550/arXiv.1609.03632.
Образец цитирования:
Колесников А.А., 
Жданов С.С., 
Использование технологий обработки естественного языка для автоматизации координирования объектов из травелогов // Геодезия и картография. – 2025. – № 5. – С. 9-15. DOI: 10.22389/0016-7126-2025-1019-5-9-15
СТАТЬЯ
Поступила в редакцию: 22.08.2024
Принята к публикации: 17.04.2025
Опубликована: 20.06.2025

Содержание номера

2025 май DOI:
10.22389/0016-7126-2025-1019-5