Статья 'Технологии глубинного анализа текста в музыковедении' - журнал 'PHILHARMONICA. International Music Journal' - NotaBene.ru
по
Меню журнала
> Архив номеров > Рубрики > О журнале > Авторы > О журнале > Требования к статьям > Редакция и редакционный совет > Порядок рецензирования статей > Ретракция статей > Этические принципы > Политика открытого доступа > Оплата за публикации в открытом доступе > Online First Pre-Publication > Политика авторских прав и лицензий > Политика цифрового хранения публикации > Политика идентификации статей > Политика проверки на плагиат
Журналы индексируются
Реквизиты журнала
ГЛАВНАЯ > Вернуться к содержанию
PHILHARMONICA. International Music Journal
Правильная ссылка на статью:

Технологии глубинного анализа текста в музыковедении

Мичков Павел Александрович

ORCID: 0000-0001-8227-7190

кандидат искусствоведения

доцент, кафедра теории музыки, Федеральное государственное бюджетное образовательное учреждение высшего образования "Новосибирская государственная консерватория имени М.И. Глинки"

630099, Россия, Новосибирская область, г. Новосибирск, ул. Советская, 31, оф. 224

Michkov Pavel Aleksandrovich

PhD in Art History

Associate Professor, Department of Music Theory, Federal State Budgetary Educational Institution of Higher Education "Novosibirsk State Conservatory named after M.I. Glinka"

630099, Russia, Novosibirskaya oblast', g. Novosibirsk, ul. Sovetskaya, 31, of. 224

p.michkov@nsglinka.ru

DOI:

10.7256/2453-613X.2022.3.37797

Дата направления статьи в редакцию:

05-04-2022


Дата публикации:

05-06-2022


Аннотация: В статье рассматривается возможность совершенствования механизма работы автора-музыковеда с текстами исторического музыкознания. Цель статьи заключена в рассмотрении механизмов обнаружения внутренних взаимосвязей между элементами музыковедческого текста. Предметом исследования является вербальные тексты музыкознания. Объектом настоящей статьи является аналитические инструменты современных цифровых технологий работы с текстами. Автор подробно рассматривает такие аспекты как выбор и формирование набора ключевых слов, определение структуры поиска необходимой для исследования информации. Особое внимание уделяется внутренним процессам лаборатории музыковедения, в рамках которых не всегда оказывается возможным формирование набора ключевых вербальных значений подготовленного исследования традиционными методами. Автором впервые предложена методология использования компьютерных средств программ глубинного анализа текста в повседневной деятельности музыковеда-исследователя. Область применения методологии не ограничивается сферой музыкальной науки, она может найти выходы и в других областях знания. В процессе исследования освещена практическая сторона внедрения продукта, в лаконичной форме представлены этапы постобработки текстового массива. Вместе с тем, заявленный в исследовании проблемный «срез» оказывается насыщенным иным информационным содержанием, что позволяет в дальнейшем отыскать скрытые закономерности развития тех или иных процессов, обнаружить новые взаимосвязи и определить новые векторы движения научного исследования.


Ключевые слова:

глубинный анализ текста, компьютерное ассистирование, информативное описание, технологии музыковедения, анализ публикаций, музыкальная наука, вербальный анализ, компьютерное моделирование, горизонты исследования, информационно-коммуникационные технологии

Abstract: The article considers the possibility of improving the mechanism of work of the author-musicologist with the texts of historical musicology. The purpose of the article is to consider the mechanisms of detecting internal relationships between the elements of a musicological text. The subject of the study is verbal texts of musicology. The object of this article is analytical tools of modern digital technologies for working with texts. The author examines in detail such aspects as the selection and formation of a set of keywords, the definition of the structure of the search for information necessary for research. Particular attention is paid to the internal processes of the musicology laboratory, within which it is not always possible to form a set of key verbal meanings of a prepared study using traditional methods. The author for the first time proposed a methodology for using computer tools for deep text analysis programs in the daily activities of a musicologist-researcher. The scope of the methodology is not limited to the field of music science, it can find solutions in other fields of knowledge. In the course of the research, the practical side of the product implementation is highlighted, the stages of post-processing of a text array are presented in a concise form. At the same time, the problematic "slice" stated in the study turns out to be saturated with other information content, which allows us to further find hidden patterns of development of certain processes, discover new relationships and determine new vectors of scientific research.


Keywords:

in-depth text analysis, computer assistance, informative description, musicology technologies, analysis of publications, music science, verbal analysis, computer simulation, horizons of research, information and communication technologies

В настоящий момент активно меняется информационное сопровождение и описание научных работ. Расширяется и совершенствуется информационный поиск. Всё более стандарты описания корпуса научной литературы, предполагают использование её автоматической обработки. Эти условия предъявляется и к работам в области музыковедения. Так, во многих научных журналах о музыкальном искусстве и на сайтах издательств излагаются правила по оформлению работы для публикации: правила включают в себя ряд параметров: фамилия автора, название работы, аннотация (как правило, на двух языках) и набор ключевых слов. Заметим, что набор ключевых слов составляется самим автором исследования. Именно автор может наиболее точно определить те лексические единицы, в которых в концентрированном виде заключается смысл текста. С другой стороны, при таком подходе несколько вуалируется феномен многозначности текста, инвариантность его смыслового поля. Автор сознательно заключает текст в определённые рамки, заданные параметрами ключевых значений в виде набора слов и словосочетаний. Исходя из этого, предметом настоящей статьи является процесс формирования набора ключевых словосочетаний средствами компьютерных ассистирующих технологий.

Так, при описании документа в автоматизированных библиотечных системах также вводятся ключевые значения. В случае, если авторский набор таких значений отсутствует, то решающее значение имеют те слова и словосочетания, которые используются в качестве заглавия источника или заголовков разделов работы. Это означает, что в процессе поиска документы, в которых ключевые слова, заданные пользователем находятся рядом, будут в приоритете, то есть будут ранжироваться выше всех остальных документов. Таким образом, оказывается, что этот метод, на данный момент являющийся самым простым и удобным, в конечном итоге не гарантирует адекватности передачи содержания текста ключевыми словами.

Более перспективным представляется процесс вовлеченности пользователя в поисковую операцию – в этапы настройки схемы поиска информации. В этом случае процесс поиска необходимого набора ключевых слов оказывается персонализированным. Так, диалоговую структуру «исследователь – компьютерная программа анализа текста» можно использовать:

a) в процессе подготовки исследования к публикации;

b) в работе библиографа при каталогизации какого-либо издания;

c) в процессе анализа структуры научной проблемы или скрытых свойств текстовых массивов.

Методологию процессов вовлеченности исследует ряд авторов. Так, в отношении первых двух пунктов («а», «b»), подобную процедуру предлагает применять Т. Волкова, утверждая, что «для оцифрованных бумажных документов необходимо будет провести семантический анализ текстов и на основе такого анализа получить сжатый текст, являющийся ключевыми словами и словосочетаниями» [1, c. 285]. Правда, в её исследовании не ведётся речь о том, каким образом будет производиться подобный анализ текста. В обоих случаях применение программ глубинного анализа текста может явиться одним из вариантов решения проблемы. Рассмотрим возможности программы TextAnalyst на примере сравнительного анализа набора ключевых слов, предлагаемых самими авторами с результатами анализа этих же текстов выполненного программой TextAnalyst.

В 70-е годы XX века в работах А. Моля [2], И. Д. Рудь, И. И. Цуккермана [3] возможность использования информационного подхода в музыкознании стала рассматриваться в связи с развитием информационных систем. Музыковедение экстраполировало основные законы теории информации в музыкальную науку, обнаружив сходство с ними в учении о музыкальном формообразовании и социологии музыкальной культуры. Очевидно, что развитие информационного подхода в музыкознании напрямую связано с текстовыми структурами. Совершение различных операций с текстом сформировало новые приёмы исследования научной информации, органично включив их в музыковедение. Подтверждением тому служит появление работ по изучению музыковедческого исследовательского творчества. Ярким примером является труд Т. И. Науменко [4] по анализу стиля вербальных текстов музыкознания.

В качестве материала для эксперимента были избраны статьи из журналов «Музыковедение» и «Музыка и время». Такой выбор был обусловлен тематикой изданий, которая охватывает широкий спектр музыковедческих проблем (вопросы теории, истории музыки, музыкальной этнографии, палеографии, освещаются вопросы педагогики и проблемы музыкального исполнительства), а также тем фактом, что с 2009 г. обязательным условием для оформления публикации авторам необходимо сопровождать текст статьи набором ключевых слов. Следует отметить, что в этих периодических изданиях авторы публикаций вместе с текстом работы прилагают также краткую аннотацию.

Предполагается, что набор ключевых слов, данный авторами работ может отличаться или же совпадать с результатами компьютерного анализа текста. Также возможно стилистическое или тематическое родство исследований, располагаемых в одной группе. Кроме того, учтём, что в процессе последующего поиска научной статьи читателем «просмотр аннотаций и ключевых слов облегчает задачу знакомства с новинками, но, конечно, не решает проблему сбора и углубленного изучения литературы по определенной теме» [5, с. 99].

В качестве первого примера, иллюстрирующего результаты проведённого эксперимента по определению группы ключевых слов средствами программы глубинного анализа текстов приведём статьи из журнала «Музыка и время». Примеры были взяты в паре ввиду их тематической и некоторой стилистической разнородности. Обе статьи посвящены исследованию проблем в области музыкальной науки: работа И. Ю. Проскуриной «Последнее сочинение А.К. Глазунова: музыковедческое расследование» [6] находится в сфере исторического музыкознания и посвящена изучению музыкального произведения позднего периода творчества А. К. Глазунова. Сфера проблем, обозначенных в публикации Т. П. Петровой «Церемониалы» Д. Лигети: между смыслом и абсурдом» [7], находится на пересечении областей исторического и теоретического музыковедения.

На схемах, которые представляют результаты анализа статей (Пример 1) отмечается, что набор ключевых слов, предлагаемый авторами анализируемых статей пересекается с результатами анализа текста, выполненным при помощи программы TextAnalyst. Между тем в большинстве случаев область ключевых значений, сформированных средствами программы значительно шире набора, представленных исследователями:

Пример 1

Сравнительная схема анализа набора ключевых слов

статьи Г. П. Петровой «Церемониалы» Д. Лигети: между смыслом и абсурдом»

В отношении пункта «с», рассмотрим другой тип анализа текста – наборы слов и словосочетаний, образованные на основе удельного веса элементов текста. Возможно, и в этом случае, возникают новые перспективы текстовой аналитики.

В периодическом издании «Музыковедение» группы материалов сформированы согласно структурной композиции издания – по рубрикам журнала. Такая организация позволяет объединить в совместные разделы тематически родственные исследования. В исследуемом периодическом издании установилась сложившаяся система рубрик. К отдельному разделу относится рубрика «Работы молодых ученых», в которой предлагаются исследования аспирантов, часто находящиеся в разных тематических направлениях, но, между тем, объединённые в одну группу. Кроме названных рубрик в журнале представлен раздел «Конференции», в котором освещаются события минувших научных собраний и дискуссий.

Тематическое содержание номеров журнала за календарный год охватывает творчество широкого круга композиторов разных стилевых эпох и направлений. Публицистические материалы освещают факты, связанные с музыкальной деятельностью и биографией Л. Бетховена, М. П. Мусоргского, Б. Бартока, Г. В. Свиридова, Ф. Караева, В. А. Гаврилина, Х. Дистлера и других. Работы по этномузыкологии исследуют традиции творчества таджиков, тувинцев, индийцев, бурят, вьетнамцев и славянских народов. Тематика исследований молодых ученых разнообразна – от стилевых особенностей творчества И. Ф. Стравинского, Е. И. Подгайца, А. Дворжака, А. Пьяцоллы до характеристики жанров детского музыкального фольклора и проблематики русского музыкального конструктивизма.

После необходимой подготовки и обработки текста производится его анализ при помощи компьютерной программы[1]. В процессе анализа текст делится на сегменты, между которыми устанавливаются взаимосвязи. Исходя из веса взаимосвязей в тексте, программа определяет набор наиболее значимых слов и словосочетаний. Такой набор может условно считаться совокупностью ключевых слов и выражений исходного текста. Кроме этого предлагается схема частотного распределения слов в тексте, исходя из количества их повторов. Таким образом, формально целью подобного анализа является выстраивание дерева зависимостей между словами и фразами в тексте. Предложения представляются в виде ветвей с единственной корневой вершиной. Поскольку одна словоформа может соответствовать нескольким грамматическим формам слова, то по ходу анализа необходимо проводить сверку результатов сегментирования.

Метод, при котором представления автора об исходной научной проблеме выстраиваются в виде структуры, ведёт к выявлению контекста работы и выстраиванию потенциальных сфер-источников информации. По верному замечанию Н.С. Бажанова: «чтобы совершенствовать поиск информации необходимо более полно и целостно представить структуру информационного поиска» [8, с. 3]. В плане исследования материала средствами программ глубинного анализа текста наблюдается тенденция к определению потенциальных контекстуальных сфер на уровне первичного анализа. Появляется вероятность изыскания скрытых свойств текстовых массивов.

В статье Т. Б. Будаевой «Вокальная сторона Пекинской оперы» [9] аннотация была исключена из общего тела анализируемого текста. Результаты анализа показали, что часто взаимодействующими выражениями на достаточно близком расстоянии оказываются слова «грим», «краска» (Пример 2):

Пример 2.

Вид реферата статьи Т. Будаевой «Вокальная сторона Пекинской оперы»

В группе ключевых слов в авторской аннотации их нет, но, после чтения статьи выясняется, что эффектность и колористичность постановок Пекинской оперы представлена ярким гримом и красками, в то время как музыкальной стороне в исследовательской литературе уделено меньшее внимание. Напрашивается вывод, что в случае поиска источников, в содержании которых затрагивается тема театральности постановок театра Китая, рассматриваемая публикация будет исключена из результатов поиска, поскольку содержательно важные значения («грим», «краска») отсутствуют в составе ключевых слов.

Важно отметить, что в данном случае, при использовании в своей деятельности программы глубинного анализа текста у автора публикации появляется возможность либо дополнить существующий список ключевых слов, либо его переформировать. Во всяком случае, исследователю предлагается ещё раз взглянуть на свой текст под несколько иным углом зрения, предоставляется возможность определить новые стороны и выявить новые смыслы, которые он, вероятно, ранее не заметил.

Как правило, программные продукты подобного рода определяют количественные характеристики наиболее часто употребляемых слов и словосочетаний. В представленном анализе музыковедческих статей, кроме частотного распределения фраз представлена схема, построенная в порядке смыслового значения словосочетаний в тексте. Такая структура определяется количеством повторений на протяжении всего материала. Роль повтора в гуманитарных науках в последнее время становится предметом пристального внимания исследователей. Подробно изучены принципы повторности в трудах литературоведов – Ю. Лотмана [10] и С. А. Рейсера [11].

Обращение к анализу повторяющихся элементов в структуре музыковедческих текстов позволяет сделать несколько предположений относительно причин их появления и роли в процессе читательского восприятия. Если два понятия находятся в одном предложении, то между ними существует взаимодействие, о котором явно или в скрытом виде повествует данный текст. Повышенная частота употребления пары или группы терминов в абзаце также указывает на их взаимосвязь, которую необходимо раскрыть, объяснить, обсуждать.

Так, одним из важных факторов, влияющих на количественный состав повторяющихся словосочетаний, может быть стилистическая установка автора на конкретный создаваемый им текст. Известно, что стиль научного произведения может существенно отличаться от публицистического, официально-делового или художественного. Стилистический приём повтора является одним из главных средств акцентирования в тексте, его композиционной организации. Следовательно, элементы, характерные для одного стиля, могут быть не задействованы в другом. Тем не менее, существуют примеры тонкого сплава разных стилевых интенций внутри одного текста.

Другим фактором, оказывающим воздействие на повторность слов и словосочетаний, является психологический аспект. Автор может вполне преднамеренно использовать повтор определённых слов и выражений для акцентирования направленности внимания читателя к конкретным сторонам и элементам освещаемой темы. В тексте такие приёмы выполняют двойную функцию: с одной стороны, они выступают в качестве способа композиционного оформления материала, средства развития основных тематических элементов, с другой – способствуют достижению коммуникативных целей, заострению внимания, формированию определённого оценочного отношения к тексту.

Помимо очевидных приёмов – стилистики и намеренной концентрации текстовых структур, «тело» текста может содержать ключевые элементы, составляющие отдельную тематическую область. И, наконец, самое главное. Повторность употребления слов и словосочетаний обусловлена смысловыми, семантическими взаимосвязями, объективно существующими между ними в тексте. Выявление таких взаимодействий при помощи ассистирующих компьютерных программ анализа текста, открывает новые горизонты, новые возможности в деятельности музыковеда.

Таким образом, можно заметить, что информационный подход предлагает музыковеду ещё один вариант исследования изучаемого им явления музыкального искусства. Такой проблемный «срез» оказывается насыщенным иным информационным содержанием, что позволяет в дальнейшем отыскать скрытые закономерности развития тех или иных процессов. Конечно, как всякий иной, такой способ имеет свои границы использования и вовсе не является универсальной технологией. Наметить зону его действия точной линией, обозначающей границы истин, невозможно, но добавить новый исследовательский инструмент в лабораторию музыковедения вполне реально.

[1] При анализе текста компьютерной программой из исходного материала были исключены аннотации на английском языке, сопровождающие статьи, так как они дублируются на языке оригинала. Анализу также не подлежат нотные фрагменты, предлагаемые авторами в виде иллюстраций, поскольку примеры являются графическим изображением.

Библиография
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
References
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.

Результаты процедуры рецензирования статьи

В связи с политикой двойного слепого рецензирования личность рецензента не раскрывается.
Со списком рецензентов издательства можно ознакомиться здесь.

В журнал «PHILHARMONICA. International Music Journal» автор представил свою статью «Технологии глубинного анализа текста в музыковедении», в которой проведено исследование технологий и механизмов поиска научных музыковедческих работ.
Автор исходит в изучении данного вопроса из того, что в эпоху развитых информационных технологий автоматизации подвергаются все сферы человеческой жизнедеятельности. Расширяется и совершенствуется информационный поиск. Всё более стандарты описания корпуса научной литературы предполагают использование её автоматической обработки. Эти условия предъявляется и к работам в области музыковедения. Сегодня каждое издательство определяет к потенциальным авторам определенный круг требований, который должен будет облегчить последующий автоматизированный поиск заинтересованному кругу лиц, а именно: название, аннотация, ключевые слова.
Актуальность данного вопроса определяется повсеместным широким применением автоматической системы поиска информации и современными стандартами оформления научных трудов, требующимися в различных направлениях научных изысканий. Научная новизна заключается в исследовании возможности применения программы TextAnalyst для глубинного анализа текстов. Методологическую базу исследования составил комплексный подход, содержащий функциональный и компаративный метод, а также эксперимент. Теоретическим обоснованием послужили труды таких исследователей социокультурной информации и текстов как А. Моль, Ю.М. Лотман, Т.И. Науменко, Т.А. Волкова и др. Эмпирическим материалом явились научные статьи, опубликованные в журналах «Музыковедение» и «Музыка и время».
Цель данного исследования заключается в анализе процесса формирования набора ключевых словосочетаний средствами компьютерных ассистирующих технологий.
Проведя библиографический анализ и исследовав научную обоснованность изучаемой проблематики, автор утверждает, что уже в 70-е годы XX века возможность использования информационного подхода в музыкознании стала рассматриваться в связи с развитием информационных систем. Музыковедение экстраполировало основные законы теории информации в музыкальную науку, обнаружив сходство с ними в учении о музыкальном формообразовании и социологии музыкальной культуры. Развитие информационного подхода в музыкознании напрямую связано с изучением текстовых структур. Совершение различных операций с текстом сформировало новые приёмы исследования научной информации, органично включив их в музыковедение.
Как отмечает автор, наиболее простым и распространенным поиском необходимой информации как в виртуальных, так и в печатных каталогах является поиск по ключевым словам. Набор ключевых слов составляется самим автором исследования, так как именно автор может наиболее точно определить те лексические единицы, в которых в концентрированном виде заключается смысл текста. Однако, по словам автора статьи, при таком подходе несколько вуалируется феномен многозначности текста, инвариантность его смыслового поля. Автор научного произведения сознательно заключает текст в определённые рамки, заданные параметрами ключевых значений в виде набора слов и словосочетаний. Таким образом, по мнению автора, что этот метод в конечном итоге не гарантирует адекватности передачи содержания текста ключевыми словами.
Более перспективным автору представляется процесс вовлеченности пользователя в поисковую операцию, в этапы настройки схемы поиска информации. В этом случае процесс поиска необходимого набора ключевых слов оказывается персонализированным. Автором предлагается три основных направления, в которых возможность настройки поиска пользователем является наиболее эффективной: подготовка исследования к публикации, работа библиографа при каталогизации какого-либо издания, анализ структуры научной проблемы или скрытых свойств текстовых массивов.
В первых двух направлениях автор считает, что применение программ глубинного анализа текста может явиться одним из вариантов решения проблемы. Автор рассматривает возможности программы TextAnalyst на примере сравнительного анализа набора ключевых слов, предлагаемых самими авторами с результатами анализа этих же текстов выполненного программой TextAnalyst. В качестве материала для эксперимента автором были избраны статьи из журналов «Музыковедение» и «Музыка и время». Такой выбор был обусловлен тематикой изданий, которая охватывает широкий спектр музыковедческих проблем (вопросы теории, истории музыки, музыкальной этнографии, палеографии, освещаются вопросы педагогики и проблемы музыкального исполнительства), а также тем фактом, что с 2009 года обязательным условием для оформления публикации авторам необходимо сопровождать текст статьи набором ключевых слов. По результатам эксперимента автором отмечается, что набор ключевых слов, предлагаемый авторами анализируемых статей, пересекается с результатами анализа текста, выполненным при помощи программы TextAnalyst. Между тем в большинстве случаев область ключевых значений, сформированных средствами программы значительно шире набора, представленных исследователями.
По третьему направлению наиболее автором в качестве наиболее эффективного предлагается анализ наборов слов и словосочетаний, образованных на основе удельного веса элементов текста. После необходимой подготовки и обработки текста производится его анализ при помощи компьютерной программы. В процессе анализа текст делится на сегменты, между которыми устанавливаются взаимосвязи. Исходя из веса взаимосвязей в тексте, программа определяет набор наиболее значимых слов и словосочетаний. Иллюстрируя работу программы на примере статьи Т. Б. Будаевой «Вокальная сторона Пекинской оперы», автор замечает, что часто результаты работы программы и первоначальное мнение автора могут различаться в силу как объективных (частотность повторения), так и субъективных (авторская стилистика текста, преднамеренная акцентированность) причин. Данное расхождение позволяет автору пересмотреть или дополнить свою аннотацию и список ключевых слов.
Проведя исследование, автор представляет выводы по изученным материалам, отмечая, что глубинный анализ музыковедческого текста при помощи компьютерных программ не является универсальной технологией и не может использоваться изолированно. В совокупности методов исследования данный метод может служить эффективным инструментом.
Представляется, что автор в своем материале затронул актуальные и интересные для современного социогуманитарного знания вопросы, избрав для анализа тему, рассмотрение которой в научно-исследовательском дискурсе повлечет определенные изменения в сложившихся подходах и направлениях анализа проблемы, затрагиваемой в представленной статье.
Полученные результаты позволяют утверждать, что изучение возможности использования современных технологий в музыковедческих исследованиях представляет несомненный теоретический и практический культурологический интерес и может служить источником дальнейших исследований.
Представленный в работе материал имеет четкую, логически выстроенную структуру, способствующую более полноценному усвоению материала. Этому способствует и адекватный выбор методологической базы. Библиографический список исследования состоит из 11 источников, что представляется достаточным для обобщения и анализа научного дискурса по исследуемой проблематике. Автор выполнил поставленную цель, получил определенные научные результаты, позволившие обобщить материал. Следует констатировать: статья может представлять интерес для читателей и заслуживает того, чтобы претендовать на опубликование в авторитетном научном издании.
Ссылка на эту статью

Просто выделите и скопируйте ссылку на эту статью в буфер обмена. Вы можете также попробовать найти похожие статьи


Другие сайты издательства:
Официальный сайт издательства NotaBene / Aurora Group s.r.o.