Обнаружение неточных повторов в документации программного обеспечения

Код статьиS013234740001215-1-1
Тип публикации Статья
Статус публикации Опубликовано
Аффилиация: Санкт-Петербургский государственный университет
Адрес: Российская Федерация
Название журналаПрограммирование
ВыпускВыпуск 5

Документация современного программного обеспечения столь же сложна, как и само программное обеспечение. Велики объёмы документации, имеется значительное количество сложных связей документации внутри себя, а также с другими артефактами разработки, непрост и трудоёмок процесс сопровождения документации. В течение жизненного цикла в документах образуется множество неточных повторов, т.е. фрагментов текста, скопированных из одного источника и впоследствии по-разному модифицированных. Такие дубликаты снижают качество документации и затрудняют её дальнейшее использование. В то же время вручную неточные повторы трудно обнаружить. В статье даётся формальное определение неточных повторов и предлагается алгоритм их обнаружения. Алгоритм основан на поиске клонов в программном обеспечении. Представлено формальное обоснование корректности алгоритма. Описаны результаты апробации алгоритма на документации 19 открытых и коммерческих программных проектов. Выполнен анализ обнаруженных неточных повторов для документации ядра ОС Linux. 

Ключевые словадокументация программного обеспечения, неточные повторы, повторное использование документации, клоны в программном обеспечении
Источник финансированияРабота частично поддержана РФФИ, грант № 16-01-00304.
Дата публикации28.10.2018
Кол-во символов1037
Размещенный ниже текст является ознакомительной версией и может не соответствовать печатной.

