Использование фонограмм в качестве вещественных доказательств в судебном расследовании невозможно без установления их аутентичности (оригинальности и отсутствия в них каких-либо изменений) судебно-следственным либо экспертным путем. Имеющиеся экспертные методики решения данной проблемы эффективны для аналоговых магнитных фонограмм, в которых сигнал непосредственно зафиксирован в виде непрерывной пространственно-временной функции. Однако их применение для определения технической подделки фонограмм (монтажа, редактирования, обработки и т.п.), выполненных с помощью цифровых технологий с последующей перезаписью в аналоговом виде, является не эффективным, а в некоторых случаях может приводить и к экспертным ошибкам. В связи с этим требуются разработки новых экспертных методик, учитывающих современные возможности цифровых технологий.
Первоочередным шагом в разработке данной задачи является установление факта происхождения аналоговой фонограммы от цифровой или наличия в технологической цепочке ее создания цифровых устройств.
Установление данного факта важно и для идентификации диктора, поскольку некоторые алгоритмы сжатия (специальной цифровой обработки) сигнала, применяемые в современной записывающей и телекоммуникационной аппаратуре, существенно его трансформируют и не позволяют использовать непосредственно имеющиеся методики идентификации человека по его устной речи без их доработки.
Диагностика применения цифровых устройств при изготовлении фонограмм может осуществляться по двум группам признаков:
" признаки преобразования сигнала из цифровой формы представления в аналоговую;
" признаки характерных для цифровой техники алгоритмов обработки сигнала.
На сегодняшний день производители оборудования уделяют огромное внимание качеству звучания цифровой аппаратуры, что существенно затрудняет работу эксперта по выявлению этих признаков вследствие определенной тонкости их проявления.
Наиболее доступным (и практически единственным пригодным сегодня для практического использования) признаком первой группы является наличие зеркально отраженных относительно половины частоты дискретизации ложных спектральных составляющих сигнала (aliasing). В наиболее простом случае, когда в конструкции не предусмотрены меры борьбы с этим явлением, ложные спектральные составляющие обнаруживаются во всем диапазоне частот, в котором записана фонограмма. В случае, когда устройство (точнее, его ЦАП) может работать на нескольких частотах дискретизации, но оснащено неперестраиваемым фильтром, рассчитанным на максимальную частоту дискретизации, ложные спектральные составляющие наблюдаются в диапазоне частот от половины частоты дискретизации сигнала до половины максимальной частоты дискретизации устройства. Подобная картина наблюдается и в случае работы ЦАП всегда на максимальной частоте дискретизации и использования простейших алгоритмов переоцифровки сигнала при выводе. И, наконец, полупрофессиональные и профессиональные устройства вовсе не дают указанных следов вследствие применения достаточной фильтрации, либо при переоцифровке сигнала (в случае применения ЦАП, работающего на многократно завышенной частоте), либо при выводе с ЦАП на выходной усилитель.
Расширение спектра ограниченного по амплитуде сигнала также интересно с точки зрения поиска признаков цифровой обработки, однако это напраление исследовано недостаточно. По сути дела, это явление имеет место как в цифровой, так и в аналоговой аппаратуре, но различный характер ограничения сигнала в указанных случаях позволяет иногда судить о происхождении фонограммы. Различия эти вызваны тем, что цифровые устройства имеют резкий излом амплитудной характеристики в месте перехода от наклонного (реально - ступенчатого) ее участка к горизонтальному, тогда как в аналоговых устройствах этот переход является плавным. Таким образом, в цифровых устройствах расширение спектра ограниченного по амплитуде сигнала выражено более резко и, в отличие от зеркальной помехи, проявляется даже в качественной аппаратуре.
Вторая группа признаков связана в основном с алгоритмами компрессии и шумоочистки речи. Единственным известным нам исключением является легко детектируемый спектральными методами алгоритм ATRAC (точнее, семейство алгоритмов), применяемый в минидисковых устройствах. Впрочем, как и алгоритмы сжатия речи, данная схема компрессии предусматривает разбиение сигнала на кадры для более компактной записи, что и проявляется в виде ступенчатого изменения средней спектральной плотности шума на границах кадров (см. рис. …). В других алгоритмах кадрирование сигнала может проявляться в виде наличия пика в среднем спектре на частоте кадрирования (например, рекомендации ITU-T G.729, частота кадрирования 100 Гц) и может использоваться лишь как вспомогательный признак.
Характерной чертой алгоритмов компрессии речи является искусственный фоновый шум (или его отсутствие), что приводит к единообразности фонового шума по всей протяженности фонограммы. Объясняется это тем, что такие устройства не записывают (не передают) данных о фоновом шуме и при распаковке сигнала для улучшения его аудиторного восприятия к нему подмешивается комфортный шум. Если заполнение шумом не производится, то амплитуда сигнала на таких участках равна нулю. В ряде случаев такой искусственный шум может характеризоваться специфическим аудиторным восприятием.
Специфические спектральные искажения, обусловленные применением алгоритмов компрессии и шумоочистки, выражаются, как правило, в наличии гармонических составляющих сигнала на участках, где этих составляющих в исходном сигнале не было. В случае адаптивной фильтрации это могут быть случайно расположенные гармоники (т.н. музыкальный шум), в случае применения вокодерных алгоритмов компрессии - это ошибки детектора тон-шум, приводящие к появлению тональной составляющей в чисто шумовых сигналах и ее выпячиванию в сигналах с шумовой основой и слабой гармонической составляющей. Встречается также (например, диктофоны TOSHIBA DMR SX-1, SX-2 при записи малых по уровню сигналов в режиме подавления шумов) неадекватная передача спектральной структуры речевого сигнала, когда спектральные полосы, хоть они и расположены с одинаковым шагом, не являются гармониками какой-либо частоты (например, 120Гц, 205Гц, 290Гц…).
Применение в экспертной практике спектрального анализа на предмет выявления описанных в данной статье признаков позволит повысить достоверность экспертных выводов.
Также необходимо отметить актуальность данного направления и необходимость более детального и всестороннего его исследования.
2001