Вторник, 19.09.2017, 14:33
Высшее образование
Приветствую Вас Гость | RSS
Поиск по сайту



Главная » Статьи » Техника. Технические науки

АНАЛИЗ МЕТОДОВ ПРОВЕРКИ ФОТОИЗОБРАЖЕНИЙ НА НАЛИЧИЕ ВНЕСЁННЫХ ИЗМЕНЕНИЙ

А.С.Гераськин, С.Ю.Желтов

АНАЛИЗ МЕТОДОВ ПРОВЕРКИ ФОТОИЗОБРАЖЕНИЙ НА НАЛИЧИЕ ВНЕСЁННЫХ ИЗМЕНЕНИЙ

В статье рассматриваются методы анализа цифровых изображений на наличие изменений. Проводится анализ их работоспособности на тестовых изображениях в рамках разработанного программного продукта. В результате исследования была выявлена невозможность определения экспертом изменений на изображениях, в которых были заретушированы или добавлены новые объекты. Для решения этой проблемы было найдено новое семейство алгоритмов, которые в сочетании с рассмотренными дают приемлемый результат.

Ключевые слова: цифровое изображение, метод анализа внесенных изменений метаданных изображения, сигнатурный поиск, качество изображения, двойное квантовании.

 

Подделка фотографий появилась задолго до цифровых камер, компьютеров и специализированного программного обеспечения. Уже через несколько десятилетий после создания в 1822 г. Жозефом Ньепсом первого фотоизображения, была сделана первая подделка [7]. С появлением компьютеров подделка изображений перешла на новый уровень и стала доступна ещё большему числу людей. В настоящее время любой желающий может отредактировать любое доступное ему изображение в графическом редакторе, причём, если отредактировать фото достаточно аккуратно, не оставляя явных признаков изменения, то разобраться с тем, является ли фотография оригиналом или подделкой, без использования специального программного обеспечения будет практически невозможно. В связи с этим в настоящее время очень высокую роль играет проверка фотографий на наличие в них внесённых изменений. Если у печатных документов могут быть проверочные номера и другие способы проверки на оригинальность, то у обычных, не прошедших специальной обработки, нет никаких встроенных способов защиты от изменения и фальсификации. Особенно остро эта проблема стоит в сфере страхования и электронного документооборота. Таким образом, на данный момент существует потребность в решениях, обеспечивающих быструю и достаточно надёжную проверку изображений на оригинальность и факт внесения в них изменений.

На данный момент в мире существует множество различных решений для проверки изображений на наличие внесённых изменений, большая часть из них является коммерческими решениями, которые чаще всего не предоставляют демонстрационный доступ к продукту.

Методы анализа изображений

Изучая популярные и использующиеся программные продукты, осуществляющие анализ изображений на предмет наличия внесённых изменений, мы отобрали алгоритмы, применяющиеся в них. Наиболее интересными и часто встречающимися методами при анализе изображений на предмет внесения в них изменений являются:
1) анализ метаданных изображения (MA) - извлечение метаданных изображения для дальнейшего изучения;
2) сигнатурный поиск (SS) - поиск известных сигнатур, оставляемых программами при обработке фотографий;
3) анализ похожих изображений (SSI) - поиск и анализ оригинала изображения, анализ миниатюр изображения;
4) анализ качества изображения (QA) - анализ матриц квантования изображения на предмет соответствия заявленному коэффициенту компрессии;
5) анализ картины шумов изображения (NA) - поиск изменений в картине шумов;
6) эффект двойного квантования (DQ) - построение гистограмм коэффициентов дискретного косинусного преобразования для выявления повторного сохранения изображения;
7) error level analysis (ELA) - поиск областей изображения с различным уровнем компрессии.

Часть приведённых методов может работать с изображениями любого формата (1-3), но такие методы как анализ картины шумов, Error Level Analysis и анализ матриц квантования применимы только к изображениям в формате JPEG, который наряду с TIFF и RAW, является одним из основных стандартов, включённых в спецификацию индустриального стандарт организации данных в устройствах получения, хранения, преобразования и вывода цифровых изображений DCF [8].

Реализация методов проверки

Для детального анализа возможностей изложенных выше методов они были реализованы в рамках одного программного продукта, который осуществляет анализ изображений

В качестве тестового изображения будем использовать фотографию учебного корпуса Саратовского Государственного Университета имени Н.Г. Чернышевского, в которую при помощи программы Adobe Photoshop CS 5 были внесены следующие изменения:
1) изображение было обрезано до размера 472 на 525 пикселей;
2) в центральной области изображения был вырезан квадратный участок, который был сохранён в меньшем качестве (QualityFactor = = 65 %) и вставлен обратно;
3) изображение было сохранено с QualityFactor = 99 %.

После данных манипуляций с изображением, оно было сохранено ещё раз при помощи редактора Adobe Photoshop Lightroom 5.6. Полученное изображение представлено на рис. 1.

Рис. 1. XII корпус СГУ имени Н.Г. Чернышевского

В графическом файле хранятся разнообразные метаданные, в которых представляется информация об устройстве, с помощью которого было получено изображение, его настройках, характеристиках самого изображения, его описание, координаты места съёмки и многое другое. В зависимости от формата изображения метаданные хранятся в разных блоках, например в изображениях формата PNG метаданные хранятся в тегах tEXt, iTXt и zTX, а метаданные в изображениях форматов JPEG, TIFF и RAW хранятся в соответствии со стандартом EXIF (листинг извлечённых из изображения 1 EXIF тегов приведён на рис. 2). Кроме того, существует стандарт ХМР, разработанный компанией Adobe Systems, который также может хранить внутри себя информацию для графических файлов, таких как JPEG, PNG, RAW, TIFF.

Для анализа этих данных достаточно уметь находить блоки данных внутри графического файла и правильно распознавать их. С этой задачей справляются различные программные решения - от программ для просмотра изображений, до специализированного программного обеспечения (ExifPro Image Viewer, ShowMeta, Exif Pilot) [8].

Рис. 2. Листинг EXIF тегов, извлечённых из рис. 1

Анализ сигнатур изображения

Кроме метаданных устройства, программы, обрабатывающие графические изображения, оставляют различные следы в контейнере изображения. Такие следы могут быть типичными для данного программного обеспечения матрицами квантования, названиями тегов, заголовками файлов (например, при сохранении изображения для web устройств в графическом редакторе Adobe Photoshop CS5, в заголовок файла вносится пометка Ducky). Также с помощью данного метода выделяются наиболее значимые теги из метаданных файла (рис. 3).


Рис. 3. Листинг сигнатур, обнаруженных в рис. 1
 
Анализ похожих изображений

Часто при редактировании изображения его сохраняют без изменения миниатюры, в таком случае достаточно произвести сравнение миниатюры и самого изображения, чтобы понять, какие изменения были в него внесены. Также можно попытаться найти оригинал изображения в интернете с помощью поиска изображений, отсортированных по дате добавления в индекс поиска, и сравнить изображение с найденным.

Данный метод не всегда может быть применён к изображению, так как оно может отсутствовать в интернете или его миниатюра может быть удалена, в таком случае стоит проводить более глубокий анализ изображения методами ELA или NA. Листинг результата работы алгоритма приведён на рис. 4.

Анализ качества изображения

При сохранении изображений в формате JPEG цифровые фотоаппараты и сканеры устанавливают коэффициент сжатия большим 80 %, поэтому именно такой коэффициент ожидается при анализе качества изображения. Напрямую этот коэффициент в фотографии не содержится, его можно вычислить по матрицам квантования изображения. Матрица квантования строится по следующей формуле [6]:


для i = 0, ...,63,
где Q[i] - ячейка матрицы квантования;
BasicTable - ячейка из матрицы округления;
QualityFactor - коэффициент сжатия.
Коэффициент сжатия в стандарте JPEG находится следующим образом:
1) если QualityFactor Меньше или равно, математический знак 0, положить QualityFactor = 1;
2) если QualityFactor > 100, положить QualityFactor=ioo;
3) если QualityFactor < 50 , перейти к шагу 4, иначе к шагу 5;
4) QualityFactor = 5000 / QualityFactor;
5) QualityFactor = 200 - QualityFactor.
Также существуют стандартные матрицы округления, приведённые в стандарте JPEG (рис. 5).

Анализ картины шумов изображения

Идея данного анализа состоит в том, что при редактировании изображения происходит изменение его картины шумов. При этом в обычном изображении увидеть это влияние практически невозможно, поэтому для отображения картины шумов применяется изменённый медианный фильтр, который обрабатывает каждый блок пикселей, но вместо удаления шума делает обратную операцию, оставляя в блоке лишь те пиксели, что содержат шум [5], алгоритм действий фильтра следующий:
1) поместить значения пикселей обрабатываемого блока 3x3 в массив P и пронумеровать их от 0 до 8;

2) вычислить значения медиан

M1 = median(P[0], P[4, P[8]),
M2 = median(P[i], P[4], P[7]),
M3 = median(P[2], P[4], P[6]),
M4 = median(P[3], P[4], P[5]);

3) вычислить значения медиан
M== median(P[4], M,, M3 ),

4) Mb = mediantf^M^M),

5) если P[4] Неравно, математический символ, знак неравенства median(P[4], MA, MB), то добавить P[4] к изображению на выходе.

Данный анализ помогает выявить работу таких инструментов, как кисть, штамп, размытие, трансформирование, вставка, при этом области имеющие изменения картины шумов после выполнения алгоритма будут темнее или ярче остальных частей изображения. Данный метод был протестирован на тестовом изображении, представленном на рис. 1, но следов редактирования фотоизображения на картине шумов не видно (рис. 6).

Рис. 4. Листинг результата работы анализа похожих изображений
 

Рис. 5. Листинг матрицы округления из стандарта JPEG

Рис. 6. Карта шумов рис. 1 (слева)

Эффект двойного квантования


Для иллюстрации данного эффекта достаточно построить гистограмму распределения этих коэффициентов, так как при DQ-эффекте на гистограмме возникают периодические нули, причём с каждым последующим сжатием их число растёт [2].

На рис. 7 представлено проявление DQ- эффекта на изображении до повторного сжатия (а), после первого сжатия (б), после второго сжатия (в).
 
Error Level Analysis

JPEG является алгоритмом сжатия с потерями, где каждый блок 8x8 пикселей обрабатывается отдельно. Как уже говорилось ранее, если рассмотреть набор DCT коэффициентов Со, прошедший квантование с коэффициентом QualityFactorо, и коэффициенты С1, прошедшие второе квантование с коэффициентом QualityFactor1 > QualityFactorо, а затем посчитать функцию разности этих коэффициентов относительно коэффициентов С2, прошедших ещё одно квантование с коэффициентом QualityFactor2, то она будет иметь два локальных минимума QualityFactor2 = QualityFactor1 (рис. 8, синяя точка) и QualityFactor2 = QualityFactorо (рис. 8, красная точка). Второй минимум, который получается при коэффициенте равном коэффициенту первого квантования изображения, называют «призраком JPEG» [3].

Рис. 7. Гистограммы распределения DCT коэффициентов
При кодировании изображений в формате JPEG отдельно обрабатываются каждый канал внутри блока 8x8 пикселей, из- за чего придётся производить вычисление разности между всеми коэффициентами DCT на каждом канале. Но на практике обычно вместо этого используют вычисление разности между значениями самих пикселей по следующей формуле:

со значением QualityFactor = q. Если построить изображение с значениями пикселей, равными разности d(x, y, q), при q = 98 [8] мы получим графическое представление ELA.

Рис. 8. График зависимости разности пикселей d от QualityFactor
 

Рис. 9. Изображение с областями с разными уровнями компрессии и его ELA

На изображении, которое не было подвержено редактированию, грани объектов будут иметь одинаковую яркость, контуры с низким контрастом будут иметь такую же яркость, как и контуры с высоким контрастом (рис. 8), одинаковые текстуры и области на изображении будут иметь однообразную текстуру и на картине ELA. Особенно хорошо это заметно на рис. 9, на котором видна область, вставленная из другого изображения.

В результате исследования методов, реализуемых большинством программных продуктов, представленных на рынке, было выявлено: все методы  основываются на свойствах формата, в котором сохранено изображение, и крайне не универсальны; рассмотренные методы дают достаточно хороший результат при поиске свойственных для них изменений в изображениях. Таким образом, для повышения универсальности применяемых методов необходимо проводить анализ на основе физических и геометрических свойствах самого изображения, к ним можно отнести: анализ теней изображения, анализ источников света. Согласно исследованиям, сочетание известных
методов с анализом физических и геометрических свойств изображения повышает эффективность таких
компьютерных систем на 80 %.

Библиографический список (References)

1. Civil War Glass Negatives and Related Prints. URL: http://www.loc.gov/pictures/collection/cwp/mystery.html.
2. Farid H. (2008) Digital image forensics. USA: Department of Computer Science. 189 p.
3. Krawetz N. (2007) A Pictures Worth Digital Image Analisys and. USA : Black Hat Briefings. 21 p.
4. Mahdian B. (2013) Detecting Double Compressed JPEG Images. Czech Republic : ASCR. 11 p.
5. Noise Analysis for Image Forensics. URL: https://29a.ch/2015/08/21/noise-analysis-for-image-forensics.
6. Алгоритм JPEG Основные соотношения. URL: http://www.mediascan.by/index.files/jpeg-ref.
Algoritm JPEG Osnovnyye sootnosheniya [JPEG Algorithm. Basic Correlations]. URL: http://www.mediascan. by/index.files/jpeg-ref.
7. Кобозева А. Эффект двойного квантования и его особенности. 2008. C. 16–19.
Kobozeva A. (2008) Effekt dvoynogo kvantovaniya i yego osobennosti [Double Quantization Effect and its Parameters]. P. 16–19.
8. Метаданные в цифровой фотографии. URL: http://www.ixbt.com/digimage/metadxph.shtml. Metadannyye v tsifrovoy fotografii [Metadata in Digital Photography]. URL: http://www.ixbt.com/digimage/metadxph.shtml.

"Информационная безопасность регионов" № 4(25) 2016

Категория: Техника. Технические науки | Добавил: x5443 (31.05.2017)
Просмотров: 87 | Теги: цифровое | Рейтинг: 0.0/0
Всего комментариев: 0
Добавлять комментарии могут только зарегистрированные пользователи.
[ Регистрация | Вход ]
...




Copyright MyCorp © 2017 Обратная связь