Распознавание лиц методом гистограммы ориентированных градиентов

Заказать уникальную курсовую работу
Тип работы: Курсовая работа
Предмет: Обучение нейронных систем
  • 29 29 страниц
  • 0 + 0 источников
  • Добавлена 26.04.2021
1 496 руб.
  • Содержание
  • Часть работы
  • Список литературы
  • Вопросы/Ответы
СОДЕРЖАНИЕ 1
ВВЕДЕНИЕ 2
1. СТРУКТУРА 3
1.1. Аннотация 4
1.2. Содержание 5
1.3. Введение 6
1. Анатомические характеристики черт лица человека 9
1.5. Заключение 47
1.6. Список использованных источников 47
2. ОФОРМЛЕНИЕ 48
2.1. Общие правила оформления 48
2.2. Нумерация страниц и разделов 49
2.3. Иллюстрации к тексту 50
2.4. Таблицы 52
2.5. Уравнения 53
2.6. Список обозначений и сокращений 54
2.7. Список использованных источников 54
2.8. Приложения 55
3. ПРИМЕРЫ ОФОРМЛЕНИЯ СПИСКА ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 57
ЗАКЛЮЧЕНИЕ 60
СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ 62
Фрагмент для ознакомления

Каждое последующее изображение создается путем применения размытия по Гауссу к предыдущему изображению.
Справа у нас есть четыре изображения, сгенерированные путем вычитания последовательных гауссианов. Результаты приводят к улучшению качества изображения как ни странно.

Локализация ключевых точек
После того, как изображения созданы, следующим шагом будет поиск важных ключевых характеристик изображения, которые можно использовать для сопоставления признаков. Идея состоит в том, чтобы найти локальные максимумы и минимумы изображений. Эта часть разделена на два этапа:
Найти локальные максимумы и минимумы
Удалить ключевые точки с низкой контрастностью (выбор ключевых точек)
 
Локальные максимумы и локальные минимумы
Чтобы найти локальные максимумы и минимумы, мы просматриваем каждый пиксель изображения и сравниваем его с соседними пикселями.
Когда я говорю «соседний», это включает не только окружающие пиксели этого изображения (в котором находится пиксель), но также девять пикселей для предыдущего и следующего изображения в октаве.
Это означает, что каждое значение пикселя сравнивается с 26 другими значениями пикселей, чтобы определить, является ли оно локальным максимумом / минимумом. Например, на диаграмме ниже у нас есть три изображения из первой октавы. Пиксель с пометкой x сравнивается с соседними пикселями (зеленым цветом) и выбирается в качестве ключевой точки, если он самый высокий или самый низкий среди соседей:

Теперь у нас есть потенциальные ключевые точки, которые представляют изображения и не зависят от масштаба. Мы применим последнюю проверку к выбранным ключевым точкам, чтобы убедиться, что это наиболее точные ключевые точки для представления изображения.
 
Выбор ключевой точки
Пока что мы успешно сгенерировали масштабно-инвариантные ключевые точки. Но некоторые из этих ключевых точек могут быть неустойчивыми к шуму. 
Поэтому необходимо выполнить окончательную проверку, чтобы убедиться, что у нас есть оптимальные ключевые точки для представления функций изображения.
Следовательно, мы удалим ключевые точки с низким контрастом или расположенные очень близко к краю.
Чтобы справиться с низкоконтрастными ключевыми точками, для каждой ключевой точки вычисляется расширение Тейлора второго порядка. Если результирующее значение меньше 0,03 (по величине), мы отклоняем ключевую точку.
Проведем проверку, чтобы выявить неудачно расположенные ключевые точки. Это ключевые точки, которые находятся близко к краю и имеют высокий отклик края, но могут быть не устойчивыми к небольшому количеству шума. Матрица Гессе второго порядка используется для определения таких ключевых точек. 
Теперь, когда мы выполнили и тест контрастности, и тест края, чтобы отклонить нестабильные ключевые точки, мы теперь назначим значение ориентации для каждой ключевой точки, чтобы сделать поворот неизменным.
 
Назначение ориентации
На этом этапе у нас есть набор стабильных ключевых точек для изображений. Теперь мы назначим ориентацию каждой из этих ключевых точек, чтобы они были инвариантны к вращению. Мы можем снова разделить этот шаг на два меньших шага:
Рассчитайте величину и ориентацию
Создайте гистограмму величины и ориентации
 
Рассчитать величину и ориентацию
Рассмотрим пример изображения, показанный ниже:

Допустим, мы хотим найти величину и ориентацию для значения пикселя, выделенного красным. Для этого мы вычислим градиенты в направлениях x и y, взяв разницу между 55 и 46 и 56 и 42. Получается, что Gx = 9 и Gy = 14 соответственно.
Когда у нас есть градиенты, мы можем найти величину и ориентацию, используя следующие формулы:
Величина = √ [(G x ) 2 + (G y ) 2 ] = 16,64
Φ = атан (Гр / Гх) = атан (1,55) = 57,17
Величина представляет собой интенсивность пикселя, а ориентация дает направление для него.
Теперь мы можем создать гистограмму, учитывая, что у нас есть эти значения величины и ориентации для пикселей.
 
Создание гистограммы для величины и ориентации
На оси x у нас будут интервалы для значений углов, например 0-9, 10-19, 20-29, вплоть до 360. Поскольку наше значение угла 57, оно попадет в 6-й интервал. Значение 6-го интервала будет пропорционально величине пикселя, то есть 16,64. Мы сделаем это для всех пикселей вокруг ключевой точки.
Вот как мы получаем гистограмму ниже:

В какой-то момент эта гистограмма достигнет максимального значения. Бункер, в котором мы видим пик, будет ориентацией ключевой точки. Кроме того, если есть еще один значимый пик (видимый между 80–100%), то создается еще одна ключевая точка с величиной и масштабом, аналогичными ключевой точке, использованной для создания гистограммы. И угол или ориентация будут равны новому бункеру с пиком.
Фактически на этом этапе мы можем сказать, что количество ключевых точек может немного увеличиться.
 
Дескриптор ключевой точки
Это последний шаг для SIFT. Выявили стабильные ключевые точки, которые инвариантны к масштабу и вращению. В этом разделе мы будем использовать соседние пиксели, их ориентацию и величину, чтобы сгенерировать уникальный отпечаток для этой ключевой точки, называемый «дескриптором».
Кроме того, поскольку мы используем окружающие пиксели, дескрипторы будут частично инвариантны к освещению или яркости изображений.
Сначала мы возьмем окрестность 16 × 16 вокруг ключевой точки. Этот блок 16 × 16 далее делится на подблоки 4 × 4, и для каждого из этих подблоков мы генерируем гистограмму, используя величину и ориентацию.

На этом этапе размер бина увеличен и мы берем только 8 бинов (а не 36). Каждая из этих стрелок представляет 8 интервалов, а длина стрелок определяет величину. Итак, у нас будет всего 128 значений ячеек для каждой ключевой точки.
Для каждой ключевой точки образовался набор векторов, то есть дескриптор.
Алгоритм SIFT достаточно популярный и часто используемый, поэтому существуют многочисленные реализации этого алгоритма. Реализация алгоритма SIFT входит в состав таких библиотек компьютерного зрения как VLFeat [9] и OpenCV [10].
2.2 Метод и алгоритм HOG
Другой популярный способ обнаружения лиц и объектов - использование классификаторов HOG.
HOG - это гистограмма ориентированных градиентов. Суть алгоритма заключается в поиске подходящих дескрипторов признаков для изображения, будь то лица или другие объекты.
В 2005 году функции гистограммы ориентированных градиентов (HOG) были реализованы Навнитом Далалом и Биллом Триггсом.
Гистограмма ориентированных градиентов (HOG) - это дескриптор функции, используемый в основном для распознавания объектов при обработке изображений. Дескриптор функции - это представление изображения или фрагмента изображения, которое, извлекая из него ценную информацию, упрощает изображение. То есть совокупность пикселей начального изображения заменяется несколькими узлами, вокруг которых определена ситуация (дескрипторы).

Основа алгоритма дескрипторной гистограммы направленных градиентов заключается в том, что распределение градиентов интенсивности или направления краев будет определять внешний вид и форму локальных объектов в изображении.
Производные изображения по x и y (градиенты) полезны, потому что из-за внезапного изменения амплитуды величина градиентов высока по краям и углам, и мы знаем, что края и углы содержат намного больше деталей формы объекта, чем плоские области. То есть анализируем именно края и углы всех объектов на фотографии.
Поэтому гистограммы градиентных путей используются как свойства этого дескриптора:

Алгоритм по вычислению дескрипторов HOG для распознавания и обнаружения лиц:
Изображение делится на блоки 8х8 ячеек, и для каждого блока 8х8 ячеек измеряется гистограмма градиентов.
Вектор из 9 сегментов (чисел), соответствующих углам от 0 до 180 градусов, в основном представляет собой гистограмму (с шагом 20 градусов).
Значения этих 64 ячеек (8X8) объединяются в эти 9 сегментов и вставляются кумулятивно.
Это в принципе ограничивает 64 значения 9 значениями.









29

-

Вопрос-ответ:

Каким методом осуществляется распознавание лиц?

Распознавание лиц осуществляется методом гистограммы ориентированных градиентов.

Какие анатомические характеристики лица используются при распознавании?

При распознавании лиц используются анатомические характеристики черт лица человека, такие как форма глаз, носа, рта и прочие особенности.

Какие правила оформления документа следует соблюдать?

Для оформления документа следует соблюдать общие правила оформления, такие как правила нумерации страниц и разделов, правила оформления иллюстраций, таблиц, уравнений и т.д.

Что такое гистограмма ориентированных градиентов?

Гистограмма ориентированных градиентов - это метод, основанный на анализе градиентов яркости пикселей изображения. Он позволяет выделить особенности объекта, такие как края или текстуры, и использовать их для распознавания лиц.

Какие источники использовались при написании статьи?

При написании статьи использовались различные источники, которые содержат информацию о распознавании лиц методом гистограммы ориентированных градиентов. Полный список использованных источников приведен в конце статьи.

Какие методы используются для распознавания лиц?

Для распознавания лиц существует несколько методов, включая метод гистограммы ориентированных градиентов. Этот метод основывается на извлечении и анализе градиентных признаков на изображении лица.

Как работает метод гистограммы ориентированных градиентов для распознавания лиц?

Метод гистограммы ориентированных градиентов для распознавания лиц основывается на извлечении ориентированных градиентных признаков из изображения лица. Он использует информацию о направлениях и интенсивностях градиентов для создания гистограммы, которая представляет собой векторный дескриптор лица. Этот дескриптор затем сравнивается с дескрипторами известных лиц для определения идентификации.

Какие анатомические характеристики черт лица используются для распознавания?

Для распознавания лиц используются различные анатомические характеристики черт лица, включая расстояния между глазами, форму и размеры носа, расстояние между глазами и носом, а также форму и размеры глаз и рта. Эти характеристики помогают создать уникальный дескриптор лица, который можно использовать для идентификации.