Tìm hiểu về phương pháp mô tả đặc trưng HOG (Histogram of Oriented Gradients)

0
433
Hog là gì

Hog là gì

Video Hog là gì

hog là viết tắt của biểu đồ gradient có định hướng, một loại “bộ mô tả tính năng”. mục đích của “bộ mô tả tính năng” là trừu tượng hóa một đối tượng bằng cách trích xuất các tính năng của nó và loại bỏ thông tin vô ích. do đó, hog chủ yếu được sử dụng để mô tả hình dạng và sự xuất hiện của một đối tượng trong hình ảnh.

Tìm hiểu về phương pháp mô tả đặc trưng HOG (Histogram of Oriented Gradients)

Bản chất của phương pháp hog là sử dụng thông tin về sự phân bố cường độ của gradient (độ dốc cường độ) hoặc hướng cạnh để mô tả các đặc điểm cục bộ của hình ảnh. toán tử lợn được thực hiện bằng cách chia nhỏ hình ảnh thành các vùng con, được gọi là “ô” và đối với mỗi ô, chúng tôi tính toán biểu đồ về hướng của các chuyển sắc cho các điểm trong ô. đặt các biểu đồ lại với nhau sẽ tạo ra một hình ảnh gốc. Để cải thiện hiệu suất nhận dạng, độ tương phản của biểu đồ cục bộ có thể được chuẩn hóa bằng cách tính toán ngưỡng cường độ trên một khu vực lớn hơn ô, được gọi là khối và sử dụng giá trị ngưỡng đó để chuẩn hóa tất cả các ô trong khối. kết quả sau bước chuẩn hóa sẽ là một vectơ đặc trưng bất biến hơn đối với những thay đổi trong điều kiện ánh sáng.

Có 5 bước cơ bản để tạo vectơ lợn cho hình ảnh, bao gồm:

  1. bộ tiền xử lý
  2. tính toán độ dốc
  3. tính toán các vectơ đặc trưng cho mỗi ô
  4. chuẩn hóa các khối
  5. tính toán vectơ lợn
  6. 1. bộ tiền xử lý

    Trong bài toán này, để dễ dàng chia hình ảnh thành các khối, ô và tính hàm trong các bước sau dễ dàng hơn, chúng ta cần thay đổi kích thước tất cả các hình ảnh trong tập dữ liệu thành một kích thước tổng thể nhất định.

    Trong các ví dụ được trình bày trong bài viết này, kích thước tổng thể của 1 hình ảnh sẽ được mặc định là 64×128

    2. tính toán gradient

    Đây là bước đầu tiên, được thực hiện bằng hai phép nhân tích chập của hình ảnh ban đầu với 2 chiều, tương ứng với các toán tử lấy đạo hàm theo hai hướng ox và oy. trong đó, hai địa chỉ tương ứng là:

    Tìm hiểu về phương pháp mô tả đặc trưng HOG (Histogram of Oriented Gradients)

    t là phép toán chuyển vị ma trận.

    nghe có vẻ khó hiểu, hãy xem hình ảnh bên dưới để có cái nhìn trực quan hơn.

    Tìm hiểu về phương pháp mô tả đặc trưng HOG (Histogram of Oriented Gradients)

    và nếu bạn có hình ảnh đầu vào i , chúng tôi sẽ có 2 hình ảnh dẫn xuất một phần theo hai hướng đó, theo công thức:

    Tìm hiểu về phương pháp mô tả đặc trưng HOG (Histogram of Oriented Gradients)

    sau đó, bạn có thể tính toán gradient bao gồm hai thành phần độ lớn (độ lớn của gradient) và hướng (độ lệch của gradient) theo công thức (*) :

    ví dụ: giả sử chúng ta có một pixel như thế này

    Tìm hiểu về phương pháp mô tả đặc trưng HOG (Histogram of Oriented Gradients)

    chúng tôi sẽ áp dụng các công thức trước đó để tính toán độ dốc của pixel này:

    Tìm hiểu về phương pháp mô tả đặc trưng HOG (Histogram of Oriented Gradients)

    đối với hình ảnh màu, độ dốc của ba kênh (đỏ, lục và lam) được đánh giá. độ lớn của gradient trong một pixel là giá trị lớn nhất của cường độ gradient của ba kênh và góc là góc tương ứng với gradient tối đa.

    3. tính toán vectơ đặc trưng cho mỗi ô

    Để tính toán vector đặc trưng của mỗi ô, chúng ta cần chia hình ảnh thành các khối, mỗi khối được chia đều thành các ô. Để xác định số khối, chúng tôi sẽ sử dụng công thức sau:

    các khối có thể được xếp chồng lên nhau như được hiển thị:

    1. chia không gian địa chỉ thành p bin (số kích thước của vectơ đặc trưng của ô).
    2. rời rạc góc nghiêng ở mỗi pixel trong vùng chứa.
    3. giả sử góc nghiêng của pixel ở vị trí (x, y) có độ lớn alpha (x, y)

      • trường hợp tùy ý lợn không có dấu với p = 9:

      • Trường hợp rời rạc hóa signed-HOG với p=18: Tìm hiểu về phương pháp mô tả đặc trưng HOG (Histogram of Oriented Gradients)

        Giá trị của vùng chứa được định lượng bằng tổng độ lớn của biến thể của các pixel thuộc vùng chứa đó. Sau khi tính toán đặc trưng ô, chúng ta sẽ nối các vectơ đặc trưng ô để có được vectơ đặc trưng khối. số kích thước của vectơ đặc trưng của khối được tính bằng công thức:

        ví dụ: trong trường hợp này, hình ảnh của chúng tôi là 64×128, chúng tôi sẽ chia mỗi hình ảnh thành các khối 16×16. mỗi khối sẽ bao gồm 4 ô, kích thước mỗi ô là 8×8.

        Tìm hiểu về phương pháp mô tả đặc trưng HOG (Histogram of Oriented Gradients)

        sau đó thực hiện tính toán hàm hog trên mỗi ô bằng cách sử dụng không gian địa chỉ 9-bin, trường hợp “ unsigned-hog “. hướng gradient sẽ nằm trong khoảng từ 0 đến 180 độ, trung bình là 20 độ trên mỗi thùng.

        trong mỗi ô, xây dựng biểu đồ cường độ gradient bằng cách bỏ phiếu các pixel trong biểu đồ. trọng số bình chọn của mỗi pixel phụ thuộc vào hướng và độ lớn của gradient (tính từ bước 2) của pixel đó. ví dụ:

        Tìm hiểu về phương pháp mô tả đặc trưng HOG (Histogram of Oriented Gradients)

        Như trong hình trên, pixel đầu tiên được bao quanh bởi màu xanh lam. có phương 80 độ và độ lớn bằng 2 nên ta thêm 2 vào thùng thứ 5 (phương 80 độ). tiếp theo là các pixel được bao quanh bởi màu đỏ. nó có hướng 10 độ và độ lớn là 4. Vì không có thùng 10 độ, chúng tôi bỏ phiếu cho các thùng 0 độ và 20 độ, mỗi thùng thêm 2 đơn vị. sau khi bình chọn tất cả các pixel trong ô có kích thước 8×8 thành 9 ô, chúng ta có thể nhận được kết quả sau:

        4. chuẩn hóa các khối

        Để cải thiện hiệu suất nhận dạng, biểu đồ cục bộ sẽ được chuẩn hóa cho độ tương phản bằng cách tính ngưỡng cường độ trong một khối và sử dụng giá trị đó để chuẩn hóa tất cả các ô trong khối. kết quả sau bước chuẩn hóa sẽ là một vectơ đặc trưng bất biến hơn đối với những thay đổi trong điều kiện ánh sáng.

        Trước tiên, hãy xem xét ảnh hưởng của quá trình chuẩn hóa đối với vectơ gradient trong ví dụ sau:

        Trong hình trên, trường hợp đầu tiên là một ô từ hình ảnh gốc. trong trường hợp thứ hai, tất cả các giá trị pixel đã được tăng lên 50. trong trường hợp thứ ba, tất cả các giá trị pixel được nhân với 1,5. dễ dàng nhận thấy, trường hợp thứ ba cho thấy độ tương phản cao hơn. tác dụng của phép nhân là làm cho các điểm ảnh sáng sáng hơn nhiều, trong khi các điểm ảnh tối chỉ trở nên sáng hơn một chút, do đó tăng độ tương phản giữa các phần sáng và tối của hình ảnh.

        Xem xét các giá trị pixel thực tế và biến thể vectơ gradient của ba trường hợp trên trong hình ảnh bên dưới:

        • các số trong ô là giá trị pixel của các pixel bên cạnh pixel được đánh dấu màu đỏ.
        • delta f là đạo hàm riêng theo cả hai hướng của pixel ([ix, iy])
        • | đồng bằng f | là giá trị độ lớn pixel, được tính bằng công thức (*)
        • Trong trường hợp một và hai, các giá trị cường độ vectơ gradient của chúng tương đương nhau, nhưng trong trường hợp ba, cường độ vectơ gradient đã tăng lên 1,5 lần. nếu chúng ta chia ba vectơ cho độ lớn tương ứng của chúng, chúng ta sẽ thu được kết quả tương đương cho cả ba trường hợp. vì vậy, trong ví dụ trên, chúng ta thấy rằng bằng cách chia các vectơ gradient cho độ lớn của chúng, chúng ta có thể làm cho chúng bất biến để thay đổi độ tương phản.

          Có nhiều phương pháp có thể được sử dụng để chuẩn hóa các khối. gọi v là vectơ để chuẩn hóa chứa tất cả các biểu đồ của mỗi khối. ‖V (k) ‖ là giá trị chuẩn hóa của v theo k = 1, 3 và e là hằng số nhỏ. thì các giá trị chuẩn hóa có thể được tính bằng một trong các công thức sau:

          Tìm hiểu về phương pháp mô tả đặc trưng HOG (Histogram of Oriented Gradients)

          kết hợp các vectơ đặc trưng khối sẽ tạo ra vectơ đặc trưng r-hog cho hình ảnh. số lượng kích thước của vectơ đặc điểm hình ảnh được tính bằng công thức:

          5. tính toán hog vector đặc trưng

          Tìm hiểu về phương pháp mô tả đặc trưng HOG (Histogram of Oriented Gradients)

          • Đối với mỗi hình ảnh 64×128, được chia thành các khối 16×16 chồng lên nhau, sẽ có 7 khối ngang và 15 khối dọc, do đó sẽ có 7×15 = 105 khối.
          • mỗi khối gồm 4 ô. bằng cách áp dụng biểu đồ 9 ô cho mỗi ô, mỗi khối sẽ được biểu diễn bằng một vectơ có kích thước 36×1.
            • sau đó, bằng cách ghép tất cả các vectơ trong một khối, chúng ta sẽ thu được một vectơ đặc trưng có kích thước hình ảnh là 105x36x1 = 3780×1.
            • biểu đồ về độ dốc có định hướng

              hướng dẫn về máy dò lợn

LEAVE A REPLY

Please enter your comment!
Please enter your name here