Review Image pyramid là gì Chi tiết

Thủ Thuật về Image pyramid là gì 2022

Bạn đang tìm kiếm từ khóa Image pyramid là gì được Update vào lúc : 2022-04-05 15:24:24 . Với phương châm chia sẻ Bí kíp về trong nội dung bài viết một cách Chi Tiết 2022. Nếu sau khi đọc Post vẫn ko hiểu thì hoàn toàn có thể lại Comment ở cuối bài để Tác giả lý giải và hướng dẫn lại nha.

Hôm nay mình có xem 1 đoạn video ngắn rất thú vị về Deep Learning CycleGANĐây là video trình làng về CycleGAN. CycleGAN là thuật toán sử dụng Deep Learning để quy đổi mặt phẳng 2 hình ảnh mà vẫn không thay đổi backgroung của khung hinh, như trong video chuyển từ ảnh ngựa thường sang ngựa vằn, v.v… CycleGAN vận dụng cho toàn bộ hình ảnh và videoMình xem video mục tiêu là để tìm hiểu về Deep Learning nhưng sau khi xem xong thì lại tò mò về kiểu cách chuyển ảnh ngựa thường sang ngựa vằn hơn :v, vì vậy đã đi google, có thật nhiều kết quả. Đầu tiên thì mình thử sử dụng PIL, kết quả tương đối tốt tuy vẫn còn đấy lỗi và code thì quá là dài, tiếp theo đó có tham khải imagemagick nhưng do thích viết python hơn với cả đọc document cũng bảo là thời hạn chạy lâu nên bỏ qua. Cuối cùng thì mình tìm ra opencv (trước chỉ nghe tên mà không biết để làm gì) thì thấy quả là vi diệu, code ngắn, độ đúng chuẩn cao hơn, thời hạn chạy cũng ngắn. Trong nội dung bài viết này tôi chỉ trình làng về bleding imageTuy nhiên nếu bạn xem xong video mà hứng thú về deep learning thì hoàn toàn có thể tìm hiểu thêm trên github, tác giả đã public toàn bộ sourcode được viết bằng Torch ://junyanz.github.io/CycleGAN/.

Nội dung chính

Giới thiệu về Opencv1. Opencv là gì2. Ứng dụng3. Cài đặtGaussian pyramidLaplacian pyramidGiới thiệu về Opencv1. Opencv là gì2. Ứng dụng3. Cài đặtGaussian pyramidLaplacian pyramidVideo liên quan

Bạn đang xem: Opencv là gì

Giới thiệu về Opencv

1. Opencv là gì

OpenCV (Open Computer Vision) là một thư viện mã nguồn mở số 1 cho xử lý về thị giác máy tính, machine learning, xử lý ảnh.OpenCV đươc viết bằng C/C++, vì vậy có vận tốc tính toán rất nhanh, hoàn toàn có thể sử dụng với những ứng dụng liên quan đến thời hạn thực. Opencv có những interface cho C/C++, Python Java vì vậy tương hỗ được cho Window, Linux, MacOs lẫn Android, iOSOpenCV có hiệp hội hơn 47 nghìn người tiêu dùng và số lượng tải về vượt quá 6 triệu lần

2. Ứng dụng

Opencv có thật nhiều ứng dụng:

Nhận dạng ảnhXử lý hình ảnhPhục hồi hình ảnh/videoThực tế ảoCác ứng dụng khác

3. Cài đặt

Mình setup opencv cho python 2.7 trên ubuntu

sudo apt-get install python-matplotlibsudo apt-get install python-opencv

Pyramid

Pyramid, hoặc pyramid representation, là một dạng màn biểu diễn tín hiệu phong phú được sử dụng trong computer vision, xử lý hình ảnh hoặc những xử lý tín hiệu. Trong số đó, một tín hiệu hoặc một hình ảnh được lặp lại với những phương pháp smoothing và subsampling. Tên gọi pyramid biểu thị cho việc màn biểu diễn trong không khí và những phương pháp phân tích.Một image pyramid thực ra là một tập hợp những hình ảnh mà toàn bộ chúng đều phát sinh từ một hình ảnh ban đầu duy nhất, hình ảnh này được liên tục được lấy mẫu xuống cho tới khi đạt đến một điểm dừng mong ước.Có hai loại image pỷamid ảnh phổ cập:Gaussian pyramid: Sử dụng để downsample hình ảnh tức là để giảm độ sắc nét của hình ảnhLaplacian pyramid: Được sử dụng để tái tạo lại một hình ảnh được lấy mẫu từ một hình ảnh thấp hơn trong pyramid (có độ sắc nét thấp hơn)

Gaussian pyramid

Gaussian pyramid là một tập những layer trong số đó layer ở vị trí càng cao thì sẽ càng có kích thước nhỏ

Mỗi layer được đánh số từ dưới lên trên, do đó, layer(i + 1) (được biểu thị là G(i + 1) nhỏ hơn layer i (G(i))

Gắn lại G(i) thành một Gaussian kernel:

Loại bỏ toàn bộ những hàng và cột số chẵn

Bạn hoàn toàn có thể thuận tiện và đơn thuần và giản dị nhận thấy rằng hình ảnh kết quả sẽ chỉ đúng chuẩn bằng một phần tư ảnh trước đó. Lặp đi lặp lại quy trình nhiều lần với hình ảnh nguồn vào G(0) (hình ảnh ban đầu) ta sẽ có được một tập layer image pyramid.

Xem thêm: Vì Sao Học Sinh Không Thích Học Lịch Sử ? Vì Sao Học Sinh Hiện Nay Ghét Học Sử

Quá trình trên đã làm giảm độ đúng chuẩn của ảnh, vậy để tăng kích thước thì sao? Đầu tiên, ta tăng ma trận hình ảnh lên gấp hai bản gốc trong mọi chiều, với những hàng và cột mới đầy những số không (0). Sau đó, thực thi tiến trình lặp với cùng một kernel ở trên.

Laplacian pyramid

Laplacian pyramid được tạo ra Gaussian pyramid. Nếu bạn mở một ảnh Laplacian pyramid thì nó là một ảnh chỉ có những đường viền bao ngoài những vật thể, đã xóa hết những phần khác. Hầu hết những thành phần trong ma trận là zeros. Laplacian pyramid thường được sử dụng trong nén hình ảnh. Một level (mức độ) Laplacian pyrmaid được hình thành bởi sự khác lạ giữa level đó trong Gaussian pyramid và level trên nó (layer đã được mở rộng) trong Gaussian pyramid.

Demo

Mình sẽ demo bằng một chương trình đơn thuần và giản dị blend 2 ảnh,Đầu vào, mình có 2 ảnh, một ảnh quả táo, 1 ảnh quả cam,

yêu cầu đầu ra là blend 2 ảnh này với nhau để thành một ảnh, một nửa là quả táo, 1 nửa là quả cam

Đầu tiên, ta cần load ảnh, lấy được những thông số (blue, green, red), riêng với bước này thì mình dùng 2 function cv2.imread và cv2.Tiếp đến ta tính toán level của pyramid, ở đây mình đặt cho layer không to nhiều hơn 16x16Với mỗi thông số BGR, ta sẽ tạo ra một gaussian pyramid

def gauss_pyramid(image, levels): output = output.append(image) tmp = image for i in range(0,levels): tmp = ireduce(tmp) output.append(tmp) return outputở đây trong funtion ireduce tôi đã tạo ra một kernel là một ma trận 5×5 làm giảm độ sắc nét của ảnh đi 1/2

Với mỗi thông số ta lại tiếp tục tạo ra một laplacian pyramid

def lapl_pyramid(gauss_pyr): output = k = len(gauss_pyr) for i in range(0,k-1): gu = gauss_pyr egu = iexpand(gauss_pyr) if egu.shape > gu.shape: egu = np.delete(egu,(-1),axis=0) if egu.shape > gu.shape: egu = np.delete(egu,(-1),axis=1) output.append(gu – egu) output.append(gauss_pyr.pop()) return outputVới mỗi thông số của 2 tấm hình, ta blend những laplacian pyramid lại với nhau nhờ vào một trong những ảnh maskdef blend(lapl_pyr_white, lapl_pyr_black, gauss_pyr_mask): blended_pyr = k= len(gauss_pyr_mask) for i in range(0,k): # print gauss_pyr_mask p1= gauss_pyr_mask*lapl_pyr_white p2=(1 – gauss_pyr_mask)*lapl_pyr_black blended_pyr.append(p1 + p2) return blended_pyrĐể biết thêm về OpenCv bạn hoàn toàn có thể tìm hiểu thêm tại đâyHomepage: ://opencv.orgDocs: ://docs.opencv.org/master/Q.&A forum: ://answers.opencv.orgIssue tracking: ://github/opencv/opencv/issues

://.youtube/watch?v=faheDNsr-B4

Bạn đang xem: Open cv là gì, học computer vision không khó! lập trình opencv