ĐẠi hỌc ĐÀ nẴng trƢỜng ĐẠi hỌc bÁch...

26
ĐẠI HỌC ĐÀ NẴNG TRƢỜNG ĐẠI HỌC BÁCH KHOA NGUYỄN THỪA PHÁT TÀI ỨNG DỤNG MÁY VECTƠ HỖ TRỢ TRONG PHÂN TÍCH MẪU VÀ CHẨN ĐOÁN BỆNH TRÊN CÂY XOÀI Chuyên ngành: Khoa học máy tính Mã số: 60.48.01 TÓM TẮT LUẬN VĂN THẠC SĨ KỸ THUẬT Đà Nẵng – Năm 2018

Upload: others

Post on 12-Oct-2019

4 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: ĐẠI HỌC ĐÀ NẴNG TRƢỜNG ĐẠI HỌC BÁCH KHOAtainguyenso.dut.udn.vn/bitstream/DUT/250/1/NguyenThuaPhatTai.TT.pdf.pdf-Tìm hiểu và thu thập hình ảnh các loại

ĐẠI HỌC ĐÀ NẴNG

TRƢỜNG ĐẠI HỌC BÁCH KHOA

NGUYỄN THỪA PHÁT TÀI

ỨNG DỤNG MÁY VECTƠ HỖ TRỢ TRONG PHÂN TÍCH

MẪU VÀ CHẨN ĐOÁN BỆNH TRÊN CÂY XOÀI

Chuyên ngành: Khoa học máy tính

Mã số: 60.48.01

TÓM TẮT LUẬN VĂN THẠC SĨ KỸ THUẬT

Đà Nẵng – Năm 2018

Page 2: ĐẠI HỌC ĐÀ NẴNG TRƢỜNG ĐẠI HỌC BÁCH KHOAtainguyenso.dut.udn.vn/bitstream/DUT/250/1/NguyenThuaPhatTai.TT.pdf.pdf-Tìm hiểu và thu thập hình ảnh các loại

Công trình đƣợc hoàn thành tại

TRƢỜNG ĐẠI HỌC BÁCH KHOA

Ngƣời hƣớng dẫn khoa học: TS. HUỲNH HỮU HƢNG

Phản biện 1:

PGS. TS. HUỲNH CÔNG PHÁP

Phản biện 2:

TS. NGUYỄN THÁI SƠN

Luận văn sẽ đƣợc bảo vệ trƣớc Hội đồng chấm Luận văn tốt nghiệp

thạc sĩ Khoa học máy tính tại Trƣờng Đại học Bách khoa vào ngày

03 tháng 02 năm 2018.

Có thể tìm hiểu luận văn tại:

Trung tâm Học liệu, Đại học Đà Nẵng tại Trƣờng Đại học Bách

khoa.

Thƣ viện Khoa Công nghệ thông tin, Trƣờng Đại học Bách khoa –

ĐHĐN.

Page 3: ĐẠI HỌC ĐÀ NẴNG TRƢỜNG ĐẠI HỌC BÁCH KHOAtainguyenso.dut.udn.vn/bitstream/DUT/250/1/NguyenThuaPhatTai.TT.pdf.pdf-Tìm hiểu và thu thập hình ảnh các loại

-1-

MỞ ĐẦU

1. Lý do chọn đề tài

Hiện nay nông dân tại các tỉnh đồng bằng sông Cửu Long nói

chung và tỉnh Trà Vinh nói riêng chỉ canh tác và trồng trọt chủ yếu

chỉ dựa vào kinh nghiệm mà chƣa biết ứng dụng khoa học và công

nghệ vào trong sản xuất để nâng cao chất lƣợng sản phẩm, hiệu quả

kinh tế nhằm giảm chi phí sản xuất.

Chính vì vậy việc triển khai nghiên cứu các ứng dụng nhận

dạng và xử lý ảnh để chẩn đoán bệnh trên cây Xoài, một loại cây

trồng có giá trị kinh tế cao, nhằm giải phóng sức lao động, tiết kiệm

thời gian, nâng cao năng suất là một việc làm hết sức có ý nghĩa

trong giai đoạn này.

Từ hiện trạng và những lý do trên tôi xin đề xuất đề tài: “Ứng

dụng máy vectơ hỗ trợ trong phân tích mẫu và chẩn đoán bệnh

trên cây Xoài”

2. Mục tiêu và nhiệm vụ nghiên cứu

2.1 Mục tiêu nghiên cứu

Nghiên cứu ứng dụng máy vectơ hỗ trợ trong việc chẩn đoán bệnh

trên cây Xoài thông qua hình ảnh.

2.2 Nhiệm vụ nghiên cứu

- Nghiên cứu tổng quan về xử lý ảnh số, nhận dạng mẫu, thuật

toán SVM.

- Tìm hiểu và thu thập hình ảnh các loại bệnh trên Xoài ngoài

thực địa.

- Phƣơng pháp huấn luyện, nhận dạng và xử lý ảnh số.

3. Đối tƣợng và phạm vi nghiên cứu

3.1 Đối tượng nghiên cứu

- Hình ảnh, các đặc trƣng của cây Xoài bị bệnh và không bị

bệnh ngoài thực địa.

- Nghiên cứu và áp dụng thuật toán SVM trong phân lớp và

nhận dạng.

Page 4: ĐẠI HỌC ĐÀ NẴNG TRƢỜNG ĐẠI HỌC BÁCH KHOAtainguyenso.dut.udn.vn/bitstream/DUT/250/1/NguyenThuaPhatTai.TT.pdf.pdf-Tìm hiểu và thu thập hình ảnh các loại

-2-

3.2 Phạm vi nghiên cứu

- Dùng thuật toán SVM trong phân tích mẫu và chẩn đoán

bệnh trên cây Xoài.

4. Phƣơng pháp nghiên cứu

4.1 Phương pháp nghiên cứu lý thuyết

- Tham khảo các đề tài, bài báo liên quan đến lĩnh vực nhận

dạng trái cây.

- Các tài liệu về cơ sở lý thuyết: Xử lý ảnh, lọc trích đặc trƣng

ảnh, xác định biên, nghiên cứu các kỹ thuật nhận dạng mẫu.

4.2 Phương pháp nghiên cứu thực nghiệm

- So sánh và phân tích hình ảnh trái, lá cây Xoài có bệnh và

không bệnh ngoài thực địa.

- Triển khai và cài đạt chƣơng trình.

5. Ý nghĩa khoa học và thực tiễn của luận văn

5.1 Ý nghĩa khoa học

Nghiên cứu nhằm ứng dụng khoa học và công nghệ vào sản

xuất nông nghiệp, đƣa ra giải pháp nhằm góp phần ứng dụng kỹ

thuật nhận dạng và xử lý ảnh vào sản xuất nông nghiệp tại tỉnh Trà

Vinh.

5.2 Ý nghĩa thực tiễn

Góp thêm một giải pháp mới để nông dân chẩn đoán bệnh trên

cây Xoài tại tỉnh Trà Vinh, góp phần giải phóng sức lao động, tiết

kiệm chi phí và nâng cao năng suất cây trồng, tăng thu nhập cho

nông dân.

Page 5: ĐẠI HỌC ĐÀ NẴNG TRƢỜNG ĐẠI HỌC BÁCH KHOAtainguyenso.dut.udn.vn/bitstream/DUT/250/1/NguyenThuaPhatTai.TT.pdf.pdf-Tìm hiểu và thu thập hình ảnh các loại

-3-

CHƢƠNG 1 -TỔNG QUAN VỀ NHẬN DẠNG VÀ XỬ LÝ ẢNH

1.1 Các bƣớc cơ bản trong xử lý ảnh số:

Con ngƣời thu nhận thông tin qua các giác quan, trong đó thị

giác đóng vai trò quan trọng nhất. Những năm trở lại đây với sự phát

triển của phần cứng máy tính, xử lý ảnh và đồ hoạ đó phát triển một

cách mạnh mẽ và có nhiều ứng dụng trong cuộc sống. Xử lý ảnh và

đồ hoạ đóng một vai trò quan trọng trong tƣơng tác ngƣời máy.

Hình 1. 1 Các bƣớc trong xử lý ảnh

1.1.1 Thu nhận ảnh

1.1.2 Tiền xử lý

1.1.3 Phân đoạn hay phân vùng ảnh

1.1.4 Biểu diễn ảnh

1.1.5 Nhận dạng và nội suy ảnh

1.2 Mốt số vấn đề cơ bản trong xử lý ảnh số

1.2.1 Điểm ảnh

1.2.2 Ảnh đen trắng

1.2.3 Ảnh nhị phân

1.2.4 Ảnh màu

1.3 Cải thiện ảnh sử dụng toán tử điểm:

1.3.1 Tăng giảm độ sáng

Hình 1. 2 Ảnh tăng/giảm độ sáng

Page 6: ĐẠI HỌC ĐÀ NẴNG TRƢỜNG ĐẠI HỌC BÁCH KHOAtainguyenso.dut.udn.vn/bitstream/DUT/250/1/NguyenThuaPhatTai.TT.pdf.pdf-Tìm hiểu và thu thập hình ảnh các loại

-4-

1.3.2 Tăng độ tương phản

Hình 1. 3 Ảnh khi tăng tƣơng độ phản

1.3.3 Biến đổi âm bản

Hình 1. 4 Ảnh âm bản

1.3.4 Biến đổi ảnh đen trắng

Hình 1. 5 Ảnh trắng đen

1.3.5 Lược đồ xám(Histogram)

Hình 1. 6 Cân bằng mức xám của ảnh

1.3.6 Kỹ thuật cải thiện ảnh nhị phân

Hình 1. 7 Minh hoạ của phép giãn ảnh

Page 7: ĐẠI HỌC ĐÀ NẴNG TRƢỜNG ĐẠI HỌC BÁCH KHOAtainguyenso.dut.udn.vn/bitstream/DUT/250/1/NguyenThuaPhatTai.TT.pdf.pdf-Tìm hiểu và thu thập hình ảnh các loại

-5-

Hình 1. 8 Ứng dụng của phép co ảnh

1.4 Trích rút đặt trƣng ảnh

1.4.1 Đặc trưng màu sắc

Hình 1. 9 Không gian màu HSV

1.4.2 Đặc trưng kết cấu

Một số trích chọn đặc điểm kết cấu suy ra từ GLCM

1.5 Phƣơng pháp nhận dạng.

1.5.1 Khái niệm nhận dạng.

Quá trình nhận dạng dựa vào những mẫu học biết trƣớc gọi là

nhận dạng có thầy hay học có thầy, trong những trƣờng hợp ngƣợc

lại gọi là học không có thầy.

Page 8: ĐẠI HỌC ĐÀ NẴNG TRƢỜNG ĐẠI HỌC BÁCH KHOAtainguyenso.dut.udn.vn/bitstream/DUT/250/1/NguyenThuaPhatTai.TT.pdf.pdf-Tìm hiểu và thu thập hình ảnh các loại

-6-

1.5.2 Support vector machine (SVM)

SVM là một phƣơng pháp phân lớp xuất phát từ lý thuyết học

thống kê. SVM sẽ cố gắng tìm cách phân lớp dữ liệu sao cho có lỗi

xảy ra trên tập kiểm tra là nhỏ nhất.

Ý tƣởng của nó là ánh xạ (tuyến tính hoặc phi tuyến) dữ liệu

vào không gian các vector đặc trƣng mà ở đó một siêu phẳng tối ƣu

đƣợc tìm ra để tách dữ liệu thuộc hai lớp khác nhau.

Hình 1. 10 H2 là siêu phẳng tốt nhất

1.5.3 K-láng giềng gần nhất (k-Nearest Neighbors)

1.5.4 Mô hình Markov ẩn (Hidden Markov Models)

1.5.5 Mạng nơ-ron nhân tạo

1.6 Đánh giá ƣu điểm của thuật toán SVM

• SVM rất hiệu quả để giải quyết bài toán dữ liệu có số chiều lớn.

• SVM giải quyết vấn đề overfitting rất tốt (dữ liệu có nhiễu và

tách dời nhóm hoặc dữ liệu huấn luyện quá ít)

• Là phƣơng pháp phân lớp nhanh

• Có hiệu suất tổng hợp tốt và hiệu suất tính toán cao

KẾT CHƢƠNG

Chƣơng 1 tác giả đã trình bày tổng quan về các vấn đề liên

quan tới nhận dạng và xử lý ảnh số. Tiếp theo chƣơng 2, tác giả sẽ

trình bày chi tiết về nhận dạng và phân tích mẫu, ứng dụng thuật toán

SVM để chẩn đoán bệnh trên cây Xoài.

Page 9: ĐẠI HỌC ĐÀ NẴNG TRƢỜNG ĐẠI HỌC BÁCH KHOAtainguyenso.dut.udn.vn/bitstream/DUT/250/1/NguyenThuaPhatTai.TT.pdf.pdf-Tìm hiểu và thu thập hình ảnh các loại

-7-

CHƢƠNG 2 – PHƢƠNG PHÁP NHẬN DẠNG

VÀ PHÂN LOẠI

2.1 Các công trình nghiên cứu liên quan

2.2 Trích xuất đặc trƣng trong đánh và phân loại trái cây:

2.2.1 ử dụng đặc trưng màu sắc

2.2.2 Trích chọn đặc trưng màu cho bài toán so màu lá lúa

Hình 2. 1 Minh họa trích đặc trƣng màu với moment thứ nhất

Hình 2.2 Minh họa trích đặc trƣng màu với 3 moment màu

2.2.3 ử dụng đặc trưng kết cấu

2.2.4 ử dụng đặc trưng Gist và Gist descriptor.

2.3 Các phƣơng pháp phân loại trái cây:

2.3.1 Phân biệt phần cuống và khiếm khuyết thực tế trên trái cây.

Page 10: ĐẠI HỌC ĐÀ NẴNG TRƢỜNG ĐẠI HỌC BÁCH KHOAtainguyenso.dut.udn.vn/bitstream/DUT/250/1/NguyenThuaPhatTai.TT.pdf.pdf-Tìm hiểu và thu thập hình ảnh các loại

-8-

Hình 2.3 Mô hình phân biệt phần cuống với các khiếm khuyết trên

trái cây

2.3.2 Kết hợp các thống kê màu sắc và đặc trưng kết cấu để

nhận biết bệnh táo

Page 11: ĐẠI HỌC ĐÀ NẴNG TRƢỜNG ĐẠI HỌC BÁCH KHOAtainguyenso.dut.udn.vn/bitstream/DUT/250/1/NguyenThuaPhatTai.TT.pdf.pdf-Tìm hiểu và thu thập hình ảnh các loại

-9-

2.3.3 Nghiên cứu xây dựng hệ thống h trợ nông dân so màu

lá lúa

Hình 2.4 Mô hình hệ thống

2.4 KẾT CHƢƠNG

Trong chƣơng 2, tác giả tìm hiểu một số bài toán về nhận dạng và

phân loại, kết quả thực nghiệm trên các loại trái cây nhƣ táo, cam

quýt, bài toán nhận dạng trên lá và so màu lá l a. Thông qua các

công trình nghiên cứu hiện tại tác giả đã hiểu biết đƣợc một số thuật

toán và các đặc trƣng cần trích xuất cho một bài toán nhận dạng và

phân loại.

Page 12: ĐẠI HỌC ĐÀ NẴNG TRƢỜNG ĐẠI HỌC BÁCH KHOAtainguyenso.dut.udn.vn/bitstream/DUT/250/1/NguyenThuaPhatTai.TT.pdf.pdf-Tìm hiểu và thu thập hình ảnh các loại

-10-

CHƢƠNG 3 – ỨNG DỤNG MÁY VECTƠ HỖ TRỢ TRONG

CHẨN ĐOÁN BỆNH TRÊN XOÀI

3.1 Phƣơng pháp phân lớp dữ liệu máy vector hỗ trợ SVM

3.1.1 Giới thiệu

SVM thực hiện chuyển tập mẫu từ không gian biểu diễn Rn

của ch ng sang một không gian Rd có số chiều lớn hơn. Trong không

gian Rd tìm một siêu phẳng tối ƣu để phân hoạch tập mẫu này dựa

trên phân lớp của ch ng.

3.1.2 Ý tưởng của phương pháp

Cho trƣớc một tập huấn luyện, đƣợc biểu diễn trong không

gian vector, trong đó mỗi tài liệu là một điểm, phƣơng pháp này tìm

ra một siêu phẳng f quyết định tốt nhất có thể chia các điểm trên

không gian này thành hai lớp riêng biệt tƣơng ứng là lớp + và lớp -.

Chất lƣợng của siêu phẳng này đƣợc quyết định bởi khoảng cách (gọi

là biên) của điểm dữ liệu gần nhất của mỗi lớp đến mặt phẳng này.

Khi đó khoảng cách biên càng lớn thì mặt phẳng quyết định càng tốt,

đồng thời việc phân loại càng chính xác.

Page 13: ĐẠI HỌC ĐÀ NẴNG TRƢỜNG ĐẠI HỌC BÁCH KHOAtainguyenso.dut.udn.vn/bitstream/DUT/250/1/NguyenThuaPhatTai.TT.pdf.pdf-Tìm hiểu và thu thập hình ảnh các loại

-11-

3.1.3 Các bước chính của phương pháp

Phƣơng pháp SVM yêu cầu dữ liệu đƣợc diễn tả nhƣ các

vector của các số thực. Nhƣ vậy nếu đầu vào chƣa phải là số thì ta

cần phải tìm cách chuyển ch ng về dạng số của SVM.

• Tiền xử lý dữ liệu: Thực hiện biến đổi dữ liệu phù hợp cho quá

trình tính toán, tránh các số quá lớn mô tả các thuộc tính.

Thƣờng nên co giãn (scaling) dữ liệu chuyển về đoạn [-1,1]

hoặc [0,1].

• Chọn hàm hạt nhân: Lựa chọn hàm hạt nhân phù hợp tƣơng

ứng cho từng bài toán cụ thể để đạt độ chính xác cao trong quá

trình phân lớp.

• Thực hiện việc kiểm tra chéo để xác định các tham số cho ứng

dụng: Điều này cũng quyết định đến tính chính xác của quá

trình phân lớp.

• Sử dụng các tham số cho việc huấn luyện với tập mẫu: Trong

quá trình huấn luyện sẽ sử dụng thuật toán tối ƣu hóa khoảng

cách giữa các siêu phẳng trong quá trình phân lớp, xác định

hàm phân lớp trong không gian đặc trƣng nhờ việc ánh xạ dữ

liệu vào không gian đặc trƣng bằng cách mô tả hạt nhân và

cuối cùng là kiểm thử tập dữ liệu.

3.1.4 Cơ sở lý thuyết

Hình 3. 1 Minh họa cho bài toán phân hai lớp

3.2 Chẩn đoán bệnh trên xoài với máy vetor hỗ trợ SVM:

3.2.1 Mô tả bài toán

Page 14: ĐẠI HỌC ĐÀ NẴNG TRƢỜNG ĐẠI HỌC BÁCH KHOAtainguyenso.dut.udn.vn/bitstream/DUT/250/1/NguyenThuaPhatTai.TT.pdf.pdf-Tìm hiểu và thu thập hình ảnh các loại

-12-

Để nhận dạng và chẩn đoán bệnh trên xoài, tác giả đề xuất thực

hiện các bƣớc xử lý nhƣ sau:

Bước 1: thu nhận tạp ảnh huấn luyện và ảnh kiểm tra

Bước 2: thực hiện các bƣớc tiền xử lý, nâng cao chất lƣợng

ảnh, chuyển ảnh màu RGB sang ảnh màu HSV, tách các kênh H,

S, V riêng biệt.

Bước 3: Trích xuất đặc trƣng, tính giá trị trung của mỗi kênh

màu HSV và độ lệch chuẩn của mỗi kênh màu trong không gian

màu HSV làm tham số cho màu sắc, Ảnh màu kênh màu V đƣợc

dùng trích lọc đặc trƣng kết cấu, ảnh V làm tham số đầu vào kết

hợp sóng con Gabor và lƣợc đồ mức xám đƣợc tính toán bằng ma

trận GLCM để trích lọc đặc trƣng kết cấu đƣa vào huấn luyện.

Bước 4: thuật toán SVM đƣợc sử dụng để thực hiện phân lớp,

so khớp các tham số đặc trƣng của mẫu xoài cần kiểm tra với tập

CSDL các đặc trƣng của lá/trái xoài đã đƣợc phân lớp, kết quả

trả về là/trái xoài bị bệnh gì hoặc không bệnh.

3.2.2 Mô hình giải quyết bài toán

Hình 3. 2 Mô hình chẩn đoán bệnh trên cây xoài

3.3 Tiền xử lý

3.3.1 Tăng/giảm độ tương phản của ảnh

Page 15: ĐẠI HỌC ĐÀ NẴNG TRƢỜNG ĐẠI HỌC BÁCH KHOAtainguyenso.dut.udn.vn/bitstream/DUT/250/1/NguyenThuaPhatTai.TT.pdf.pdf-Tìm hiểu và thu thập hình ảnh các loại

-13-

Nếu ảnh có độ tƣơng phản kém so với nền, ta có thể thay đổi

theo các hàm.

Trong Matlab, để thực hiện nâng cao độ tƣơng phản của ảnh

đầu vào in_img ta sử dụng câu lệnh sau:

Out_img = imadjust(in_img);

Hình 3. 3 Độ tƣơng phản của ảnh

3.3.2 Thực hiện phép co/giãn ảnh

Hình 3. 4 Co giãn ảnh

3.3.3 Chuyển và tách ảnh màu RGB sang các kênh H-S-V

Chuyển ảnh màu RGB sang ảnh màu HSV và tách cách

kênh màu

Hình 3. 5 Ảnh màu RGB chuyển đổi sang ảnh màu HSV và ảnh các

kênh màu

Page 16: ĐẠI HỌC ĐÀ NẴNG TRƢỜNG ĐẠI HỌC BÁCH KHOAtainguyenso.dut.udn.vn/bitstream/DUT/250/1/NguyenThuaPhatTai.TT.pdf.pdf-Tìm hiểu và thu thập hình ảnh các loại

-14-

Giá trị của S và V nằm trong khoảng 0 (màu đen) và 1 (màu

trắng), giá trị của H nằm trong khoảng 0 đến 360.

3.4 Trích chọn đặc trƣng

3.4.1 Đặc trưng màu sắc

Để tách đƣợc đặc trƣng về màu sắc, tác giả đề xuất ảnh màu

RGB đƣợc chuyển đổi sang không gian màu và tách các kênh H, S,

V riêng biệt. Tính giá trị trung của ba kênh màu H, S, V và độ lệch

chuẩn của các kênh màu trong không gian màu HSV làm tham số

đặc trƣng cho màu sắc.

Phƣơng pháp tính độ lệch chuẩn (Standard Deviation) từ một dãy

n giá trị cho trƣớc x1, x2,...xn:

Bước 1: Tìm mean của dãy số đã cho (x1+x2+...+xn) / n

Bước 2: Với mỗi x trong dãy số đã cho, tính độ lệch (deviation)

của nó so với mean bằng phép tính (x - mean)

Bước 3: Tính bình phƣơng của các giá trị thu đƣợc ở bƣớc 2.

Bước 4: Tìm mean của các bình phƣơng độ lệch tìm đƣợc ở bƣớc

3. Giá trị này đƣợc biết đến nhƣ là phƣơng sai (Variance) σ2.

Bước 5: Tính căn bậc hai (square root) của phƣơng sai (Variance)

ta đƣợc kết quả cần tìm.

3.4.2 Đặc trưng kết cấu

Ảnh màu RGB đầu vào sau khi đƣợc chuyển đổi sang không

gian màu HSV và đƣợc tách ra từng kênh H, S, V riêng biệt thì kênh

đơn màu V đƣợc dùng làm đầu vào cho sóng con Gabor để trích lọc

đặc trƣng kết cấu, sóng con Gabor có rất nhiều tham số khác nhau, vì

vậy tại bƣớc này phải thực hiện để điều chỉnh và chọn lọc các giá trị

tham số đầu vào của sóng con Gabor sao cho kết quả xử lý ảnh đơn

Page 17: ĐẠI HỌC ĐÀ NẴNG TRƢỜNG ĐẠI HỌC BÁCH KHOAtainguyenso.dut.udn.vn/bitstream/DUT/250/1/NguyenThuaPhatTai.TT.pdf.pdf-Tìm hiểu và thu thập hình ảnh các loại

-15-

màu V nổi rõ kết cấu nhất. Sau đƣa vào sóng con Gabor một ảnh đơn

kênh mới có kết cấu rõ nhất đƣợc tạo ra (ảnh V’), ảnh V’ này đƣợc

đƣa vào ma trận đồng hiện mức xám để đo lƣờng các giá trị kết cấu

của ảnh V’. Kết quả từ ma trận đồng hiện mức xám đƣợc dùng làm

dữ liệu đầu xây dựng tập CSDL huấn luyện hoặc làm tham số đầu

vào để phân lớp đối tƣợng.

3.4.2.1 Sóng con Gabor – Gabor Wavelet

Trong xử lý ảnh, sóng con Gabor là một bộ lọc tuyến tính

thƣờng đƣợc sử dụng để phát hiện biên, phần vùng ảnh, phân tích

đặc trƣng ảnh, phân lớp ảnh,...Tần số và hƣớng đƣợc thể hiện trong

các sóng con Gabor tƣơng tự nhƣ hệ thống thị giác của con ngƣời.

Tập hợp các sóng con Gabor với tần số và hƣớng khác nhau có thể

trợ gi p cho việc trích lọc đầy đủ các đặc trƣng trong ảnh. Sóng con

Gabor hai chiều (2-D Gabor) đƣợc áp dụng trong ảnh với tỉ lệ và tần

số khác nhau. Hàm Gabor 2-D đƣợc biến đổi từ đƣờng hình sin phức

tạp của hàm Gaussian 2-D. Hàm sóng con Gabor trong miền không

gian có dạng nhƣ sau:

Bƣớc sóng (λ - lamda) đại diện cho sóng của các tác nhân cosine của

hàm Gaussian, hƣớng (θ - theta) đại diện cho hƣớng của các đƣờng

gạch sọc song song của hàm Gabor tại một góc nào đó (độ), độ lệch

pha – phase offset (φ - phi) theo góc, và tỉ lệ hƣớng (γ - gamma) là tỷ

Page 18: ĐẠI HỌC ĐÀ NẴNG TRƢỜNG ĐẠI HỌC BÁCH KHOAtainguyenso.dut.udn.vn/bitstream/DUT/250/1/NguyenThuaPhatTai.TT.pdf.pdf-Tìm hiểu và thu thập hình ảnh các loại

-16-

lệ co giãn trong không gian và nó xác định tính đơn giản của hàm

Gabor, và độ lệch chuẩn σ xác định kích thƣớc của hàm Gaussian

tuyến tính. Băng thông (b) bán đáp ứng (half-response) trong không

gian tần số và tỉ lệ giữa σ/ có quan hệ nhƣ sau:

Bảng 3. 1 Tham số hàm Gabor Wavelet và đặc trƣng kết cấu ảnh V

Ảnh màu RGB Gabor Wavelet Ảnh kết cấu

36,10,1

,5.0],2

0[,8

Nb

72,10,1

,5.0],2

0[,8

Nb

108,10,1

,5.0],2

0[,8

Nb

144,10,1

,5.0],2

0[,8

Nb

180,10,1

,5.0],2

0[,8

Nb

Page 19: ĐẠI HỌC ĐÀ NẴNG TRƢỜNG ĐẠI HỌC BÁCH KHOAtainguyenso.dut.udn.vn/bitstream/DUT/250/1/NguyenThuaPhatTai.TT.pdf.pdf-Tìm hiểu và thu thập hình ảnh các loại

-17-

3.4.2.2 Ma trận đồng hiện mức xám Co-occurrence

GLCM là một trong những phƣơng pháp trích lọc đặc trƣng

quan trọng trong lĩnh vực phân tích kết cấu ảnh đƣợc đề xuất từ rất

sớm bởi Haralick vào năm 1973. GLCM của ảnh f(x,y) có kích thƣớc

MxM và có G mức độ xám là một ma trận hai chiều C(i, j). Mỗi phần

tử của ma trận thể hiện xác suất xảy ra cùng giá trị cƣờng độ sáng i

và j tại một khoảng cách d và một góc θ xác định. Do đó, có thể có

nhiều ma trận GLCM khác nhau phụ thuộc vào cặp giá trị d và θ

Một số đặt trƣng quan trọng có thể kể đến nhƣ năng lƣợng

(energy), độ tƣơng phản (contrast), entropy, độ tƣơng đồng

(Correlation), tính đồng nhất (homogeneity).

Bảng 3. 2 Các giá trị tham số của GLCM

Ảnh màu RGB Gabor Wavelet Các giá trị tham số của

GLCM

36,10,1

,5.0],2

0[,8

Nb

Entropy: 0.265715

Contrast: 0.143287

Correlation: 0.716450

Energy: 0.625673

Homogeneity: 0.632575

72,10,1

,5.0],2

0[,8

Nb

Entropy: 0.596124

Contrast: 0.343675

Correlation: 0.574691

Energy: 0.626423

Homogeneity: 0.451565

108,10,1

,5.0],2

0[,8

Nb

Entropy: 0.365885

Contrast: 0.241668

Correlation: 0.724789

Energy: 0.621576

Homogeneity: 0.594648

144,10,1

,5.0],2

0[,8

Nb

Entropy: 0.357885

Contrast: 0.341568

Correlation: 0.615239

Energy: 0.632326

Page 20: ĐẠI HỌC ĐÀ NẴNG TRƢỜNG ĐẠI HỌC BÁCH KHOAtainguyenso.dut.udn.vn/bitstream/DUT/250/1/NguyenThuaPhatTai.TT.pdf.pdf-Tìm hiểu và thu thập hình ảnh các loại

-18-

Homogeneity: 0.548535

180,10,1

,5.0],2

0[,8

Nb

Entropy: 0.432624

Contrast: 0.241714

Correlation: 0.527460

Energy: 0.621873

Homogeneity: 0.628845

3.5 Thực nghiệm

3.5.1 Một số hình ảnh tập mẫu huấn luyện trái xoài

3.5.1.1 Mẫu xoài không bệnh

Hình 3. 6 Xoài không bệnh

3.5.1.2 Mẫu bệnh thối trái trên xoài do nấm

Hình 3. 7 bệnh thối trái

3.5.1.3 Mẫu bệnh nứt trái trên xoài

Hình 3. 8 bệnh nứt trái

3.5.2 Một số hình ảnh tập mẫu huấn luyện lá xoài

3.5.2.1 Mẫu lá không bệnh

Hình 3. 9 lá xoài không bệnh

3.5.2.2 Mẫu lá bệnh ghẻ lồi

Page 21: ĐẠI HỌC ĐÀ NẴNG TRƢỜNG ĐẠI HỌC BÁCH KHOAtainguyenso.dut.udn.vn/bitstream/DUT/250/1/NguyenThuaPhatTai.TT.pdf.pdf-Tìm hiểu và thu thập hình ảnh các loại

-19-

Hình 3. 10 lá bệnh ghẻ lồi

3.5.2.3 Mẫu lá bệnh thán thư

Hình 3. 11 lá bệnh thán thƣ

Yêu cầu của chƣơng trình là thu nhận hình ảnh lá/quả xoài ở

đầu vào, đầu ra của chƣơng trình nhằm chẩn đoán lá/quả xoài có

bệnh hay không, nếu có thì xác định là bệnh gì. Hiện nay để xử lý

ảnh ta có thể sử dụng các ngôn ngữ C#, Matlab,…Tôi lựa chọn ngôn

ngữ lập trình Matlab vì trong thƣ viện của Matlab có nhiều hàm đã

đƣợc hỗ trợ sẵn.

3.5.3 Xử lý

Mở ảnh và thực hiện xử lý, trong giai đoạn này ta thực hiện cải

thiện nhằm nâng cao chất lƣợng ảnh đầu vào, khử nền, lọc nhiễu,

thay đổi độ phản,....

Chuyển kênh màu ảnh RGB HSV sử dụng bộ lọc Gabor để

làm rõ đặc trƣng kết cấu ảnh và thu nhận ảnh sóng con kết cấu với

các đặc trƣng rỏ nhất, sóng con Gabor dùng làm ảnh đầu vào cho

GLCM để trích xuất đƣợc các tham số năng lƣợng (energy), độ

tƣơng phản (contrast), entropy, độ tƣơng đồng (Correlation), tính

đồng nhất (homogeneity), ...

Sau quá trình xử lý, kết quả ta thu đƣợc hình ảnh đã chuyển

sang không gian màu HSV, các ảnh kênh H, kênh S, kênh V sẽ đƣợc

lƣu trữ làm dữ liệu đầu vào cho quá trình trích xuất các đặc trƣng của

ảnh, tính toán các tham số trung bình và độ lệch chuẩn giữa các kênh

màu.

Page 22: ĐẠI HỌC ĐÀ NẴNG TRƢỜNG ĐẠI HỌC BÁCH KHOAtainguyenso.dut.udn.vn/bitstream/DUT/250/1/NguyenThuaPhatTai.TT.pdf.pdf-Tìm hiểu và thu thập hình ảnh các loại

-20-

Sau quá trình thực hiện ở các bƣớc tiền xử lý ta đƣợc ảnh kết

cấu và sóng con Gabor với các đặc trƣng rõ nét nhất. Ảnh này sẽ tiếp

tục làm dữ liệu đầu vào cho GLCM để trích xuất các tham số đặc

trƣng Entropy, Contrast, Correlation, Energy, Homegeneity ứng với

các giá trị λ , φ, γ, b, N, và hƣớng (góc) θ khác nhau.

Hình 3. 12 Giao diện trích xuất đặc trƣng

Để lấy các tham số tạo ma trận đồng hiện trong Matlab ta dùng

hàm:

I=imread(A) % đọc ảnh A

GLCM = graycomatrix(I) % tạo ra ma trận co-occurrence

cấp độ xám (GLCM) từ ảnh I.

stats = graycoprops(GLCM, properties) % properties: thuộc

tính cần trích xuất Entropy, Contrast,…

Bảng 3. 3 Các tham số đặc trƣng đƣợc trích xuất từ tập ảnh huấn luyện

Page 23: ĐẠI HỌC ĐÀ NẴNG TRƢỜNG ĐẠI HỌC BÁCH KHOAtainguyenso.dut.udn.vn/bitstream/DUT/250/1/NguyenThuaPhatTai.TT.pdf.pdf-Tìm hiểu và thu thập hình ảnh các loại

-21-

3.5.4 Huấn luyện và chẩn đoán bệnh ứng dụng máy vetor h

trợ VM

3.5.4.1 Giao diện chính:

• Chọn ảnh: Chọn ảnh cần chẩn đoán bệnh từ tập dữ liệu kiểm tra

• Tiền xử lý: Thực hiện các xử lý, nâng cao chất lƣợng ảnh, tách

kênh màu, trích xuất các đặc trƣng và đƣợc huấn luyện lƣu vào tập

tin Training_Data.mat

• Phân đoạn ảnh: Phân vùng ảnh đầu vào và tìm các các đặc trƣng

giống nhau trên ảnh đầu vào đƣa vào các cụm tƣơng ứng.

• Dự đoán bệnh: Thực hiện phân lớp và chẩn đoán hiển thị kết quả.

Hình 3. 13 Giao diện huấn luyện và chẩn đoán bệnh

Huấn luyện SVM yêu cầu dữ liệu đƣợc diễn tả nhƣ các vector

của các số thực. Trong quá trình huấn luyện sẽ sử dụng thuật toán tối

ƣu hóa khoảng cách giữa các siêu phẳng trong quá trình phân lớp,

xác định hàm phân lớp trong không gian đặc trƣng nhờ việc ánh xạ

dữ liệu vào không gian đặc trƣng bằng cách mô tả hạt nhân và cuối

cùng là kiểm thử tập dữ liệu.

Máy học SVM trong thực nghiệm này là máy học với hàm

nhân (kernel) RBF, với tham số C bằng 12 và Gama bằng 2-8

.

Thực nghiệm cũng đã đƣợc làm với một số tham số khác của

C và Gama, bộ tham số nói trên đƣợc chọn bằng phƣơng pháp thử và

sai. Do tham số Gama nhỏ nên có thể dùng máy học SVM với hàm

nhân tuyến tính (linear kernel). Kết quả thực nghiệm trên cùng bộ dữ

Page 24: ĐẠI HỌC ĐÀ NẴNG TRƢỜNG ĐẠI HỌC BÁCH KHOAtainguyenso.dut.udn.vn/bitstream/DUT/250/1/NguyenThuaPhatTai.TT.pdf.pdf-Tìm hiểu và thu thập hình ảnh các loại

-22-

liệu với hàm nhân tuyến tính (C=10 và eps=0.01) cho kết quả tốt hơn

trên hàm nhân RBF, nhƣng không có khác biệt nhiều. Vì vậy có thể

dùng hàm nhân RBF hay hàm nhân tuyến tính với các tham số nhƣ

vừa nêu.

3.5.4.2 Kết quả thực nghiệm:

Hình ảnh lá/quả xoài đƣa vào kiểm tra sẽ đƣợc tiền xử lý để

nâng cao chất lƣợng ảnh, loại bỏ các tạp nhiễu, sau khi xử lý tiếp tục

đƣa vào trích xuất các tham số đặc trƣng để đƣa vào chẩn đoán bệnh.

Kết quả hiển là tên bệnh/không bệnh.

Bảng 3. 4 Số lƣợng mẫu dùng trong thực nghiệm

Tên lớp Số mẫu huấn

luyện

Số mẫu

kiểm tra

Tổng số

mẫu

Bệnh thối trái 100 20 100

Bệnh nứt trái 100 20 100

Trái không bệnh 100 20 100

Lá thán thƣ 100 20 100

Lá ghẻ lồi 100 20 100

Lá không bệnh 100 20 100

Tổng 600 120 600

Bảng 3. 5 Kết quả thực nghiệm phân lớp bằng máy học SVM

Tên lớp

Bệnh

thối trái

Bệnh

nứt trái

Không

bệnh

thán thƣ

ghẻ lồi

không bệnh

Tổng

mẫu

kiểm

tra a. Nhãn lớp 1 2 3 4 5 6

Bệnh thối trái 1 17 2 1 0 0 0 20

Bệnh nứt trái 2 2 16 2 0 0 0 20

Không bệnh 3 1 1 18 0 0 0 20

Lá thán thƣ 4 0 0 0 16 1 3 20

Lá ghẻ lồi 5 0 0 0 1 18 1 20

Lá không bệnh 6 0 0 0 3 2 15 20

Trong đó:

• Tên các lớp đƣợc gán nhãn từ 1 đến 6 tƣơng ứng với 6 tên lớp

• Bệnh thối trái đƣợc gán nhãn 1, với tổng mẫu kiểm thử là 20, trong

đó 17/20 mẫu chẩn đoán đ ng “bệnh thối trái”, 1/20 mẫu đƣợc chẩn

Page 25: ĐẠI HỌC ĐÀ NẴNG TRƢỜNG ĐẠI HỌC BÁCH KHOAtainguyenso.dut.udn.vn/bitstream/DUT/250/1/NguyenThuaPhatTai.TT.pdf.pdf-Tìm hiểu và thu thập hình ảnh các loại

-23-

đoán “không bệnh”, 2/20 mẫu đƣợc chẩn đoán “ bệnh nứt trái”, độ

chính xác=17/20*100=85%

• Bệnh Lá thán thƣ đƣợc gán nhãn 4, với tổng mẫu kiểm thử là 20,

trong đó 16/20 mẫu chẩn đoán đ ng “Lá thán thƣ”, 1/20 mẫu đƣợc

chẩn đoán “ghẻ lồi”, 3/20 mẫu đƣợc chẩn đoán “ không bệnh”, độ

chính xác=16/20*100=80%

• Với số mẫu đƣa vào kiểm tra càng nhiều thì độ chính xác càng cao

3.6 Kết quả chẩn đoán

3.6.1 Lá bệnh thán thư

• Các tham số đặc trƣng và kết quả chẩn đoán ảnh của lá xoài

bị bệnh thán thƣ khi đƣa vào kiểm tra

Hình 3. 14 Bệnh thán thƣ

3.6.2 Bệnh ghẻ lồi trên lá xoài

• Các tham số đặc trƣng và kết quả chẩn đoán ảnh của lá xoài bị

bệnh ghẻ lồi khi đƣa vào kiểm tra

Hình 3. 15 Bệnh ghẻ lồi

Page 26: ĐẠI HỌC ĐÀ NẴNG TRƢỜNG ĐẠI HỌC BÁCH KHOAtainguyenso.dut.udn.vn/bitstream/DUT/250/1/NguyenThuaPhatTai.TT.pdf.pdf-Tìm hiểu và thu thập hình ảnh các loại

-24-

3.6.3 Lá xoài không bệnh

• Các tham số đặc trƣng và kết quả chẩn đoán ảnh của lá xoài

không bệnh khi đƣa vào kiểm tra.

Hình 3. 16 Lá xoài không bệnh

3.7 KẾT CHƢƠNG

SVM đƣợc đánh giá là một hƣớng tiếp cận phân lớp đạt độ

chính xác cao. Hạn chế lớn nhất của SVM là tốc độ phân lớp rất

chậm, Tuy nhiên, SVM vẫn đƣợc đánh giá là phƣơng pháp học máy

tiên tiến đã đóng góp nhiều thành công trong các lĩnh vực khai phá

dữ liệu cũng nhƣ trong lĩnh vực nhận dạng.

KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN

Luận văn đã xây dựng hệ thống nhận dạng hình ảnh và chẩn

đoán bệnh trên cây xoài dùng SVM. Cơ sở dữ liệu trong luận văn

này do tác giả sƣu tầm từ nhiều nguồn khác nhau, chủ yêu từ ảnh

chụp thực tế, tham vấn những ngƣời nông dân làm vƣờn có kinh

nghiệm, nên việc chẩn đoán và xác định bệnh trên xoài một cách

chính xác, khách quan.

Hƣớng phát triển đề tài là nhận dạng và chẩn đoán bệnh từ ảnh

chụp trực tiếp trên thiết bị di động, khi kết quả là có bệnh thì đƣa ra

lời tƣ vấn và cách chữa trị, chăm sóc ứng với từng loại bệnh trên xoài

trong từng giai đoạn phát triển của cây xoài./.