tra tỪ ĐiỂn anh viỆt qua camera trÊn ĐiỆn thoại di ĐỘng dùng android
Post on 22-Feb-2016
66 Views
Preview:
DESCRIPTION
TRANSCRIPT
TRA TƯ ĐIÊN ANH VIÊT QUA CAMERA TRÊN ĐIÊN THOAI DI ĐÔNG DUNG
ANDROID
Sinh viên thưc hiên: Trân Văn Tri – 0812543
Nguyên Minh Tri - 0812548
Giao viên hương dân: Th.S Bui Tân Lôc
PGS. TS. Đinh Điên
Đại học Khoa học Tư Nhiên Tp HCMKhoa Công nghê Thông tinBô môn Công nghê Tri Thưc
2 / 24
Cac nôi dung chinh1 • Giơi thiêu tông quan
2 • Hê điêu hanh Android
3 • Nhân dạng ky tư quang học
4 • Tra tư điên Anh - Viêt
5• Cai đăt va thưc nghiêm ưng
dung6 • Tông kêt
3 / 24
Giơi thiêu tông quan Bôi canh va nhu câu thưc tê:
4 / 24
Muc tiêu: Muc tiêu: Ưng dung tra tư điên Anh Viêt qua
camera trên điên thoại di đông dung Android.
punctuation
6 / 24
Kỹ thuât xử ly trên Android
CameraDictionary (Java)
Thư viên (C/C++)
NDK tool
• Android SDK • Camera API• NDK tool • Text to Speech
7 / 24
Nhân dạng ky tư quang học - OCR
Man who roused schoolboy frenzy eighty years ago
Bắt đầu
Ảnh được thu nhận từ camera
Nhận diện ký tự quang học
Kết quả nhận dạng
Kết thúc
8 / 24
Cac giai phap ap dung nhân dạng ky tư quang học
Lam sao đê thưc hiên?
Tư xây dưng hê thông
OCR
Thưc hiên OCR trên
website sẵn có
Sử dung thư viên OCR sẵn
có
Sử dung thư viên
OCR sẵn có
9 / 24
So sanh cac thư viên OCRTính Năng Tesseract OCR GOCR JavaOCRNgôn ngữ cài đặt
C/C++ C/C++ Java
Năm phát triển 1984-1994 tại HP va 2005 đên nay dươi dạng mã nguồn mở
Bắt đâu phat triên tư 2001 - 2010
Trong năm 2009
Số ngôn ngữ hỗ trợ
Trên 40 ngôn ngữ Tiêng Anh Tiêng Anh
Độ chính xác Kha cao . Nằm trong top 3 của UNLV (1995)
Chưa xac định Chưa xac định
Huấn luyện dữ liệu
Có thê huân luyên ngôn ngữ mơi va font
Không hỗ trợ Không hỗ trợ
10 / 24
Đô chinh xac của Tesseract
Ngôn ngữ Tổng số ký tự (triệu)
Tổng số từ (triệu)
Độ chính xác ký tự (%)
Độ chính xác từ
(%)Tiếng Anh 39 4 99.5 96.28
Tiếng Nga 213 26 99.25 94.22
Tiếng Hoa giản thể
0.25 không xac định
96.23 không xac định
Tiếng Hindi 1.4 0.33 84.59 30.56
11 / 24
Tra tư điên Anh Viêt
Tư cân tra
Khôi phuc tư gôc
Dữ liêu có trong tư điên
không?Tim tư gân
đung
Tra vê nghia của tư
Sai Đung
tables
table
Cai ban
12 / 24
Tra tư điên Anh Viêt Tô chưc dữ liêu tư điên
table
13 / 24
Tra tư điên Anh Viêt Khôi phuc tư gôc
Porter Stemming
Tư cân xử ly
Chuyên đôi cac trương hợp tân cung –
s, -es
Tân cung la “i”, đưng
trươc la phu âm?
Tra vê kêt qua
Sai Đung
Chuyên đôi cac trương hợp tân cung –
ing, -ed
Đôi “i” thanh “y”
looking
looking
look
look
14 / 24
Tra tư điên Anh Viêt Tim tư gân đungTính năng Phương pháp dùng
LeveinsteinPhương pháp thay
thế ký tựTốc độ thực thi
Rât châm Tương đôi nhanh. Trong khoang 2- 5 giây phu thuôc vao đô dai của tư
Kết quả tìm kiếm
Cac tư kêt qua có thê nhiêu hơn, it hơn hoăc cung đô dai vơi tư ban đâu (sai khac 1 ky tư)
Cac tư kêt qua có cung đô dai vơi tư ban đâu
15 / 24
Cai đăt ưng dung
16 / 24
Thưc nghiêm ưng dung
Font chữ Kiểu chữTổng số
từSố từ sai
Tỷ lệ lỗi
Độ chính xác
Times New Roman In Thương 100 9 9%
87.5%
Times New Roman In nghiêng 100 16 16%
Arial In Thương 100 12 12%
83%
Arial In nghiêng 100 22 22%
17 / 24
Môt sô tư nhân diên saiẢnh chụp
Kết quả nhận dạng
18 / 24
Tông kêt Kêt qua đạt được qua đê taiLý thuyết
Tìm hiểu được: Môi trường lập trình và xây dựng ứng dụng trên Android.Bộ nhận dạng quang hoc Tesseract OCR.
Xây dựng cấu trúc tra từ điển và thuật toán xử lý ngôn ngữ.
Ứng dụngHoàn thành tính năng được đề ra: Tra từ điển qua Camera.Tra từ nhanh, chiếm ít bộ nhớ, không làm chậm máy.Chương trình chạy ổn đinh, ít lỗi.
19 / 24
Tông kêt (tt) Hạn chê
Nhận dạng từ tốt hơn khi thiết bi co hỗ trợ autofocus.
Thuật toán tìm từ gần đúng còn chậm phụ thuộc vào độ dài từ.
20 / 24
Tông kêt (tt) Hương phat triên
Bổ sung dữ liệu từ điển và cài đặt thêm ngôn ngữ tiếng Việt và tiếng Hoa.
Cải thiện chất lượng ảnh trên các thiết bi Android không co hỗ trợ auto focus.
Tăng tính tiện dụng của chương trình: dùng con trỏ để nhận diện từ thay vì điều chỉnh khung hình chữ nhật.
21 / 24
So sanh vơi cac ưng dung hiên có trên thị trương
Tính năng so sánh
Camera-Dictionary (luận văn) CamDictionary (thi trường)
Dung lượng Môt tâp tin cai đăt 16.3 MB Môt tâp tin cai đăt 18.56 MBBộ nhớ khi sử dụng
396 KB 512 KB
Khơi động ứng dụng
1-2 giây hiên thị man hinh camera 1-2 giây hiên thị man hinh dịch đoạn văn sau đó chuyên sang man hinh camera
Tốc độ nhận dạng ảnh sang text
Trung binh 2-3 giây Xử ly rât nhanh, chinh xac trung binh 1s
Tính tiện dụng khi chụp từ
Giơi hạn khung chup, nên bât tiên hơn
Không có giơi hạn khung chup ma xử ly chữ lân cân con tro nên tiên lợi hơn
Dữ liệu từ điển Tư điên Anh-Viêt: 106376 tư: 18,8MB Ban Free: dữ liêu tư Google Translate.
Ban License: 60% tư điên Oxford.Tốc độ tra từ < 1 giây Châm, phu thuôc vao kêt nôi mạngPhát âm Tiêng Anh dung Text To Speech. < 1
giâyPhu thuôc vao kêt nôi mạng.
22 / 24
Cac tinh năng chinh trong ưng dungSTT Tên tính năng
1 Tra tư điên trưc tiêp bằng camera điên thoại2 Tra tư điên bằng cach nhâp tư ban phim3 Khôi phuc tư gôc, đưa vê nguyên mâu cac trương hợp
thêm -s, -es, -ed, -ing…4 Tim tư gân đung, hiên thị danh sach cac tư gợi y liên
quan khi tư cân tra không có trong tư điên5 Đọc, phat âm tư tiêng Anh
Cac tinh năng phu hỗ trợ: Ngươi dung bât tắt flash Lây net tư đông Hiên thị danh sach muc tư Thay đôi size phông chữ
23 / 24
Demo ưng dung Sony Ecricson Neo Mt15i, camera 8Mpx. Phiên ban Andoird Gingerbeard 2.3.4
24 / 24
Chân thanh cam ơn sư theo doi của Thây Cô va cac bạn!
top related