nghiÊn cỨu nhÂn bẢn chuyỂn ĐỘng khuÔn mẶt trÊn cÁc...

20
ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ ĐẶNG TUẤN ANH NGHIÊN CỨU NHÂN BẢN CHUYỂN ĐỘNG KHUÔN MẶT TRÊN CÁC MÔ HÌNH KHUÔN MẶT 3D KHÁC NHAU Ngành: Công nghệ Thông tin Chuyên ngành: Công nghệ Phần mềm Mã số: 60 48 10 LUẬN VĂN THẠC SĨ NGƯỜI HƯỚNG DẪN KHOA HỌC TS. Bùi Thế Duy Hà Nội - 2008

Upload: others

Post on 01-Nov-2019

4 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: NGHIÊN CỨU NHÂN BẢN CHUYỂN ĐỘNG KHUÔN MẶT TRÊN CÁC …repository.vnu.edu.vn/bitstream/VNU_123/15154/1/V_L0_01858.pdfTRƯỜNG ĐẠI HỌC CÔNG NGHỆ ĐẶNG TUẤN

ĐẠI HỌC QUỐC GIA HÀ NỘI

TRƯỜNG ĐẠI HỌC CÔNG NGHỆ

ĐẶNG TUẤN ANH

NGHIÊN CỨU NHÂN BẢN CHUYỂN ĐỘNG

KHUÔN MẶT TRÊN CÁC MÔ HÌNH

KHUÔN MẶT 3D KHÁC NHAU

Ngành: Công nghệ Thông tin

Chuyên ngành: Công nghệ Phần mềm

Mã số: 60 48 10

LUẬN VĂN THẠC SĨ

NGƯỜI HƯỚNG DẪN KHOA HỌC

TS. Bùi Thế Duy

Hà Nội - 2008

Page 2: NGHIÊN CỨU NHÂN BẢN CHUYỂN ĐỘNG KHUÔN MẶT TRÊN CÁC …repository.vnu.edu.vn/bitstream/VNU_123/15154/1/V_L0_01858.pdfTRƯỜNG ĐẠI HỌC CÔNG NGHỆ ĐẶNG TUẤN

MỤC LỤC

MỞ ĐẦU ......................................................................................................................... 5

CHƢƠNG 1. TỔNG QUAN VỀ KHUÔN MẶT VÀ HOẠT ẢNH CỦA KHUÔN

MẶT 3D .......................................................................................................................... 7

1.1 Giới thiệu .......................................................................................................... 7

1.2 Các kỹ thuật hiện có đƣợc sử dụng để tạo mô hình và làm hoạt ảnh khuôn

mặt 3D .......................................................................................................................... 8

1.2.1 Tạo mô hình khuôn mặt .............................................................................. 9

1.2.2 Tạo mô hình hoạt ảnh của khuôn mặt ...... Error! Bookmark not defined.

1.2.3 Môi .......................................................... Error! Bookmark not defined.

1.3 Một mô hình khuôn mặt 3D cho ứng dụng thời gian thực .. Error! Bookmark

not defined.

1.3.1 Lƣới mặt ................................................... Error! Bookmark not defined.

1.3.2 Mô hình môi ............................................. Error! Bookmark not defined.

1.4 Các cơ làm khuôn mặt hoạt ảnh...................... Error! Bookmark not defined.

1.4.1 Các cơ vectơ ............................................. Error! Bookmark not defined.

1.4.2 Cơ vòng miệng ......................................... Error! Bookmark not defined.

1.4.3 Cơ vòng mắt ............................................. Error! Bookmark not defined.

1.4.4 Xoay quai hàm .......................................... Error! Bookmark not defined.

1.4.5 Xoay tròng mắt ......................................... Error! Bookmark not defined.

1.5 Kết quả thực nghiệm ....................................... Error! Bookmark not defined.

1.6 Kết luận chƣơng .............................................. Error! Bookmark not defined.

CHƢƠNG 2. CƠ SỞ LÝ THUYẾT NỀN TẢNG ........ Error! Bookmark not defined.

2.1 Giới thiệu ........................................................ Error! Bookmark not defined.

2.2 Các nghiên cứu trƣớc đây về việc chuyển hoạt ảnh khuôn mặt ............. Error!

Bookmark not defined.

2.2.1 Nhân bản biểu hiện ................................... Error! Bookmark not defined.

2.2.2 Dịch chuyển các bảng hoạt ảnh khuôn mặt MPEG-4 ... Error! Bookmark

not defined.

Page 3: NGHIÊN CỨU NHÂN BẢN CHUYỂN ĐỘNG KHUÔN MẶT TRÊN CÁC …repository.vnu.edu.vn/bitstream/VNU_123/15154/1/V_L0_01858.pdfTRƯỜNG ĐẠI HỌC CÔNG NGHỆ ĐẶNG TUẤN

2.2.3 Chuyển một cấu trúc khuôn mặt nhiều lớp ............ Error! Bookmark not

defined.

2.3 Mạng RBF và các thuật toán di truyền học .... Error! Bookmark not defined.

2.3.1 Mạng RBF ................................................ Error! Bookmark not defined.

2.3.2 Các thuật toán di truyền học ..................... Error! Bookmark not defined.

CHƢƠNG 3. XÂY DỰNG MÔ HÌNH KHUÔN MẶT 3D TỪ MỘT KHUÔN MẶT

GỐC ............................................................................... Error! Bookmark not defined.

3.1 Giới thiệu ........................................................ Error! Bookmark not defined.

3.2 Mô tả phƣơng pháp biến đổi khuôn mặt 3D ... Error! Bookmark not defined.

3.3 Các mạng RBF ................................................ Error! Bookmark not defined.

3.4 Hàm sai số ....................................................... Error! Bookmark not defined.

3.5 Sử dụng GA điều chỉnh các điểm đánh dấu ... Error! Bookmark not defined.

3.5.1 Nhiễm sắc thể ........................................... Error! Bookmark not defined.

3.5.2 Hàm thích nghi (Fitness function) ............ Error! Bookmark not defined.

3.5.3 Phép lai ghép (Crossover) ........................ Error! Bookmark not defined.

3.5.4 Đột biến (Mutation) .................................. Error! Bookmark not defined.

3.5.5 Phép toán bổ sung (Additional Operation) ............. Error! Bookmark not

defined.

3.6 Quy trình biến đổi khuôn mặt 3D ................... Error! Bookmark not defined.

3.7 Một công cụ biến đổi khuôn mặt 3D .............. Error! Bookmark not defined.

3.7.1 Tạo mô hình khuôn mặt 3D bằng Poser 5 Error! Bookmark not defined.

3.7.2 Công cụ biến đổi ....................................... Error! Bookmark not defined.

KẾT LUẬN ................................................................... Error! Bookmark not defined.

TÀI LIỆU THAM KHẢO ............................................................................................. 12

PHỤ LỤC ...................................................................... Error! Bookmark not defined.

Page 4: NGHIÊN CỨU NHÂN BẢN CHUYỂN ĐỘNG KHUÔN MẶT TRÊN CÁC …repository.vnu.edu.vn/bitstream/VNU_123/15154/1/V_L0_01858.pdfTRƯỜNG ĐẠI HỌC CÔNG NGHỆ ĐẶNG TUẤN

DANH MỤC VIẾT TẮT

Ký hiệu Tiếng Anh Ý nghĩa

AMA Abstract Muscle Action Hành động cơ trừu tƣợng

FAP Facial Animation Parameter Tham số hoạt ảnh mặt

FAT Face Animation Table Bảng hoạt ảnh khuôn mặt

FFD Free Form Deformation Biến đổi dạng tự do

GA Genetic Algorithms Các thuật toán di truyền học

RBF Radial Basis Function Hàm cơ sở bán kính

RFFD Rational Free Form Deformation Biến đổi dạng tự do hợp lý

Page 5: NGHIÊN CỨU NHÂN BẢN CHUYỂN ĐỘNG KHUÔN MẶT TRÊN CÁC …repository.vnu.edu.vn/bitstream/VNU_123/15154/1/V_L0_01858.pdfTRƯỜNG ĐẠI HỌC CÔNG NGHỆ ĐẶNG TUẤN

DANH MỤC CÁC BẢNG

Bảng 1.1: Các cơ trên mô hình khuôn mặt (ở phần khuôn mặt bên phải). ............ Error!

Bookmark not defined.

Bảng 1.2: Kết quả của việc áp dụng các kỹ thuật tăng tốc độ hoạt ảnh (trên một máy

tính Pentium III, 800 Mhz, 256MB RAM, Nvidia GeForce3 video card) ............ Error!

Bookmark not defined.

Page 6: NGHIÊN CỨU NHÂN BẢN CHUYỂN ĐỘNG KHUÔN MẶT TRÊN CÁC …repository.vnu.edu.vn/bitstream/VNU_123/15154/1/V_L0_01858.pdfTRƯỜNG ĐẠI HỌC CÔNG NGHỆ ĐẶNG TUẤN

DANH MỤC CÁC HÌNH VẼ

Hình 1.1: Các mô hình khuôn mặt CANDIDE (trái) và Greta (phải) ........................... 10

Hình 1.2: Một bề mặt B-spline ...................................................................................... 12

Hình 1.3: Mô hình cơ vòng của Waters......................... Error! Bookmark not defined.

Hình 1.4: Mô hình cơ phiến của Waters ........................ Error! Bookmark not defined.

Hình 1.5: Mô hình cơ vectơ của Waters ........................ Error! Bookmark not defined.

Hình 1.6: Hành động của cơ vòng miệng thực: (a) chìa môi và (b) mím môi. ..... Error!

Bookmark not defined.

Hình 1.7: (a) Khuôn mặt khung lƣới cùng các cơ; (b) khuôn mặt bình thƣờng; và (c)

hiệu ứng của cơ gò má lớn bên trái. .............................. Error! Bookmark not defined.

Hình 1.8: Chia vùng trên phần khuôn mặt bên phải. ..... Error! Bookmark not defined.

Hình 1.9: Đôi môi (bên trái) và các điểm điều khiển của môi (bên phải). ............ Error!

Bookmark not defined.

Hình 1.10: (a) Lƣới mặt không có môi; và (b) môi kết hợp với toàn bộ lƣới mặt Error!

Bookmark not defined.

Hình 1.11: Giản đồ các cơ mặt ...................................... Error! Bookmark not defined.

Hình 1.12: Tác động của cơ đơn lên lƣới (a và b); Tác động của hai cơ lên lƣới (biểu

diễn theo từng bƣớc) bằng cách mô phỏng tính chất song song (c,d,e,f) và bằng cách

thêm sự biến đổi (g,h,i,j)................................................ Error! Bookmark not defined.

Hình 1.13: Tác động của ba cơ lên lƣới mặt: bằng cách mô phỏng các đƣờng song

song (a) và bằng cách thêm sự biến đổi (b) ................... Error! Bookmark not defined.

Hình 1.14: Khi có biểu hiện buồn, xử lý sự co cơ đối với cặp lông mày: bằng cách mô

phỏng các đƣờng song song (a) và bằng cách thêm sự biến đổi (b) .. Error! Bookmark

not defined.

Hình 1.15: Miền chứa các nếp nhăn đƣợc tạo bởi sự co rút của một cơ vectơ ..... Error!

Bookmark not defined.

Hình 1.16: Hàm nếp nhăn .............................................. Error! Bookmark not defined.

Hình 1.17: Bài toán “pháp tuyến đỉnh không biểu diễn” và cách giải. ................. Error!

Bookmark not defined.

Hình 1.18: Các nếp nhăn do sự co cơ tạo nên. .............. Error! Bookmark not defined.

Hình 1.19: Mô tả hành động của cơ vòng miệng: đẩy môi ra (a); mím môi lại (b).

....................................................................................... Error! Bookmark not defined.

Page 7: NGHIÊN CỨU NHÂN BẢN CHUYỂN ĐỘNG KHUÔN MẶT TRÊN CÁC …repository.vnu.edu.vn/bitstream/VNU_123/15154/1/V_L0_01858.pdfTRƯỜNG ĐẠI HỌC CÔNG NGHỆ ĐẶNG TUẤN

Hình 1.20: Sự biến đổi của môi dƣới tác động của sự co cơ vòng miệng: dạng bình

thƣờng (a); đẩy môi ra (b) và mím môi lại (c)............... Error! Bookmark not defined.

Hình 1.21: Chỉ nhắm một mắt (a); Nhắm cả hai mắt (b). ............ Error! Bookmark not

defined.

Hình 1.22: Các góc định hƣớng mắt. ............................. Error! Bookmark not defined.

Hình 1.23: Vùng nhìn đƣợc của mắt. ............................ Error! Bookmark not defined.

Hình 1.24: Khuôn mặt buồn khi có (a) và khi không có (b) các nếp nhăn và việc xử lý

hành động co đa cơ. ....................................................... Error! Bookmark not defined.

Hình 1.25: Gƣơng mặt ngạc nhiên. ............................... Error! Bookmark not defined.

Hình 1.26: Gƣơng mặt hạnh phúc. ................................ Error! Bookmark not defined.

Hình 1.27: Gƣơng mặt buồn. ......................................... Error! Bookmark not defined.

Hình 2.1: Mạng RBF trong xây dựng mô hình chuỗi thời gian .. Error! Bookmark not

defined.

Hình 2.2: Mạng RBF trong phân loại mẫu .................... Error! Bookmark not defined.

Hình 2.3: Sơ đồ thuật toán di truyền học ....................... Error! Bookmark not defined.

Hình 3.1: Tổng quan hệ thống khai thác khuôn mặt. .... Error! Bookmark not defined.

Hình 3.2: Mô hình khuôn mặt nguồn (4650 đa giác). ... Error! Bookmark not defined.

Hình 3.3: Giao phần giữa một bề mặt của mô hình khuôn mặt với mặt phẳng mẫu.

....................................................................................... Error! Bookmark not defined.

Hình 3.4: Cách đặt vị trí các điểm mẫu trên giao phần giữa mặt phẳng mẫu và bề mặt

của mô hình khuôn mặt mục tiêu và mô hình khuôn mặt biến đổi. ... Error! Bookmark

not defined.

Hình 3.5: Một điểm đánh dấu ban đầu và biến thể của nó .......... Error! Bookmark not

defined.

Hình 3.6: Phép lai ghép đa điểm. .................................. Error! Bookmark not defined.

Hình 3.7: Cách thức hội tụ của quá trình GA: đƣờng nét đứt – các nghiệm đƣợc thay

thế bởi phép chiếu của chúng lên mô hình khuôn mặt mục tiêu trong suốt quá trình

GA; đƣờng liên tục: phép chiếu đƣợc sử dụng chỉ để tính hàm sai số và để tạo ra

nghiệm cuối cùng........................................................... Error! Bookmark not defined.

Hình 3.8: Quy trình biến đổi khuôn mặt 3D .................. Error! Bookmark not defined.

Hình 3.9: Giao diện công cụ Face của Poser 5 .............. Error! Bookmark not defined.

Hình 3.10: Hai hình ảnh của khuôn mặt: chụp thẳng và chụp bên..... Error! Bookmark

not defined.

Page 8: NGHIÊN CỨU NHÂN BẢN CHUYỂN ĐỘNG KHUÔN MẶT TRÊN CÁC …repository.vnu.edu.vn/bitstream/VNU_123/15154/1/V_L0_01858.pdfTRƯỜNG ĐẠI HỌC CÔNG NGHỆ ĐẶNG TUẤN

Hình 3.11: Nạp ảnh và xác định một số vị trí trên gƣơng mặt .... Error! Bookmark not

defined.

Hình 3.12: Kết quả thu đƣợc sau bƣớc 1 ....................... Error! Bookmark not defined.

Hình 3.13: Texture Variation và công cụ Face ShapingError! Bookmark not defined.

Hình 3.14: Biểu đồ lớp thiết kế của hệ thống ................ Error! Bookmark not defined.

Hình 3.15: Giao diện công cụ biến đổi khuôn mặt 3D .. Error! Bookmark not defined.

Hình 3.16: Đƣa vào khuôn mặt mục tiêu ...................... Error! Bookmark not defined.

Hình 3.17: Chọn các điểm đánh dấu trên khuôn mặt mục tiêu ... Error! Bookmark not

defined.

Hình 3.18: Kết quả thực nghiệm khi sử dụng công cụ biến đổi khuôn mặt 3D .... Error!

Bookmark not defined.

Page 9: NGHIÊN CỨU NHÂN BẢN CHUYỂN ĐỘNG KHUÔN MẶT TRÊN CÁC …repository.vnu.edu.vn/bitstream/VNU_123/15154/1/V_L0_01858.pdfTRƯỜNG ĐẠI HỌC CÔNG NGHỆ ĐẶNG TUẤN

MỞ ĐẦU

Hiện nay, phần lớn tƣơng tác giữa con ngƣời và máy tính đƣợc thực hiện thông qua

chuột và bàn phím. Cùng với sự phát triển nhanh chóng của đồ họa máy tính và công nghệ

ngôn ngữ, các nhà nghiên cứu ngày càng chú ý tới việc đƣa sự tƣơng tác này trở nên linh hoạt,

thích ứng và hƣớng tới con ngƣời hơn. Một cách thực hiện điều này là qua việc tạo ra các

agent hiện thân (embodied agent). Các agent hiện thân đã từng đƣợc sử dụng làm giao diện

cho tƣơng tác con ngƣời – máy tính [11]. Ngƣời ta cho rằng những agent hội thoại hiện thân

(embodied conversational agents) cho phép ngƣời sử dụng tƣơng tác tự nhiên hơn với máy

tính.

Với xu thế phát triển của thế giới ảo, công nghệ agent hiện thân cho phép tạo dựng

những nhân vật ảo với nhiều mục đích khác nhau nhƣ giải trí, giáo dục. Khả năng nói chuyện,

biểu hiện gƣơng mặt và các cử chỉ của agent hiện thân khiến chúng rất phù hợp với các ứng

dụng giải trí. Ngƣời kể chuyện ảo tại Đại học Twente là một ví dụ về agent hiện thân [38]. Đây

là một agent nói chuyện hiện thân, kể lại những câu chuyện đƣợc sáng tác ra, với những ngôn

điệu và cử chỉ thích hợp. Agent này đƣợc đặt trong một mô hình - bản sao nhà hát địa phƣơng:

Virtual Music Center. Bên cạnh dạng kể chuyện truyền thống này, ngƣời ta cũng dự định phát

triển các vở kịch ảo, trong đó các nhân vật hiện thân diễn trên sân khấu ảo, dựa trên cốt truyện

đã sáng tác. Còn có nhiều ví dụ khác về các agent hiện thân phục vụ lĩnh vực giải trí, nhƣ các

nhân vật nhân tạo ở phòng thí nghiệm truyền thông MIT [4], các nhà bình luận bóng đá robot

[2].

Các agent hiện thân có thể làm ngƣời hƣớng dẫn các thủ tục, trả lời câu hỏi thắc mắc,

và kiểm soát hành động của sinh viên. Agent hiện thân cũng có thể trở thành đồng đội trong

những nhiệm vụ đòi hỏi sự tham gia của nhiều ngƣời. Một ví dụ về những agent nhƣ vậy là

Steve - chuyên gia luyện bay trong môi trƣờng ảo tại Đại học Nam California [35]. Steve

đƣợc xây dựng nhằm hỗ trợ việc tập luyện của đội trong một mô hình môi trƣờng làm việc ảo

tƣơng tác ba chiều của một sinh viên, khi mà việc luyện tập dựa trên các thiết bị thật không có

trên thực tế.

Các agent hiện thân cũng đƣợc dùng để phát triển các trò chơi trên máy tính. Các trò

chơi máy tính truyền thống thƣờng có những nhân vật thụ động, cứng nhắc, máy móc. So với

trò chơi một ngƣời chơi (một ngƣời chơi với các nhân vật máy tính), thì các trò chơi nhiều

ngƣời chơi vẫn đƣợc ƣa chuộng hơn. Chơi với ngƣời thật thú vị hơn vì cách phản ứng của con

ngƣời luôn đƣa đến những diễn biến mới mẻ, ngay cả khi chơi nhiều lần với cùng một ngƣời.

Còn trò chơi chỉ chơi với nhân vật máy tính sẽ không có đƣợc điều đó. Các agent hiện thân

(hay các nhân vật ảo có thể cử động) có mục tiêu, kiến thức và khả năng riêng của chúng, đây

có thể là lời giải đáp cho vấn đề này [23], đặc biệt là đối với những loại trò chơi sử dụng máy

tính để tạo nên thế giới và các nhân vật ảo có thể tƣơng tác động với ngƣời chơi, ví dụ nhƣ

Quake, Half-Life 2, Diablo 3,... Do đó, các nhân vật ảo có thể cử động đang đƣợc phát triển

và đƣa vào nhiều loại trò chơi máy tính. Chúng cũng có tiềm năng dẫn đến việc ra đời những

loại trò chơi hoàn toàn mới [23].

Một agent hiện thân điển hình gồm các thành phần sau:

Page 10: NGHIÊN CỨU NHÂN BẢN CHUYỂN ĐỘNG KHUÔN MẶT TRÊN CÁC …repository.vnu.edu.vn/bitstream/VNU_123/15154/1/V_L0_01858.pdfTRƯỜNG ĐẠI HỌC CÔNG NGHỆ ĐẶNG TUẤN

- Một cái đầu nói chuyện có khả năng nói, thể hiện các cử động môi trong khi nói, có

các biểu cảm trên gƣơng mặt và thể hiện đƣợc các tín hiệu hội thoại.

- Một cơ thể có khả năng thể hiện các cử chỉ.

- Một mô hình trí não có thể bao gồm lòng tin, cảm xúc, kế hoạch hành vi, động thái và

tính cách…

Đối tƣợng nghiên cứu của luận văn này là các agent hiện thân đƣợc thể hiện dƣới dạng

một khuôn mặt 3D. Trong bài toán xây dựng một mô hình khuôn mặt 3D, thông thƣờng ta

phải trải qua các bƣớc sau:

- Bƣớc 1: Sử dụng đồ hoạ máy tính để tạo dựng một mô hình khuôn mặt 3D.

- Bƣớc 2: Tạo dựng mô hình cơ mặt có thể đạt đƣợc những biểu hiện khuôn mặt chân

thực trong thời gian thực trên một máy tính thông thƣờng.

Các nghiên cứu trƣớc đây đã cho thấy bƣớc 2 đòi hỏi rất nhiều công sức và thời gian. Và

việc này lặp lại mỗi khi chúng ta xây dựng một mô hình khuôn mặt 3D mới. Đây là lý do để luận

văn nghiên cứu một phƣơng pháp tạo dựng mô hình cơ mặt cho một khuôn mặt 3D mới bằng

cách biến đổi mô hình khuôn mặt nguồn đã có mô hình cơ mặt. Trên cơ sở nghiên cứu và thử

nghiệm phƣơng pháp nhân bản của Bùi Thế Duy và cộng sự [9], tôi đƣa ra một quy trình và xây

dựng một công cụ tạo ra hoạt ảnh trên các khuôn mặt 3D. Công cụ này đƣợc xây dựng để kết nối

với phần mềm tạo khuôn mặt Poser.

Có một số ƣu điểm khi sử dụng mô hình khuôn mặt biến đổi để thể hiện một mô hình

khuôn mặt mới thay cho việc sử dụng chính bản thân mô hình mới. Thứ nhất, khi tạo hoạt ảnh

với những mô hình khuôn mặt khác nhau, chúng ta có thể giữ đƣợc một mô hình khuôn mặt cố

định với số đỉnh và số đa giác đƣợc xác định trƣớc. Thứ hai, ta có thể tái sử dụng các thông số

trên mô hình khuôn mặt cố định trƣớc, ví dụ nhƣ các thông số xoay quai hàm và đảo mắt. Thứ

ba, ta có thể sử dụng lại những thông tin về các vùng trên mô hình khuôn mặt để nâng cao hiệu

quả của cơ vectơ và điều khiển hoạt ảnh.

Luận văn đƣợc cấu trúc nhƣ sau. Chƣơng 1 giới thiệu một mô hình khuôn mặt 3D dựa

trên hệ thống cơ đơn giản, có thể đáp ứng các mục tiêu sau: nó vừa có thể tạo nên những biểu

hiện khuôn mặt chân thực, đồng thời lại đạt đƣợc hoạt ảnh thời gian thực trên những máy tính

cá nhân thông thƣờng. Chƣơng 2 trình bày cơ sở lý thuyết để xây dựng một phƣơng pháp

truyền hoạt ảnh khuôn mặt từ một mô hình khuôn mặt cho trƣớc tới một mô hình mới đƣợc

tạo ra mà không cần nhiều thao tác của con ngƣời. Chƣơng 3 trình bày một phƣơng pháp

truyền hoạt ảnh khuôn mặt từ một mô hình khuôn mặt cho trƣớc tới một mô hình mới đƣợc

tạo ra mà không cần nhiều thao tác của con ngƣời. Chƣơng này mô tả quy trình và một công

cụ do tác giả phát triển để thử nghiệm phƣơng pháp đƣợc đƣa ra trong luận văn.

Page 11: NGHIÊN CỨU NHÂN BẢN CHUYỂN ĐỘNG KHUÔN MẶT TRÊN CÁC …repository.vnu.edu.vn/bitstream/VNU_123/15154/1/V_L0_01858.pdfTRƯỜNG ĐẠI HỌC CÔNG NGHỆ ĐẶNG TUẤN

CHƯƠNG 1. TỔNG QUAN VỀ KHUÔN MẶT VÀ HOẠT ẢNH CỦA KHUÔN MẶT 3D

1.1 Giới thiệu

Khuôn mặt của con ngƣời rất đặc biệt. Đó là bộ phận cơ thể quan trọng để giúp nhận

diện một ngƣời bằng mắt thƣờng. Trong hàng trăm khuôn mặt quen thuộc, chúng ta vẫn có

thể nhận ra một khuôn mặt cụ thể. Ta cũng có khả năng phát hiện ra từng cử động tinh tế của

khuôn mặt. Khả năng này phát triển từ thời thơ ấu của chúng ta và nhờ nó ta có đƣợc công cụ

giao tiếp cơ bản nhất của con ngƣời. Theo một số nghiên cứu, trẻ em 9 tháng tuổi bắt đầu hiểu

đƣợc những phản ứng của khuôn mặt ngƣời khác. Ngay khi 1 tuổi, trẻ em phát triển bình

thƣờng có thể phân biệt các biểu hiện cảm xúc và chúng tiếp tục hoàn thiện khả năng này

trong quá trình trƣởng thành.

Hoạt ảnh của khuôn mặt con ngƣời giữ vai trò quan trọng trong giao tiếp mặt đối mặt.

Cử động môi trong khi nói chuyện giúp đoán biết đƣợc bằng mắt ngƣời đó đang nói gì. Cohen

and Massaro [13] đã chứng minh rằng tỷ lệ nhận biết âm vị từ những đoạn video vừa có hình

ảnh ngƣời nói vừa có âm thanh cao hơn hẳn so với từ những đoạn băng chỉ có âm thanh. Đối

với ngƣời điếc, cử động môi là điều thiết yếu để họ hiểu đƣợc các hội thoại. Trong giao tiếp

bằng cử chỉ, biểu hiện của khuôn mặt thƣờng ngụ ý sự biến đổi của khuôn mặt theo thời gian.

Tuy nhiên, ngay cả một bức tranh chân dung cũng thể hiện cảm xúc, nghĩa là biểu hiện của

khuôn mặt có thể ở chế độ tĩnh, mặc dù những biểu hiện đó không rõ ràng nếu không đƣợc

đặt trong hoàn cảnh cụ thể. Biểu hiện của khuôn mặt diễn ra liên tục trong suốt quá trình nói

chuyện. Chúng là sự minh họa và bổ sung cho những thông tin từ lời nói. Chúng có thể diễn

đạt cảm xúc, tâm trạng, và truyền đạt các thông tin về tính cách của ngƣời nói. Những thông

tin này có thể làm lộ ra phần ẩn giấu bên trong một con ngƣời, mà lời nói không toát lên

đƣợc.

Bài toán tạo mô hình khuôn mặt con ngƣời và tạo ra các hoạt ảnh mặt bằng máy tính

là một thách thức lớn trong cộng đồng khoa học nghiên cứu về đồ họa vi tính. Một nhu cầu

mới nảy sinh là thể hiện đƣợc khuôn mặt chân thực, chất lƣợng cao và đồng thời đạt đƣợc

hoạt ảnh thời gian thực của khuôn mặt. Nhìn chung, trƣớc nghiên cứu của Bùi Thế Duy và

cộng sự [7, 8], các cách tiếp cận đều chƣa thể đạt đƣợc cả hai mục tiêu này. Hoạt ảnh khung

cơ sở (key-frame animation) [29], hoạt ảnh đƣợc tham số hoá (parameterized animation) [30]

và hoạt ảnh dựa trên hệ thống cơ giả (pseudo-muscle-based animation) [21] là các cách thức

đơn giản để đạt đƣợc hoạt ảnh thời gian thực, tuy nhiên chúng không thể tạo ra các biểu hiện

khuôn mặt chân thực, do không tạo đƣợc các chỗ phình và nếp nhăn trên da, cũng nhƣ không

xử lý đƣợc các tƣơng tác đa tham số (đa cơ). Mặt khác, hoạt ảnh dựa trên hệ thống cơ đa lớp

với nhiều lớp thuộc cấu trúc khuôn mặt có thể tạo đƣợc sự biểu đạt chân thực, nhƣng việc xử

lý hoạt ảnh thời gian thực bằng phƣơng pháp này đòi hỏi dung lƣợng tính toán khổng lồ, mà

các máy tính cá nhân thông thƣờng không đáp ứng đƣợc.

Trong chƣơng này, tôi sẽ xem xét một mô hình khuôn mặt 3D dựa trên hệ thống cơ

giản đơn, mà có thể tạo ra nét mặt chân thực cũng nhƣ các hoạt ảnh thời gian thực trên máy

tính cá nhân thông thƣờng. Để thực hiện đƣợc điều này, tôi sẽ tìm hiểu:

Page 12: NGHIÊN CỨU NHÂN BẢN CHUYỂN ĐỘNG KHUÔN MẶT TRÊN CÁC …repository.vnu.edu.vn/bitstream/VNU_123/15154/1/V_L0_01858.pdfTRƯỜNG ĐẠI HỌC CÔNG NGHỆ ĐẶNG TUẤN

- Một mô hình có biểu hiện khuôn mặt chân thực và chất lƣợng cao, đủ đơn giản để giữ

đƣợc các hoạt ảnh thời gian thực và có thể hỗ trợ mô hình cơ điều khiển sự biến đổi

trên gƣơng mặt.

- Một mô hình cơ tạo ra sự biến đổi chân thực trên bề mặt của khuôn mặt, xử lý đƣợc

các tƣơng tác đa cơ một cách chính xác, và tạo ra đƣợc các chỗ phình và nếp nhăn

trong thời gian thực.

Phần 1.2 bàn cụ thể về các kỹ thuật hiện có đƣợc sử dụng để tạo mô hình và làm hoạt ảnh

khuôn mặt. Trƣớc tiên, tôi nghiên cứu về hai kỹ thuật chính để tạo mô hình khuôn mặt, đó là:

tạo mô hình khuôn mặt bằng các lớp hình đa giác và tạo mô hình khuôn mặt bằng các lớp bề

mặt đƣợc tham số hoá. Phần này cũng chỉ ra những ƣu và nhƣợc điểm của từng kỹ thuật trong

quá trình biểu hiện và hoạt ảnh gƣơng mặt. Sau đó tôi nghiên cứu tiếp các kỹ thuật làm hoạt

ảnh khuôn mặt. Bốn kỹ thuật chính đƣợc đề cập tới là: hoạt ảnh khung cơ sở [29], hoạt ảnh

đƣợc tham số hoá [30], hoạt ảnh dựa trên hệ thống cơ giả [21] và hoạt ảnh dựa trên hệ thống

cơ (muscle-based animation) [43]. Phần 1.3 giới thiệu cấu trúc mô hình khuôn mặt của Bùi

Thế Duy và cộng sự [7]. Tôi mô tả cách thức xây dựng mạng lƣới khuôn mặt để tạo ra các

biểu hiện chân thực trong khi vẫn giữ đƣợc hoạt ảnh trong thời gian thực. Mạng lƣới khuôn

mặt cũng đƣợc thiết kế để nâng cao hiệu quả của mô hình cơ. Phần 1.4 thảo luận về hệ thống

cơ điều khiển hoạt ảnh của khuôn mặt [7, 8]. Trong phần này, tôi mô tả cách thức mở rộng mô

hình cơ của Waters [43] để xử lý việc kết hợp giữa các hành động đa cơ, và để tạo ra các chỗ

phình và các nếp nhăn trên gƣơng mặt. Phần này cũng bàn về các kỹ thuật để nâng cao hiệu

quả của mô hình cơ. Tiếp theo, tôi tìm hiểu cách cử động cơ vòng miệng, cơ vòng mắt và sự

chuyển động của hàm. Cuối cùng, những kết quả thực nghiệm của Bùi Thế Duy và cộng sự

[8] sẽ đƣợc đƣa ra ở Phần 1.5, trong đó khuôn mặt đƣợc tạo ra mang các sắc thái ngạc nhiên,

hạnh phúc và buồn rầu, nhằm minh họa cho cách thức xây dựng các biểu hiện khuôn mặt chân

thực.

1.2 Các kỹ thuật hiện có được sử dụng để tạo mô hình và làm hoạt ảnh

khuôn mặt 3D

Mục đích của hoạt ảnh khuôn mặt 3D là điều khiển mạng lƣới bề mặt 3D của mô hình

khuôn mặt theo thời gian, sao cho tại một thời điểm bất kỳ, mô hình khuôn mặt có biểu hiện

nhƣ ta mong muốn. Có nhiều phƣơng pháp tạo nên hoạt ảnh khuôn mặt 3D, từ phƣơng pháp

đơn giản nhằm tạo ra hoạt ảnh thời gian thực nhƣ mô hình khuôn mặt CANDIDE [36], đến

những phƣơng pháp phức tạp hơn nhằm đạt đƣợc sự biểu hiện khuôn mặt có chất lƣợng nhƣ

ảnh chụp, ví dụ nhƣ mô hình khuôn mặt dựa trên hệ thống cơ đa lớp của Lee và cộng sự [24].

Theo mô tả của Rydfalk [36], CANDIDE là một mô hình khuôn mặt đƣợc tham số hoá

(parameterized face model), chỉ bao gồm 75 đỉnh và 100 tam giác. Mô hình này đƣợc xây

dựng dành riêng cho việc mã hoá khuôn mặt con ngƣời, qua đó khuôn mặt ngƣời đƣợc mã

hóa với tỷ lệ bít đƣợc giảm đáng kể, trong các ứng dụng nhƣ điện thoại truyền hình. Số lƣợng

ít các đa giác của mô hình này cho phép tái xây dựng và đạt đƣợc hiệu ứng hoạt ảnh nhanh

chóng ngay cả với các máy tính thông thƣờng (dung lƣợng thấp). CANDIDE do các đơn vị

hành động (Action Units) toàn cục và cục bộ điều khiển [15]. Các đơn vị toàn cục tƣơng ứng

với các chuyển động xoay quanh ba trục. Các đơn vị hành động cục bộ tạo ra các biểu hiện

khác nhau của khuôn mặt.

Page 13: NGHIÊN CỨU NHÂN BẢN CHUYỂN ĐỘNG KHUÔN MẶT TRÊN CÁC …repository.vnu.edu.vn/bitstream/VNU_123/15154/1/V_L0_01858.pdfTRƯỜNG ĐẠI HỌC CÔNG NGHỆ ĐẶNG TUẤN

Mô hình khuôn mặt của Lee và cộng sự [24] là một ví dụ trong các phƣơng pháp nhằm

đạt đƣợc các biểu hiện chất lƣợng cao. Nó bao gồm nhiều lớp: một lớp mô sinh học, một lớp

cơ và một cấu trúc sọ đặc. Để tạo mô hình khuôn mặt của một cá nhân, các dữ liệu từ một

máy quét laze sẽ đƣợc nhập tự động vào mô hình khuôn mặt chung. Hình ảnh từ máy quét

cũng đƣợc xử lý để tạo nên kết cấu bề mặt của mô hình khuôn mặt. Bằng một hệ thống cơ xây

dựng dựa trên vật lý học, các biểu hiện khuôn mặt chân thực sẽ đƣợc tạo ra trên bề mặt đƣợc

cấu thành của mô hình khuôn mặt.

Có hai vấn đề cần lƣu tâm khi xử lý hoạt ảnh khuôn mặt 3D. Vấn đề đầu tiên là việc

tạo mô hình khuôn mặt, trong đó xử lý cách biểu hiện của chính mô hình khuôn mặt đó. Vấn

đề thứ hai là việc tạo mô hình chuyển động của khuôn mặt. Bây giờ tôi sẽ xem xét lại các kỹ

thuật để xử lý hai vấn đề này một cách chi tiết. Ngoài ra, tôi cũng sẽ thảo luận về các phƣơng

pháp để tạo mô hình và làm môi cử động. Trong số các bộ phận của khuôn mặt, môi đóng vai

trò quan trọng trong giao tiếp mặt đối mặt. Nó cũng là một thành phần quan trọng trong các

biểu hiện cảm xúc và tham gia vào việc giải nghĩa lời nói. Bởi vậy, môi luôn là một thành

phần đƣợc chú ý đặc biệt trong việc tạo mô hình hoạt ảnh khuôn mặt.

1.2.1 Tạo mô hình khuôn mặt

Khuôn mặt con ngƣời là một bề mặt ba chiều linh hoạt và phức tạp. Khuôn mặt

thƣờng mang một số nếp nhăn cố định, còn những chỗ phình và nếp nhăn tạm thời đƣợc tạo ra

trong quá trình biểu đạt của khuôn mặt. Thách thức đặt ra là làm sao có thể tạo nên một bề

mặt cho phép biểu hiện chân thực, đồng thời đạt đƣợc hiệu ứng chuyển động thời gian thực.

Tạo mô hình khuôn mặt bằng lớp da gồm nhiều đa giác

Một phƣơng pháp là sử dụng nhiều lớp đa giác để mô phỏng trực tiếp bề mặt khuôn

mặt. Sau đó, mô hình khuôn mặt đƣợc tạo hoạt ảnh bằng cách trực tiếp điều khiển các đỉnh đa

giác trên bề mặt. Phƣơng pháp này lần đầu đƣợc giới thiệu bởi Gouraud [17]. Ông xây dựng

một mẫu bề mặt của khuôn mặt bằng nhiều điểm và nối các điểm này để tạo thành một lớp da

gồm các hình đa giác. Ứng dụng phƣơng pháp này, Parke [29] đã tạo ra một mô hình khuôn

mặt, một trong những công trình đầu tiên trong lĩnh vực nghiên cứu hoạt ảnh khuôn mặt con

ngƣời. Mô hình này bao gồm khoảng 250 hình đa giác đƣợc tạo thành từ 400 đỉnh. Do khuôn

mặt con ngƣời gần nhƣ đối xứng, nên chỉ cần tạo ra một nửa mô hình khuôn mặt, còn nửa kia

là sự lặp lại đối xứng. Parke tập trung vào tốc độ và chất lƣợng của quá trình kết xuất đồ họa

(render) khi tạo ra mô hình khuôn mặt. Ông giảm đến mức tối thiểu số lƣợng hình đa giác

(nhƣng vẫn đảm bảo chất lƣợng tốt) để có thể đạt đƣợc kết xuất đồ họa nhanh hơn. Để thu

đƣợc độ tô bóng mịn (smooth shading), ông sử dụng thêm nhiều đa giác ở các vùng có độ

cong lớn (mũi, miệng, quanh mắt và đỉnh cằm) và giảm bớt ở các vùng có độ cong nhỏ (trán,

má và cổ). Các đa giác ở vùng dƣới mắt, cánh mũi, bờ môi, khóe miệng, những nơi xuất hiện

nếp nhăn trên khuôn mặt, đƣợc thiết kế sao cho cạnh của chúng trùng với các nếp gấp. Các đa

giác nằm trong vùng xuất hiện các đƣờng biên màu sắc, nhƣ môi và lông mày, đƣợc thiết kế

sao cho cạnh của chúng trùng với các đƣờng biên này.

Nhiều hệ thống hoạt ảnh khuôn mặt khác sử dụng lƣới đa giác để mô phỏng lớp da của

khuôn mặt. Ví dụ nhƣ mô hình khuôn mặt CANDIDE [36] và mô hình khuôn mặt Greta [32].

CANDIDE ban đầu là một mô hình khuôn mặt tham số hóa do Rydfalk tạo nên tại Linkoping

Page 14: NGHIÊN CỨU NHÂN BẢN CHUYỂN ĐỘNG KHUÔN MẶT TRÊN CÁC …repository.vnu.edu.vn/bitstream/VNU_123/15154/1/V_L0_01858.pdfTRƯỜNG ĐẠI HỌC CÔNG NGHỆ ĐẶNG TUẤN

Image Coding Group, đƣợc xây dựng riêng nhằm mã hóa khuôn mặt con ngƣời. Nó bao gồm

75 đỉnh và 100 tam giác, cho phép tái xây dựng khuôn mặt một cách nhanh chóng ngay ở các

máy tính dung lƣợng thấp. Những phiên bản nâng cao của mô hình khuôn mặt này đã ra đời

sau đó. Nhiều đỉnh đa giác đƣợc thêm vào để che phủ toàn bộ phần đầu (gồm cả tóc và răng)

và phần vai (Candide-2 [45]), và để đơn giản hóa hoạt ảnh bằng các tham số hoạt ảnh mặt

MPEG-4 (Candide-3 [1]). Greta là một mô hình khuôn mặt phù hợp với các đặc điểm kỹ thuật

MPEG-4 và chứa khoảng 15000 đa giác. Mô hình này là nỗ lực lớn nhằm nâng cao mức độ

chi tiết trên các vùng biểu hiện của mô hình khuôn mặt trong giao tiếp trao đổi thông tin và

thể hiện cảm xúc. Đó là những vùng gồm miệng, mắt, trán và nếp nhăn kéo từ cánh mũi qua

khóe miệng. Nhiều đa giác đƣợc thiết kế và đặt tại các vùng này. Ngoài ra, trán và nếp nhăn

qua khóe miệng đƣợc đặc biệt chú ý. Các đa giác ở vùng trán đƣợc tổ chức thành một lƣới các

đƣờng ngang cách đều, để tạo nên những nếp nhăn ngang xuất hiện khi nhƣớn lông mày bằng

các kỹ thuật tạo bề mặt sần (bump mapping techniques) [27]. Các đa giác nằm ở nếp nhăn qua

khóe miệng đƣợc sắp xếp sao cho sự phân tách giữa vùng da bị kéo căng gần miệng và vùng

da ở má có thể tạo nên nếp nhăn rõ nét khi khuôn mặt cƣời.

Hình 1.1: Các mô hình khuôn mặt CANDIDE (trái) và Greta (phải)

Khi tạo mô hình bề mặt của khuôn mặt, bên dƣới lớp da gồm các đa giác, ngƣời ta sử

dụng thêm các lớp nhƣ lớp mỡ dƣới da, lớp cơ và bề mặt sọ để hình thành nên mô hình cơ dựa

trên vật lý học [19, 24].

Để tạo mô hình một cá nhân cụ thể, ta sử dụng ba kỹ thuật. Kỹ thuật thứ nhất là xây

dựng thủ công mô hình khuôn mặt cho một cá nhân bằng các kỹ thuật tạo mô hình 3D nhƣ

AutoCAD và 3DMax. Đây là một công việc rất tốn thời gian và đòi hỏi sự kiên trì. Kỹ thuật

thứ hai, đƣợc gọi là phƣơng pháp quang trắc (photogrammetric measurement), xây dựng mô

hình khuôn mặt từ nhiều tấm ảnh chụp đầu của cá nhân từ những góc độ khác nhau. Để tìm

đƣợc mối quan hệ giữa các bức ảnh với mô hình 3D, ta cần xác định đƣợc những điểm đặc

trƣng trên các bức ảnh. Kỹ thuật thứ ba là sử dụng máy quét laze để quét hình các khuôn mặt

thật, rồi sử dụng hình ảnh đó làm chất liệu cho mô hình khuôn mặt. Các máy quét laze cho

Page 15: NGHIÊN CỨU NHÂN BẢN CHUYỂN ĐỘNG KHUÔN MẶT TRÊN CÁC …repository.vnu.edu.vn/bitstream/VNU_123/15154/1/V_L0_01858.pdfTRƯỜNG ĐẠI HỌC CÔNG NGHỆ ĐẶNG TUẤN

phép thu đƣợc dữ liệu 3D rất chi tiết nhƣ màu sắc hay mức xám của các điểm đƣợc quét. Việc

kết hợp những dữ liệu này có thể tạo nên những mô hình tĩnh chân thực đến bất ngờ.

Việc mô phỏng khuôn mặt con ngƣời bằng các đa giác có nhiều ƣu điểm. Nhờ phƣơng

pháp xây dựng các bề mặt đa giác, nhiều vấn đề đƣợc giải quyết thông qua các thuật toán, ví

dụ nhƣ việc xác định một phần hay toàn bộ đối tƣợng nằm bên trong không gian quan sát,

phát hiện các bề mặt ẩn, xác định độ tô bóng của các bề mặt hiển thị… Những thuật toán này

xử lý nhanh và đỡ tốn kém hơn so với thuật toán dành cho các bề mặt cấp độ cao hơn, chúng

cũng đƣợc bổ sung vào phần cứng của máy tính. Ngoài ra, việc phát triển các thuật toán tô

bóng Grouraud [17] và tô bóng Phong [10] cho phép tạo đƣờng cong liên tục trên một bề mặt

xây dựng từ các đa giác. Tuy nhiên, nếu chỉ sử dụng một lƣợng nhỏ đa giác nhƣ trong mô

hình Parke [29] và mô hình khuôn mặt CANDIDE [36], thì những thuật toán này không thể

che dấu hoàn toàn độ phẳng của bề mặt khuôn mặt.

Tạo mô hình khuôn mặt bằng các bề mặt tham số

Có thể tạo mô hình khuôn con ngƣời bằng một bề mặt tham số. Mục đích là tìm kiếm

một phƣơng trình toán học để biểu diễn bề mặt khuôn mặt. Tuy nhiên, rất khó tìm ra một

phƣơng trình cho phép biểu diễn khuôn mặt một cách chi tiết. Cách tiếp cận đƣợc ƣa chuộng

hơn là tạo ra một bề mặt bằng cách kết nối một tập hợp các mảng tham số. Những mảng này

phải liên kết với các mảng kế tiếp tại đƣờng biên. Đây thƣờng đƣợc gọi là tính chất liên tục

C0. Độ mịn của toàn bộ bề mặt đƣợc đánh giá thông qua tính chất liên tục ở các bậc cao hơn.

Bề mặt đạt đƣợc liên tục C1 khi các mảng (đƣợc biểu diễn bằng đạo hàm bậc nhất của các

mảng ban đầu) đạt liên tục tại các đƣờng biên, liên tục C2 là liên tục đối với đạo hàm bậc

hai… Bề mặt liên tục ở bậc càng cao thì càng mịn. Bề mặt đƣợc tạo nên bởi các mảng này

thƣờng đƣợc xác định bởi một tập hợp các điểm đƣợc gọi là “điểm điều khiển” (control

points). Ta có thể làm mô hình khuôn mặt hoạt ảnh bằng việc điều chỉnh các điểm điều khiển

này. Các điểm điều khiển thƣờng đƣợc sắp xếp thành một lƣới kích thƣớc :)1()1( mn

mjniW ji 0,0,, . Các điểm nằm trên bề mặt, ),( vuw , đƣợc xác định là tổng trọng

số của các điểm điều khiển jiW , :

m

i

n

jjiji WvNuNvuw

0 0,)()(),(

trong đó )(uNi và )(vN j là các hàm cơ bản. Một hàm cơ bản biểu diễn một đƣờng cong

trên mặt phẳng hai chiều. Nhƣ vậy, về mặt trực giác, bề mặt đƣợc tạo nên bằng cách kết hợp

nhiều đƣờng cong. Những đƣờng cong này đƣợc lựa chọn một cách cẩn thận sao cho bề mặt

đƣợc tạo nên đạt độ mịn cần thiết. Ngƣời ta thƣờng chọn các đƣờng cong spline do sự đơn

giản và tính chất liên tục bậc cao của chúng. Hình 1.2 là một ví dụ về bề mặt đƣợc tạo bởi các

mảng tham số nhƣ thế này.

Page 16: NGHIÊN CỨU NHÂN BẢN CHUYỂN ĐỘNG KHUÔN MẶT TRÊN CÁC …repository.vnu.edu.vn/bitstream/VNU_123/15154/1/V_L0_01858.pdfTRƯỜNG ĐẠI HỌC CÔNG NGHỆ ĐẶNG TUẤN

Hình 1.2: Một bề mặt B-spline

TÀI LIỆU THAM KHẢO

1. Ahlberg, J. (2001), “Candide-3 – an updated parameterized face”, Technical Report

Report No. LiTH-ISY-R-2326, Dept. of Electrical Engineering, Linkping, University,

Sweden.

2. André, E., Herzog, G., and Rist, T. (1997), “Generating multimedia presentations for

robocup soccer trò chơis”, In Kitano, H., editor, RoboCup ’97: Robot Soccer World Cup I,

pages 200–215. Springer-Verlag, New York.

3. Bishop, C. M. (1995), Neural Networks for Pattern Recognition. Oxford University Press,

Oxford.

4. Blumberg, B., Downie, M., Ivanov, Y. A., Berlin, M., Johnson, M. P., and Tomlinson, B.

(2002), “Integrated learning for interactive synthetic characters”, In SIGGRAPH 2002,

pages 417–426.

5. Bors, A. G., Gabbouj, G. (1994), “Minimal topology for a radial basis function neural

network for pattern classification”, Digital Signal Processing: a review jounal, vol. 4, no.

3, pp. 172-188.

6. Broomhead, D. S. and Lowe, D. (1988), “Multivariable functional interpolation and

adaptive networks”, Complex Systems, vol. 2, pages 321-355.

7. Bui The Duy, Heylen, D., and Nijholt, A. (2003a), “Improvements on a simple muscle-based

3d face for realistic facial expressions”, In 16th International Conference on Computer

Animation and Social Agents (CASA-2003), pages 33–40, Los Alamos, CA. IEEE Computer

Society.

8. Bui The Duy, Heylen, D., Poel, M., and Nijholt, A. (2003b), “Exporting vector muscles for

facial animation”. In Butz, A., Krger, A., and Olivier, P., editors, Proceedings International

Symposium on Smart Graphics 2003, Berlin, Lecture Notes in Computer Science, Springer.

9. Bui The Duy, Poel, M., Heylen, D., and Nijholt, A. (2003c), “Automatic face morphing for

transferring facial animation”, In Proceedings 6th IASTED International Conference on

Computers, Graphics, and Imaging (CGIM 2003), Anaheim/Calgary/Zurich, ACTA Press.

Page 17: NGHIÊN CỨU NHÂN BẢN CHUYỂN ĐỘNG KHUÔN MẶT TRÊN CÁC …repository.vnu.edu.vn/bitstream/VNU_123/15154/1/V_L0_01858.pdfTRƯỜNG ĐẠI HỌC CÔNG NGHỆ ĐẶNG TUẤN

10. Bui Tuong Phong (1975), “Illumination for computer generated pictures”,

Communications of the ACM, 18(6).

11. Cassell, J., Sullivan, J., Prevost, S., and Churchill, E., editors (2000), Embodied

Conversational Agents, The MIT Press.

12. Chen, S., Cowan, C. F. N., Grant, P. M. (1991), “Orthogonal least squares learning

algorithm for radial basis function networks”, IEEE Trans. On Neural Networks, vol. 2,

no. 2, pp. 302-309.

13. Cohen, M. M. and Massaro, D. W. (1993), “Modeling coarticulation in synthetic visual

speech”, In Magnenat Thalmann, N. and Thalmann, D., editors, Models and Techniques in

Computer Animation, pages 139–156, Springer, Tokyo.

14. Eck, M. (1991), “Interpolation methods for reconstruction of 3d surfaces from sequences

of planar slices”, CAD und Computergraphik, 13(5).

15. Ekman, P. and Friesen, W. V. (1978), “Facial Action Coding System”, Consulting

Psychologists Press, Palo Alto, CA.

16. Goldberg, D. E. (1989), Genetic Algorithms in Search, Optimization, and Machine

Learning, Addison-Wesley, Reading, MA.

17. Gouraud, H. (1971), Computer display of curved surfaces. PhD thesis, Dept. of Electrical

Engineering, University of Utah.

18. Hoch, M., Fleischmann, G., and Girod, B. (1994), “Modeling and animation of facial

expressions based on b-splines”, Visual Computer, 11.

19. Kahler, K., Haber, J., and Seidel, H. P. (2001), “Geometry-based muscle modeling for

facial animation”. In Watson, B. and Buchanan, J. W., editors, Proceedings of Graphics

Interface 2001, pages 37–46.

20. Kahler, K., Haber, J., Yamauchi, H., and Seidel, H. P. (2002), “Head shop: Generating

animated head models with anatomical structure”, In Spencer, S. N., editor, Proceedings

of the 2002 ACM SIGGRAPH Symposium on Computer Animation (SCA-02), pages 55–

64, New York, ACM Press.

21. Kalra, P., Mangili, A., Magnenat-Thalmann, N., and Thalmann, D. (1992), “Simulation of

facial muscle actions based on rational free form deformations”, In Kilgour, A. and

Kjelldahl, L., editors, Computer Graphics Forum (EURO-GRAPHICS ’92 Proceedings),

volume 11 (3), pages 59–69.

22. King, S. A., Parent, R. E., and Olsafsky, B. (2000), “An anatomically-based 3d parametric

lip model to support facial animation and synchronized speech”, In Proceedings of

Deform 2000, pages 7–19.

23. Laird, J. E. and van Lent, M. (2000), “Human-level ai’s killer application: Interactive

computer trò chơis”, In Proceedings of the Seventeenth National Conference on Artificial

Intelligence and Twelfth Conference on Innovative Applications of Artificial Intelligence,

AAAI Press / The MIT Press.

Page 18: NGHIÊN CỨU NHÂN BẢN CHUYỂN ĐỘNG KHUÔN MẶT TRÊN CÁC …repository.vnu.edu.vn/bitstream/VNU_123/15154/1/V_L0_01858.pdfTRƯỜNG ĐẠI HỌC CÔNG NGHỆ ĐẶNG TUẤN

24. Lee, Y., Terzopoulos, D., and Waters, K. (1995), “Realistic face modeling for animation”,

In Cook, R., editor, SIGGRAPH 95 Conference Proceedings, Annual Conference Series,

pages 55–62. ACM SIGGRAPH, Addison Wesley.

25. Magnenat-Thalmann, N., Primeau, E., and Thalmann, D. (1988), “Abstract muscle action

procedures for human face animation”, The Visual Computer, 3(5):290–297.

26. Mani, M. V. and Ostermann, J. (2001), “Cloning of MPEG-4 face models”, In

International Workshop on Very Low Bit rate Video Coding (VLBV01).

27. Moubaraki,L., Ohya, J., and Kishino, F. (1995), “Realistic 3D facial animation in virtual

space teleconferencing”, In 4th IEEE International workshop on Robot and Human

Communication.

28. Noh, J. and Neumann, U. (2001), “Expression cloning”, In Fiume, E., editor, SIGGRAPH

2001, Computer Graphics Proceedings, Annual Conference Series, pages 277–288. ACM

Press / ACM SIGGRAPH.

29. Parke, F. I. (1972), Computer generated animation of faces, Master’s thesis, Dept. of

Electrical Engineering, Division of Computer Science, University of Utah.

30. Parke, F. I. (1974), A parametric model for human faces, PhD thesis, University of Utah.

31. Parke, F. I. and Waters, K. (1996), Computer Facial Animation, A K Peters. ISBN 1-

56881-014-8.

32. Pasquariello, S. and Pelachaud, C. (2001), “Greta: A simple facial animation engine”, In

6th Online World Conference on Soft Computing in Industrial Appications, Session on

Soft Computing for Intelligent 3D Agents.

33. Platt, S. M. and Badler, N. I. (1981), “Animating facial expression”, Computer Graphics,

13(3):245–252.

34. Poggio, T., Girosi, F. (1990), “Network for approximation and learning”, Proc. IEEE, vol. 78,

no. 9, pp. 1481-1497.

35. Rickel, J. and Johnson, W. L. (1998), “Steve: A pedagogical agent for virtual reality”, In

Proceedings of the Second International Conference on Autonomous Agents.

36. Rydfalk, M. (1987), “Candide, a parameterized face”, Technical Report, Report No. LiTH-

ISY-I-866, Dept. of Electrical Engineering, Linkping University, Sweden.

37. Terzopoulos, D. and Waters, K. (1990), “Physically-based facial modelling, analysis, and

animation”, The Journal of Visualization and Computer Animation, 1(2): 73–80.

38. Theune, M., Faas, S., Heylen, D., andNijholt, A. (2003), “Thevirtualstoryteller: Story

creation by intelligent agents”, In Proceedings TIDSE 03: Technologies for Interactive

Digital Storytelling and Entertainment, pages 204–215, Fraunhofer IRB Verlag.

39. Tou, J. T., Gonzalez, R. C. (1974), Pattern Recognition, Reading, MA: Addison –

Wesley.

40. Ulgen, F. (1997), “A step toward universal facial animation via volume morphing”, In 6th

IEEE International Workshop on Robot and Human communication, pages 358–363.

Page 19: NGHIÊN CỨU NHÂN BẢN CHUYỂN ĐỘNG KHUÔN MẶT TRÊN CÁC …repository.vnu.edu.vn/bitstream/VNU_123/15154/1/V_L0_01858.pdfTRƯỜNG ĐẠI HỌC CÔNG NGHỆ ĐẶNG TUẤN

41. Waite, C. (1989), The facial action control editor, face: A parametric facial expression

editor for computer generated animation, Master’s thesis, MIT, Media Arts and Sciences.

42. Wang, C. L. (1993), Langwidere: A hierarchical spline based facial animation system

with simulated muscles. Master’s thesis, University of Calgary.

43. Waters, K. (1987), “A muscle model for animating three-dimensional facial expression”.

In Stone, M. C., editor, Computer Graphics (SIGGRAPH ’87 Proceedings), pages 17–24.

44. Waters, K. (1996),

http://crl.research.compaq.com/publications/books/waters/Appendix1/appendix1.html.

45. Welsh, B. (1991), Model-based coding of images, PhD thesis, Essex University.

46. Wikipedia (2008), Ellipsoid, [http://en.wikipedia.org/wiki/Ellipsoid]

47. Wikipedia (2008), Genetic Algorithm, [http://en.wikipedia.org/wiki/Genetic_algorithm]

48. Wikipedia (2008), Mahalanobis Distance,

[http://en.wikipedia.org/wiki/Mahalanobis_distance]

49. Wikipedia (2008), Radial Basis Function,

[http://en.wikipedia.org/wiki/Radial_basis_function]

50. Wu, Y., Magnenat-Thalmann, N., and Thalmann, D. (1994), “A plastic-visco-elastic

model for wrinkles in facial animation and skin”, In Proc. 2nd Pacific Conference on

Computer Graphics and Applications.

Page 20: NGHIÊN CỨU NHÂN BẢN CHUYỂN ĐỘNG KHUÔN MẶT TRÊN CÁC …repository.vnu.edu.vn/bitstream/VNU_123/15154/1/V_L0_01858.pdfTRƯỜNG ĐẠI HỌC CÔNG NGHỆ ĐẶNG TUẤN