mỐi quan hỆ giỮa toÁn hỌc vÀ khoa hỌc mÁy...

27
MỐI QUAN HỆ GIỮA TOÁN HỌC VÀ KHOA HỌC MÁY TÍNH

Upload: others

Post on 03-Oct-2020

2 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: MỐI QUAN HỆ GIỮA TOÁN HỌC VÀ KHOA HỌC MÁY TÍNHfit.hnue.edu.vn/~trungnc/TextBookAndLectureNote/Nhap mon KHMT… · Introduction to Computer Science FIT – HNUE 2020

MỐI QUAN HỆ GIỮA TOÁN HỌC

VÀ KHOA HỌC MÁY TÍNH

Page 2: MỐI QUAN HỆ GIỮA TOÁN HỌC VÀ KHOA HỌC MÁY TÍNHfit.hnue.edu.vn/~trungnc/TextBookAndLectureNote/Nhap mon KHMT… · Introduction to Computer Science FIT – HNUE 2020

Introduction to Computer Science FIT – HNUE 2020

Toán học

Toán học thuần túy (Pure Math)

Nghiên cứu, phát triển nội tại của Toán học

Phát triển theo chiều sâu, giải quyết những

vấn đề mới, khó của Toán học

Toán học ứng dụng (Applied Math)

Toán học cần cho cuộc sống

Nền tảng cho các khoa học khác

Phát triển theo động lực của các khoa học

khác, như CNTT, Lý, Hóa,…

2

Page 3: MỐI QUAN HỆ GIỮA TOÁN HỌC VÀ KHOA HỌC MÁY TÍNHfit.hnue.edu.vn/~trungnc/TextBookAndLectureNote/Nhap mon KHMT… · Introduction to Computer Science FIT – HNUE 2020

Introduction to Computer Science FIT – HNUE 2020

Các lĩnh vực ứng dụng của Toán học

Toán học

trong

CNTT

Vật lý

Hóa

Sinh học

….

3

Page 4: MỐI QUAN HỆ GIỮA TOÁN HỌC VÀ KHOA HỌC MÁY TÍNHfit.hnue.edu.vn/~trungnc/TextBookAndLectureNote/Nhap mon KHMT… · Introduction to Computer Science FIT – HNUE 2020

Introduction to Computer Science FIT – HNUE 2020

Khoa học máy tính

Các thuật ngữ

Khoa học máy tính (computer science)

Tin học (informatics)

Công nghệ thông tin (information technology)

Bản chất

Là khoa học về xử lý thông tin tự động bằng máy

tính điện tử.

Xử lý thông tin là quá trình biến đổi dữ liệu từ dạng

này sang dạng khác để thu được tri thức

4

Page 5: MỐI QUAN HỆ GIỮA TOÁN HỌC VÀ KHOA HỌC MÁY TÍNHfit.hnue.edu.vn/~trungnc/TextBookAndLectureNote/Nhap mon KHMT… · Introduction to Computer Science FIT – HNUE 2020

Introduction to Computer Science FIT – HNUE 2020

Khoa học máy tính

5

Page 6: MỐI QUAN HỆ GIỮA TOÁN HỌC VÀ KHOA HỌC MÁY TÍNHfit.hnue.edu.vn/~trungnc/TextBookAndLectureNote/Nhap mon KHMT… · Introduction to Computer Science FIT – HNUE 2020

Introduction to Computer Science FIT – HNUE 2020

Toán học và KHMT

Toán học là nền tảng của KHMT

Quá trình biến đổi dữ liệu chính là các biến đổi toán học, nên

cốt lõi của KHMT là toán học

Các lý thuyết, mô hình toán học làm cơ sở cho sự phát triển

của KHMT

KHMT sử dụng máy tính để giải quyết một số vấn đề

của toán học

Các bài toán có độ phức tạp hàm mũ

Tìm nghiệm của bài toán tối ưu

….

6

Page 7: MỐI QUAN HỆ GIỮA TOÁN HỌC VÀ KHOA HỌC MÁY TÍNHfit.hnue.edu.vn/~trungnc/TextBookAndLectureNote/Nhap mon KHMT… · Introduction to Computer Science FIT – HNUE 2020

Introduction to Computer Science FIT – HNUE 2020

Alan Turing – Cha đẻ của KHMT

Nhà toán học, logic học và mật mã học người

Anh thường được xem là cha đẻ của ngành

KHMT.

Phép thử Turing là một trong những cống hiến

của ông trong ngành trí tuệ nhân tạo; đặt ra câu

hỏi máy tính có thể suy nghĩ như con người?

Máy Turing, là một mô hình thiết bị xử lý các kí

tự, có thể thực hiện được tất cả các thuật toán; các

hàm toán học tính được đều có thể thực hiện

được.

Giải thưởng Turing, tương đương giải thưởng

Nobel, trao cho những cá nhân có đóng góp nổi

bật trong lĩnh vực KHMT.

7

Page 8: MỐI QUAN HỆ GIỮA TOÁN HỌC VÀ KHOA HỌC MÁY TÍNHfit.hnue.edu.vn/~trungnc/TextBookAndLectureNote/Nhap mon KHMT… · Introduction to Computer Science FIT – HNUE 2020

Introduction to Computer Science FIT – HNUE 2020

7 bài toán của thế kỷ 21

Ngày 24 tháng 5 năm 2000, Viện Toán học Clay công

bố và thách thức 7 bài toán của thế kỷ 21

Các bài toán:

P versus NP

The Hodge Conjecture

The Poincaré Conjecture (solved 2006)

The Riemann Hypothesis 4. Yang-Mills Existence and Mass

Gap

Navier-Stokes Existence and Smoothness

The Birch and Swinnerton-Dyer Conjecture

8

Page 9: MỐI QUAN HỆ GIỮA TOÁN HỌC VÀ KHOA HỌC MÁY TÍNHfit.hnue.edu.vn/~trungnc/TextBookAndLectureNote/Nhap mon KHMT… · Introduction to Computer Science FIT – HNUE 2020

Introduction to Computer Science FIT – HNUE 2020

Bài toán “P versus NP”

“P versus NP” là một bài toán mở quan trọng trong lý

thuyết khoa học máy tính. Bài toán đặt ra là có phải bất kì

vấn đề nào có lời giải có thể được kiểm chứng "nhanh

chóng" cũng có thể được giải một cách "nhanh chóng”.

Cụm từ "nhanh chóng“ ám chỉ thời gian đa thức. Lớp các

bài toán có lời giải thực thi trong thời gian đa thức được

gọi là P. Lớp các bài toán mà lời giải có thể được kiểm tra

tính đúng sai trong thời gian đa thức là lớp NP.

9

Page 10: MỐI QUAN HỆ GIỮA TOÁN HỌC VÀ KHOA HỌC MÁY TÍNHfit.hnue.edu.vn/~trungnc/TextBookAndLectureNote/Nhap mon KHMT… · Introduction to Computer Science FIT – HNUE 2020

Introduction to Computer Science FIT – HNUE 2020

Ví dụ: bài toán tìm tập con

Có tập hợp con nào của {−2, −3, 15, 14, 7, −10} có tổng bằng 0?

Lời giải: {−2, −3, −10, 15} có tổng bằng 0 có thể được kiểm

chứng dễ dàng bằng cách cộng các số đó lại.

Tuy nhiên, hiện chưa có thuật toán nào để tìm ra một tập hợp như

thế trong thời gian đa thức (có một thuật toán đơn giản thực thi

trong thời gian hàm mũ là kiểm tra tất cả 2n-1 tập con).

Như vậy, bài toán này nằm trong NP (kiểm chứng nhanh chóng)

nhưng chưa biết có nằm trong P (giải nhanh chóng) hay không.

Có rất nhiều bài toán như vậy. Chưa ai có thể chứng minh được

rằng, với bất kỳ bài toán nào như vậy, thực sự cần rất nhiều thời

gian để giải.

10

Page 11: MỐI QUAN HỆ GIỮA TOÁN HỌC VÀ KHOA HỌC MÁY TÍNHfit.hnue.edu.vn/~trungnc/TextBookAndLectureNote/Nhap mon KHMT… · Introduction to Computer Science FIT – HNUE 2020

Introduction to Computer Science FIT – HNUE 2020

Ví dụ: bài toán SAT

11

Page 12: MỐI QUAN HỆ GIỮA TOÁN HỌC VÀ KHOA HỌC MÁY TÍNHfit.hnue.edu.vn/~trungnc/TextBookAndLectureNote/Nhap mon KHMT… · Introduction to Computer Science FIT – HNUE 2020

Introduction to Computer Science FIT – HNUE 2020

Ví dụ: bài toán SAT

12

Page 13: MỐI QUAN HỆ GIỮA TOÁN HỌC VÀ KHOA HỌC MÁY TÍNHfit.hnue.edu.vn/~trungnc/TextBookAndLectureNote/Nhap mon KHMT… · Introduction to Computer Science FIT – HNUE 2020

Introduction to Computer Science FIT – HNUE 2020

Thời gian đa thức và hàm mũ

13

Page 14: MỐI QUAN HỆ GIỮA TOÁN HỌC VÀ KHOA HỌC MÁY TÍNHfit.hnue.edu.vn/~trungnc/TextBookAndLectureNote/Nhap mon KHMT… · Introduction to Computer Science FIT – HNUE 2020

Introduction to Computer Science FIT – HNUE 2020

Giải pháp khi dữ liệu lớn

Điều gì xảy ra khi dữ liệu lớn, N>106?

Cần thuật toán heuristic nhanh, gần đúng

Chú trọng đến giá của tính toán

Cần luôn điều khiển được độ chính xác

Đạt kết quả tốt nhất trong thời gian và tài nguyên cho phép

Sử dụng máy tính song song

14

Page 15: MỐI QUAN HỆ GIỮA TOÁN HỌC VÀ KHOA HỌC MÁY TÍNHfit.hnue.edu.vn/~trungnc/TextBookAndLectureNote/Nhap mon KHMT… · Introduction to Computer Science FIT – HNUE 2020

Introduction to Computer Science FIT – HNUE 2020

Toán học trong một số lĩnh vực của

KHMT

Mật mã và an toàn thông tin (cryptography &

security)

Học máy (machine learning)

Khai phá dữ liệu (data mining)

Xử lý ngôn ngữ tự nhiên

Tin-sinh học (bioinformatics)

….

15

Page 16: MỐI QUAN HỆ GIỮA TOÁN HỌC VÀ KHOA HỌC MÁY TÍNHfit.hnue.edu.vn/~trungnc/TextBookAndLectureNote/Nhap mon KHMT… · Introduction to Computer Science FIT – HNUE 2020

Introduction to Computer Science FIT – HNUE 2020

Mật mã và an toàn thông tin

Là nghiên cứu về bí mật của truyền tin (truyền tin trong

điều kiện có kẻ địch).

An toàn mạng và máy tính: quản lý sự truy nhập máy

tính và tin cậy của thông tin, và các ứng dụng như: ATM

cards, computer passwords, e-commerce, ...

Là lĩnh nghiên cứu lâu đời

Có tầm quan trọng

Có ảnh hưởng đến xã hội

16

Page 17: MỐI QUAN HỆ GIỮA TOÁN HỌC VÀ KHOA HỌC MÁY TÍNHfit.hnue.edu.vn/~trungnc/TextBookAndLectureNote/Nhap mon KHMT… · Introduction to Computer Science FIT – HNUE 2020

Introduction to Computer Science FIT – HNUE 2020

Mật mã và an toàn thông tin

Mã hoá đối xứng

Dùng cùng một chìa khoá để khoá và mở thông tin cần được giữ bí mật

Cả bên gửi và nhận thông tin đều phải có chìa khoá này

Mã hoá bất đối xứng

Dùng hai chìa khoá khác nhau để

khoá và mở khoá thông tin bí mật.

Public key sẽ được công khai và

được gửi đi đến đối tượng cần mã

hoá thông tin, còn private key được

giữ bí mật

Dựa trên việc tìm một thuật toán để

nhân tử hóa các số trong thời gian đa

thức (như RSA)

17

Page 18: MỐI QUAN HỆ GIỮA TOÁN HỌC VÀ KHOA HỌC MÁY TÍNHfit.hnue.edu.vn/~trungnc/TextBookAndLectureNote/Nhap mon KHMT… · Introduction to Computer Science FIT – HNUE 2020

Introduction to Computer Science FIT – HNUE 2020

Học máy (machine learning)

Học máy là một lĩnh vực nghiên cứu và phát triển các thuật toán

có thể học được từ dữ liệu

Có nhiều bài toán đặt ra

Bài toán phân lớp (classification)

Bài toán hồi quy (regression)

Bài toán phân cụm (clustering)

Bản chất của các thuật toán học máy là tìm nghiệm của một bài

toán tối ưu

Được phát biểu dưới dạng một bài toán tối ưu có hoặc không có

ràng buộc

Quá trình giải bài toán là tìm giá trị tối ưu của các tham số mô hình

dựa trên dữ liệu đã có

18

Page 19: MỐI QUAN HỆ GIỮA TOÁN HỌC VÀ KHOA HỌC MÁY TÍNHfit.hnue.edu.vn/~trungnc/TextBookAndLectureNote/Nhap mon KHMT… · Introduction to Computer Science FIT – HNUE 2020

Introduction to Computer Science FIT – HNUE 2020

Học máy (machine learning)

Bài toán học máy

gồm hai pha

Pha huấn luyện mô

hình (training

phase)

Kiểm thử mô hình

(testing phase)

ML có nhiều ứng

dụng trong AI

19

Page 20: MỐI QUAN HỆ GIỮA TOÁN HỌC VÀ KHOA HỌC MÁY TÍNHfit.hnue.edu.vn/~trungnc/TextBookAndLectureNote/Nhap mon KHMT… · Introduction to Computer Science FIT – HNUE 2020

Introduction to Computer Science FIT – HNUE 2020

Khai phá dữ liệu (data mining)

Là quá trình khám phá tri

thức (knowledge) từ các

nguồn dữ liệu cho trước

Tri thức có thể tồn tại

dưới dạng các luật (rules),

các mẫu (patterns), hoặc

các mô hình (models)

Có ứng dụng trong nhiều

lĩnh vực khác nhau của

đời sống xã hội

20

Page 21: MỐI QUAN HỆ GIỮA TOÁN HỌC VÀ KHOA HỌC MÁY TÍNHfit.hnue.edu.vn/~trungnc/TextBookAndLectureNote/Nhap mon KHMT… · Introduction to Computer Science FIT – HNUE 2020

Introduction to Computer Science FIT – HNUE 2020

Khai phá dữ liệu (data mining)

Tiến trình khai phá tri thức từ dữ

liệu

Các mô hình toán học được dùng

trong các bước khác nhau

21

Page 22: MỐI QUAN HỆ GIỮA TOÁN HỌC VÀ KHOA HỌC MÁY TÍNHfit.hnue.edu.vn/~trungnc/TextBookAndLectureNote/Nhap mon KHMT… · Introduction to Computer Science FIT – HNUE 2020

Introduction to Computer Science FIT – HNUE 2020

Khai phá dữ liệu (data mining)

22

Page 23: MỐI QUAN HỆ GIỮA TOÁN HỌC VÀ KHOA HỌC MÁY TÍNHfit.hnue.edu.vn/~trungnc/TextBookAndLectureNote/Nhap mon KHMT… · Introduction to Computer Science FIT – HNUE 2020

Introduction to Computer Science FIT – HNUE 2020

Xử lý ngôn ngữ tự nhiên

Là quá trình giúp cho

máy tính (computer) có

thể hiểu và nói chuyện

được với con người

thông qua một ngôn ngữ

tự nhiên

Là lĩnh vực nghiên cứu

sôi động và có nhiều

ứng dụng thực tế nhất

hiện nay

Làm thế nào để con người có thể nói

chuyện được với máy tính thông qua

ngôn ngữ của con người?

23

Page 24: MỐI QUAN HỆ GIỮA TOÁN HỌC VÀ KHOA HỌC MÁY TÍNHfit.hnue.edu.vn/~trungnc/TextBookAndLectureNote/Nhap mon KHMT… · Introduction to Computer Science FIT – HNUE 2020

Introduction to Computer Science FIT – HNUE 2020

Xử lý ngôn ngữ tự nhiên

Có nhiều bài toán đã và

đang được giải quyết

Dịch máy; Tóm tắt văn bản;

Phát hiện xu thế người

dùng; Chatbot,…

Sử dụng các mô hình toán

học

Các mô hình thống kê; Các

mô hình mạng nở-ron; Mô

hình học sâu (deep learning)

Đã có những bước tiến đáng

kể, tuy nhiên, gặp nhiều thách

thức, vì sao?

24

Page 25: MỐI QUAN HỆ GIỮA TOÁN HỌC VÀ KHOA HỌC MÁY TÍNHfit.hnue.edu.vn/~trungnc/TextBookAndLectureNote/Nhap mon KHMT… · Introduction to Computer Science FIT – HNUE 2020

Introduction to Computer Science FIT – HNUE 2020

Tin-sinh học (bioinformatics)

Lượng dữ liệu sinh học vô cùng lớn, đa

dạng, phức tạp, và được lưu trữ dưới nhiều

dạng khác nhau

Đồ thị, chuỗi, ma trận số, text,…

Có nhiều bài toán đặt ra

Xây dựng cây phân loài, để hiểu được quan

hệ giữa các loài sinh vật

Gióng hang các hệ gen để phát hiện các

điểm đặc biệt, như đột biến, khiếm khuyết,

quan hệ huyết thống,…

Tìm kiếm các vùng chứa thông tin di

truyền (gen)

….

25

Page 26: MỐI QUAN HỆ GIỮA TOÁN HỌC VÀ KHOA HỌC MÁY TÍNHfit.hnue.edu.vn/~trungnc/TextBookAndLectureNote/Nhap mon KHMT… · Introduction to Computer Science FIT – HNUE 2020

Introduction to Computer Science FIT – HNUE 2020

Tin-sinh học (bioinformatics)

Cần các mô hình toán học đủ mạnh để mô hình hóa

lượng dữ liệu lớn, đa dạng.

26

Page 27: MỐI QUAN HỆ GIỮA TOÁN HỌC VÀ KHOA HỌC MÁY TÍNHfit.hnue.edu.vn/~trungnc/TextBookAndLectureNote/Nhap mon KHMT… · Introduction to Computer Science FIT – HNUE 2020

Introduction to Computer Science FIT – HNUE 2020

Kết luận

Toán học và KHMT có mối quan hệ chặt chẽ,

sâu sắc và căn bản

Các bài toán của KHMT đều phải sử dụng các

mô hình toán học để giải

KHMT đem Toán học đến gần hơn với đời sống

27