บทที่ 1...
DESCRIPTION
บทที่ 1 ระบบคลังข้อมูลและกระบวนการคลังข้อมูล (Data Warehouse and Data Warehousing). 321452 Data Warehouse Design. หัวข้อภายในบทนี้. คลังข้อมูล (Data Warehouse) คลังข้อมูลคืออะไร เหตุใดต้องมีคลังข้อมูล องค์ประกอบหลักของคลังข้อมูล ประโยชน์ของคลังข้อมูล - PowerPoint PPT PresentationTRANSCRIPT
บทท 1 ระบบคลงขอมลและกระบวนการคลงขอมล(Data Warehouse and
Data Warehousing)321452 Data Warehouse Design
หวขอภายในบทน คลงขอมล (Data Warehouse)
คลงขอมลคออะไร เหตใดตองมคลงขอมล องคประกอบหลกของคลงขอมล ประโยชนของคลงขอมล
กระบวนการคลงขอมล (Data Warehousing)
2
คลงขอมล (Data Warehouse) ปจจบนทกองคกรธรกจ ตางตระหนกถงความสำาคญ
ของขอมล (Data) และสารสนเทศ (Information)
เพราะขอมลเปนวตถดบทจะนำาไปใชในการวเคราะห วจย เพอทำาใหธรกจดำาเนนไปไดอยางมประสทธภาพ และสงผลใหเกดกำาไรสงสดตอองคกร
3
คลงขอมล (Data Warehouse) การวดวาการมและการใชขอมลขององคกร จะม
ประโยชนสงสดตอองคกรหรอไมอยางไรนน เราตองมการวดการใชขอมลใน 2 มต ดวยกน คอ การมและการใชขอมลนน เพยงพอหรอไม การมและการใชขอมลนนมคณภาพมากนอยเพยงใด
4
คลงขอมล (Data Warehouse)5
ความเพยงพอ องคกรตองมขอมลเพยงพอตอความตองการ ในขณะ
เดยวกนตองมกระบวนการ วธการ และเครองมอ ทจะใชงานขอมลเหลานนครบถวน
คณภาพ องคกรตองมขอมลทมคณภาพตรงตามตองการ ในขณะ
เดยวกนตองมกระบวนการ วธการ และเครองมอ เพอใหสามารถวเคราะหขอมลไดตรงตามความตองการ
คลงขอมล (Data Warehouse)6
ในสภาพปจจบน องคกรธรกจ มกมระบบสารสนเทศ (Information System) เพอจดการขอมลในแตละดาน
แตละระบบตางมหนาทและความรบผดชอบแตกตางกนไปดวยปจจยบางอยาง เชน ความจำากดของงบประมาณ ณ ขณะในขณะหนง นโยบายของบรษท วสยทศนของผบรหาร ฯลฯ
อาจทำาใหระบบสารสนเทศสำาหรบงานแตละดานอาจ ถกพฒนาขนในเวลาทตางกน เทคโนโลยทตางกน หรอมรปแบบการเกบขอมลทไมเหมอนกน
คลงขอมล (Data Warehouse)7
อาจทำาใหระบบสารสนเทศสำาหรบงานแตละดานอาจจะถกพฒนาขน ในเวลาทตางกน เทคโนโลยทตางกน มรปแบบการเกบขอมลทไมเหมอนกน
สงผลใหเกดปญหาบางอยางขนในการใชงานขอมล ดงตวอยางตอไปน
กรณตวอยาง8
บรษท ABC เปนบรษทททำาธรกจเกยวกบการผลตสนคาประเภทอปกรณอเลกทรอนกส บรษทเรมกอนตงในป 2533 ซงมประวตและรายละเอยดในการพฒนาระบบสารสนเทศ ดงน
ป พ.ศ.
สงทเกดขน
2534
พฒนาระบบคลงสนคา โดยใช Text File เพอเกบขอมล ระบบทำางานบนระบบปฏบตการ DOS และระบบและขอมลน ถกใชงานโดยฝายคลงสนคา
2535
พฒนาระบบเกยวกบการขายสนคา โดยใชฐานขอมล Microsoft Access เพอเกบขอมล ระบบทำางานบนระบบปฏบตการ DOS รวมกบ Windows 3.1 และระบบและขอมลน ถกใชงานและดแลโดยฝายขาย
2539
พฒนาระบบเกยวกบการบรหารงานบคคลโดยใชฐานขอมล Oracle เพอเกบขอมล ระบบทำางานบนระบบปฏบตการ Windows 95 และระบบและขอมลน ถกใชงานและดแลโดยฝายบคคล
กรณตวอยาง9
ในการใชงานระบบสารสนเทศทไดจากคอมพวเตอร นบตงแตป 2540 จนถงปจจบน เกดปญหาในการวเคราะหขอมลหลายกรณ ดงนกรณ
ทคำาอธบาย
1 การระบประเภทสนคาของระบบคลงสนคาและระบบการขายสนคาแตกตางกน เชน ในระบบคลงสนคา อาจกำาหนดวา ทวมรหสสนคาเปน 0001 แตในระบบการขายกลบใหรหสสนคาสำาหรบทวเปน TV115 ทำาใหการตรวจสอบสนคาประเภทหนงๆ ทนำาออกมาจากคลงสนคาถกขายไปเทาไร ทำาไดยาก เพราะระบบการใหรหส (Coding System) แตกตางกน
กรณตวอยาง10
กรณท
คำาอธบาย
2 ระบบการขาย มการเกบขอมลพนกงานขายทงหมดไว เพอการคำานวณคาตอบแทนจากการขาย ในขณะเดยวกน ระบบบรหารงานบคคลกมการเกบขอมลของบคลากรทกคนไวเชนกน เพอบนทกประวตการพจารณาขนเงนเดอน หรอการบนทกเขาทำางาน ซงในบางครงการแกไขขอมลพนกงานขาย อาจดำาเนนการในระบบการขาย แตไมไดแกไขในระบบบรหารงานดวย ทำาใหขอมลบคคลเดยวกนใน 2 ระบบ ไมตรงกน
3 เพอการพจารณาขนเงนเดอนของฝายบรหารงานบคคล จำาเปนตองใชขอมลการขายของพนกงานแตละคน แตเนองจากระบบการเกบขอมลทแตกตางกน(Access VS Oracle) จงทำาใหตองมการถายโอนขอมลจากระบบการขายมายงระบบหรหารงานบคคล เพอใหสามารถนำามาวเคราะหรวมกนได ซงทำาใหเกดความไมคลองตวในการทำางาน
ขอสรปจากกรณตวอยาง11
จากกรณตวอยางน จะเหนวาการพฒนาระบบงานในลกษณะนกอใหเกดปญหาขนในหลายดาน ซงสรปไดดงน การมมาตรฐานของ Hardware, Software และ
รปแบบการเกบมลทแตกตางกน ทำาใหการใชขอมลรวมกนทำาไดยาก (ดงกรณท 3)
เกดความซำาซอนของขอมล (Data Redundancy) หมายถง การมขอมลทมเนอหาเดยวกนอยในหลายๆ แหง ซงเปนการสนเปลองพนทจดเกบ และการดแลรกษาโดยไมจำาเปน (ดงกรณท 2)
ขอสรปจากกรณตวอยาง12
จากการทม Data Redundancy ขน ทำาใหเสยงตอการเกดความไมสอดคลองของขอมล (Data Inconsistency) เมอมขอมลทมเนอหาเดยวกนถกแยกเกบไวในหลายๆ ระบบ หากมการแกไข แลวแกไขไมครบทกระบบ จะทำาใหขอมลตวเดยวกนนนในแตระบบกลบมเนอหาทแตกตางกนได
การทแตระบบมวธการใหรหสของขอมล (Coding System) ทแตกตางกน ทำาใหเกดปญหา หลายมาตรฐาน หรอ มาตรฐานซอน (Multiple Standards) ขน (ดงกรณท 1) ทำาใหการหาหรอระบวาขอมลตวใดในสองระบบเปนขอมลเดยวกนทำาไดยาก รวมทงการอางองขอมลทสอดคลองกนหรอมความสมพนธกนขามระบบกเปนไปไดยากเชนกน นบเปนอปสรรคสำาคญในการวเคราะหขอมลขามธรกจ (Cross-Business Data Analysis)
ขอสรปจากกรณตวอยาง13
รปแบบการพฒนาระบบสารสนเทศดงกรณตวอยางทกลาวมา เราเรยกวา “การพฒนาระบบแบบยงฉาง (Silo-based System Development)” ซงหมายถง การพฒนาระบบสารสนเทศของแตละสวนขนทละสวน
โดยทแตละสวนมมาตรฐานและเทคโนโลยทแตกตางกน เปรยบไดกบยงฉางในทงนา ทแตละแหงตางกมอสระของตนเอง ไมยงเกยวกบยงฉางอนๆ
เพอใหการมและการใชขอมลใหเปนประโยชนสงสดตอองคกร จงไดมแนวคดทจะรวมเอาขอมลจากระบบสารสนเทศตางๆ ขององคกร เขาเปนอนหนงอนเดยวกน เพอลด หรอขจดปญหาการมและการใชขอมลจากระบบสารสนเทศแบบยงฉาง หนทางหนง กคอ การสรางระบบคลงขอมล (Data Warehouse)
คลงขอมลคออะไร14
นยามของคลงขอมล เปนระบบขอมลขนาดใหญทเอออำานวยใหผใชงานสามารถใช
ขอมลไดอยางมประสทธภาพ ขอมลทจดเกบอยในคลงขอมลตองมปรมาณเพยงพอ และเปนขอมลทมคณภาพเพยงพอตอการนำาไปวเคราะห เพอหาคำาตอบทเหมาะสมทางธรกจ การจดเกบตองเอออำานวยตอการใชขอมลเชงวเคราะหใหเปนไปไดโดยงาย สามารถวเคราะหขอมลไดรวดเรว ไมยงยากซบซอน
สวนสำาคญททำาใหระบบคลงขอมล มความแตกตางจากระบบสารสนเทศทวไป คอ คณลกษณะของขอมล ทจดเกบอยในฐานขอมล
คณลกษณะของขอมลในคลงขอมล15
Subject-oriented Data Integrated Data Time Referenced Data Non-Volatile Data
Subject-oriented Data16
ในองคแตละแหงมกจะพฒนาระบบสารสนเทศเพอตอบสนองตอการทำางานขององคกรทแตกตางกน เชน พฒนาระบบสารสนเทศการขาย เพอตอบสนองตอการวเคราะหขอมล
การขายสนคา พฒนาระบบคลงสนคา เพอตอบสนองตอการวเคราะหขอมลการสง
สนคาเขา หรอการจายสนคาออก การจดกลมขอมลในลกษณะขางตน เปนการแบงขอมลตาม
กจกรรมขององคกร(Activity-oriented Data) ทแตกตางกน
แตในระบบคลงขอมล ขอมลจะถกจดกลมตามเนอหาของขอมล (Subject-oriented Data) แทน โดยพจารณาวา ในบรรดาขอมลทมอยในทกๆ ระบบนน มขอมลใดบางทบอกเลาเรองราวเดยวกน หรอ คลายคลงกน จะถกจดในกลมเดยวกน
Subject-oriented Data17
ตวอยางเชน ระบบการขายสนคาและระบบคลงสนคา ในระบบการขายสนคา มทงขอมลสนคา
และขอมลรายได/รายจาย ทเกดขนจากการขายสนคา ในระบบคลงสนคา มทงขอมลสนคา และขอมลรายได/ราย
จาย ทเกดขนจากการจดการสนคาคงคลง ดงนน เราจงควรแบงขอมลออกเปน 2 กลมใหญๆ คอ
กลมสนคา กลมของรายได/คาจาย
Integrated Data18
ขอมลทเขามาสคลงขอมลนนมทมาจากหลายๆ แหลง เชน ระบบปฏบตงานประจำาวนขององคกร ระบบสารสนเทศตางๆ ในองคกร แหลงขอมลภายนอก
ดงนน อาจเกดความซำาซอนของขอมลขน กลาวคอ อาจมขอมลทเปนเรองเดยวกน แตมทมาแตกตางกน หรอมมาตรฐานขอมลทแตกตางกน
Integrated Data19
ดงนน หนาทของคลงขอมล คอ การกำาจดความซำาซอนของขอมล หรอการทำาใหขอมลมคณสมบต Integrated Data เพอไมใหเกดความสบสนในการวเคราะหขอมล
ในทางกลบกน เราอาจจำาเปนตองยอมรบใหเกด Data Dependency ได (เพอความสะดวกในการแกไขขอมล) แตตองไมเกดปญหา Data Inconsistency
Time Referenced Data20
ในระบบปฏบตงาน จะสนใจเฉพาะขอมลในปจจบน ซงมผลตอการดำาเนนธรกจขององคกรใน ณ ขณะนน
แตระบบคลงขอมลจะมงเนนไปทการเกบขอมลเพอการวเคราะหขอมลตามชวงเวลา(Time-Series Data Analysis)
เพอใหสามารถวเคราะหขอมลดงกลาวได คลงขอมลตองสามารถบอกไดวาเกดเหตการณอะไรขน เกดขนเมอใด เพอเออตอการตอบคำาถามในลกษณะดงตวอยางตอไปน
ยอดขายรถยนตของปนในแตละไตรมาส จำาแนกตามประเภทรถยนต เปนเทาใด?
Time Referenced Data21
ดงนน ระบบคลงขอมลตองจดเกบขอมลทงในอดตและปจจบนขององคกร โดยเมอนำามาใชงาน ระบบตองบอกไดวาขอมลทกำาลงสนใจนนเกดขนเมอใด เราเรยกขอมลในลกษณะนวา “Time-Referenced
Data”
Non-Volatile Data22
เพอรกษาคณสมบต Time-Referenced Data ขอมลในคลงขอมลจงตองเปนขอมลทคงอยตลอดไป ไมวาจะเปนขอมลทเกาเพยงใด กจะยงอยในคลงขอมล
ตลอด ไมถกลบออก เราเรยกคณสมบตนวา “Non-Volatile Data” เพอใหการวเคราะหขอมลแบบ Time-Series Data
Analysis ใหผลลพธทมประสทธภาพ
Non-Volatile Data23
อยางไรกตามถงแมวา Non-Volatile Data จะไมถกลบออกจากคลงขอมลกตาม
แตเพอการจดการพนทในคลงขอมลอยางมประสทธภาพ Non-Volatile Data สามารถถกเปลยนแปลงรปแบบไป เพอใหขอมลมขนาดเลกลง โดยการเปลยนแปลงนจะตองไมกระทบตอการวเคราะหขอมล
เราเรยกกระบวนการนวา “Data Packing” ซงจะไดศกษารายละเอยดในภายหลง
คลงขอมลไมใชผลตภณฑ(DW is not on-the shelf system)
24
คลงขอมลไมใชผลตภณฑ หรอ ระบบสำาเรจรป ทสามารถหาซอไดจากทองตลาด
แตคลงขอมล เปนหลกการ วธการ และแนวทางแกปญหา เนองจาก ลกษณะของงานของแตละองคกรมความแตกตางกน และมความ
เปนเฉพาะตวของตนเอง ทงในแงทฤษฎและปฏบต ดงนน จงเปนการยากทจะมระบบหรอซอฟตแวร ทสามารถเขากบ
ธรกจของทกองคกรไดอยางแทจรง ในทางตรงกนขาม การพฒนาคลงขอมลตองการความรเกยวกบ
กจกรรมและธรกจขององคกรอยางถองแท เพอใหผพฒนาสามารถเขาใจภาพและเรองราวทางธรกจขององคกรไดอยงถองแทกอน จงจะสามารถออกแบบคลงขอมลทสามารถสรางผลลพธทมประโยชนสงสดตอการตดสนใจในอนาคตได
เหตใดตองมคลงขอมล25
องคกรใดควรมคลงขอมล การพฒนาคลงขอมลของแตละองคกรมวตถประสงคแตกตางกนไป เชน
บางแหงสรางคลงขอมลเพอแกปญหาการใชขอมลในองคกร(Data Warehouse as a Solution to Data Access Problem) [แบบนจำาเปนตองสราง]
บางแหงสรางคลงขอมลเพอการใชขอมลทมประสทธภาพ(Data Warehouse as a Solution to Data Access Optimizer) [แบบนตองพจาณาดกอน]
สำาหรบองคกรทยงไมประสบปญหาการใชขอมล แตคดจะสรางคลงขอมลนน ตองคำานงถงความคมคาในการสรางคลงขอมล (โดยทวไป การสรางคลงขอมล ตองใชทรพยากรจำานวนมาก)
ตวอยางเชน องคกรสมควรมคลงขอมล หากวาในปจจบนองคกรมขอมลหลายประเภท และม
ปรมาณมากขนเรอยๆ และคาดวาในอนาคตจำาเปนตองอาศยการวเคราะหขอมลแบบภาพรวม เพอการแขงขนทางธรกจในอนาคต
เหตใดตองมคลงขอมล26
ความจำาเปนของการมคลงขอมลในแงของผใชงาน ระบบสารสนเทศทวไป มกเปนระบบทความตองการของผใชผกตกกบนก
วเคราะหระบบ และนกพฒนาระบบ เพราะผลลพธตางๆ ทผใชงานตองการ มกอยในรปของรายงานทตายตว (Fixed
Report) ถาตองการปรบเปลยนแกไขรายงาน ผใชตองรอใหนกวเคราะหระบบ และนกพฒนาระบบปรบแกให ทำาใหเกดความไมคลองตว และเสยงตอการไมไดผลลพธทตองการ เนองจากนกวเคราะหระบบ และนกพฒนาระบบคงไมมความเขาใจเรองราวทางธรกจไดดเทาผใชงาน
เพอแกไขปญหาดงกลาว การวางโครงสรางของขอมลในคลงขอมล จะมลกษณะตรง หรอใกลเคยงความ
ตองการของผใชงาน และมเครองมอทชวยใหผใชงานสามารถสรางรายงานตามความตองการใหมๆ ไดเอง รวมถงการวเคราะหขอมลในรปแบบตางๆ ทยดหยน และสามารถตอยอดความ
ตองการไดงาย ทำาใหผใชลดการพงพานกคอมพวเตอรไดระดบหนง
เหตใดตองมคลงขอมล27
ความจำาเปนของการมคลงขอมลในแงของผบรหาร การไดมาซงผลการวเคราะหขอมลทหลากหลายอยาง
รวดเรว ทำาใหผบรหารไดรบขอมลเพอการตดสนใจไดอยางทนทวงท
สงผลใหการดำาเนนธรกจไดอยางคลองตว
ขอแตกตางระหวางขอมลปฏบตการและคลงขอมล
คลงขอมลเมอมองเผนๆกคอฐานขอมลชนดหนงแตสรางขนมาเพอวตถประสงคตางออกไป สงทแตกตางอยางเหนไดชด คอ ขอมลในฐานขอมลเปนขอมลดบทเราใสลงไปเรอยๆ หรอทเรยก
กนวา ฐานขอมลปฏบตการ แตคลงขอมลจะเปนมากกวานน คอ ขอมลททมอยจะถกนำามา
ประมวลผลใหมเพอหาแนวโนมและวเคราะหสงทจะเกดขนในอนาคต
โดยสรปแลว คลงขอมลใชเพอการวเคราะห (ขอมลทงอดตและปจจบน) ฐานขอมลใชเพอทำาการประมวลผล (เฉพาะขอมลปจจบน)
28
ขอแตกตางระหวางขอมลปฏบตการและคลงขอมล
การใชงาน ฐานขอมลปฏบตการ(Operational Database)
คลงขอมล(Data
Warehouse)ลกษณะการจดการขอมล
Application กบ Application (Application Oriented)
ตามหวขอเรองทตองการ (Subject Oriented)
โครงสรางขอมล ซบซอนแลวแตเครองมอและการคำานวณ แตเปนรปแบบทชดเจนประมวลผลซำาเรองเดม
มโครงสรางไมแนนอน ประมวลผลแบบวเคราะห แตงาย เหมาะกบองคกร
เนอหาและชวงเวลา
ปจจบน อดตและปจจบน
การปรบปรงขอมล
อาจจะมการปรบปรงบอย และเพมขอมลจำานวนมากในแตละวน และทำาเปนประจำา
แลวแตสถานการณและความตองการไมมการปรบปรงขอมลโดยตรง
29
ขอแตกตางระหวางขอมลปฏบตการและคลงขอมล
การใชงาน ฐานขอมลปฏบตการ(Operational Database)
คลงขอมล(Data
Warehouse)การเคลอนไหวของขอมล
ตลอดเวลา คงทจนกวาจะปรบปรงใหม
เวลาในการทำางาน เสยวเวลา ถง 2 – 3 วนาท
ไมแนนอน ตงแตหลายวนาทจนถงนาท
ความแนนอนในการใชขอมล
แนนอน ไมแนนอน
แหลงขอมล ภายในองคกร ทงภายในและภายนอกองคกร
ขนาดของขอมล กกะไบต กกะไบตถงเทราไบต
30
องคประกอบหลกของคลงขอมล31
Data Warehouse
Data
Source
Staging
Areas
Data WarehouseDatabase
Data
Mart Data
Usage
Data Sources หมายถง แหลงขอมลตนทางตางๆ ทจะนำาเขาสคลง
ขอมล (มาจากระบบปฏบตการตางๆ ขององคกร ) อาจมาจากระบบเดยวหรอหลายๆ ระบบกได มรปแบบทหลากหลาย เชน
Text File Oracle Excel File Access
32
Staging Areas เนองจากขอมลทมาจากระบบปฏบตการขององคกร
(Data Sources) อาจมความหลากหลาย ทงในแงมาตรฐานและวธการจดเกบ และอาจมความซำาซอนกน
ขอมลจากแหลงขอมล จำาเปนตองถกปรบใหเขากบมาตรฐานของคลงขอมลเสยกอนทจะเขาไปอยใน Data Warehouse Database
ดงนน คลงขอมลจงจำาเปนจะตองม Staging Areas Database ซงเปนฐานขอมลททำาหนาทพกขอมล ขณะทถกปรบใหเขากบมาตรฐานของคลงขอมล
33
Data Warehouse Database เปนฐานขอมลททำาหนาทในการจดเกบขอมลทางธรกจ
ขององคกร จดเปนสวนทมความสำาคญทสดของคลงขอมล
34
Data Mart หรอ Data Provisioning Area
ขอมลมาจาก Data Warehouse Database จะถกดงและประมวลผล แลวนำาผลทไดมาเกบไวท Data Provisioning Area ซงโครงสรางขอมลของ Data Provisioning Area นนจะอยในรปแบบทเหมาะสมสำาหรบการนำาไปใชงาน เชน อยในรป Report หรอ Cube เปนตน ในการใชงาน จะนยมเรยก Data Provisioning Area วา Data Mart
35
Data Mart หรอ Data Provisioning Area
ลกษณะของ Data Mart มดงน ขอมลเจาะจงไปยงฟงกชนเฉพาะกลมหรอหนวยงานภายในของ
องคกร ใหผลตอบแทนทรวดเรว คมคาในการลงทนในดานเวลา การบรหารและจดการขอมลสามารถทำาไดโดยงาย ชวยเพมประสทธภาพ เนองจากการ Query ถกแบงไปยง
ขอมลแตละสวนของฟงกชน
36
Data Usage เปนสวนททำาหนาทดงเอาขอมลทไดถกเตรยมไวใน
Data Provisioning Area หรอแมแต Data Warehouse Database เพอนำาเสนอผลลพธทใชสำาหรบการวเคราะหขอมล
ใน Data Usage โดยจะมเครองมอหรอระบบททำาหนาทออกรายงาน ซงอาจจะเปน Simple Reporting Tools หรอ Multi Dimensional Tools หรอ Data Mining Tools กได
37
กระบวนการคลงขอมล(Data Warehousing)
เปนการจดการขอมล และการใชงานคลงขอมล ทำาใหเกดแนวคด กระบวนการ และวธการหลายๆ อยางขนในคลงขอมล อาทเชน แนวคดการออกแบบและสรางโครงสรางขอมล กระบวนการในการยายขอมล วธการเพอไดมาซงขอมล วธการวเคราะหขอมล วธการจดการกบขอมลทลาสมยแลว ฯลฯ
หลกการของวธการเหลาน ถกเรยกรวมกนวา “กระบวนการคลงขอมล (Data Warehousing)”
38
กระบวนการคลงขอมล(Data Warehousing)39
Data Warehouse
Data ProvisioningData Store
Data Store
Data
Source
Staging
Areas
Data WarehouseDatabase
Data
Mart Data
Usage
MetadataControl
Control
Control
Data Propagation
สามารถจำาแนกกระบวนการตางๆ ใน Data Warehousing ออกเปนกลมใหญ ดงรป
กลมกระบวนการจดเกบขอมล (Data Storing)
หมายถง กระบวนการตางๆ ทดำาเนนการเพอใหการจดเกบขอมลเปนไปอยางถกตอง สามารถบอกเลาถงธรกจขององคกรไดอยางแมนยำา และมประสทธภาพ
ซงกระบวนการเหลาน ไดแก การสรางแบบจำาลองขอมล การสรางฐานขอมล การจดแบงพนทบนฐานขอมล (Database Partitioning) การปรบแตงฐานขอมล (Database Tuning) ฯลฯ
40
กลมกระบวนการเคลอนยายขอมล (Data Propagation)
หมายถง กระบวนการเพอการเคลอนยายขอมล จากองคประกอบหนงไปยงอกองคประกอบหนง
เทคนคทใชกนในคลงขอมล เรยกวา “กระบวนการ ETL (Extract Transform Load)”
41
กลมกระบวนการเตรยมเพอการใชขอมล (Data Provisioning)
หมายถง กระบวนการเพอการออกแบบโครงสรางขอมลใน Data Mart และการใชขอมลจาก Data Mart แบบตางๆ
42
กระบวนการบรหารจดการขอมล (Housekeeping)
หมายถง กระบวนการบรหารจดการทรพยากรของคลงขอมล เนองจากฐานขอมลทใชเพอการจดเกบขอมลมจำานวนและขนาดทจำากด การคาดการณการเตบโตของขอมล เพอจดเตรยมพนทใหเพยง
พอตอการใชงานตามชวงเวลาทเหมาะสม (เรยกวา Data Sizing)
การจดการกบขอมลทลาสมย ใหจดเกบอยใน Data Warehouse Database ไดตอไป แตตองมขนาดเลกลง (เรยกวา Data Packing)
กระบวนการอนๆ ทจำาเปนตองดำาเนนการ เพอใหคลงขอมลสามารถทำางานตอไปไดดวยความราบรน
43
กระบวนการควบคมการทำางานของระบบ(Controlling)
ระบบคลงขอมล กเหมอนกบระบบทวๆ ไป ทตองมการควบคมการทำางาน โดยจะมขอมลประเภทพเศษทเรยกวา “Metadata” เพอเกบขอมลเกยวกบคณสมบตของขอมลและของระบบ ซงจะถกใชเพอการควบคมการทำางานตางๆ ในคลงขอมล
Metadata เปนแนวคดคอยขางใหมในระบบคลงขอมล มรายละเอยดปลกยอยมากมาย และมความเฉพาะตวแตกตางกนไปในและคลงขอมล ซงจะกลาวถงในบทหลงๆ
44
ประโยชนของระบบคลงขอมล
ในระบบคลงขอมล ขอมลทซบซอนจะถกรวบรวมหรอเปลยนแปลงใหงายตอการจดเกบและสามารถเรยกกลบมาใชไดอยางรวดเรวและถกตอง โดยขอมลตางๆเหลานจะถกนำามาใชสำาหรบการวเคราะหและชวยในเรองการตดสนใจโดยอาศยเครองมอ (tool) ทอยในเครองคอมพวเตอรทเปนซอฟทแวรมาใชในการจดการทำารายงานและเพมประสทธภาพสำาหรบการตดสนใจใหรวดเรวยงขน
45
ประโยชนของระบบคลงขอมล
โดยผบรหาร นกวางแผน และนกวเคราะหขอมลสามารถเรยกหาขอมลหรอสอบถาม (query) เพอใหไดรบคำาตอบในรปแบบตารางรายงาน หรอรายงาน กราฟ เพอมาทำาการวเคราะหขอมลดวยตนเอง เชน การเปรยบเทยบยอดขายระหวางชวงเวลาในอดตกบ
ปจจบนไปจนถงการทำาพยากรณยอดขายในอดต (Forecasting)
การหายอดขายสงสดหรอตำาสด การเปรยบเทยบยอดขาย ตนทน กำาไร ในรปแบบตาราง
รายงาน หรอรายงาน กราฟ ฯลฯ
46
ประโยชนของระบบคลงขอมล
การจดทำาคลงขอมลจะมความสำาคญมากขนในอนาคต เพราะปจจบนนผใชและผบรหารของหนวยงานเรมมเขาใจความสำาคญของขอมลมากขน และเรมตระหนกวาหากนำาขอมลมาวเคราะหใหเขาใจสถานภาพหรอเหตการณทเกดขนแลวจะทำาใหหนวยงานหรอบรษทสามารถตอบสนองตอเหตการณทเกดขนไดดยงขน และจะทำาใหหนวยงานหรอบรษททำางานบรรลวตถประสงคและเปาหมายไดดยงขนตามไปดวย
47
ขอดของคลงขอมล
ใหผลตอบแทนสง ถงแมวาจะมการลงทนทสงกตาม ทำาใหองคกรเกดความไดเปรยบคแขงขนในแงของการ
ไดรบขอมลและสารสนเทศกอนคแขง ทำาใหสามารถวเคราะหขอมลเหลานน เพอกำาหนดเปนแผนกลยทธ และกำาหนดทศทางในการดำาเนนงานไดกอนคแขงขน เชน พฤตกรรมผบรโภค แนวโนมความตองการของผบรโภค เปนตน
48
ขอดของคลงขอมล
เพมประสทธภาพในการตดสนใจของผบรหาร เนองจากคลงขอมลไดจดการใหขอมลทไดรบมาจากแหลงขอมลทแตกตางกน มความสอดคลองกน และวเคราะหตามประเดนทผบรหารตองการ อกทงขอมลทมอยในคลงขอมลกมปรมาณมาก ทงขอมลในอดตและปจจบน จงทำาใหการตดสนใจมประสทธภาพมากขน
49
ขอเสยของคลงขอมล
แนวโนมความตองการขอมลมเพมมากขนเรอยๆ เมอผใชไดรบขอมลตามทตองการจากคลงขอมลแลว ความตองการขอมลของผใชกจะมเพมมากขนเรอยๆ เนองจากเชอในประสทธภาพของคลงขอมลวาจะจดหาใหตนไดแนนอน จงอาจเปนสาเหตใหคำาตอบทผใชตองการ เพมความซบซอนใหกบกระบวนการทำางานมากขน
50
ขอเสยของคลงขอมล
ขนตอนในการกลนกรองและนำาขอมลเขาสคลงขอมลนนใชเวลานาน และตองอาศยผทมความชำานาญในการกลนกรองขอมล
ใชเวลานานในการพฒนาคลงขอมล ระบบคลงขอมลมความซบซอนสง
51
Q & AEnd
52