comparison of r project with spss program for data ... · model of the university’s borrowed...
TRANSCRIPT
วารสารวทยาศาสตรและเทคโนโลย มหาวทยาลยอบลราชธาน ปท 16 ฉบบท 1 มกราคม – เมษายน 2557
16
การเปรยบเทยบการท างานโปรแกรม R และโปรแกรม SPSS กรณการจ าแนกประเภทขอมลเงนยมทดรองจายของมหาวทยาลยขอนแกน
ภายใตแนวความคดการท าเหมองขอมล Comparison of R Project with SPSS Program for Data Classification of Khon Kaen
University Borrowed Money Database under the Concept of Data Mining
นรมล พนสมา* และ อนตต เจาสกล
ภาควชาวศวกรรมคอมพวเตอร คณะวศวกรรมศาสตร มหาวทยาลยขอนแกน จ.ขอนแกน 40000 *E-mail: [email protected]
บทคดยอ การวจยนมวตถประสงคเพอการประยกตใชงานโปรแกรม R ในการวเคราะหปจจยจากฐานขอมลเงนยมทดรอง
จายของมหาวทยาลยขอนแกน โดยเปรยบเทยบกบ SPSS ภายใตแนวความคดการท าเหมองขอมล เกบรวบรวมขอมลเงนยมจากฐานขอมลและสมภาษณเจาหนาทผดแลระบบและผปฏบตงาน โดยใชหลกการของการท าเหมองขอมลดวยวธการกรองขอมล เตรยมขอมล จากนนท าการสรางโมเดลจ าแนกการยมคนเงนยมทดรองจายโดยใชโปรแกรม R และ SPSS และวเคราะหเปรยบเทยบการท างานและประสทธภาพของโปรแกรม
ผลการวจยพบวา โปรแกรม R มความยดหยนของรปแบบไฟลขอมลทน าเขามากกวาโปรแกรม SPSS โปรแกรม R มการจดการขอมลทรวดเรว ใชงานงายไมตางกบ SPSS โปรแกรม R ใหผลวเคราะหทกระชบตรงตามความตองการของผใชมความนาเชอถอและใหผลวเคราะหทเปนรปแบบกราฟกทสวยงามมความทนสมย ผใชงานสามารถเขยนพฒนาโปรแกรมเพมไดอกทงยงไมมคาใชจายในการพฒนาโปรแกรม เหมาะส าหรบการสนบสนนการสรางงานวจยของสถานศกษาและองคกรทมขอจ ากดดานงบประมาณ สวนโปรแกรม SPSS เหมาะส าหรบการวเคราะหขอมลทางสถตข นตนและผใชทไมมความรดานการเขยนโปรแกรมมากนก นอกจากนนจากการวจยสามารถน าผลการวเคราะหไปใชชวยแกปญหาเงนนอน การยมเงนเกนกวาการใชจายจรงและลดความเสยงในการสญเงนของระบบเงนยมทดรองจาย อกทงยงชวยเปนแนวทางในการปรบปรงและก าหนดนโยบายเงนยมทดรองจายของมหาวทยาลยขอนแกนใหเขมงวดมากขนโดยออกเปนประกาศฉบบท 1269/2556 ท าใหการปฏบตงานเปนไปอยางมประสทธภาพและเกดประโยชนสงสด สงผลใหยอดการคางช าระเงนยมทดรองจายลดลงเหลอประมาณ 10 ลานบาทจากยอดโดยประมาณ 400 ลานบาท กอนน าแนวปฏบตออกใชงาน
ค าส าคญ : การจ าแนกประเภทขอมล การเปรยบเทยบโปรแกรม R และโปรแกรม SPSS การท าเหมองขอมล
Abstract
This research aimed to apply R Project in the factor analysis of Khon Kaen University’s borrowed money
database by comparison with SPSS program under the concept of data mining. Data collection was done by
use of the borrowed money database and interviews with administrators and operators of the university. A
model of the university’s borrowed money data was constructed by the use of R Project and SPSS and its
efficiency was analyzed. The results showed that R Project is able to analyze more types of input data than
SPSS, it can execute data faster, it is easier for users, and its results can fit what users claim and are
วารสารวทยาศาสตรและเทคโนโลย มหาวทยาลยอบลราชธาน ปท 16 ฉบบท 1 มกราคม – เมษายน 2557
17
trustworthy. R Project results have excellent graphics and are easy to understand. Also, it is an open-source
free software that allows users to add additional functionality by defining new functions corresponding to
requirements. R Project is suitable for support and researchers can use it for their own investigations with no
payment, except costs involved in learning. It was found that SPSS is suitable for analyzing basic statistics and
users do not need the same amount of knowledge about programming language that R Project demands. It is
anticipated that Khon Kaen University can apply the results of this research to solve the problems of stagnant
money and borrowing more money than the actual expenditure, and reduce the risk of losing money in the form
of borrowed money. The study helped the university as a guide to the improvement and establishment of a strict
and efficient borrowed money policy (declaration No.1269/2556). As a result of this declaration, the total unpaid
borrowed money was reduced to about 10 million baht from 400 million baht.
Keywords: Data classification, R Project, Comparison with SPSS program, Data mining
บทน า
ปจจบนบรษทหรอองคกรตาง ๆ เรมใหความ
สน ใ จกบขอ ม ลท ถ ก จด เ กบ ไ ว เ พ ม ม ากข น โ ดยม
วตถประสงคเพอน าลกษณะเฉพาะทแฝงอยภายในกลม
ขอมลมาใชสนบสนนการตดสนใจอยางมประสทธภาพตอ
การด าเนนงานทเปนประโยชนตอองคกร ตวอยางเชน การ
ใหบรการ เวบไซต เพอ เผยแพรขอมลขาวส ารและ
แลกเปลยนความร การศกษาเกยวกบพฤตกรรมของ
ผใชบรการเวบไซตจะชวยใหองคกรสามารถน าขอมลมาใช
ในการวางแผนพฒนาเวบไซตใหตรงกบความตองการใช
งานหรอใชในการวางแผนกลยทธเพอสรางความไดเปรยบ
ทางการแขงขนได
มหาวทยาลยขอนแกนเปนสถาบนการศกษา
ขนาดใหญทมหนวยงานภายในมหาวทยาลยมากกวา 30
หนวยงาน ซงแตละหนวยงานมการจดเกบขอมลไปยง
ฐานขอมลกลางโดยผใชทมสทธเขาถงขอมลในระบบ
ขอมลทส าคญเหล าน ถ กจด เกบภายในฐานขอมล
เปรยบเสมอนเปนคลงเอกสารขนาดใหญทสามารถเรยกด
ไดตามความตองการของผใช อยางไรกตามขอมลทจดเกบ
ยงไมถกน ามาใชประโยชนหรอน ามาวเคราะหเพอใหเกด
ประโยชนในการบรหารจดการหรอก าหนดนโยบายจาก
ขอมลจรงทเกดขนภายในมหาวทยาลย เนองจากขอมล
ภายในฐานขอมลมหาวทยาลยมจ านวนมาก ผวจยจงไดน า
ขอมลเพยงบางสวนมาท าการวเคราะหเพอเปนกรณศกษา
ซงขอมลทเลอกคอ ระบบ KKU-FMIS ในสวนของเงนยม
ทดรองจายของมหาวทยาลย เนองจากเปนขอมลทส าคญ
เพราะจ านวนเงนทหมนเวยนมจ านวนมาก มความเสยงสง
หากมระบบการจดการท ไมมประสทธภาพ กจะม
ผลกระทบตอภาพลกษณของมหาวทยาลยเปนอยางมาก
นอกจากนขอมลเงนยมทดรองจายนน ยงสามารถน ามา
จากขอมลจรงทถกใชงาน โดยการสงออก (Export) จาก
ฐานขอมลทมการใชงานอย ณ ปจจบน
การท าเหมองขอมล (Data Mining) เปน
กระบวนการทกระท ากบขอมลจ านวนมากเพอคนหา
รปแบบและความสมพนธทซอนอยในชดขอมลจ านวนมาก
ทเกบไวในฐานขอมล [1] เพอสามารถน าขอมลมาใชใหเกด
ประโยชน ซงในปจจบนการท าเหมองขอมลไดถกน ามา
ประยกตใชในงานหลายประเภท ทงดานธรกจทชวยในการ
ตดสนใจของผบรหาร ดานวทยาศาสตรและการแพทย
รวมทงในดานเศรษฐกจและสงคม นอกจากนนยงมการน า
การท าเหมองขอมลมาใชในงานวจยเปนจ านวนมาก [2],
[3], [4] และ [5]
วารสารวทยาศาสตรและเทคโนโลย มหาวทยาลยอบลราชธาน ปท 16 ฉบบท 1 มกราคม – เมษายน 2557
18
การเลอกเครองมอในการวเคราะหขอมลเปนขนตอน
ทส าคญมากในการท าเหมองขอมล โดยซอฟตแวรดานการ
วเคราะหขอมลทใชกนอยางแพรหลายและไดรบความนยม
มากคอ โปรแกรม SPSS สวนโปรแกรม SAS, Stata , S-
Plus, หรอ Statistica มผใชอยพอสมควร [6] โปรแกรม
SPSS มผนยมใชมาเปนเวลานาน [7] จงท าใหผใชสวน
ใหญมองวาโปรแกรม SPSS เปนทางเลอกทดทสดเพราะม
ผใชเปนจ านวนมากงายตอการคนควาเอกสารแนะน าและ
เปนโปรแกรมทมรปแบบไมซบซอนงายตอการใชงาน [8]
แตโปรแกรม SPSS มคาใชจายในการใชงาน เปนอปสรรค
ในการสรางงานวจยและไมเหมาะส าหรบสถานศกษาหรอ
หนวยงานทมขอจ ากดดานงบประมาณ ซงอาจน าไปสการ
ใชงานโปรแกรมทละเมดลขสทธ แนวโนมการใชโปรแกรม
แบบเปดเผยรหสจงเ ปนทางเลอกท เหมาะสม โดย
โปรแกรม R เปนโปรแกรมทไดรบการยอมรบและมความ
นยมสงโดยผใชเพมขนจากหลายองคกร เชน Google,
Facebook, Twitter, Pfizer และ Shell หรอองคกรของรฐ
ระดบนานาชาตมากมาย [9, 10] กลาวไดวาภาษา R เปน
อนาคตอนใกลในฐานะภาษากลางของการวเคราะหขอมล
ทางสถต [11] นอกจากนนในดานการท างานโปรแกรม R
มความสามารถในการวเคราะหขอมลสถตข นสงและการ
แสดงผลกราฟกคณภาพสงตามความตองการ มความ
สวยงามทนสมย [12] แตผใชยงมความเชอเกาวาโปรแกรม
R เปนโปรแกรมทซบซอนใชงานยากและไมมเอกสาร
แนะน า [7] ซงปจจบนโปรแกรม R ไดมการปรบปรง
รปแบบของโปรแกรมใหใชงานงายและยงมการเปดอบรม
การใชงานโดยผเชยวชาญ เชน Reinforce BI เปนตน ทง
ยงไมมภาระคาใชจายในการจดหา เหมาะส าหรบการสราง
และพฒนางานวจยเพมมากขน
ง าน วจย น จ ง ม เ ป า หมาย เพ อ เ ป ร ย บ เ ทย บ
ประสทธภาพผลการท างานและผลการวเคราะหทางสถต
ของโปรแกรม R และโปรแกรม SPSS ในกรณการจ าแนก
ประเภทขอมล (Data Classification) [13, 14] การบรหาร
จดการเงนยมทดรองจายของมหาวทยาลยขอนแกน
ภายใตแนวความคดของการท าเหมองขอมล
วธด าเนนการวจย
หลงจากศกษาปญหาและก าหนดวตถประสงคใน
การวจยรวมทงท าการศกษาเอกสารงานวจยทเกยวของ
แลว จากหลกในการท าเหมองขอมลทง 6 ขนตอน คอ การ
ท าความเขาใจปญหา การท าความเขาใจขอมล การเตรยม
ขอมล การสรางแบบจ าลอง การประเมน และการน าไปใช
ผวจยไดก าหนดวธด าเนนการวจยเปน 6 ขนตอน เขยน
เปนแผนผงล าดบงานวจยไดดงรปท 1
วารสารวทยาศาสตรและเทคโนโลย มหาวทยาลยอบลราชธาน ปท 16 ฉบบท 1 มกราคม – เมษายน 2557
19
รปท 1 แผนผงล าดบงานวจย
1. การศกษาและส ารวจปญหา
การต ง เ ป าหมายในการท า งานวจย เพ อแกปญหาของระบบเงนยมทดรองจาย จากการศกษาส ารวจขอมลโดยใชวธการเกบรวบรวมจากฐานขอมลและการสมภาษณเจาหนาทผดและระบบเงนยมทดรองจาย รวมถงบคลากรทท าหนาทเกยวของกบการบรหารเงนยมทดรองจาย เพอส ารวจปญหาทเกดขนของระบบเงนยม ทดรองจายทตองการการแกไข
2. การศกษาและส ารวจขอมลเงนยมทดรอง
จาย
การศกษาส ารวจขอมลใชวธการเกบรวบรวม ทบทวนขอมลจากฐานขอมลและการสมภาษณเจาหนาทผดแลระบบฐานขอมลของมหาวทยาลยรวมถงเงนยม ทดรองจาย เพอทราบถงระบบการจดการฐานขอมลและระบบการยมเงนทดรอง รวมถงศกษาเงนยมแตละประเภทโดยการสมภาษณเจาหนาทผเกยวของและจากเอกสารเงน
ยมฉบบจรง เพอวเคราะหแลวเสนอแนะ น าไปใชในการตดสนใจของผบรหารเงนยมทดรองจายและพฒนาระบบตอไป
3. การเตรยมขอมล ขอมลเงนยมทดรองจายทวเคราะหเปนขอมล
เงนยมทดรองจายในรปตาราง (Ms-Excel) ทน ามาจาก
ฐานขอมลของมหาวทยาลย การเกบรวบรวมขอมลเรมจาก
การคดเลอกขอมลทตองการและตรวจสอบความสมบรณ
ของขอมล ตอจากนนน าแนวคดการกรองขอมลของเหมอง
ขอมล [15, 16] มาใชในการจดการ เชน ตดแอตตรบว
(Attribute) ทไมจ าเปน แอตตรบวทซ าซอน แอตตรบวท
เปนคาคงทและแถว (record) ทไมสมบรณออกจากขอมลท
น ามาวเคราะห (ขอมลทใชในการวเคราะหคอขอมลเงนยม
ทดรองจาย ตงแตปงบประมาณ 2552-2554 เนองจาก
ความสมบรณของขอมลและจ านวนขอมลมากพอส าหรบ
เรมตน
ศกษาและส ารวจปญหา
ศกษาและส ารวจเงนยมทดรอง
เตรยมพรอมขอมลใหสมบรณโดยใชเทคนคการท าเหมองขอมล
สรางโมเดลจ าแนกการยมคนเงนยมทดรองดวยโปรแกรม R
สรางโมเดลจ าแนกการยมคนเงนยมทดรองดวยโปรแกรม SPSS
วเคราะหและเปรยบเทยบโปรแกรม R และโปรแกรม SPSS
จบการวจย
วารสารวทยาศาสตรและเทคโนโลย มหาวทยาลยอบลราชธาน ปท 16 ฉบบท 1 มกราคม – เมษายน 2557
20
การน ามาวเคราะห) นอกจากนนยงใชหลกการของการ
กรองขอมลชวยในการจดการขอมลทเกดจากขอผดพลาด
ของระบบจดเกบฐานขอมล เชน ขอมลไมตรงตามสญญา
ยมจรง ขอมลเงนดอกเบยตดลบ เปนตน โดยการตดขอมล
สวนนนออกไมน ามาวเคราะห
4. การสรางโมเดลจ าแนกประเภทการยมคน
เงนยมทดรองจายโดยใชโปรแกรม R
การใชงานโปรแกรม R ในการวเคราะหขอมลเปนอกแนวความคดของการท าเหมองขอมลในการสรางแบบจ าลองโดยใชเครองมอชวยในการวเคราะหผล [11] ทางผวจ ยท าการเกบขอมลและทดสอบการท างานของโปรแกรมตงแตกระบวนการน าเขาขอมลในกรณการรองรบรปแบบไฟลขอมล การจดการขอมลน าเขาเพอเขาสการวเคราะห และการสรางโมเดลในการวจยซงเปนแบบจ าลองโครงสรางตนไมใชหลกการการจ าแนกประเภทของเหมองขอมล โดยท าการทดสอบประมวลผลไฟลขอมลขนาดตาง ๆ เพอเปรยบเทยบการท างานและผลการวเคราะหกบโปรแกรม SPSS นอกจากนนยงใชโปรแกรม R ชวยในการจ าแนกและวเคราะหขอมลเชงคณภาพโดยใชจดเดนในเรองของกราฟกของโปรแกรม R เพอเปรยบเทยบกบโปรแกรม SPSS
5. การสรางโมเดลจ าแนกประเภทการยมคนเงน
ยมทดรองจายโดยใชโปรแกรม SPSS
วธการในการสรางโมเดลโครงสรางแบบตนไมของโปรแกรม SPSS คลายกนกบโปรแกรม R แตกตางกนทรปแบบการท างาน และขอจ ากดของรปแบบไฟลทรองรบ
6. การวเคราะหและเปรยบเทยบโปรแกรม R
และ SPSS
การเปรยบเทยบโปรแกรม R และ SPSS เรมตงแตสวนการรองรบขอมลน าเขาและการจดการขอมล ความสามารถในการท างานท งประสทธภาพการประมวลผลและผลของการวเคราะห รวมถงรปแบบการแสดงผลการวเคราะหและการเปรยบเทยบจดเดนจดดอยโดยรวมของโปรแกรมทงสอง
ผลการวจย
ผลการวจยแบงเปน 3 สวน ดงน 1. โมเดลจากการวเคราะหดวยโปรแกรม R
และ SPSS การสรางโมเดลโครงสรางแบบตนไมดวยโปรแกรม
R และ SPSS ใชขอมลเงนยมทดรองจายทผานการกรองซงเปนเทคนคหนงของการท าเหมองขอมลไดขอมลส าหรบการวเคราะหดงตารางท 1
วารสารวทยาศาสตรและเทคโนโลย มหาวทยาลยอบลราชธาน ปท 16 ฉบบท 1 มกราคม – เมษายน 2557
21
ตารางท 1 ขอมลเงนยมทดรองจายทผานการกรองขอมล
คอลมน ประเภทขอมล ความหมาย 1 DIV_CODE รหสหนวยงาน รหสแทนหนวยงานตางๆ ภายในมหาวทยาลย 2 FUND_CODE รหสกองทน รหสแทนเงนกองทน 3 PLAN_CODE รหสแผนงาน รหสแทนแผนงานทยมเงน 4 PROJ_ID รหสโครงการ รหสแทนโครงการทยมเงน 5 ATV_CODE รหสกจกรรรม รหสแทนกจกรรมทยมเงน 6 BUDGET_YEAR ปงบประมาณ ปทท ารายการยมเงน 7 BUDGET_YEAR_CONTROL ปงบประมาณควบคม ปทมการใชจายเงนจรง 8 CONTRACT_DATE วนทท าสญญา วนทท าสญญายมเงน 9 CONTRACT_TYPE_CODE รหสประเภทสญญายม รหสแทนประเภทของสญญายมเงน 10 PERIOD_TIMES จ านวนงวด จ านวนงวดทช าระเงนคน 11 PR_ATM เงนตน เงนทท าการยม 12 INT_ATM ดอกเบย ดอกเบยทคดจากการช าระเงนลาชา 13 TOT_ATM จ านวนเงนรวม ยอดเงนรวมทตองช าระ 14 BAL_PR_ATM ยอดเงนคงเหลอของเงนตน เงนตนคงเหลอทตองช าระ 15 BAL_INT_ATM ยอดเงนคงเหลอของดอกเบย ดอกเบยคงเหลอทตองช าระ 16 BUILD_DATE วนทต งหน วนทรายการเงนยมจดเกบเขาระบบ 17 DUE_DATE วนทสนสดโครงการ วนทถงก าหนดช าระเงน 18 CHARGE_DATE วนทคดคาปรบ วนทเรมคดดอกเบย 19 CHARGE_STATUS สถานการณคดคาปรบ คดดอกเบยหรอไม “Y” คอ ไมคดดอกเบย และ “N” คอคด
ดอกเบย
การวเคราะหดวยเทคนคการจ าแนกประเภท
ขอมลเพอใหทราบถงปจจยทท าใหเกดการคนเงนลาชา ก าหนดใหเอาตพตคอ สถานะการคดคาปรบ สวนตวแปรในเรองเวลา เชน วนทตางๆ ก าหนดใหเปนตวแปรอสระ
เนองจากตองการสรางโมเดลทสามารถใชท านายผลทเกดขนในทกชวงเวลาทเกดขน และแอตตรบวนอกจากนนก าหนดใหเปนอนพต ซงไดผลการวเคราะหตามรปท 2 และ 3
วารสารวทยาศาสตรและเทคโนโลย มหาวทยาลยอบลราชธาน ปท 16 ฉบบท 1 มกราคม – เมษายน 2557
22
รปท 2 การวเคราะหโครงสรางแบบตนไมดวยโปรแกรม SPSS
รปท 3 การวเคราะหโครงสรางแบบตนไมดวยโปรแกรม R
วารสารวทยาศาสตรและเทคโนโลย มหาวทยาลยอบลราชธาน ปท 16 ฉบบท 1 มกราคม – เมษายน 2557
23
จากรปท 2 และ 3 โปรแกรม R และ SPSS ใหผลการวเคราะหดวยโครงสรางแบบตนไมทใกลเคยงกนคอ หนวยงานเปนปจจยทมผลตอลกษณะการคนเงนลาชาเปนปจจยแรกโดยคณะสาธารณสขศาสตร คณะมนษยศาสตรและสงคมศาสตร คณะศกษาศาสตรและคณะเทคนคการแพทยมปญหาการคนเงนลาชา ปจจยตอมาเปนประเภทของกจกรรมซงลกษณะการคนทมปญหาลาชาจะเปนกจกรรมการเรยนการสอนสาขามนษยศาสตรและสงคมศาสตร คาใชจายเกยวกบการด าเนนงาน กจกรรมการเรยนการสอนและกจกรรมการเรยนการสอนสาขาเทคนคการแพทย ประเภทของสญญายมโดยเงนยมแทน
เงนเดอนและคาจางประจ ามปญหาการคนเงนลาชามากทสด ซงขอมลในสวนน เปนผลจากการวเคราะหขอมลโดยรวมของการยมเงนยมทดรองจาย ซงเปนขอสงเกตในการพจารณาในรายละเอยดของแตละปจจยเพอน าไปใชในการพจารณาตดสนใจใหยมของผบรหาร ปรมาณการยมและมาตรการในการแกไขปญหาการคนเงนลาชาตอไป
2. การเปรยบเทยบประสทธภาพและการท างานของโปรแกรม R และ SPSS
การเปรยบเทยบโปรแกรม R และ SPSS กรณ
รปแบบการน าเขาขอมลเพอวเคราะห ดจากรปท 4 และ 5
รปท 4 รปแบบไฟลขอมลทโปรแกรม SPSS รองรบ
วารสารวทยาศาสตรและเทคโนโลย มหาวทยาลยอบลราชธาน ปท 16 ฉบบท 1 มกราคม – เมษายน 2557
24
รปท 5 รปแบบไฟลขอมลทโปรแกรม R รองรบ
จากรปท 4 และ 5 เปนการแสดงใหเหนประเภท
ของไฟลขอมลทสามารถน าเขาวเคราะหของแตละ
โปรแกรม โดยโปรแกรม R มความยดหยนมากกวา
รองรบรปแบบไฟลขอมลหลายชนด นอกจากจะรองรบ
ขอมลประเภทขอความ เชน text csv ฯลฯ แลวนนยง
รองรบไฟลจากโปรแกรมค านวณสถตอนๆ เชน Weka
และ SPSS เปนตน
การวเคราะหขอมลโปรแกรม R สามารถจดการขอมลและท างานไดรวดเรวกวาโปรแกรม SPSS และในกรณขอมลมขนาดใหญการวเคราะหดวยโปรแกรม SPSS จ าเปนจะตองใชคอมพวเตอรทมสมรรถนะสงจากการทดสอบ เชน คอมพวเตอรแรม (RAM) 3 กกะไบต กบไฟลขนาด 8.02 เมกะไบต โปรแกรม R ใชเวลาในการค านวณสรางโมเดลโครงสรางแบบตนไม 9.64 วนาท สวน
โปรแกรม SPSS ใชเวลาถง 18.1 วนาท และไฟลขนาด 13.9 เมกะไบต โปรแกรม R ใชเวลาค านวณสรางโมเดล 11.95 วนาท สวนโปรแกรม SPSS ใชเวลา 31.7 วนาท
ผลการวเคราะหขอมลดวยโปรแกรม R ใหผลทกระชบตรงตามทผใชตองการเทานน [17] แตกตางกบโปรแกรม SPSS ซงจะใหผลการวเคราะหทมากเกนความจ าเปนท าใหผใชทไมช านาญการใชงาน ไมทราบผลการวเคราะหทตองการอยสวนใดและอาจสงผลใหวเคราะหผลคลาดเคลอนไมตรงตามวตถประสงคได ดงแสดงในรปท 2 และ 3
ในสวนของกราฟกโปรแกรม R และ SPSS มการท างานทไมแตกตางกนมากนก แตจะแตกตางในเรองของรปแบบทน าเสนอ ดงโครงสรางแบบตนไมในรปท 2, 3, 6 และ 7
วารสารวทยาศาสตรและเทคโนโลย มหาวทยาลยอบลราชธาน ปท 16 ฉบบท 1 มกราคม – เมษายน 2557
25
รปท 6 ตวอยางกราฟกโดยโปรแกรม R
(6.2) (6.1)
(6.5) (6.4)
(6.3)
วารสารวทยาศาสตรและเทคโนโลย มหาวทยาลยอบลราชธาน ปท 16 ฉบบท 1 มกราคม – เมษายน 2557
26
รปท 7 ตวอยางกราฟกโดยโปรแกรม SPSS จากรปท 6 และ 7 เปนการเปรยบเทยบกราฟ
ประเภทตางๆ ระหวางโปรแกรม R และ SPSS โดยใชขอมลเงนยมทดรองจายเปนกรณตวอยาง เชน กราฟรปท 6.1 และ 7.1 ใชขอมลยอดเงนยมทดรองจายน าเสนอในรปแบบ Box Plot เพอดการกระจายตวของขอมล และบอกถงคาทกระโดดจากกลม รปท 6.2 และ 7.2 ใชขอมลประเภทสญญายมน าเสนอในรปแบ Bar Plot เพอเปรยบเทยบประเภทสญญาไดอยางชดเจน เปนตน โปรแกรม R มกราฟหลากหลายประเภทใหเลอกใชมากกวาไมวาจะเปนกราฟ Mosaic ซงใชอธบายปรมาณ
ของขอมลทสนใจโดยจากรปท 6.3 อธบายไดวาประเภทเงนยมอนๆ มยอดการยมทมากทสด เนองมาจากผกรอกขอมลการยมไมระบประเภททช ดเจนสงผลเสยตอการตรวจสอบของผดแลระบบ หรอ รปท 6.5 กราฟ Benford’ s Law อธบายความผดปกตของชดขอมล ซงมจดเดนในเรองกราฟกทสวยงามและมความทนสมยมากกว าโปรแกรม SPSS สามารถอธบายผลการวเคราะหไดดกวา งายตอการท าความเขาใจของผใชงาน จากการวจยและการสบคนโปรแกรม R และ SPSS มขอแตกตางดงตารางท 2
(7.2) (7.1)
(7.3)
(7.4)
วารสารวทยาศาสตรและเทคโนโลย มหาวทยาลยอบลราชธาน ปท 16 ฉบบท 1 มกราคม – เมษายน 2557
27
ตารางท 2 การเปรยบเทยบระหวางโปรแกรม R และ SPSS
ประเดนการพจารณา R SPSS
1 คาใชจายในการใชงาน โปรแกรมเปดเผยรหสไมเสยคาใชจายใน
การใชงานและสามารถพฒนาเพมเตมโดย
ผใช
โปรแกรมส าเรจรปมคาใชจายในการใช
งาน
2 ระบบปฏบตการ Windows, Mac OS, Linux, USD และ
Unix
Windows, Mac OS และ Linux
3 ANOVA method ทรองรบ One-way, Two-way, MANOVA, GLM,
Mixed model, Post-hoc และ Latin
squares
One-way, Two-way, MANOVA, GLM,
Mixed model, Post-hoc และ Latin
squares
4 Regression method ทรองรบ OLS, WLS, 2SLS, NLLS, Logistic, GLM,
LAD, Stepwise, Quantile, Probit, Cox ,
Poisson และ MLR
OLS, WLS, 2SLS, NLLS, Logistic,
GLM และ Stepwise
5 Time series analysis method ท
รองรบ
ARIMA, GARCH, Unit root test,
Cointegration test, VAR และ Multivariate
GARCH
ARIMA
จากตารางท 2 เหนไดวาโปรแกรม SPSS ม
ขอบเขตการใชงานทแคบเมอเทยบกบโปรแกรม R ไมวา
จะเปนการวเคราะหขอมลและการใชงาน ในสวนการ
จ าแนกประเภทขอมลทใชในงานวจยกเชนเดยวกนไมวาจะ
เปนรปแบบขอมลทน ามาวเคราะห ปรมาณขอมล รวมถง
การวเคราะหและแสดงผลโปรแกรม R สามารถใชงานได
ดกวา
3. ระบบเงนยมทดรองจายและฐานขอมล ระบบฐานขอมลมหาวทยาลยเปนระบบขนาดใหญ
มการจดเกบโดยขอมลถกสงจากหนวยงานยอยตาง ๆ มายงฐานขอมลกลาง ขอมลมจ านวนมากและยงไมมการน าไปใชประโยชนอยางจรงจง รวมถงยงขาดความสมบรณ ความถกตองและความคงเสนคงวา สวนขอมลเงนยม ทดรองจายมการจดเกบแยกรายละเอยดเปนสวนๆ แลวเชอมโยงถงกน จากการท าวจยสามารถน าผลการวเคราะหมาชวยในการแกปญหาระบบเงนยมทดรองจาย ดงน
วารสารวทยาศาสตรและเทคโนโลย มหาวทยาลยอบลราชธาน ปท 16 ฉบบท 1 มกราคม – เมษายน 2557
28
ตารางท 3 การแกปญหาระบบเงนยมทดรองจายกอนและหลงปรบปรง
รายการดชนชวด กอนปรบปรง หลงปรบปรงดวยโปรแกรม R และ SPSS 1. การยมเงนกอนงวดเดยวของโครงการระยะยาว
เกดปญหาเงนนอนเนองจากไมไดใชจายจรงในคราวเดยว
ก าหนดใหยมเงนเทาจ านวนทตองจายตามเวลาทใชจายจรง
2. การยมเงนเกนกวาการใชจาย
ยมจากการคาดคะเนรายจายท าใหเกดเงนนอนในสวนตาง สงคนลาชาหรอไมน าสง
ก าหนดใหแสดงแผนการใชเงนทงจ านวนและเวลาทชดเจน
3. การคนเงนลาชา คนเงนยมทดรองจายลาชาหรออยในสถานะเงนสญไมสามารถตดตามได
ก าหนดนโยบายทเขมงวดในการตรวจสอบและเรยกเกบเงนคน เรยกเกบดอกเบยกรณคนเงนเกนก าหนดเวลา
4. สทธการยมเงนทดรอง ผยมรายเกาทยงไมคนเงนแตสามารถยมเงนใหมได
ตรวจสอบสทธเขมงวดไมสามารถยมไดหากยงไมคนเงนยมเกา
5. สทธการบรหารเงนของผรบผดชอบโครงการเพยงผเดยว
เกดปญหาเงนนอนไวทผรบผดชอบและเสยงตอการสญเงน
เบกจายไดตามจ านวนและเวลาทใชจายจรงและบางรายการเบกจายโดยงานกองคลงทรบผดชอบเงนยมโดยตรง
6. ยอดเงนยมทดรองจายทคางช าระ
ยอดการคางช าระสงถงประมาณ 400 ลานบาทกอนน าระบบออกใชงาน
ยอดการคางช าระลดลงเหลอประมาณ 10 ลานบาท
ขอมลจากตารางท 3 อธบายเพมเตมจากประกาศ
มหาวทยาลยขอนแกนฉบบท 1269/2556 เรองหลกเกณฑและแนวปฏบตการยมเงนทดรองจายจากเงนรายได ซงเปนผลจากการวจยเสนอแนะการก าหนดนโยบายชวยใหมหาวทยาลยลดความเสยงในการใชจายงบประมาณไดเปนอยางมาก โดยท าใหยอดการคางช าระเงนทดรองจายลดลงเหลอประมาณ 10 ลานบาทจากประมาณ 400 ลานบาท ซงจากยอดทลดลง เนองมาจากระเบยบเงนยมทดรองจายทเขมงวดขนเรองการคดดอกเบยและการคนเงนยมทดรองไดหลายงวด เพอใหยอดคางเงนยมไมสงเกนจรง (กรณใช
เอกสารเบกจายจรงในการคนเงนยมตามโครงการนนๆ ไปพลางกอน เหลอเพยงเงนสวนตางทยงคางอย ) ท าใหสามารถน าเงนในสวนนไปใชในการพฒนามหาวทยาลยไดอยางมประสทธภาพและเกดประโยชนสงสดตอไป
นอกจากน นจากการท าวจยท าใหทราบวาอกสาเหตของการคนเงนลาชาเนองจากผยมลมก าหนดการช าระเงน เนองจากไมมการแจงเตอนทสะดวกรวดเรว จงน าเสนอแนวคดการแจงเตอน ทผยมสามารถตรวจสอบเงนยมไดดวยตวเอง โดยผดแลระบบเงนยมทดรองจายไดจดท าโปรแกรมแบบออนไลน ดงรปท 8
วารสารวทยาศาสตรและเทคโนโลย มหาวทยาลยอบลราชธาน ปท 16 ฉบบท 1 มกราคม – เมษายน 2557
29
รปท 8 หนาเวบไซตระบบตรวจสอบเงนยมมหาวทยาลยขอนแกน
จากรปท 8 ผยมสามารถตรวจสอบสถานะเงนยม
ปจจบนไดดวยตนเองไดอยางสะดวกและรวดเรว โดยใชระบบการยนยนตวตนท เช อมโยงกบระบบ LDAP (Lightweight Directory Access Protocol) ของมหาวทยาลย ท าใหสามารถวางแผนการช าระเงนไดตรงตามก าหนดเวลา
สรปและเสนอแนะ
การวจยเพอวเคราะหปจจยจากฐานขอมลเงนยมทดรองจาย เปนการวจยจากไฟลน าออกของฐานขอมลโดยใชเทคนคการท าเหมองขอมล ไดแก การกรองขอมลและการจ าแนกประเภทขอมล โดยประยกตใชโปรแกรม R เปนเครองมอเปรยบเทยบกบโปรแกรม SPSS ผลการวจยท าใหไดแบบจ าลองโครงสรางแบบตนไม พบคณลกษณะของหนวยงาน ประเภทของสญญายม และประเภทกจกรรมมความสมพนธตอลกษณะการคนเงน ซงท าใหทราบถงหนวยงาน ประเภทสญญาและกจกรรมทมปญหาในการคนเงนลาชา สามารถน าไปใชประกอบการพจารณาอนมตเงนยมและเปนแนวทางการแกไขปญหาเหลานนของผบรหาร นอกจากนนจากการวจยไดชใหเหนปญหาของระบบเงนยมทดรองจายและเสนอแนะแนวทางในการปรบปรงและก าหนดนโยบายเงนยมทดรองจายของ
มห าวทย าลย ข อน แก น ใ ห เ ขม ง ว ดม ากข น ท า งมหาวทยาลยจงไดออกเปนประกาศฉบบท 1269/2556 ท าใหการปฏบตงานเปนไปอยางมประสทธภาพและเกดประโยชนสงสด สงผลใหยอดการคางช าระเงนยมทดรองจายลดลงเหลอประมาณ 10 ลานบาทจากยอดโดยประมาณ 400 ลานบาท อนน าไปสการลดความเสยงในการสญเงนงบประมาณและสามารถน าเงนสวนตางไปใชประโยชนในการพฒนามหาวทยาลยตอไป
การ เปรยบเทยบประสทธภาพการท างานโปรแกรม SPSS มขอจ ากดในการท างานและวเคราะหขอมลคอนขางมากเมอเทยบกบโปรแกรม R ซงเปนโปรแกรมแบบเปดเผยรหสทสามารถวเคราะหขอมลสถตข นสงไดและยงสามารถวเคราะหขอมลไดหลากหลายรปแบบเปนทนาเชอถอในการใชงานของนกวจยสวนใหญและองคกรแนวหนาของโลก [18] แตถงอยางไรกตาม แตละโปรแกรมตางกมจดเดนของตนเองแลวแตผใชจะเลอกน าไปใชใหตรงตามความตองการและเหมาะสม โปรแกรม SPSS เหมาะส าหรบนกวจยทยงไมมความรดานสถตมากนกและไมมความดานการเขยนโปรแกรม แต SPSS สามารถวเคราะหขอมลทางสถตข นตนไดและยงมคาใชจาย สวนโปรแกรม R ไมมคาใชจาย ยกเวนคาใชจายในการเรยนร เหมาะส าหรบการสนบสนนการสรางงานวจย
วารสารวทยาศาสตรและเทคโนโลย มหาวทยาลยอบลราชธาน ปท 16 ฉบบท 1 มกราคม – เมษายน 2557
30
ของสถานศกษาและองคกรทมขอจ ากดดานงบประมาณ สามารถพฒนาเขยนโปรแกรมเพมเตมเพอใหสามารถท างานตรงตามความตองการของผใชมากทสด แตผใชตองมความรดานสถตพอสมควรและตองมความรดานการเขยนโปรแกรมเปนอยางด หากตองการวเคราะหขอมลในระดบสงขนไป แตปจจบนโปรแกรม R กไดมการปรบปรงรปแบบของโปรแกรมใหงายตอการใชงานของผใชแลวเชนกน ทงยงมการเปดอบรมการใชงานท าใหสามารถใชงานไดงายขนในอนาคต
การประยกตใชงานโปรแกรม R หรอ SPSS กบระบบเงนยมอนๆ สามารถเลอกใชไดตามความเหมาะสมและขอจ ากดของแตละหนวยงาน ซงสามารถน าไปใชไดในการวเคราะหหาความสมพนธของขอมลแตละสวนเพอหาปจจยอนทมผลตอการเกดปจจยทผใชสนใจ การหาความสมพนธทซอนอยในชดขอมล และการจดจ าแนกขอมลเพอทจะสามารถน าผลการวเคราะหไปใชใหเกดประโยชนในการบรหารงานตอไป
เอกสารอางอง [1] บญเสรม กจศรกล. 2546. รายงานฉบบสมบรณ
โ ค ร ง ก า ร ว จย ร วมภ าครฐ แ ล ะ เ อกชน
ปงบประมาณ 2545 โครงการยอยท 7
อลกอรทมการท าเหมองขอมล.
[2] เรวต วลลพรละภกด. 2554. “การท าเหมองขอมลผม
บตรเครดตของธนาคารและซอประกนภยใน
ชองทาง Bancassurance”. การประชมวชาการ
เพอเผยแพรผลงานการศกษาคนควาอสระ
ระดบบณฑตศกษา ประจ าป 2554 ณ สถาบน
บณฑตพฒนบรหารศาสตร 26 ธนวาคม 2554.
[3] ธรพงศ เรอนนอย และ อภเชษฐ บญจวง. 2554.
“การศกษาเปรยบเทยบเทคนคเหมองขอมลการ
คดแยกกจกรรมสวนบคคล”. การประชม
วชาการเสนอผลงานวจย ระดบบณฑตศกษา
มหาวทยาลยนครพนม ครงท 1 มหาวทยาลย
นครพนม, 2 กนยายน 2554 หนา 556-561.
[4] อมรนทร กอนแพง และ สมจตร อาจอนทร. 2554.
“การพยากรณราคาขาวเปลอกโดยใชเทคนคการ
ท าเหมองขอมล”. การประชมวชาการเสนอ
ผลงานวจย ระดบบณฑตศกษาแหงชาต ครง
ท 23 มหาวทยาลยเทคโนโลยราชมงคลอสาน,
23-24 กมภาพนธ 2555 หนา 17.
[5] จนทมา เอกวงษ, ศจมาจ ณ วเชยร และ ชชาต
หฤไชยะศกด. 2555. “การวเคราะหรายงานการ
ประเมนคณภาพภายนอกสถานศกษาอาชวศกษา
ดวยการท าเหมองขอมล ”. ว.เทคโนโลย
สารสนเทศ 8: 27-35.
[6] กลยา วานชยบญชา. 2546. การใช SPSS for
Windows ในการวเคราะหขอมล. กรงเทพฯ:
ภาควชาสถต คณะพาณชยศาสตรและการบญช
จฬาลงกรณมหาวทยาลย.
[7] กลยา วานชยบญชา. 2548. การวเคราะหสถตขนสง
ดวย SPSS For Windows. พมพครงท 4.
กรงเทพฯ: ภาควชาสถต คณะพาณชยศาสตรและ
การบญช จฬาลงกรณมหาวทยาลย.
[8] สมประสงค เสนารตน. 2553. การวเคราะห
เปรยบเทยบโปรแกรม R, Instat และ SPSS:
กรณ ANOVA. สาขาวชาวจยและประเมนผล
การศกษา มหาวทยาลยมหาสารคาม.
[9] R Development core team. 2013. R Foundation
for Statistical Computing: The R User.
Http://www.edii.uclm.es/~useR-2013. 1 June.
[10] R Development core team. 2013. R Foundation
for Statistical Computing: R Foundation
Members & Supporters.Http://www.r-
project.org/foundation/ memberlist.html.4 May.
[11] ศรชย พงษวชย. 2552. สถตเพอการวจยดวย
โปรแกรม R. กรงเทพฯ :สพเรยพรนตง-เฮาส.
วารสารวทยาศาสตรและเทคโนโลย มหาวทยาลยอบลราชธาน ปท 16 ฉบบท 1 มกราคม – เมษายน 2557
31
[12] กลยาณ เตงพงศธร. “การประยกตใชโปรแกรมเสรม
FactoMineR ของโปรแกรม R เพอวเคราะห
องคประกอบหลกของขอมลการประเมนคณภาพ
ท า ง ป ร ะ ส า ท ส ม ผ ส อ า ห า ร ”. ว า ร ส า ร
อตสาหกรรมเกษตรพระจอมเกลา. 2(2): 31-
41.
[13] Jajuga, K.,Sokotow ski,A., and Bock, H.-H. 2002.
Classification, Custering and Data
Analysis: Recent Advances and
Applications. United Kingdom: Lightning
Source UK Ltd.
[14] Oded Maimon and Lior Rokach. 2010. Data
Mining and Knowledge Discovery
Handbook. Second Edition. New York:
Springer.
[15] T. L. Daniel. 2005. Discovering Knowledge in
Data: An Introduction to Data Mining. Jonh
Wiley & Sons.
[16] กฤษณะ ไวยมย, ชดชนก สงศร และ ธนาวนท รกธรร
มานนท. 2001. “การใชเทคนคดาตาไมนนงเพอ
พ ฒ น า ค ณ ภ า พ ก า ร ศ ก ษ า น ส ต ค ณ ะ
วศวกรรมศาสตร”.The Necptec Technical
Journal v.3, no.11: 134-142.
[17] Chambers, J.M. 2008. Software for data
analysis: Programming with R. Springer
New York.
[18] Vance, Ashlee. “Data Analysis are Mesmerized by the Power of Program R.” The New York Times 7 Jan. 2009: B6. Print.