6.7ความหมายและความแตกต่างของฐานข้อมูล(Database) คลังข้อมูล(Data Warehouse) เหมืองข้อมูล(Data Mining)และคลังข้อมูลขนาดเล็ก(Data Mart)
6.7.1 ความหมาย
ฐานข้อมูล (Database) เป็นกลุ่มของข้อมูลที่มีการจัดการเพื่อทำให้เข้าถึง จัดการและปรับปรุงได้ง่าย ประเภทของฐานข้อมูลที่เด่นมาก คือฐานข้อมูลสัมพันธ์(Relational Database)ซึ่งฐานข้อมูลเก็บข้อมูลในแบบของตารางทำให้สามารถจัดการและเข้าถึงได้หลายวิธี ฐานข้อมูลกระจาย (Distributed Database)เป็นฐานข้อมูลที่สามารถกระจายและทำซ้ำ(Replicate)ระหว่างจุดต่าง ๆ บนเครือข่าย
คลังข้อมูล (Data Warehouse)หมายถึง ฐานข้อมูลขนาดใหญ่ขององค์กรหรือหน่วยงานหนึ่งๆ ซึ่งเก็บรวบรวมข้อมูลจากฐานข้อมูลระบบงานประจำวัน (Operational Database orInternal Data Sources)และฐานข้อมูลอื่นภายนอกองค์กร (External Database)โดยข้อมูลที่ถูกจัดเก็บในคลังข้อมูลนั้นมีวัตถุประสงค์ในการนำมาใช้งาน และมีลักษณะของการจัดเก็บแตกต่างไปจากข้อมูลในฐานข้อมูลระบบงานอื่นการย้ายข้อมูลจากฐานข้อมูลปกติเข้าไปไว้ในคลังข้อมูลมีข้อดีหลายอย่าง เช่น ทำให้องค์กรหรือเจ้าของข้อมูลมีโอกาสได้ออกแบบรูปแบบการเก็บข้อมูลใหม่ให้เหมาะสมกับการเรียกใช้มากยิ่งขึ้นและทำให้เหมาะสำหรับการนำไปใช้ช่วยในการตัดสินใจหรือใช้ในงานวิเคราะห์นอกจากนั้นระบบคลังข้อมูลยังรวมเอาข้อมูลที่ใช้อยู่ในปัจจุบันเข้ากับข้อมูลในอดีตเข้าเป็นฐานข้อมูลเดียวกันสามารถเรียกใช้งานได้จากอินเตอร์เฟสแบบกราฟิกได้โดยตรง (GUI) พร้อมสำหรับการจัดการข้อมูลและนำข้อมูลที่ได้ไปวิเคราะห์ข้อดีสุดท้ายก็คือระบบคลังข้อมูลทำให้ผู้ใช้ระดับสูง หรือพนักงานทั่วไปสามารถเข้าถึงและเรียกใช้ฐานข้อมูลได้ด้วยตัวเองโดยไม่ต้องอาศัยความช่วยเหลือจากเจ้าหน้าที่ทางไอทีอีกต่อไปทำให้ทั้งคู่คือพนักงานและเจ้าหน้าที่ไอทีทำงานได้สะดวกและมีประสิทธิภาพมากขึ้น
เหมืองข้อมูล (Data Mining)คือกระบวนการที่กระทํากับข้อมูลจํานวนมากเพื่อค้นหารูปแบบและความสัมพันธ์ที่ซ่อนอยู่ในชุดข้อมูลนั้น ในปัจจุบันการทําเหมืองข้อมูลได้ถูกนําไปประยุกต์ใช้ในงานหลายประเภท ทั้งในด้านธุรกิจที่ช่วยในการตัดสินใจของผู้บริหาร ในด้านวิทยาศาสตร์และการแพทย์รวมทั้งในด้านเศรษฐกิจและสังคม การทําเหมืองข้อมูลเปรียบเสมือนวิวัฒนาการหนึ่งในการจัดเก็บและตีความหมายข้อมูล จากเดิมที่มีการจัดเก็บข้อมูลอย่างง่ายๆ มาสู่การจัดเก็บในรูปฐานข้อมูลที่สามารถดึงข้อมูลสารสนเทศมาใช้จนถึงการทําเหมืองข้อมูลที่สามารถค้นพบความรู้ที่ซ่อนอยู่ในข้อมูล
คลังข้อมูลขนาดเล็ก (Data Mart)คือ ข้อมูลส่วนย่อย (Subset) ของคลังข้อมูล เป็นข้อมูลเฉพาะของแต่ละเรื่อง แต่ละหัวข้อ หรือความเคลื่อนไหวทางธุรกิจ สามารถใช้เป็นยุทธวิธีเพื่อแก้ปัญหาทางธุรกิจในทันทีทันใด สาเหตุที่ต้องมีการสร้างคลังข้อมูลขนาดเล็กได้แก่ มีความเร็วในการเรียกใช้ข้อมูลสูงเพราะว่ามีข้อมูลน้อย มีการแย่งข้อมูลระหว่างผู้ใช้ระบบด้วยกันน้อย และสามารถปรับปรุงข้อมูลได้อย่างรวดเร็ว
6.7.2ความแตกต่าง
ฐานข้อมูลเป็นที่เก็บรวบของเรคคอร์ดข้อมูลหรือไฟล์ เช่น รายการการขาย รายการผลิตภัณฑ์ คลังสินค้าหรือรายละเอียดของลูกค้าโดยปกติผู้จัดการฐานข้อมูลให้ผู้ใช้สามารถควบคุมการอ่าน เขียน เข้าถึง ระบุการสร้างรายงาน และวิเคราะห์การใช้ฐานข้อมูล และผู้จัดการฐานข้อมูลมีบทบาทเด่นในระบบเมนเฟรม ระบบเวิร์กสเตชัน ระบบขนาดกลาง เช่น เอเอส400 (AS 400)และคอมพิวเตอร์ส่วนบุคคล ภาษาเอสคิวแอล(Structured Query Language : SQL)เป็นภาษามาตรฐานสำหรับการสร้างคิวรี่ในการปรับปรุงฐานข้อมูล เช่น ไอบีเอ็มดีบีทู ไมโครซอฟท์แอคเซสไซเบส เป็นต้น
คลังข้อมูลสาเหตุที่ต้องใช้ เพราะองค์กรต่างๆ ในปัจจุบันส่วนใหญ่จะมีการลงทุนลงแรงไปมากกับระบบที่เรียกว่า “ระบบฐานข้อมูลประจำวัน (Operational System)” ระบบสารสนเทศที่ว่านี้จะมีหน้าที่หลักในการรวบรวม และจัดเก็บข้อมูลเอาไว้ไม่ว่าจะเป็นข้อมูลของลูกค้า ข้อมูลการขาย ข้อมูลฝ่ายบุคคลหรือข้อมูลเกี่ยวกับคงคลังก็ตาม เนื่องจากระบบเหล่านี้มีการลงทุนไปมากดังนั้นปริมาณข้อมูลที่มหาศาลก็เลยถือได้ว่าเป็นทรัพย์สินและทรัพยากรอย่างหนึ่งขององค์กรด้วย และจำเป็นต้องมีการจัดการที่เหมาะสมเพื่อนำเอาทรัพย์สินเหล่านี้มาใช้อย่างเกิดประโยชน์สูงสุดหลายองค์กรนำข้อมูลเหล่านี้มาช่วยในการตัดสินใจโดยประยุกต์ใช้เป็นระบบ “ดีเอสเอส(Decision Support System : DSS)” โดยนำเอาระบบคลังข้อมูลมาช่วยเพื่อให้ผู้บริหารสามารถเรียกใช้ข้อมูลที่ต้องการได้อย่างรวดเร็วและมีประสิทธิภาพมากขึ้นข้อมูลเชิงบริหารนี้จะสามารถช่วยลดปัญหาที่เกิดจากการใช้ข้อมูลจากฐานข้อมูลการดำเนินงาน (Operational Database) ซึ่งเป็นการเก็บข้อมูลในรูปแบบทีละรายการ(Transaction) ซึ่งโดยทั่วไปปัญหาที่พบเมื่อต้องการข้อมูลที่ช่วยในการตัดสินใจได้แก่
1. การเรียกข้อมูลจากฐานข้อมูลปฏิบัติการซึ่งมีขนาดใหญ่ทำให้ประสิทธิภาพของระบบลดลงและทำงานได้ช้าลง
2. ข้อมูลที่นำเสนอมีรูปแบบเดียวไม่สามารถเปลี่ยนแปลงได้ตามความต้องการของผู้บริหาร
3. ไม่สามารถหาคำตอบในเชิงพยากรณ์ได้
4. ไม่ตอบสนองการทำคิวรีที่ซับซ้อนได้ดีเท่าที่ควร
5. ข้อมูลถูกจัดเก็บอยู่ตามฐานข้อมูลของระบบงานต่างๆ ซึ่งยากแก่การเรียกใช้และขาดความสัมพันธ์ทางธุรกิจ
6. การดึงข้อมูลจากฐานข้อมูลและคลังข้อมูลก็สามารถเชื่อมต่อกับอินเตอร์เน็ตได้และสาเหตุที่ต้องใช้เหมืองข้อมูลเพราะ
6.1จำนวนและขนาดข้อมูลขนาดใหญ่ถูกผลิตและขยายตัวอย่างรวดเร็ว การสืบค้นความรู้จะมีความหมายก็ต่อเมื่อฐานข้อมูลที่ใช้มีขนาดใหญ่มากปัจจุบันมีจำนวนและขนาดข้อมูลขนาดใหญ่ที่ขยายตัวอย่างรวดเร็วโดยผ่านทางอินเตอร์เน็ต ดาวเทียม และแหล่งผลิตข้อมูลอื่น ๆ เช่น เครื่องอ่านบาร์โค้ด เครดิตการ์ดพาณิชย์อิเล็กทรอนิกส์ เป็นต้น
6.2 ข้อมูลถูกจัดเก็บเพื่อนำไปสร้างระบบการสนับสนุนการตัดสินใจเพื่อเป็นการง่ายต่อการนำข้อมูลมาใช้ในการวิเคราะห์เพื่อการตัดสินใจส่วนมากข้อมูลจะถูกจัดเก็บแยกมาจากระบบฐานข้อมูลประจำวันโดยจัดอยู่ในรูปของคลังหรือเหมืองข้อมูล ซึ่งเป็นการง่ายต่อการนำเอาไปใช้ในการสืบค้นความรู้
6.3 ระบบคอมพิวเตอร์สมรรถนะสูงมีราคาต่ำลงเทคนิคเหมืองข้อมูลประกอบไปด้วย อัลกอริทึม (Algorithm)ที่มีความซับซ้อนและความต้องการการคำนวณสูงจึงจำเป็นต้องใช้งานกับระบบคอมพิวเตอร์สมรรถนะสูงปัจจุบันระบบคอมพิวเตอร์สมรรถนะสูงมีราคาต่ำลงพร้อมด้วยเริ่มมีเทคโนโลยีที่นำเครื่องไมโครคอมพิวเตอร์จำนวนมากมาเชื่อมต่อกันโดยเครือข่ายความเร็วสูง (PC Cluster) ทำให้ได้ระบบคอมพิวเตอร์สมรรถนะสูงในราคาต่ำ
6.4 การแข่งขันอย่างสูงในด้านอุตสาหกรรมและการค้าเนื่องจากปัจจุบันมีการแข่งขันอย่างสูงในด้านอุตสาหกรรมและการค้ามีการผลิตข้อมูลไว้อย่างมากมายแต่ไม่ได้นำมาใช้ให้เกิดประโยชน์จึงเป็นการจำเป็นอย่างยิ่งที่ต้องควบคุมและสืบค้นความรู้ที่ถูกซ่อนอยู่ในฐานข้อมูลความรู้ที่ได้รับสามารถนำไปวิเคราะห์เพื่อการตัดสินใจในการจัดการในระบบต่าง ๆ ซึ่งจะเห็นได้ว่าความรู้เหล่านี้ถือว่าเป็นผลิตผลอีกชิ้นหนึ่ง
ส่วนมากการออกแบบคลังข้อมูลขนาดเล็กมีแนวโน้มที่จะเริ่มจากการวิเคราะห์ตามความต้องการของผู้ใช้ และคลังข้อมูลเริ่มจากการวิเคราะห์ข้อมูลที่มีอยู่จริง และการรวบรวมข้อมูลในทางที่ข้อมูลสามารถนำไปใช้ต่อ คลังข้อมูลเป็นการรวมข้อมูลที่ส่วนกลาง คลังข้อมูลขนาดเล็กเป็นข้อมูลที่ได้จากคลังข้อมูล และทำให้ง่ายในการเข้าถึง และออกแบบตามวัตถุประสงค์เฉพาะโดยทั่วไปคลังข้อมูลมีแนวโน้มในการใช้เชิงกลยุทธศาสตร์แต่แนวคิดยังไม่ชัดเจน คลังข้อมูลขนาดเล็กมีแนวโน้มการเชิงยุทธวิธีและจุดมุ่งหมายสำหรับการนำไปใช้ทันที