สรุป
บทที่3 ฐานข้อมูล และคลังข้อมูล

มีรูปแบบเป็นลำดับชั้นโดยเริ่มด้วยหน่วยที่เล็กที่สุด คือ บิต (Bit) ไบต์ (Byte) เขต ข้อมูล(Field) ระเบียนข้อมูล (Record) และไฟล์ (File) ตามลำดับ
- บิต (Bit) เป็นหน่วยที่เล็กที่สุดของข้อมูลที่จัดเก็บในระบบคอมพิวเตอร์เป็นเลขฐาน
สอง 0 กับ 1
- ไบต์ (Byte) ประกอบด้วยบิตหลาย ๆ บิตมาเรียงต่อกัน 8 บิต มาเรียงต่อกันเป็น 1 ไบท์ สร้างรหัสแทนข้อมูลใช้แทนอักขระ เป็นตัวเลข ตัวอักษร สัญลักษณ์ ได้ทั้งหมด 28 = 256 ตัว
- เขตข้อมูล (Field) เป็นการนำข้อมูลหลายอักขระมารวมกันเป็นคำให้เกิดความหมาย
- ระเบียนข้อมูล (Record) กลุ่มของเขตข้อมูลที่มีความสัมพันธ์กัน นำมารวมกัน
- ไฟล์ (File) คือ กลุ่มของระเบียนข้อมูลที่มีความสัมพันธ์กันนำมาจัดเก็บไว้ด้วยกัน
ปัญหาเกี่ยวกับแฟ้มข้อมูล
1. ความซ้ำซ้อนของข้อมูล (Data Redundancy) การเก็บข้อมูลมากกว่าหนึ่งแห่ง ทำให้ยากต่อการควบคุมความถูกต้องให้ตรงกันของข้อมูล
2. ความผูกพันระหว่างข้อมูลและโปรแกรม (Program-Data Dependence) เป็นความผูกพันระหว่างข้อมูลและโปรแกรม โดยการเรียกใช้ข้อมูลต้องมีโปรแกรม หากเปลี่ยนแปลงข้อมูล หรือโครงสร้าง จะมีผลกระทบต่อโปรแกรม ทำให้ต้องตามแก้โปรแกรมที่เกี่ยวข้อง ซึ่งทำให้เกิดค่าใช้จ่ายสูงในการบำรุงรักษาโปรแกรม
3. การไม่สามารถใช้ข้อมูลร่วมกันได้ (Lack of Data sharing) มีการจัดเก็บข้อมูลแยกจากกันทำให้ความพร้อมการใช้ข้อมูลยาก ไม่สามารถนำข้อมูลจากหลายแฟ้มมาใช้งานร่วมกันได
4. การขาดความร่วมมือ (Lack of Flexibility) ระบบแฟ้มข้อมูลขาดความคล่องตัวในการตอบสนองต่อความต้องการใหม่ ๆ
5. การขาดระบบรักษาความปลอดภัยที่ดี (Poor Security) การป้องกันไม่ให้ผู้ที่ไม่มีสิทธิเข้าถึงข้อมูลและใช้ข้อมูล มีขอบเขตความสามารถจำกัด
แนวทางในการใช้ฐานข้อมูลในการบริหารจัดการข้อมูล
1.ลดความซ้ำซ้อนของข้อมูล (Minimum Redundancy) การนำข้อมูลมารวมกันเพื่อตัดข้อมูลที่ซ้ำกันออกไป ระบบฐานข้อมูลมี DBMS เป็นซอฟต์แวร์ที่ดูแลจัดการข้อมูลทำให้ควบคุมการเกิดความซ้ำซ้อนของข้อมูลได้
มีความเป็นอิสระต่อกัน (Data Independence) ระบบฐานข้อมูลมีแหล่งรวมข้อมูลเก็บข้อมูลต่างๆ ไว้ส่วนกลาง มี DBMS ดูแลการปรับเปลี่ยนโครงสร้างของข้อมูล
สนับสนุนการใช้ข้อมูลร่วมกัน (Improved Data Sharing) การจัดเก็บข้อมูลไว้ส่วนกลางช่วยให้สามารถใช้ข้อมูลร่วมกันได้ โปรแกรมประยุกต์สามารถใช้ข้อมูลที่มีอยู่แล้วโดยไม่ต้องเพิ่มข้อมูลเข้าไปในระบบอีก
2.มีความเป็นอิสระของข้อมูล (Data Independence)
3.สนับสนุนการใช้ข้อมูลร่วมกัน (Improved Data Sharing)
4.มีความคล่องตัวในการใช้งาน (Improved Flexibility) การรวบรวมข้อมูลไว้ที่เดียวกัน มีการควบคุมอยู่ส่วนกลางช่วยให้มีความคล่องตัวในการใช้งานได้มากกว่าระบบไฟล์ข้อมูล DBMS มีเครื่องมือช่วยในการสร้างแบบฟอร์มและรายงานต่าง ๆ ลดขั้นตอน และเวลาในการจัดทำรายงานและการเขียนโปรแกรมได้มาก
5.มีระบบรักษาความปลอดภัยของข้อมูลสูง (High Degree of Data Integrity) ฐานข้อมูลมีระบบรักษาความปลอดภัย โดย DBMS จะตรวจสอบรหัสผ่านเข้าสู่ระบบ และอนุญาตผู้มีสิทธิเข้ามาในระบบได้เฉพาะสิทธิแต่ละคนเท่านั้น
ปัญหาเกี่ยวกับแฟ้มข้อมูล
ระบบฐานข้อมูลประกอบด้วยองค์ประกอบหลัก 4 ส่วน คือ ข้อมูล (Data) ฮาร์ดแวร์ (Hardware)
ซอฟแวร์ (Software) และผู้ใช้ (Users)1. ข้อมูล (Data) หมายถึง ข้อมูลและความสัมพันธ์ของข้อมูลที่จัดเก็บอยู่ในฐานข้อมูล
2. ฮาร์ดแวร์ (Hardware)ได้แก่ เครื่องคอมพิวเตอร์และอุปกรณ์รอบข้าง (Peripherals)
3. ซอฟแวร์ (Software)ได้แก่ ระบบปฏิบัติการ (Operating Systems)และระบบจัดการข้อมูล (Database Management Systeme : DBMS) รวมทั้งโปรแกรมยูทิลิตี้ต่าง ๆ
4. ผู้ใช้ (Users)ได้แก่ บุคลากรที่เกี่ยวข้องกับระบบฐานข้อมูล เช่น ผู้บริหารฐานข้อมูล (Database Administrator : DBA) นักวิเคราะห์ระบบ (System Analysts) ผู้เขียนโปรแกรมประยุกต์ (Programmers)และผู้ใช้งาน (End Users) เป็นต้น
ระบบจัดการฐานข้อมูล ( Database Management System) หรือที่เรียกว่า ดีบีเอ็มเอส (DBMS)
คือซอฟต์แวร์สำหรับบริหารและจัดการฐานข้อมูล เปรียบเสมือนสื่อกลางระหว่างผู้ใช้และโปรแกรมต่างๆ ที่เกี่ยวข้องกับการใช้ฐานข้อมูล ซึ่งมีหน้าที่ช่วยให้ผู้ใช้เข้าถึงข้อมูลได้ง่ายสะดวกและมีประสิทธิภาพ การเข้าถึงข้อมูลของผู้ใช้ อาจเป็นการสร้างฐานข้อมูล การแก้ไขฐานข้อมูล หรือการตั้งคำถามเพื่อให้ได้ข้อมูลมาโดยผู้ใช้ไม่จำเป็นต้องรับรู้เกี่ยวกับรายละเอียดภายในโครงสร้างของฐานข้อมูล เปรียบเสมือนเป็นสื่อกลางระหว่างผู้ใช้และโปรแกรมต่าง ๆ ที่เกี่ยวข้องกับการใช้ฐานข้อมูลซึ่งต่างจากระบบแฟ้มข้อมูลที่หน้าที่เหล่านี้จะเป็นหน้าที่ของโปรแกรมเมอร์
รูปแบบของฐานข้อมูล
ฐานข้อมูลแบบลําดับขั้น (Hierarchical Database)
เป็นฐานข้อมูลที่นําเสนอข้อมูลและความสัมพันธ์ระหว่างข้อมูลในรูปแบบของโครงสร้างต้นไม้
(Tree Structure) เป็นโครงสร้างลักษณะคล้ายต้นไม้เป็นลําดับขั้น ซึ่งแตกออกเป็นกิ่งก้านสาขา ผู้ที่คิดค้นฐานข้อมูลแบบนี้คือ North American Rockwell

ฐานข้อมูลแบบเครือข่าย (Network Database)
โครงสร้างของข้อมูลแต่ละแฟ้มข้อมูลมีความสัมพันธ์คล้ายร่างแห โดยมีลักษณะโครงสร้างคล้ายกับโครงสร้างแบบลําดับขั้น แตกต่างกันตรงที่โครงสร้างแบบเครือข่ายสามารถมีต้นกําเนิดของข้อมูลได้มากกว่า 1 เรคอร์ด การออกแบบลักษณะของฐานข้อมูลแบบเครือข่ายทําให้สะดวกในการค้นหามากกว่าลักษณะฐานข้อมูลแบบลําดับขั้น เพราะไม่ต้องไปเริ่มค้นหาตั้งแต่ข้อมูลต้นกําเนิดโดยทางเดียว ข้อมูลแต่ละกลุ่มจะเชื่อมโยงกันโดยตัวชี้

ฐานข้อมูลแบบเชิงสัมพันธ์ (Relational Database)
ฐานข้อมูลแบบเชิงสัมพันธ์ประกอบด้วยกลุ่มของเอนทิตี้ที่มีความสัมพันธ์กัน โดยข้อมูลของแต่ละเอนทิตี้จะถูกจัดเก็บข้อมูลในรูปแบบของตาราง 2 มิติในแนวแถว (Row) และแนวคอลัมน์(Column) โดยบรรทัดแรกของตารางคือ ชื่อแอททริบิวต์

Data Mining (เหมืองข้อมูล )
คือกระบวนการที่กระทำกับข้อมูลจำนวนมากเพื่อค้นหารูปแบบและความสัมพันธ์ที่ซ่อนอยู่ในชุดข้อมูลนั้น ในปัจจุบันการทำเหมืองข้อมูลได้ถูกนำไปประยุกต์ใช้ในงานหลายประเภท ทั้งในด้านธุรกิจที่ช่วยในการตัดสินใจของผู้บริหาร ในด้านวิทยาศาสตร์และการแพทย์รวมทั้งในด้านเศรษฐกิจและสังคม
การทำเหมืองข้อมูล (Data Mining) เปรียบเสมือนวิวัฒนาการหนึ่งในการจัดเก็บและตีความหมายข้อมูล จากเดิมที่มีการจัดเก็บข้อมูลอย่างง่ายๆ มาสู่การจัดเก็บในรูปแบบฐานข้อมูลที่สามารถดึงข้อมูลสารสนเทศมาใช้จนถึงการทำเหมืองข้อมูลที่สามารถค้นพบความรู้ที่ซ่อนอยู่ในข้อมูล หรือจะแยกๆ เป็นข้อๆ ได้ดังนี้
– กระบวนการหรือการเรียงลำดับของการค้นข้อมูลจำนวนมากและเก็บข้อมูลที่เกี่ยวข้อง
– การนำมาใช้โดยหน่วยงานทางธุรกิจและนักวิเคราะห์ทางการเงินหรือการนำมาใช้งานในด้านวิทยาศาสตร์เพื่อเอาข้อมูลขนาดใหญ่ที่สร้างโดยวิธีการทดลองและการสังเกตการณ์ที่ทันสมัย
– การสกัดหรือแยกข้อมูลที่เป็นประโยชน์จากข้อมูลขนาดใหญ่หรือฐานข้อมูล
– การวางแผนทรัพยากรขององค์กรโดยสามารถวิเคราะห์ทางสถิติและตรรกะของข้อมูลขนาดใหญ่เป็นการมองหารูปแบบที่สามารถช่วยการตัดสินใจได้
สรุป
คลังข้อมูล (Data Warehouse) เป็นการรวบรวมข้อมูลจากฐานข้อมูลของระบบงาน ปฏิบัติงานประจ าวันขององค์กรแล้วน ามาแปลงข้อมูลให้อยู่ในรูปแบบที่เหมาะสมในการจัดเก็บ และสะดวกในการใช้งานแล้วจึงน าข้อมูลนั้นเข้าไปเก็บในคลังข้อมูล(Data Warehouse) การ พัฒนาหรือสร้างคลังข้อมูลมาใช้ในองค์กรจะต้องมีการพิจารณาถึงองค์ประกอบที่จ าเป็นในการ สร้างให้เหมาะสมด้วยทั้งนี้เพื่อให้เกิดความคุ้มค่าในการลงทุนและเกิดประโยชน์สูงสุดต่อองค์กร
อ้างอิง https://pimpanp.wordpress.com/2008/04/26/
ความคิดเห็น
แสดงความคิดเห็น