บทที่ 3

ฐานข้อมูล และคลังข้อมูล

 

 

   

 

 

 

 

 

 

 

 

 

 

       โครงสร้างข้อมูลมีรูปแบบเป็นลำดับชั้นโดยเริ่มจากหน่วยที่เล็กที่สุด

คือบิต (Bit) คือหน่วยที่เล็กที่สุด ประกอบด้วยเลขฐานสอง  ซึ่งมีสถานะเป็น 0 กับ 1

ไบต์ (Byte) ประกอบด้วยบิตหลายๆ บิตมาเรียงต่อกัน เช่น นำ 8 บิตมาเรียงกันเป็น1 ไบต์

เขตข้อมูล (Field) เป็นการนำข้อมูลหลายอักขระมารวมกันเป็นคำเพื่อให้เกิดความหมาย

ระเบียนข้อมูล (Record) คือ กลุ่มของเขตข้อมูลที่มีความสัมพันธ์กัน ถูกนำมารวมกัน เช่น ระเบียนข้อมูลพนักงาน

ไฟล์ (File) คือ กลุ่มของระเบียนข้อมูลที่มีความสัมพันธ์กันถูกนำมาจัดเก็บไว้ด้วยกัน 

ปัญหาเกี่ยวกับแฟ้มข้อมูลความซ้ำซ้อนของข้อมูล (Data Redundancy) 

การจัดเก็บข้อมูลมากกว่าหนึ่งแห่ง ทำให้ยากที่จะควบคุมถูกต้องตรงกันของข้อมูล

ความผูกพันระหว่างข้อมูลและโปรแกรม (Program-Data Dependence)

คือ ความไม่เป็นอิสระของข้อมูล หากมีการเปลี่ยนแปลงโครงสร้างหรือวิธีการเรียกใช้ข้อมูลย่อมมีผลกระทบต่อโปรแกรม ทำให้ต้องตามแก้โปรแกรมต่างๆ ที่เกี่ยวข้องก่อให้เกิดค่าใช้จ่ายในการบำรุงรักษาโปรแกรมสูง

การไม่สามารถใช้ข้อมูลร่วมกันได้ (Lack of Data Sharing) ข้อมูล

ที่มีการจัดเก็บแยกจากกันโดนแต่ละส่วนงานจัดเก็บข้อมูลเป็นของตนเองทำให้ความซ้ำซ้อนของการใช้ข้อมูลอยู่ในระดับต่ำ ยากต่อการใช้งานร่วมกันได้

การขาดความคล่องตัว (Lack of Flexibility)

ขาดการคล่องตัวในการตอบสนองต่อความต้องการใหม่ๆ เนื่องจากแฟ้มข้อมูลไม่สนับสนุนงานในรูปแบบที่ไม่เคยทำเป็นประจำ

การขาดระบบรักษาความปลอดภัยที่ดี (Poor Security)

คือ การกำหนดว่าผู้ใช้รายใดสามารถเข้าถึงข้อมูลได้ในระดับใดได้บ้างจะทำได้ยากโดยการเขียนโปรแกรม วิธีรักษาความปลอดภัยของระบบแฟ้มข้อมูลมีขอบเขตความสามารถค่อนข้างจำกัด

 แนวทางในการใช้ฐานข้อมูลในการบริหารจัดการข้อมูลลดความซ้ำซ้อน (Minimum Redundancy)

 การจัดเก็บของแฟ้มข้อมูลเป็นการจัดเก็บข้อมูลเดียวกันไว้หลายแห่ง ทำให้เกิดความซ้ำซ้อนของข้อมูล การนำข้อมูลมารวมกันเพื่อตัดหรือลดส่วนที่ซ้ำกันออกไปจะช่วยลดความซ้ำซ้อนของข้อมูลได้

มีความเป็นอิสระของข้อมูล (Data Independence)

DBMS ช่วยในการดูแลการปรับเปลี่ยนโครงสร้างของข้อมูล ทำให้โปรแกรมต่างๆ เป็นอิสระจากการเปลี่ยนแปลงโครงสร้างของข้อมูล

สนับสนุนการใช้ข้อมูลร่วมกัน (Improved Data Sharing)

การจัดเก็บข้อมูลไว้ในส่วนกลางช่วยให้สามารถใช้ข้อมูลร่วมกันได้ โปรแกรมประยุกต์ที่จะพัฒนาขึ้นใหม่สามารถใช้ข้อมูลที่มีอยู่แล้วได้โดยไม่จำเป็นต้องเพิ่มข้อมูลเข้าไปในระบบอีก

มีความคล่องตัวในการใช้งาน (Improved Flexibility)

การเก็บข้อมูลในส่วนกลางจะช่วยใหม่มีความคล่องตัวในการใช้งานเพราะมี DBMS โดยทั่วไปจะมีเครื่องมือสนับสนุนในการสร้างแบบฟอร์มและรายงานต่างๆ ซึ่งช่วยลงขั้นตอนและเวลาในการจัดทำ

มีระบบรักษาความปลอดภัยของข้อมูลสูง (High Degree of Data Integrity)

านข้อมูลมีระบบรักษาความปลอดภัยของข้อมูล โดย DBMS จะตรวจสอบรหัสผ่านเข้าสู่ระบบ และจะอนุญาตให้ผู้ที่มีสิทธิเข้ามาในระบบทำการเรียกดูข้อมูลหรือแก้ไขข้อมูลได้เฉพาะสิทธิที่กำหนดในแต่ละคนเท่านั้น

 องค์ประกอบของระบบฐานข้อมูลระบบฐานข้อมูลประกอบด้วยองค์ประกอบหลัก 4 ส่วน คือ

1.  ข้อมูล (Data) ข้อมูลและความสัมพันธ์ของข้อมูลที่จัดเก็บอยู่ในฐานข้อมูล

2.  ฮาร์ดแวร์ (Hardware) เครื่องคอมพิวเตอร์และอุปกรณ์รอบข้าง

3.  ซอฟต์แวร์ (Software) ระบบปฏิบัติการ (Operating Systems) และระบบจัดการข้อมูล (Database Management System : DBMS)

4.  ผู้ใช้ (Users) บุคลากรที่เกี่ยวข้องกับระบบฐานข้อมูล  

รูปแบบของฐานข้อมูล (Database Model) แบบจำลองฐานข้อมูลลำดับชั้น (Hierarchical Database Model) มีโครงสร้างคล้ายโครงสร้างต้นไม้ (Tree Structure)           

  1.  ข้อมูลมีความสัมพันธ์กันในลักษณะ One-to-Many            

2.  ข้อมูลจะได้รับการจัดเก็บในรูปของ Segment            

3.  Segment ที่อยู่บนสุดเรียกว่า Root Node ลงมาเรียกว่า Child Node           

4.  Node ระดับบนจะเป็น Parent Segment ของ Node           

5.  ระดับล่างลงมาโดยที่ Parent Segment สามารถมี Child Segment ได้มากกว่าหนึ่ง ในขณะที่ Child Segment จะขึ้นอยู่กับ Parent Segment เดียวเท่านั้น 

ข้อดีและข้อจำกัด          

  เข้าใจง่าย มีความซ้ำซ้อนน้อยและเหมาะกับข้อมูลที่มีการเยงลำดับอย่างต่อเนื่อง แต่ไม่สามารถรองรับความสัมพันธ์ของข้อมูลในลักษณะ Many-to-Many และการเข้าถึงข้อมูลมีความคล่องตัวน้อย

 แบบจำลองฐานข้อมูลเครือข่าย (Network Database Model)           

ข้อดีและข้อจำกัด  

โครงสร้างของข้อมูลที่นำเสนอเป็นลักษณะ Multi-List Structure โดยมีความสัมพันธ์ของข้อมูลเป็นแบบ Many-to-Many โดยที่ Segment สามารถมี Parent ได้มากกว่าหนึ่ง และจะเรียก Parent  ว่า Owner ส่วน Child เรียกว่า Member           

ความซ้ำซ้อนของข้อมูลมีน้อยกว่าแบบจำลองฐานข้อมูลลำดับชั้น สามารถเชื่อมโยงข้อมูลแบบไป-กลับได้ โดยใช้พอยน์เตอร์ วิธีนี้จะเปลืองเนื้อที่ในการจัดเก็บพอยน์เตอร์ และยังมีความยุ่งยากอยู่ในการเปลี่ยนแปลโครงสร้างข้อมูลที่มีความซับซ้อน

 แบบจำลองฐานข้อมูลเชิงสัมพันธ์ (Relational Database Model)            

แสดงโครงสร้างของข้อมูลในรูปแบบตาราง และเรียกตารางว่า รีเลชัน (Relation) โดยแต่ละรีเลชันประกอบด้วย แถวหรือทัพเพิล (Tuple) และ คอลัมน์ซึ่งเรียกว่า แอตทริบิวต์ (Attribute) ในแต่ละรีเลชันจะมีแอตทิรบิวต์หรือกลุ่มของแอตทริบิวต์ ซึ่งเรียกว่า คีย์ (Key) 

ข้อดีและข้อจำกัด           

มีโครงสร้างที่เข้าใจง่ายกว่าฐานข้อมูลอื่นๆ ผู้ใช้ไม่จำเป็นต้องเข้าใจถึงโครงสร้างการจัดเก็บข้อมูลทางกายภาพ ข้อมูลมีความเป็นอิสระจากโปรแกรม แต่ต้องใช้ฮาร์ดแวร์และซอฟต์แวร์ที่มีคุณภาพสูง 

ระบบข้อมูลแบบกระจาย (Distributed Database)           

ข้อมูลจัดเก็บไว้ที่เครื่องคอมพิวเตอร์หลายเครื่องตามพื้นที่ต่างๆ แทนที่จะเก็บไว้ที่ส่วนกลางเพียงแห่งเดียว เพื่อความคล่องตัวในการดำเนินงาน โดยเครื่องคอมพิวเตอร์เหล่านี้สามารถสื่อสารถึงกันได้ 

ข้อดีและข้อจำกัด           

ข้อมูลสอดคล้องกับลักษณะการใช้งานจริง ทำให้สามารถเรียกใช้ข้อมูลได้อย่างรวดเร็ว แต่ข้อมูลแบบกระจายจะมีความซับซ้อนในการประมวลผลเพื่อเรียกใช้ข้อมูล การฟื้นสภาพ และการออกแบบฐานข้อมูลมากกว่าระบบฐานข้อมูลแบบรวม 

ฐานข้อมูลแบบออบเจ็กต์ (Object-Oriented Database)           

เรียกว่า ฐานข้อมูลเชิงวัตถุเกิดจากแนวคิดการเขียนโปรแกรมเชิงวัตถุ (Object-Oriented Program :OOP) เพื่อตอบสนองต่อความต้องการในการจัดเก็บข้อมูลที่มีความสลับซับซ้อน มีขนาดใหญ่ และมีความหลากหลายมากกว่าเดิม เช่น ข้อมูลเสียง รูปภาพ และ วีดิทัศน์ 

ข้อดีและข้อจำกัด           

สามารถเก็บข้อมูลพื้นฐานทั่วไป ข้อมูลวัตถุ และข้อมูลมัลติมีเดียได้ง่าย แต่การประมวลผลรายการ ข้อมูลทั่วไปจะไม่รวดเร็วเท่ากับระบบฐานข้อมูลเชิงสัมพันธ์ 

คลังข้อมูล (Data Warehouse)            

คือ ที่เก็บรวบรวมข้อมูลจากหลายแหล่งและหลากหลายชนิด เข้าด้วยกัน เป็นฐานข้อมูลขนาดใหญ่ขององค์การ โดยข้อมูลในคลังข้อมูลอาจได้มาจากฐานข้อมูลของระบบปฏิบัติการในองค์การ และฐานข้อมูลจากแห่งภายนอกองค์การ ซึ่งข้อมูลเหล่านี้จะได้รับการเลือก, กลั่นกรอง และปรับแก้ไขทำให้เป็นมาตรฐานเดียวกัน

ดาต้ามาร์ท (Data Mart)           

คือ คลังข้อมูลขนาดเล็กที่มีลักษณะเจาะจง สำหรับใช้ในองค์การธุรกิจ มีค่าใช้จ่ายต่ำกว่าคลังข้อมูล และการจัดทำข้อมูลดาต้ามาร์ท ใช้เวลาที่สั้นกว่าคลังข้อมูล และการนำไปประยุกต์ใช้ในการพัฒนาระบบสนับสนุนการตัดสินใจภายในหน่วยงาน สะดวกกว่าการใช้คลังข้อมูล

 ธุรกิจอัจฉริยะ (Business Intelligence : BI)           

 คือ การใช้ข้อมูลขององค์การที่มีคุณค่ามาช่วยสนับสนุนการตัดสินใจในการดำเนินงานของธุรกิจ ซึ่งโดยทั่วไปจะเกี่ยวข้องกับการเข้าใช้งานข้อมูล การวิเคราะห์ข้อมูล และการค้นพบโอกาสใหม่ๆ ในการดำเนินการทางธุรกิจ

การวิเคราะห์ข้อมูลหลายมิติและการค้นหาความรู้ในคลังข้อมูล           

มี 2 ประเภท1.  การประมวลผลเชิงวิเคราะห์แบบออนไลน์ (OLAP)  เป็นเครื่องมือที่สามารถในการค้นหาและวิเคราะห์ข้อมูลจากคลังข้อมูลเพื่อตอบสนองความต้องการของผู้ใช้ได้อย่างรวดเร็ว

              2.      ดาต้าไมนิ่ง (Data Mining) เป็นเครื่องมือและเทคนิคในการสกัด (Extract) ข้อมูลและประมวลผลข้อมูลในเชิงวิเคราะห์ขั้นสูงจากฐานข้อมูลขนาดใหญ่ โดยสามารถค้นหารูปแบบ แนวโน้ม พฤติกรรม และความสัมพันธ์ที่ซ้อนเร้นอยู่ภายในข้อมูลเพื่อให้ความรู้ใหม่ๆ 

ความแตกต่างระหว่างคลังข้อมูลกับฐานข้อมูลปฏิบัติการ           

ฐานข้อมูลปฏิบัติการ (Operational Database) เป็นระบบที่นำมาช่วยในการรวบรวมและจัดเก็บข้อมูลรายการธุรกรรมจาการดำเนินงานประจำวัน ซึ่งแหล่งข้อมูลเหล่านี้นับวันจะเพิ่มปริมาณมากขึ้น จึงจำเป็นต้องจัดเก็บข้อมูลในอดีตลงในสื่อบันทักข้อมูลที่แยกเก็บต่างหาร เช่น จัดเก็บในเทป หรือ ดิสก์ที่มีความจุสูง           

คลังข้อมูล

เป็นแหล่งเก็บข้อมูลรวมข้ององค์การ ที่ได้รับการออกแบบมาให้มีความเรียบง่ายต่อการค้นหาและเรียกใช้ได้อย่างรวดเร็ว สามารถรองรับการวิเคราะห์ข้อมูลที่มีปริมาณมาก โดยข้อมูลมีการจัดเก็บในลักษณะที่รวบรวมจัดเก็บเป็นระเบียบตามเนื้อหา และแปรผันตามเวลา ซึ่งข้อมูลในคลังข้อมูลไม่สามารถซ้ำซ้อนได้ นำไปเป็นข้อมูลพื้นฐานให้กับระบบงานเพื่อการบริหารอื่นๆ

 

 

edit @ 30 Jan 2009 16:41:55 by sirirat50324704

edit @ 2 Feb 2009 17:29:49 by sirirat50324704

edit @ 2 Feb 2009 18:20:37 by sirirat50324704

edit @ 2 Feb 2009 20:39:26 by sirirat50324704

Comment

Comment:

Tweet