Cơ sở dữ liệu (database) là gì ?

DATABASE - CƠ SỞ DỮ LIỆU (CSDL) TRONG MÁY TÍNH


CSDL là gì? 
CSDL trong máy tính được tổ chức như thế nào? 
CSDL bao gồm những khái niệm gì?


Máy tính đã trở nên thông dụng trong mỗi cơ quan, gia đình. Máy tính chỉ thật sự có ý nghĩa khi mà nó thay con người quản lý, lưu trữ và xử lý một lượng thông tin lớn mà con người không thể kiểm soát nổi. Bạn là người có nhiều bạn bè và quen biết rộng, và bạn không muốn quên ngày sinh của những người thân cũng như số điện thoại của những người quen. Bạn sử dụng một cuốn sổ nhỏ để ghi lại họ tên, địa chỉ, số điện thoại và ngày sinh của từng người. Cuốn sổ này rất tiện lợi vì bạn có thể tra bất cứ thứ gì mà bạn ghi lại trong sổ. Như vậy, bạn đã có một cơ sở dữ liệu đơn giản chứa đựng các thông tin cần thiết về mọi người.

Tuy nhiên, khi số người lên đến hàng trăm hoặc hơn, bạn sẽ thấy ghi sổ cũng còn bất tiện: bạn không thể tìm nhanh chóng số điện thoại của một người nếu bạn ghi chép tuần tự người này tiếp sau người kia mà không sắp xếp theo một trật tự nhất định nào đó. Còn nếu có sắp xếp, ví dụ theo thứ tự ABC của tên ở mỗi trang, bạn sẽ thấy một số trang có rất nhiều và lấn sang trang của chữ khác, còn một số lại rất ít. Hơn nữa, bạn lại cần ghi cả địa chỉ cơ quan của những người đó. Trong số đó có vài người làm cùng một nơi và bạn không muốn ghi lại.

Đây có lẽ là thời điểm thích hợp để máy tính cho thấy tác dụng của nó. Bạn sẽ cần phải sử dụng một chương trình máy tính (ứng dụng) chuyên biệt có sẵn để nhập tất cả dữ liệu này vào máy tính và nó sẽ quản lý thông tin giúp bạn.

Bạn có thể chia các thông tin ra thành hai phần, các thông tin về cá nhân và các thông tin về cơ quan công tác. Nó sẽ tương tự như hai bảng 1và 2. Như vậy, bạn đã có một cơ sở dữ liệu (database) chứa thông tin về những người quen. Cơ sở dữ liệu này gồm hai bảng (table): người quen và cơ quan công tác.

Cơ sở dữ liệu (database): kho thông tin về một chủ đề, được tổ chức hợp lý để dễ dàng quản lý và truy tìm. 
Bất kỳ kho thông tin nào đáp ứng được yêu cầu này đều có thể coi là một cơ sở dữ liệu (CSDL). 

Như trên đây, bạn có hai cơ sở dữ liệu: CSDL người quen ghi trong sổ và CSDL trên máy tính. Thông thường, những thông tin trong CSDL được chia thành nhiều mẫu tin có cấu trúc tương đối giống nhau, ví dụ như đây là một mẫu tin:

- Họ tên: Nguyễn Thanh Hà
- Ngày sinh: 28/5/1970
- Điện thoại: 8242948
- Địa chỉ: 1B Chương Dương, Hà Nội
- Tên cơ quan: Ngân Hàng Đầu Tư và Phát Triển Việt Nam

Table (Bảng): Là một thành phần cơ bản trong chương trình quản trị cơ sở dữ liệu quan hệ. Bảng được hình thành khi sắp xếp các thông tin có liên quan với nhau theo hàng và cột. Các hàng tương ứng với các bản ghi (record) dữ liệu và các cột tương ứng với trường dữ liệu. Các bạn hãy xem bảng Người quen. Các hàng là người, mỗi hàng tương ứng với một người. Các cột là trường (hay lĩnh vực) của thông tin. Ta có các cột Họ tên, Ngày sinh, Điện thoại, Địa chỉ, Tên cơ quan.

Record (bản ghi): trong chương trình quản trị cơ sở dữ liệu, đây là một đơn vị hoàn chỉnh nhỏ nhất của dữ liệu, được lưu trữ trong những trường hợp dữ liệu đã được đặt tên. Trong một cơ sở dữ liệu dạng bảng, bản ghi dữ liệu đồng nghĩa với hàng (row). Bản ghi chứa tất cả các thông tin có liên quan với mẫu tin mà cơ sở dữ liệu đang theo dõi. Ví dụ, trong cơ sở dữ liệu về Người quen, bản ghi sẽ liệt kê tên người quen, số điện thoại, ngày sinh, địa chỉ và tên cơ quan. Hầu hết các chương trình đều hiển thị các bản ghi dữ liệu theo hai cách: theo các mẫu nhập dữ liệu và theo các bảng dữ liệu. Các bản ghi dữ liệu được hiển thị dưới dạng các hàng ngang và mỗi trường dữ liệu là một cột.

Field (Trường dữ liệu): trong chương trình quản trị cơ sở dữ liệu, đây là không gian dành cho một mẫu thông tin trong bản ghi dữ liệu. Trong chương trình quản trị CSDL dạng bảng với dữ liệu được tổ chức theo hàng và cột, thì trường dữ liệu tương ứng với các cột. Như ở bảng Cơ quan, ta có các trường Tên cơ quan, Địa chỉ, Thành phố, Số điện thoại, Lĩnh vực hoạt động.

RDBM - Relation Database Management (Quản lý cơ sở dữ liệu quan hệ): là một cách quản lý cơ sở dữ liệu, trong đó dữ liệu được lưu trữ trong các bảng dữ liệu hai chiều gồm các cột và các hàng, có thể liên quan với nhau nếu các bảng đó có một cột hoặc một trường chung nhau.

Chương trình quản trị cơ sở dữ liệu: một chương trình ứng dụng trên máy tính cung cấp các công cụ để truy tìm, sửa chữa, xóa và chèn thêm dữ liệu. Các chương trình này cũng có thể dùng để thành lập một cơ sở dữ liệu và tạo ra các báo cáo, thống kê. 

Các chương trình quản trị cơ sở dữ liệu liên quan khá thông dụng hiện nay tại Việt Nam là Foxpro, Access cho ứng dụng nhỏ, DB 2, MS SQL và Oracle cho ứng dụng vừa và lớn.

Bạn sử dụng tên cơ quan để liên kết giữa hai bảng Người Quen và Cơ Quan. Đôi lúc, bạn nhận thấy rằng tên cơ quan không phải là duy nhất. Rất có thể hai công ty FPT, một công ty hoạt động trong lĩnh vực xử lý thực phẩm và một công ty hoạt động trong lĩnh vực tin học. ở đây ta có khái niệm khóa (key).

Primary key (khóa chính ) là một giá trị dùng để phân biệt bản ghi này với bản ghi khác. Giá trị của khóa chính trong mỗi bản ghi là duy nhất trong cả bảng (table). Có thể xem số chứng minh nhân dân như một khóa chính và không người nào giống người nào.

Ngoài khóa chính ra còn có khóa ngoài (foreign key). Khóa ngoài là giá trị dùng để liên kết giữa các bảng và thiết lập mối quan hệ giữa các bản ghi trong các bảng khác nhau. Giả sử trong ví dụ, ta đặt ra mã số cơ quan và mã số cơ quan này duy nhất đối với mỗi cơ quan, bảng của ta sẽ như bảng 3.

Trong bảng Cơ quan, Mã số cơ quan là khóa chính. Còn trong bảng Người quen, Mã số cơ quan là khóa ngoài và dùng để xác định cơ quan người đó làm việc.

Thông thường, để xử lý dữ liệu trong CSDL quan hệ, người ta thường sử dụng một công cụ là Ngôn ngữ truy vấn có cấu trúc (Structured Query Language - SQL) để thực hiện các công việc như tìm kiếm thông tin, cập nhật thông tin mới, xóa bỏ thông tin cũ...

Ví dụ: để chọn ra từ bảng Người quen những người làm việc tại cơ quan có mã số 001 (tức Bộ Giao Thông Vận Tải) ta sử dụng câu lệnh như sau:

SELECT*FROM Nguoi_quen WHERE Ma_so_co_quan = 001


Kết quả trả về như bảng 5.

Ngôn ngữ SQL là một bộ phận không thể thiếu của các chương trình quản trị cơ sở dữ liệu quan hệ.

Đến đây có lẽ bạn đã mệt với nhiều khái niệm về cơ sở dữ liệu. Tuy nhiên chúng rất có ích. Nếu đi sâu nghiên cứu và thực hành hơn nữa, bạn sẽ còn tìm thấy nhiều điều lý thú và hữu dụng. Cơ sở dữ liệu là một lĩnh vực rất quan trọng của công nghệ thông tin mà nếu thiếu nó, nhiều vấn đề đặt ra sẽ khó mà giải quyết được.

Tìm kiếm nội dung khác: