SQL - Công cụ quản lý CSDL điển hình


SQL - CÔNG CỤ QUẢN LÝ CSDL ĐIỂN HÌNH



SQL là một công cụ quản lý dữ liệu được sử dụng phổ biến ở nhiều lĩnh vực. Nếu bạn không có nhiều thời gian để nghiên cứu sâu về tin học mà lại có nhiều dữ liệu cần phải được phân tích, xử lý, thì hãy dùng SQL vì SQL đơn giản nhưng rất hiệu quả. Hầu hết tất cả các ngôn ngữ lập trình cấp cao đều có hỗ trợ SQL. Có thể kể ra như MS Visual Basic, MS Access, MS Visual Foxpro, DBase, DB2, Paradox, Oracle....

Đầu tiên SQL được sử dụng trong các ngôn ngữ quản lý CSDL và chạy trên máy đơn lẻ. Do sự phát triển nhanh chóng của nhu cầu xây dựng những CSDL lớn theo mô hình khách/chủ (Client/Server), nhiều phần mềm sử dụng ngôn ngữ SQL đã ra đời mà điển hình là MS SQL Server, Oracle, Sybase... Trong mô hình khách/chủ, toàn bộ CSDL được tập trung lưu trữ trên máy chủ (Server), mọi thao tác xử lý dữ liệu được thực hiện trên máy chủ bằng các lệnh SQL. Máy trạm (Client) chỉ dùng để cập nhật dữ liệu cho máy chủ hoặc lấy thông tin từ máy chủ.

Trên lĩnh vực đang phát triển hiện nay là Internet, ngôn ngữ SQL lại càng đóng vai trò quan trọng hơn. Nó được sử dụng để nhanh chóng tạo ra các trang Web động (Dynamic Web Page). Trang Web động thường có nội dung được lấy ra từ CSDL. SQL có thể được sử dụng như một chất keo kết dính giữa CSDLvà trang Web. Khi người dùng yêu cầu, SQL sẽ thực hiện việc truy cập thông tin trong CSDL trên máy chủ và hiển thị kết quả trên trang Web. Và SQL cũng là công cụ để cập nhật thông tin cho CSDLđó.

Vậy SQL là gì mà lại có vai trò quan trọng đến như vậy? Trước hết SQL là viết tắt của cụm từ Structure Query Language, tạm dịch là ngôn ngữ truy vấn có cấu trúc. Có nghĩa là SQL chỉ làm việc với những dữ liệu có cấu trúc dạng bảng (table) như của Foxpro, DBase, Access ... Nếu bạn chỉ làm việc với các tệp dữ liệu dạng văn bản như của Winword, hay các ảnh, âm thanh ... thì bạn không thể ứng dụng SQL được.

Đối tượng của SQL là các bảng dữ liệu và các bảng này bao gồm nhiều cột và hàng. Cột được gọi là trường và hàng là bản ghi của bảng. Cột với tên gọi và kiểu dữ liệu xác định tạo nên cấu trúc của bảng. Khi bảng được tổ chức có hệ thống cho một mục đích, công việc nào đó ta có một CSDL. Trong công việc hàng ngày thường gặp rất nhiều loại bảng khác nhau như bảng danh sách nhân viên, danh sách phòng ban, bảng lương, bảng quyết toán... Khi bảng này được lưu thành CSDL thì có thể dùng SQL để phân tích, xử lý thông tin trong đó. Kết quả thực hiện của SQL thường là một bảng mới. 

Ví dụ ta yêu cầu SQL lấy ra từ bảng Danh sách nhân viên những nhân viên có nhà ở Hà Nội thì SQL sẽ trả về một bảng mới chỉ chứa các nhân viên có nhà ở Hà Nội. SQL còn được dùng để cập nhật thông tin cho các CSDL đã có. Ví dụ như cần phải xoá tất cả các phiếu xuất kho hai năm trước đây chẳng hạn. Bạn có thể mở bảng dữ liệu Phiếu xuất kho ra và tìm kiếm rồi xoá từng phiếu một cách thủ công, vừa mất thì giờ vừa có khả năng nhầm lẫn hoặc bỏ sót. Khi đó bạn nên dùng SQL với thời gian thực hiện chỉ tính bằng giây và đảm bảo không có sự nhầm lẫn hay bỏ sót nào cả. Trong những trường hợp như vậy kết quả câu lệnh SQL không phải là bảng mới mà chính là bảng đã được bổ sung cập nhật dữ liệu theo yêu cầu. SQL luôn luôn thao tác trên các bảng. SQL dùng để phân tích, tổng hợp số liệu từ các bảng đã có sẵn, tạo nên các dạng bảng mới, sửa đổi cấu trúc, dữ liệu của các bảng đã có. Sau khi thực hiện một hay một chuỗi các lệnh SQL là có thể có đủ số liệu để tạo ra báo cáo theo yêu cầu công việc. Vì mục tiêu của các chương trình quản lý CSDL là quản lý dữ liệu được lưu trữ trong các bảng nên SQL được dùng rất thường xuyên trong mọi công việc.

Một trong những lý do khiến SQL ngày càng phổ biến hơn là SQL rất dễ sử dụng. Bạn không nhất thiết phải là chuyên gia tin học, cũng không cần phải biết lập trình mà vẫn có thể ứng dụng SQL để xử lý công việc của mình. Thực hiện được điều đó là nhờ có các công cụ trực quan giúp tạo ra các câu lệnh SQL một cách dễ dàng, hiệu quả, đó là các Query (câu hỏi truy vấn) trong các phần mềm có sử dụng SQL. Mỗi Query là một câu lệnh SQL được xây dựng hoàn chỉnh và ghi lại để có thể mang ra sử dụng bất cứ lúc nào. Sản phẩm của một Query là một bảng mới thì bảng này lại có thể được sử dụng trong các Query khác. Cứ như vậy ta có thể có một chuỗi các Query trước khi đi đến kết quả cuối cùng. Các Query này được thiết kế đặc biệt để thể hiện các câu hỏi của bạn về dữ liệu đã lưu trữ và khi chạy nó sẽ trả về kết quả theo yêu cầu của bạn. Sử dụng Query rất dễ dàng và ít có khả năng mắc lỗi, thậm chí bạn chỉ cần dùng chuột để tạo ra một câu lệnh SQL hoàn chỉnh. Yêu cầu duy nhất để sử dụng Query là bạn phải nắm vững cấu trúc CSDL của mình.

Khi thiết kế Query bạn chỉ cần dùng chuột chọn các bảng dữ liệu cần thiết đưa vào Query rồi chọn các trường sẽ đưa ra, sau đó ghi Query lại với một tên nào đó. Và thế là bạn có thể sử dụng nó ngay lập tức hoặc dùng nó để xây dựng các Query khác.

Chúng ta sẽ cùng xây dựng một lệnh SQL bằng Query để có thể hiểu rõ hơn công dụng của nó. Giả sử bạn đã có hai bảng dữ liệu là Nhân viên và Hoá đơn trong MS Access. Bảng Nhân viên chứa danh sách các nhân viên trong công ty còn bảng Hoá đơn lưu lại tất cả các hoá đơn đã sử dụng khi bán hàng. Trường Mã nhân viên dùng để kết nối giữa hai bảng. Yêu cầu là đưa ra báo cáo số tiền bán hàng của từng nhân viên. Ta sẽ xây dựng một Query để thực hiện yêu cầu trên.

Tạo Query gồm [/b]bảng Hoá đơn và bảng Nhân viên[/B] kết hợp lại để có được tổng số tiền bán hàng theo từng tên nhân viên. Sau khi chọn New Query, hộp thoại chọn bảng sẽ hiện ra và ta chọn hai bảng cần thiết bằng cách nháy đúp lên tên từng bảng hoặc nhấn phím Add sau khi đã chọn bảng.

Chọn bảng xong ta chọn các trường cần thiết đưa ra kết quả bằng cách nháy đúp chuột lên tên trường đó. Các trường được chọn sẽ xuất hiện trong bảng lưới phía dưới. Cụ thể ở đây ta nháy đúp lên trường Tên nhân viên và Thành tiền. Do cần có tổng số tiền bán hàng của từng nhân viên nên ta phải đánh dấu Totals từ menu View rồi chọn Group by cho Tên nhân viên và Sum cho Thành tiền và kết quả như trên hình.

Như vậy là bạn đã hoàn thành việc thiết kế một Query và có thể xem câu lệnh SQL đã được tự động tạo ra bằng cách chọn SQL trong menu View rồi đặt tên Query với một tên tuỳ ý.

Sau đó, khi muốn xem kết quả câu lệnh SQL đã có, bạn chỉ cần cho chạy Query vừa tạo ra bằng cách nháy đúp lên nó hoặc bấm lên nút Open. Kết quả hiển thị ra màn hình là tổng hợp những dữ liệu mới nhất trong hai bảng dữ liệu nguồn tại thời điểm chạy Query.

Sau khi sử dụng thành thạo SQL bạn đã có trong tay một công cụ mạnh để xây dựng chương trình. Khi phải học sử dụng một ngôn ngữ mới nào đó thì bạn không phải học lại từ đầu cách sử dụng SQL trong ngôn ngữ đó. Phần cốt lõi của SQL là giống nhau trong mọi ngôn ngữ. Bạn chỉ cần học cách áp dụng SQL trong từng trường hợp cụ thể của ngôn ngữ đó cùng những điểm cải tiến bổ sung mà thôi.

SQL có khả năng đáp ứng hầu hết các yêu cầu đối với việc cập nhật, phân tích dữ liệu từ các bảng. Sau đây chúng ta sẽ điểm qua một số công dụng chính của SQL.

- Chọn lọc một số cột nhất định trong bảng dữ liệu: Thường ta không sử dụng tất cả các thông tin của bảng cùng một lúc. Có thể dùng SQL để tách ra chỉ những cột cần thiết mà thôi.

- Lọc các bản ghi theo những tiêu chuẩn khác nhau: như tách riêng các hoá đơn của một khách hàng nào đó, hay in danh sách nhân viên chỉ của một vài phòng ban...

- Sắp xếp các bản ghi theo những tiêu chuẩn khác nhau: Mỗi loại báo cáo thường có yêu cầu sắp xếp các bản ghi theo những cột khác nhau để tiện cho việc theo dõi. Có báo cáo thống kê sắp xếp theo khách hàng, báo cáo khác lại sắp xếp theo mặt hàng được bán, mặc dù tất cả thông tin nằm trong cùng một bảng Bán hàng. Ta có thể thực hiện sắp xếp theo một hoặc nhiều cột khác nhau bằng SQL.

Cập nhật, xoá các bản ghi trên toàn bảng theo những điều kiện khác nhau: ví dụ như khi cần xoá toàn bộ các hoá đơn đã phát hành cách đây 5 năm...

- Kết hợp hai hay nhiều bảng theo chiều ngang: Trong CSDL, mỗi bảng lưu trữ thông tin về một đối tượng và các bảng liên hệ với nhau qua các trường khoá. Dùng SQL để thực hiện việc kết hợp các bảng này với nhau thông qua các trường khoá như ở ví dụ trên để có được bảng kết quả theo yêu cầu.

- Nối hai hay nhiều bảng theo chiều dọc: khi dữ liệu rất lớn hoặc phân tán ở nhiều nơi ta có thể phải quản lý nhiều bảng theo cùng một mẫu, như mỗi bảng cho một quý, tháng hoặc một công ty. Khi cần tổng hợp dữ liệu của cả năm hoặc của cả tổng công ty ta có thể dùng SQL để nối các bảng lại với nhau.

- Tạo bảng mới, thay đổi cấu trúc bảng đã có: phục vụ cho việc lập trình.

- Thực hiện các phép tính toán thống kê theo từng nhóm: tổng, trung bình, max, min... Đây là chức năng thường xuyên được sử dụng để tổng hợp thông tin trước khi in báo cáo như tính tổng số lượng của từng mặt hàng, số hàng đã bán cho từng khách hàng...

- Kết nối với dữ liệu trên máy chủ (Server): Khi kho dữ liệu được tập trung trên máy chủ trong MS SQL Server hay Oracle ... ta phải dùng lệnh SQL để trực tiếp thâm nhập vào cơ sở dữ liệu.

- Kết hợp các trang Web với CSDL bằng lệnh SQL.

Có thể phân ra hai loại câu lệnh SQL, một loại tổng hợp dữ liệu sang bảng mới (bảng mới có thể chỉ tồn tại trong bộ nhớ hoặc được ghi ra đĩa) và một loại chỉ cập nhật dữ liệu, cấu trúc của các bảng đã có. Bảng mới được tạo ra từ câu lệnh SQL có thể được sử dụng ở mọi nơi trong chương trình có yêu cầu dữ liệu dạng bảng, đặc biệt dùng cho báo cáo (report), danh sách (list), đối tượng lưới (grid) ...

Tất cả các chức năng của SQL đều có thể được thực hiện bằng các công cụ khác của các phần mềm có sử dụng SQL. Tuy nhiên dùng SQL có nhiều ưu điểm lớn so với các cách khác như là:

- Câu lệnh đơn giản, dễ nhớ, dễ sử dụng và rất ngắn gọn.
- Tốc độ rất cao do được tối ưu hoá với những công nghệ mới.
- Khả năng thực hiện những yêu cầu phức tạp của công việc...

Nếu đã thành thạo lập trình xử lý các công việc, bạn nên tiết kiệm thời gian và sức lực bằng cách sử dụng SQL.

Câu lệnh SQL ngắn gọn và đơn giản hơn thì khả năng mắc lỗi ít hơn và tốc độ vận hành nhanh hơn. Trong các ngôn ngữ như Visual Foxpro hay Access bạn được cung cấp công cụ trực quan để tạo ra Query - câu lệnh SQL được ghi lại độc lập. Sử dụng các công cụ tạo Query bạn có thể không cần phải nắm vững cú pháp câu lệnh SQL mà vẫn tạo được các Query phức tạp. Sau khi tạo xong câu lệnh, SQL sẽ được tự động sinh ra và bạn có thể sao chép dùng vào nhiều việc khác.

Có thể bạn đang tự hỏi nếu SQL đúng là vạn năng như vậy sao không dùng một mình SQL để xử lý dữ liệu mà vẫn còn phải dùng các công cụ lập trình khác. Tuy SQL có nhiều khả năng nhưng trong một số trường hợp cụ thể vẫn phải dùng kết hợp với những công cụ lập trình khác để có được hiệu quả tối đa. Ví dụ như khi bạn cần phải làm việc với từng bản ghi chứ không phải trên phạm vi toàn bảng, khi bạn đang làm việc với một bản ghi nào đó và muốn chuyển sang làm việc với một bản ghi ở sau nó, hoặc bạn muốn có được các thông tin về cấu trúc một bảng (tên cột, kiểu dữ liệu, có khả năng cập nhật không...).

Khả năng của SQL là rất lớn nên nó có phạm vi ứng dụng rộng trong việc quản lý CSDL bằng máy tính.

Source: PCWorld