Nói một cách đơn giản nhất, ứng dụng điện toán đám mây chính là những ứng dụng trực tuyến trên Internet. Trình duyệt là nơi ứng dụng hiện hữu và vận hành còn dữ liệu được lưu trữ và xử lý ở máy chủ của nhà cung cấp ứng dụng đó.
Một số nền tảng điện toán đám mây hiện nay: Google App Engine, Windows Azure, Amazone Webservice, Sun Cloud, Facebook, …
Google App Engine (App Engine hay GAE) là một nền tảng điện toán đám mây của Google để phát triển và lưu trữ ứng dụng web trong những trung tâm dữ liệu do Google quản lý (google-managed data centers). Bản beta được giới thiệu lần đầu tiên vào ngày 7 tháng 4 năm 2008.
GAE là 1 dịch vụ lưu trữ các ứng dụng web. Khi nói đến “ứng dụng web”, chúng ta muốn nói tới các ứng dụng hay dịch vụ được truy cập trên các trang web, thường là thông qua trình duyệt web: những trang web mua bán, mạng xã hội, … App Engine cũng có thể phục vụ các trang web truyền thống như xử lý văn bản hay hình ảnh nhưng được thiết kế dành cho thời gian thực.
Thực ra, GAE được thiết kế để lưu trữ những ứng dụng và phục vụ nhiều người dùng một cách đồng thời. Khi một ứng dụng có thể phục vụ nhiều người dùng một cách đồng thời mà không làm giảm hiệu suất, chúng ta gọi đó là sự co giãn (scales). Những ứng dụng được viết cho App Engine sẽ được co giãn một cách tự động. Càng nhiều người sử dụng chương trình, App Engine sẽ tạo ra càng nhiều tài nguyên cho ứng dụng đó và quản lý chúng. Chính bản thân ứng dụng cũng không cần phải biết đến các tài nguyên mà nó đang sử dụng.
Không như những server cung cấp các dịch vụ lưu trữ thông thường hay các server có chức năng tự quản lý, với Google App Engine, chúng ta chỉ phải trả tiền cho những tài nguyên mà chúng ta sử dụng. Những tài nguyên này được đo bằng gigabyte và không có bất kì lệ phí hàng tháng nào hay lệ phí để chúng ta thay đổi diện mạo trang web. Hóa đơn thanh toán những nguồn tài nguyên này bao gồm CPU chúng ta sử dụng, lưu trữ hàng tháng, băng thông vào ra (incoming and outgoing bandwidth), và một số các tài nguyên khác của dịch vụ App Engine.
Để giúp chúng ta có thể làm quen với GAE, mỗi lập trình viên sẽ có khoảng 500 MB lưu trữ, một lượng tài nguyên miễn phí đủ để chạy những ứng dụng nhỏ với băng thông thấp. Google dự toán rằng với nguồn tài nguyên miễn phí, một ứng dụng có thể đạt tới 5 triệu lượt truy cập trong một tháng.
2. KIẾN TRÚC HOẠT ĐỘNG
Kiến trúc của App Engine khác với những Server lưu trữ ứng dụng Web thông thường. Ở phần lõi của nó, App Engine sẽ hạn chế những truy cập từ ứng dụng của chúng ta đến cơ sở hạ tầng vật lý, ngăn cản chúng ta từ việc mở các Socket, chạy các tiến trình ngầm, hay các cách đi khác bằng cổng sau để giúp chương trình của ta có quyền trên môi trường này. App Engine được thiết kế để giải quyết mối quan tâm của chúng ta về sự mở rộng và độ tin cậy. Nó được xây dựng dựa trên khái niệm có thể mở rộng theo chiều ngang, nghĩa là thay vì ứng dụng của chúng ta sẽ được chạy trên một phần cứng mạnh mẽ, thì nó có thể chạy trên nhiều phần cứng yếu hơn.
Chúng ta có thể thấy ứng dụng App Engine đang chạy như một thực thể cô lập trong môi trường gồm nhiều thành phần (multitenant environment). App Engine chia sẻ những nguồn tài nguyên giữa các ứng dụng nhưng cô lập về dữ liệu và bảo mật giữa những thành phần với nhau. Ứng dụng của chúng ta có thể sử dụng một số các dịch vụ của Google, như là URLFetch. Bởi vì chúng ta không thể mở cổng (port) một cách trực tiếp trong ứng dụng của mình, nên chúng ta phải lệ thuộc vào dịch vụ này, ví dụ: yêu cầu Google mở cổng và thực thi ứng dụng của mình.
Xem xét kỹ hơn một chút, giả sử App Engine là một tòa nhà có gắn hệ thống điều hòa không khí và nhiệt độ. Chúng ta là một phần trong căn nhà đó (chính xác hơn là ứng dụng của chúng ta). Chúng ta không thể điều chỉnh nhiệt độ một cách trực tiếp bởi nó sẽ ảnh hưởng đến những phần khác trong tòa nhà (các ứng dụng khác). Vì vậy, chúng ta phải gửi một yêu cầu đến người chủ của căn nhà này để nhờ họ thay đổi nhiệt độ cho chúng ta. Chính xác đó là các dịch vụ của GAE như URLFetch, Bigtable query, Memcache, mail, XMPP, và các dịch vụ khác. Đó chính là bản chất những gì đang xảy ra trong App Engine.
Như vậy, trong GAE, tùy vào ứng dụng viết theo ngôn ngữ nào, nó sẽ được chạy trên môi trường Java hay Python tương ứng. Song song đó, chúng ta sẽ được cung cấp sử dụng miễn phí các dịch vụ của google như URL Fetch, Mail, Memcache, … và được lưu trữ trên cơ sở dữ liệu hướng đối tượng datastore. Khi yêu cầu được gửi lên từ phía người dùng, GAE sẽ chuyển yêu cầu đó cho ứng dụng của chúng ta. Tùy theo việc xử lý chúng mà ta cấu hình và sử dụng các ứng dụng thích hợp của GAE.
3. CÁC THÀNH PHẦN CHÍNH VÀ CHỨC NĂNG
3.1. Môi trường thực thi (runtime environment)
Một ứng dụng App Engine đáp ứng các yêu cầu web. Một yêu cầu web sẽ bắt đầu khi có một người dùng hay điển hình là các trình duyệt web của người dùng gửi một yêu cầu truy cập vào ứng dụng thông qua giao thức HTTP. Khi App Engine nhận được yêu cầu, nó sẽ xác định ứng dụng dựa vào tên miền, hoặc tên miền con của <tên bạn>.appspot.com (cung cấp miễn phí mỗi ứng dụng) hoặc là một tên miền riêng của chúng ta đã được đăng kí và thiết lập với Google Apps. App Engine lựa chọn một máy chủ từ nhiều máy chủ để xử lý các yêu cầu đó. Sau đó, App Engine sẽ gửi các yêu cầu đã nhận được từ người dùng đến ứng dụng phù hợp để xử lý, sau khi đã xử lý xong các ứng dụng này sẽ gửi dữ liệu trả về cho App Engine, App Engine sẽ nhận dữ liệu phản hồi từ các ứng dụng và trả về cho người dùng thông qua trình duyệt Web.
Google App Engine cung cấp hai môi trường thực thi tốt cho các ứng dụng. Đó là Java và Python. Môi trường chúng ta chọn sẽ phụ thuộc vào ngôn ngữ và những công nghệ liên quan khi chúng ta dùng để phát triển ứng dụng.
Môi trường Java thực thi các ứng dụng được viết cho JVM6. Ứng dụng có thể được phát triển dựa vào ngôn ngữ lập trình Java hoặc hầu hết các ngôn ngữ có thể biên dịch và chạy trên JVM: ví dụ PHP (dùng Quercus), Ruby (dùng JRuby), Javascript (dùng Rhino), Scala, Groovy. App Engine cũng hỗ trợ Google Web Tootkit (GWT).
Môi trường Python thực thi các ứng dụng được viết dựa vào ngôn ngữ lập trình Python bản 2.5. App Engine gọi các ứng dụng Python nhờ vào CGI (Common Gateway Interface). Ứng dụng có thể dùng hầu hết các thư viện của Python, các framework của Python như Django, web2py, Pylons.
Cả hai môi trường Java và Python đều sử dụng chung một mô hình: một yêu cầu gửi đến ứng dụng trên server, ứng dụng được kích hoạt (nếu cần thiết), gọi bộ phận xử lý yêu cầu và trả về kết quả cho client. Mỗi môi trường sử dụng bộ tiền xử lý (interpreter) cho riêng mình (JVM hay Python).
3.2. Các file server tĩnh (static file servers)
Hầu hết các website có một số tài nguyên mà chúng chuyển đến các trình duyệt không thay đổi trong suốt hoạt động của site. Ví dụ như các hình ảnh và các file Css hỗ trợ hiển thị của site, các đoạn mã Javascript chạy trên trình duyện, và các file HTML tĩnh. Vì việc gửi những file này không cần đến việc gọi code của ứng dụng, nói cách khác, việc này không cần thiết, làm giảm hiện quả làm việc của các server ứng dụng.
Thay vì thế, App Engine cung cấp một tập các server tách biệt chuyên làm nhiệm vụ trao đổi các file tĩnh này. Những server nói trên tối ưu hóa cho kiến trúc bên trong và hạ tầng mạng để xử lý các requests cho các tài nguyên tĩnh. Đối với client, các file tĩnh này cũng giống như các tài nguyên khác được cung cấp bởi ứng dụng của chúng ta.
Chúng ta upload các file tĩnh cùng với code ứng dụng. Chúng ta có thể cấu hình vài cách hiển thị nhất định cho các file này, bao gồm các URL cho file tĩnh, loại nội dung, và các hướng dẫn cho trình duyệt để lưu các bản sao file này trong bộ nhớ cache để giảm lưu lượng và tăng tốc cho trang Web.
3.3. Kho dữ liệu (datastore)
Hầu hết mọi ứng dụng web đều cần một nơi để chứa thông tin khi xử lý yêu cầu từ phía client và lấy thông tin cho những lần yêu cầu sau này. Việc sử dụng một server làm một trung tâm dữ liệu là một ý tưởng rất hay nhưng có vấn đề xảy ra khi quá nhiều kết nối được gửi tới server này.
Hệ thống database của Google App Engine gần giống như một đối tượng database. Thiết kế của App Engine datastore chỉ là trừu tượng để cho App Engine có thể xử lý việc phân tán và co giãn các ứng dụng. Chính vì thế trong các đoạn mã của chúng ta sẽ quan tâm đến những thứ khác được nêu sau đây.
3.3.1 Thực thể (entities) và Thuộc tính (properties)
Một ứng dụng App Engine có thể chứa dữ liệu trong một hay nhiều thực thể datastore. Mỗi thực thể có một hay nhiều thuộc tính, mỗi thuộc tính đều có tên và giá trị. Mỗi thực thể đều được phân loại để tiện cho việc truy vấn.
Ở cái nhìn đầu tiên, chúng ta thấy thực thể có thể gần giống các hàng (row) trong một bảng trong cơ sở dữ liệu quan hệ. Và mỗi thuộc tính có thể giống với một cột. Tuy nhiên đối với các thực thể cùng loại với nhau có thể có các thuộc tính khác nhau. Thứ 2, các thực thể có thể có cùng thuộc tính với các thực thể cùng loại khác nhưng khác về kiểu dữ liệu. Một điểm khác nhau nữa giữa thực thể và các hàng (row) là các thực thể có thể có nhiều giá trị cho một thuộc tính đơn lẻ.
Mỗi thực thể có một khóa riêng (key) phân biệt lẫn nhau được cung cấp bởi ứng dụng hoặc do App Engine. Khác với CSDL quan hệ, khoá của thực thể không phải là thuộc tính, nó tồn tại độc lập với thực thể. Khoá của thực thể không được thay đổi khi thực thể đã được tạo ra.
3.3.2 Truy vấn (queries) và Chỉ mục (indexes)
Một câu truy vấn trên datastore trả về không hoặc nhiều thực thể cùng loại với nhau. Nó cũng có thể trả về các khóa của thực thể. Câu truy vấn có thể dựa vào các giá trị thuộc tính của thực thể và được sắp xếp theo giá trị của thuộc tính. Câu truy vấn cũng có thể làm việc với các khóa của thực thể.
Với App Engine, mỗi câu truy vấn sẽ có một chỉ mục trong datastore. Khi ứng dụng cần thực hiên một câu truy vấn, thì datastore sẽ tìm chỉ mục của câu truy vấn đó. Khi chúng ta tạo mới một thực thể và cập nhật cái cũ thì datastore cũng sẽ cập nhật lại chỉ mục. Điều này giúp cho câu truy vấn được nhanh hơn.
3.3.3 Phiên giao dịch (transaction)
Khi một ứng dụng có quá nhiều client liên tục đọc hay ghi cùng một dữ liệu ở cùng một thời điểm, thì phiên giao dịch rất cần thiết để dữ liệu không bị đọc sai. Mỗi phiên giao dịch là đơn vị nhỏ nhất và chỉ có hai trạng thái là thành công hoặc thất bại.
Một ứng dụng đọc hay cập nhật nhiều thực thể trong một phiên giao dịch, nhưng nó phải nói cho App Engine biết những thực thể nào sẽ được cập nhật khi nó tạo ra nhiều thực thể. Ứng dụng làm được điều này bởi việc tạo ra nhóm thực thể. Nhờ nhóm thực thể, App Engine sẽ biết được các thực thể sẽ phân tán như thế nào qua các server, vì thế nó có thể khẳng định chắc chắn là phiên giao dịch thành công hay thất bại. App Engine cũng hỗ trợ những phiên giao dịch nội bộ (local transaction).
Nếu một người dùng cố gắng cập nhật một thực thể trong khi người khác đang cập nhật thực thể đó thì datastore sẽ ngay lập tức trả về một biệt lệ báo lỗi. Trong thuật ngữ database, thì ta nói App Engine sử dụng “optimistic concurrency control”. Với chỉ mục và “optimistic concurrency control”, App Engine được thiết kế giúp cho ứng dụng có thể đọc dữ liệu nhanh hơn và đảm bảo hơn.
3.4 Các dịch vụ (services)
Dịch vụ chính là mối quan hệ giữa datastore với môi trường thực thi. GAE bao gồm một số các dịch vụ hữu ích cho các ứng dụng web.
Dịch vụ memcache là dịch vụ lưu trữ theo khóa - giá trị. Thuận lợi chính của dịch vụ này trên datastore là tốc độ nhanh, rất nhanh so với việc lưu trữ và lấy dữ liệu một cách bình thường trên datastore. Memcache lưu trữ dữ liệu trên bộ nhớ thay vì trên ổ đĩa để tăng tốc độ truy cập. Nó cũng phân tán như datastore tuy nhiên không lưu trữ, vì thế nếu mất điện thì dữ liệu trên memcache cũng mất. Và nó cũng có nhiều giới hạn sử dụng hơn datastore. Việc sử dụng memcache tốt nhất là lưu lại các kết quả của các câu query hay các tính toán trước đó. Ứng dụng sẽ kiểm tra trong memcache, nếu không có dữ liệu thì sẽ tiến hành query trên datastore.
Ứng dụng App Engine có thể truy cập các tài nguyên web khác nhờ vào dịch vụ URL Fetch. Dịch vụ này tạo ra các yêu cầu theo dạng HTTP gửi đến các server khác trên Internet như là việc tương tác với các web service khác. Vì khi ta truy cập đến server khác thời gian sẽ lâu nên URL Fetch hỗ trợ chạy ngầm bên dưới trong khi xử lý các yêu cầu khác.
Ứng dụng App Engine có thể gửi mail dựa vào dịch vụ Mail, hoặc nếu được cấu hình, nó có thể nhận được email.
Ứng dụng App Engine có thể gửi và nhận những tin nhắn đến các dịch vụ chat có sử dụng giao thức XMPP bao gồm Google Talk.
3.5 Tài khoản Google (google accounts)
Các chức năng của App Engine tích hợp trong các tài khoản của Google như Google Mail, Google Docs và Google Calendar. Chúng ta có thể sử dụng tài khoản trên Google như cho các ứng dụng của chúng ta, do đó không cần thiết lập thêm. Và nếu các người dùng của chúng ta đã có tài khoản trên Google, họ có thể đăng nhập vào ứng dụng của chúng ta với các tài khoản đó, mà không cần tạo tài khoản riêng trong ứng dụng. Tất nhiên, điều đó không bắt buộc. Chúng ta luôn có thể xây dựng hệ thống tài khoản riêng của mình, hoặc sử dụng một provider OpenID.
3.6 Các công cụ lập trình (programming tools)
Google cung cấp một số tool miễn phí cho việc phá triển ứng dụng App Engine bằng ngôn ngữ Java và Python. Chúng ta có thể download software development kit (SDK) cho ngôn ngữ tương ứng và hệ điều hành của chúng ta từ website Google. Người dùng Java có thể down SDK cho Java trong form plug-in cho Eclipse. Người dùng Python sử dụng Windows hoặc Mac OS X có thể tải SDK cho Python từ form của giao diện ứng dụng. Các SDK đó đều có file zip, sử dụng command-lines để trực tiếp tích hợp vào môi trường phát triển hoặc xây dựng hệ thống.
Mỗi SDK bao gồm một server web chạy ứng dụng của chúng ta tại máy cá nhân, đóng vai trò môi trường thực thi,kho dữ liệu và các service. Server này tự động phát hiện những thay đổi trong file source và load lại chúng nếu cần, vì thế chúng ta có thể luôn mở server trong khi đang lập trình cho ứng dụng.
Nếu chúng ta sử dụng Eclipse, chúng ta có thể chạy server cho Java trong bộ tích hợp debugger, và có thể đặt các breakpoint trong code. Chúng ta cũng có thể sử dụng Eclipse cho ứng dụng phát triển Python dùng PyDev, một nhánh mở rộng của Eclipse, bao gồm bộ debugger cho Python.
Mỗi SDK cũng bao gồm một công cụ cho việc tương tác với các ứng dụng chạy trên App Engine. Chủ yếu là sử dụng cho việc upload code lên App Engine. Chúng ta cũng có thể sử dụng tool để download các file log từ ứng dụng đang chạy, hoặc quản lý danh mục ứng dụng.
SDK Python và Java gồm một chức năng mà chúng ta có thể cài đặt trong ứng dụng cho việc truy cập có thứ tự từ xa một cách an toàn đến ứng dụng. SDK Python bao gồm các công cụ dùng cho việc xử lý dữ liệu lớn, như upload dữ liệu từ file text, và tải lượng lớn dữ liệu, hoặc sao lưu cho mục đích lưu trữ. SDK cũng có command-line shell của Python cho việc test, kiểm lỗi và thao tác với dữ liệu. (Các tool này có trong SDK cho Python, nhưng cũng làm việc với các ứng dụng Java sử dụng phiên bản Java có chức năng truy cập từ xa). Chúng ta có thể viết đoạn mã script và chương trình sử dụng chức năng truy cập từ xa cho việc vận chuyển lượng lớn dữ liệu và các biện pháp bảo trì khác.
4. HẠN CHẾ CỦA GOOGLE APP ENGINE
• App Engine hỗ trợ HTTPS đối với domain con của .appspot.com những vẫn chưa hỗ trợ đối với các domain khác.
• Hiện Google App Engine hỗ trợ 2 loại ngôn ngữ là: Python, Java
(Một số ngôn ngữ khác như PHP cũng có thể chạy được nếu cài cùng với bộ chuyển từ PHP sang Java).
• Phụ thuộc hoàn toàn vào các dịch vụ của Google.
• Microsoft, … sẽ chẳng bao giờ mua sản phẩm được xây dựng trên nền tảng của đối thủ.
• Các nhà đầu tư e ngại vì toàn bộ dữ liệu của mình đều nằm trong tay nhà cung cấp dịch vụ, dù cho đó là Google.
5. SỬ DỤNG GOOGLE APP ENGINE
# Project members authenticate over HTTPS to allow committing changes. svn checkout https://svn.codespot.com/a/eclipselabs.org/cloudcomputing/trunk/ cloudcomputing --username tranlamson When prompted, enter your generated googlecode.com password.
- Ebook upload trên project hosting https://code.google.com/a/eclipselabs.org/p/cloudcomputing.