Saturday, November 14, 2009

3G và tương lai của Internet băng rộng Việt Nam !

3G và tương lai của Internet băng rộng Việt Nam

Việt Nam đã chính thức "điền tên mình vào bản đồ 3G thế giới". 3G đã chính thức mở thêm một kênh phát triển Internet băng rộng quan trọng cho Việt Nam.

Tốc độ tăng trưởng doanh thu từ dịch vụ dữ liệu di động trên nền 3G củaVerizone tại Mỹ đạt 3,9 tỷ USD từ tháng 1/2008 - 1/2009 (tăng 33%). Ảnh: Đ.N

Những nghiên cứu kinh tế đã chỉ ra rằng với mỗi phần trăm tăng thêm trong tỷ lệ sử dụng Internet băng rộng của quốc gia, tỷ lệ GDP trên đầu người sẽ tăng tương ứng khoảng 10%, và cứ mỗi phần trăm gia tăng trong tỷ lệ người sử dụng di động của quốc gia, mức tăng GDP theo đầu người sẽ tăng tương ứng khoảng 5%.

Hơn nữa, những đầu tư trực tiếp vào việc phát triển công nghệ truyền thông sẽ góp phần mạnh mẽ trong việc tạo ra công ăn việc làm. Tổ chức Wireless Intelligence năm 2008 đã thống kê rằng cứ mỗi một triệu USD đầu tư vào ngành viễn thông tại Mỹ sẽ tạo ra 18 việc làm mới.

Nhìn ở những con số thống kê này, có thể thấy tiềm năng lớn mà 3G có thể đóng góp cho sự phát triển kinh tế của quốc gia.

Khi băng rộng di động vượt qua cố định

Các tổ chức nghiên cứu như Strategy Analytics, Wireless Intelligence hay In-Stat đều thống nhất nhận định rằng số lượng thuê bao băng rộng di động (gồm các chuẩn công nghệ CDMA 2000EV-DO, HSPA và LTE) sẽ vượt số lượng thuê bao băng rộng cố định (gồm có các hình thức truy cập qua cáp modem, DSL, FTTH, qua vệ tinh…) trong năm 2010, và đến năm 2011, trên 60% trong tổng số gần 1,5 tỷ thuê bao băng rộng sẽ là những thuê bao di động.

“Thế giới hiện có xấp xỉ 830 triệu thuê bao 3G và đến năm 2013, 3G (gồm công nghệ EV-DO, HSPA và TD-SCDMA) sẽ chiếm tới khoảng 89% số lượng thuê bao băng rộng di động trên toàn cầu”, ông William F. Davidson, Phó chủ tịch cao cấp phụ trách tiếp thị toàn cầu và quan hệ nhà đầu tư của Tập đoàn Qualcomm đã chia sẻ với các biên tập viên các tờ báo ICT hàng đầu của các thị trường đang phát triển tại trụ sở chính của Qualcomm ở San Diego (Mỹ) trong tháng 10 vừa qua. “Trong đó, HSPA sẽ có khoảng 1,4 tỷ thuê bao và EV-DO sẽ có được 330 triệu thuê bao. Doanh thu từ các thiết bị cầm tay 3G cũng sẽ chiếm tới 79% trong tổng doanh thu 179,2 tỷ USD từ thiết bị cầm tay vào năm 2013”.

Trụ sở của Tập đoàn Qualcomm tại thành phố San Diego, bang California, Hoa Kỳ. Ảnh: Đ.N

“Thời của Internet băng rộng di động đang đến, đó là bởi xuất phát từ những đặc điểm rất độc đáo và mạnh mẽ của chính yếu tố ‘di động’”, ông Dan Novak, Phó chủ tịch phụ trách marketing, PR và truyền thông toàn cầu của Qualcomm lý giải. “Các thiết bị di động có thể luôn ở bên bạn, luôn kết nối mà không phụ thuộc vào vị trí địa lý. Yếu tố cá nhân hóa luôn được đề cao ở những thiết bị di động. Hơn nữa, công nghệ xử lý ngày càng mạnh mẽ cũng như pin hoạt động ngày càng khỏe cũng sẽ là những yếu tố giúp các thiết bị di động băng rộng như ĐTDĐ, PDA hay laptop ngày càng trở nên phổ dụng”.

3G: Nhìn từ xung quanh

Trung Quốc, quốc gia đầu tiên trên thế giới triển khai cùng lúc 3 chuẩn công nghệ 3G, với 3 nhà khai thác là China Mobile (chuẩn TD-SCDMA, đã triển khai tại 284 thành phố ở Trung Quốc), China Telecom (chuẩn EV-DO, triển khai trên toàn quốc) và China Unicom (chuẩn WCDMA, triển khai tại 238 thành phố). “Nếu như trong năm 2008 đầu tiên triển khai 3G, Trung Quốc mới có 28 triệu thuê bao so với tổng số 591 triệu thuê bao GSM, thì đến năm 2013, dự báo tỷ lệ này tương ứng sẽ là 279 triệu thuê bao và 783 triệu thuê bao. Tức là trong 5 năm tới, 3G tại Trung Quốc sẽ đạt tốc độ tăng trưởng tới… 901%”, ông Jing Wang, Phó chủ tịch điều hành Qualcomm tại thị trường Châu Á – Thái Bình Dương, Trung Đông và Châu Phi cho biết.

Tại thị trường Nhật Bản, tính đến tháng 4/2009, đất nước mặt trời mọc này đã sở hữu 100 triệu thuê bao 3G CDMA (trong đó 94,8% là thuê bao di động). Tỷ lệ doanh thu từ dịch vụ dữ liệu (data) trên 3G của các nhà cung cấp dịch vụ hàng đầu Nhật Bản như NTT Docomo, KDDI hay SoftBank cũng rất ấn tượng, chiếm tỷ lệ tương ứng là 44%, 40% và 45%.

Hay như ở Hàn Quốc, số lượng thuê bao 3G cũng đang chiếm tỷ trọng áp đảo, với 25,8 triệu thuê bao CDMA (chiếm 54,3%) và 21,3 triệu thuê bao WCDMA (chiếm 45,2%). Chuẩn băng rộng di động WiBro của riêng Hàn Quốc hiện chỉ là 224 ngàn thuê bao (chiếm 0,5%).

Không chỉ riêng ở thị trường Châu Á – Thái Bình Dương, tốc độ tăng trưởng doanh thu từ dịch vụ dữ liệu di động trên nền 3G của các nhà khai thác trên toàn cầu như Vodafone (Anh), Telstra (Úc) hay AT&T, Verizon (Mỹ) đều ở mức ấn tượng – trên 30% (từ tháng 1/2008 – 1/2009: Vodafone đạt doanh thu 888 triệu bảng Anh (tăng 34%); Telstra đạt 979 triệu AUD (tăng 37%); Verizone đạt 3,9 tỷ USD (tăng 33%) và AT&T đạt 3,4 tỷ USD (tăng 36%).

3G đang tạo ra một thị trường dịch vụ nội dung đầy tiềm năng. Ngay cả những hãng chuyên về những phát minh công nghệ 3G như Qualcomm cũng không bỏ qua thị trường này với việc tập trung triển khai cung cấp các dịch vụ nội dung như Flo TV tại thị trường Mỹ, giải pháp quản lý hệ thống vận tải đường dài (QES) lớn nhất thế giới hay hợp tác với các công ty sản xuất thiết bị y tế để cùng phát triển các giải pháp chăm sóc sức khỏe di động.(Qualcomm Wireless Health) – một ngành công nghiệp mới dự kiến sẽ đạt quy mô 7 tỷ USD vào năm 2012…

Tương lai sáng của 3G ở Việt Nam

Đông Nam Á và Thái Bình Dương (SEA&P) là thị trường lớn thứ 3 trên thế giới về thiết bị 3G trong 5 năm tới (chiếm 11%), xếp sau khu vực Tây Âu (20%) và thị trường Mỹ/Canada (18%), theo nghiên cứu của tổ chức WCIS+ tháng 7/2009. Trong khu vực SEA&P, Việt Nam là thị trường lớn thứ 2 về quy mô (chiếm 16%) và chỉ xếp sau Indonesia (42%).

“Chúng tôi đánh giá rất cao việc Chính phủ Việt Nam cấp 4 giấy phép triển khai 3G cho các mạng di động Việt Nam. 3G chắc chắn không chỉ đóng góp chung vào sự phát triển của nền kinh tế Việt Nam, mà còn tạo ra một sân chơi đầy “sáng tạo” cho Việt Nam – quốc gia có tỷ lệ dân số trẻ và rất đông đảo, khát khao sáng tạo”, ông Jing Wang nhận xét. “Chúng tôi đã có mặt tại Việt Nam và với việc tổ chức nhiều khóa đào tạo về nền tảng công nghệ BREW để sáng tạo ra các dịch vụ nội dung cho các chuyên gia công nghệ Việt Nam, chúng tôi khẳng định cam kết mạnh mẽ của mình trong việc hỗ trợ Việt Nam phát triển 3G trong thời gian tới”.

VN lọt vào tốp 10 gia công phần mềm hàng đầu!

VN lọt vào tốp 10 gia công phần mềm hàng đầu

* TP.HCM là một trong 6 thành phố gia công kiểm thử phần mềm hàng đầu trên thế giới

Ảnh: minh họa
TT - Theo báo cáo của Tập đoàn truyền thông công nghệ thông tin Tholons/Global Services công bố ngày 9-11, VN xếp thứ 9 trong 10 quốc gia gia công phần mềm hàng đầu.

Trong đó, TP.HCM tiếp tục được bình chọn là một trong sáu thành phố gia công kiểm thử phần mềm hàng đầu trên thế giới, được biết đến về lĩnh vực phát triển, quản lý ứng dụng (ADM) và lĩnh vực phát triển trò chơi, hoạt hình. Đây là năm thứ hai liên tiếp TP.HCM nằm trong danh sách 50 thành phố gia công mới nổi trên thế giới.

Ông Nguyễn Quốc Hùng, chủ tịch kiêm giám đốc điều hành LogiGear VN - tập đoàn về kiểm thử phần mềm, cho biết bảng khảo sát của Tholons kết hợp với Global Service Media nhằm đánh giá những điểm gia công trên toàn cầu dựa trên khả năng cung cấp dịch vụ, bao gồm nhiều lĩnh vực khác nhau.

Bảng khảo sát chủ yếu dựa trên sáu tiêu chí về tỉ lệ và chất lượng của nguồn nhân lực, chi phí, xúc tiến thương mại, cơ sở vật chất, rủi ro và chất lượng cuộc sống.

TP.HCM đã có mặt trong bảng xếp hạng lần đầu tiên vào năm 2006 và được đánh giá là có nguồn nhân công rẻ, trình độ cao, đặc biệt trong lĩnh vực công nghệ thông tin.

Quảng cáo theo ngữ cảnh

Quảng cáo theo ngữ cảnh - lựa chọn mới cho website tại VN

Các hình thức phổ biến như đặt logo, banner và pop-up đã bộc lộ một số hạn chế và các website trong nước đang tìm đến giải pháp ưu việt hơn là quảng cáo theo ngữ cảnh, tương tự AdSense của Google.
>Quảng cáo trực tuyến đang được 'cá nhân hóa' / Đọc quảng cáo trực tuyến - một phần tất yếu khi lướt web?

Theo Internet World, hiện thế giới có gần 1,73 tỷ người sử dụng Internet (chiếm 25,6% dân số), trong khi tại Việt Nam là 21,9 triệu theo thống kê của VNNIC đến tháng 9/2009. Việc chuyển đổi hình thức marketing truyền thống sang online sẽ thành xu thế trong những năm tới.

Hình thức phổ biến nhất trên các báo điện tử là khách hàng sẽ mua vị trí đặt logo, banner hoặc pop-up under (cửa sổ quảng cáo hiển thị dưới cửa sổ trình duyệt website đang truy cập). Điểm mạnh của mô hình này là mọi người khi truy cập vào trang web đều có thể nhìn thấy quảng cáo.

Tuy nhiên, điều bất cập là lượng truy cập có thể không đồng đều (giảm vào ngày cuối tuần hoặc những kỳ nghỉ lễ, Tết) hoặc khi hệ thống bị gián đoạn nhưng khách hàng vẫn bị tính phí. Hơn nữa, tính định hướng của dạng quảng cáo này thấp vì chỉ được đặt ở một nơi cố định và hiển thị cả ở những bài viết có nội dung không liên quan tới sản phẩm.

Để khắc phục các nhược điểm này, nhiều hệ thống quảng cáo trên thế giới đang sử dụng một số cách tính toán khác như thu phí theo số lượt hiển thị (CPM - Cost Per Mille), theo giá trị của mỗi lần click (CPC - Cost Per Click) hoặc theo hoạt động tương tác của người dùng trên quảng cáo (CPA - Cost Per Action) như việc người dùng nhập form thông tin, chơi game trên quảng cáo…

Ngoài ra, nhà quảng cáo cũng cố gắng thu gọn số lượng người sử dụng đại trà để nhắm trúng khách hàng mục tiêu như lựa chọn theo kênh (channel), ví dụ quảng cáo giày chạy bộ trên mục Thể thao của nhiều website thông tin tổng hợp.

Hình thức quảng cáo được đánh giá thông minh nhất hiện nay chính là việc quảng cáo theo ngữ cảnh bài viết. Chỉ cần gắn một đoạn script đơn giản lên website, hệ thống sẽ tự động "đọc hiểu" nội dung bài viết và hiển thị quảng cáo liên quan tới chủ đề của bài viết đó.

hệ thống tự động đọc hiểu nội dung và hiển thị quảng cáo phù hợp. Ảnh: Adwords.
Hệ thống tự động đọc hiểu nội dung và hiển thị quảng cáo phù hợp. Ảnh: Adwords.

Tại Việt Nam hiện chỉ có Google AdSense phát triển loại hình này nhưng rào cản lớn nhất của họ là ngôn ngữ vì công nghệ đọc hiểu tiếng Việt khá phức tạp. Thêm vào đó, việc thanh toán trực tuyến đều phải sử dụng thẻ quốc tế như MasterCard, Visa… nên khả năng thanh toán không cao, xử lý rủi ro có thể khó khăn và mất nhiều thời gian.

Hiện nay, một hệ thống quảng cáo mới có tên PolyAd với những tính năng như quảng cáo CPM, CPC, CPA, quảng cáo theo kênh và quan trọng nhất là chức năng hiển thị quảng cáo theo ngữ cảnh (Contextual Advertising) đã được Công ty Truyền thông FPT phát triển từ hơn một năm qua.

Theo ông Doãn Trung Kiên, Phó giám đốc Trung tâm nghiên cứu và phát triển Công ty Truyền thông FPT, hệ thống này tự động xử lý việc phân tích bài viết và hiện quảng cáo liên quan, đồng thời tính toán tỷ lệ sao cho các quảng cáo chia sẻ vị trí, tần suất hiển thị hiệu quả và hợp lý nhất. Khách hàng cũng có thể lựa chọn quảng cáo với chữ (text), hình ảnh (image) hay đa phương tiện (rich media)...

Một ưu điểm khác là việc thanh toán trực tuyến với thẻ nội địa của các ngân hàng đang được triển khai trên hệ thống và sẽ đưa vào hoạt động từ đầu 2010.

25,6% dân số Việt Nam sử dụng Internet là một tiềm năng lớn cho ngành quảng cáo trực tuyến, nhất là khi mô hình này chứng minh được ưu điểm về chi phí trong khủng hoảng kinh tế so với các loại hình marketing đắt đỏ khác.

Hạ tầng trên mây





Thay vì đầu tư sở hữu một hạ tầng CNTT phức tạp, tốn kém, doanh nghiệp (DN) có thể dựa vào Internet để truy cập và sử dụng những tài nguyên CNTT khổng lồ, được cung cấp dưới dạng dịch vụ.

Dùng CNTT như dùng điện, nước


Công ty cổ phần công nghệ truyền thông Việt Nam (VNTT) là một DN xây dựng hạ tầng, cung cấp dịch vụ (DV) viễn thông và trung tâm dữ liệu cho các DN ở các khu công nghiệp và khu đô thị mới, với quy mô lên tới 1.800 DN trên diện tích 20.000 ha (chủ yếu thuộc các khu công nghiệp có vốn đầu tư nước ngoài).

Từ trước tới nay, VNTT đã đầu tư hạ tầng mạng trên cơ sở sử dụng 100% cáp quang, hệ thống mạng lõi thế hệ mới và các trung tâm dữ liệu hiện đại nhất cho khách hàng. Tuy nhiên, sắp tới, VNTT sẽ cung cấp hạ tầng CNTT cho các khách hàng của mình theo một cách khác hẳn. Ngày 15/10 vừa qua, VNTT đã bắt tay với hãng IBM để xây dựng một trung tâm gồm rất nhiều máy chủ, phần cứng, PM, các ứng dụng, kiến thức (know how)... kết hợp với nhau. Khi trung tâm này hoàn thành, các công ty khách hàng của VNTT, từ bất cứ đâu, có thể truy cập qua Internet để sử dụng hạ tầng cực mạnh mà VNTT đã đầu tư, tùy theo nhu cầu cụ thể của họ. Họ không phải xây dựng những trung tâm dữ liệu rối rắm với những máy chủ cồng kềnh kèm theo hàng tá thiết bị, không phải mua nhiều phần cứng, PM và đau đầu vì cấu hình, cài đặt, nâng cấp, mở rộng... nữa.

Nói cách khác, khách hàng của VNTT sẽ sử dụng CNTT dưới dạng DV (thông qua Internet và trình duyệt web), giống như DV điện, nước, truyền hình cáp (thông qua các đường ống, đường truyền). Dùng tới đâu trả tiền, tùy theo nhu cầu.

Trước mắt, VNTT sẽ cung cấp cho khách hàng các DV về trung tâm dữ liệu, các DV làm việc cộng tác như DV thư điện tử (sử dụng PM IBM Lotus Domino), mạng nội bộ intranet (sử dụng PM IBM Websphere Portal Express) và DV máy chủ trên nền IBM Lotus Foundations, quản lý nhờ PM IBM Tivoli.

Kiểu trung tâm cung cấp DV CNTT như nói trên được gọi là trung tâm điện toán đám mây (Cloud Computing), hay còn gọi là "điện toán máy chủ ảo".

Lợi ích của "đám mây"

Công nghệ điện toán đám mây (ĐTĐM) được nghiên cứu và ứng dụng trong một vài năm trở lại đây. Theo ông Trần Viết Huân, giám đốc nhóm Giải Pháp Công Nghệ Chất Lượng Cao - IBM Việt Nam, ĐTĐM kế thừa những khía cạnh khác nhau của các mô hình điện toán trước đây.

Ví dụ, ĐTĐM liên kết và tận dụng tài nguyên nhàn rỗi từ các máy tính không sử dụng hết công suất (ảo hóa), giống như điện toán lưới (Grid Computing). ĐTĐM cung cấp tài nguyên tính toán như một DV. Đó chính là đặc điểm của mô hình "điện toán tiện ích" (Utility Computing). Về mặt ảo hóa ở mức độ ứng dụng, ĐTĐM giống như mô hình PM hoạt động như DV (Software as a Service - SaaS).

Với những đặc điểm nêu trên, theo ông Huân, ĐTĐM có thể giúp các DN đẩy nhanh thời gian đưa sản phẩm, DV ra thị trường bằng cách giảm thiểu thời gian cấp phát tài nguyên điện toán. Lấy ví dụ, nếu cần một tài nguyên tính toán cho một dự án, DN phải qua một quá trình mua phần cứng, mua quyền sử dụng PM, cấu hình và cài đặt các ứng dụng... Những việc đó có thể mất hàng tuần. Với công nghệ cấp phát tài nguyên tự động của ĐTĐM, họ chỉ tốn vài chục phút hoặc vài giờ, có thể tự phục vụ thông qua một giao diện thân thiện.

Điện toán đám mây (Cloud computing) là mô hình điện toán sử dụng các công nghệ máy tính và phát triển dựa vào mạng Internet. Thuật ngữ "đám mây" ở đây là lối nói ẩn dụ chỉ mạng Internet (dựa vào cách được bố trí của nó trong sơ đồ mạng máy tính) và như một liên tưởng về độ phức tạp của các cơ sở hạ tầng chứa trong nó. Ở mô hình điện toán này, mọi khả năng liên quan đến CNTT đều được cung cấp dưới dạng các DV, cho phép người sử dụng truy cập các DV công nghệ từ một nhà cung cấp nào đó "trong đám mây" mà không cần phải có các kiến thức, kinh nghiệm về công nghệ đó, cũng như không cần quan tâm đến các cơ sở hạ tầng phục vụ công nghệ đó.
Theo vi.wikipedia.org

Do việc toàn bộ TTDL được ảo hóa, khả năng sử dụng tài nguyên trong ĐTĐM trở nên hữu hiệu hơn, đồng thời việc quản trị TTDL được đơn giản hóa với mô hình kiến trúc theo hướng DV (Service Oriented Architecture), nên ĐTĐM có thể giúp các DN hoạt động đạt hiệu quả cao.

Với quy trình cung cấp DV, cấp phát tài nguyên được tự động hóa và chuẩn hóa, ĐTĐM giúp giảm thiểu những rủi ro do những tác động của con người gây ra. Đồng thời DV ĐTĐM cho phép đầu tư nhỏ ban đầu và tăng hệ thống một cách linh hoạt khi khối lượng công việc tăng lên. IBM đã thực hiện điều này với công ty Sogeti (thuộc Tập đoàn Capgemini). Trong vòng 72 giờ, hạ tầng CNTT của Sogeti đã mở rộng một cách nhanh chóng, cho phép hơn 4.000 nhân viên có thể tham gia đóng góp ý kiến cho tập đoàn.

Ông Võ Tấn Long, phó tổng giám đốc IBM Việt Nam cho rằng, trung tâm ĐTĐM là sự kết hợp của 2 yếu tố: công nghệ và mô hình kinh doanh. "ĐTĐM khiến cho việc sử dụng các tài nguyên CNTT ngày càng thông minh hơn, hiệu quả hơn, chi phí ít hơn, và đảm bảo rằng những tài nguyên đó có thể được sử dụng bởi nhiều người khác nhau, từ bất cứ đâu", ông Long nói.

"Mây xanh" của IBM

Mô hình ĐTĐM được một số công ty nghiên cứu và sử dụng trong vài năm gần đây. IBM cung cấp mô hình ĐTĐM riêng, gọi là Blue Cloud (Mây Xanh).

Mây Xanh của IBM bao gồm tập hợp các giải pháp dựa trên chuẩn mở và mã nguồn mở. Ví dụ hạ tầng ảo hóa dựa trên nền tảng Linux và PM ảo hóa Xen, VMware. Kết hợp với các PM quản lý TTDL có sẵn và các hệ thống máy chủ System X, System Y, Mainframe..., IBM tạo ra một trung tâm ĐTĐM được ảo hóa ở cấp độ cao và có khả năng cung cấp linh hoạt các DV mới, từ các DV truyền thống như máy chủ ảo đến các DV ứng dụng, DV về hợp tác trong DN như email, hệ thống intranet.

Ngày 24/9 vừa qua, IBM thành lập 2 trung tâm ĐTĐM tại Hà Nội và TP Hồ Chí Minh - 2 trung ĐTĐM đầu tiên của IBM trong khu vực ASEAN. Ông Võ Tấn Long, phó tổng giám đốc IBM Việt Nam cho biết, 2 trung tâm này không trực tiếp cung cấp DV ĐTĐM cho khách hàng, mà tư vấn, đào tạo, chuyển giao công nghệ cho các công ty khác, giúp họ xây dựng những trung tâm ĐTĐM của riêng họ. Những công ty này sẽ trực tiếp cung cấp DV ĐTĐM cho khách hàng của họ, giống như trường hợp VNTT nói trên.

Gridbon Technologies

Điện toán đám mây: Không còn xa vời

Tạm biệt các trung tâm dữ liệu! Chúc mừng các ứng dụng điện toán đám mây! Bỏ qua những quảng cáo ồn ào về điện toán đám mây, các nhà quản lý CNTT đang tìm hiểu về thời điểm và cách thức ứng dụng công nghệ mới này.


Học giả Nicholas Carr sẽ nhận nhiều phản kháng từ các nhà công nghệ kỳ cựu khi ông đưa ra tiên đoán mới nhất: Điện toán đám mây (cloud computing – hay còn gọi là máy chủ ảo) sẽ đẩy các bộ phận chuyên trách CNTT đến tình trạng thất nghiệp. Trong cuốn sách mới viết gần đây với nhan đề "The big switch: Rewiring the world, from Edison to Google" (tạm dịch: Một sự thay đổi lớn: Kết nối lại thế giới, từ Edison đến Google), ông viết: "Các bộ phận chuyên trách CNTT sẽ còn rất ít việc để làm khi một khối lượng khổng lồ công việc tính toán được chuyển từ các trung tâm dữ liệu riêng đến máy chủ ảo".

Đây có phải là sự thổi phồng quá đáng? Đúng vậy. Tuy nhiên có cốt lõi của sự thật nằm dưới sự cường điệu. Điện toán đám mây (ĐTĐM), một khái niệm "mờ mịt" như tên gọi của nó, đang nổi lên như một công nghệ mới thu hút sự quan tâm của các nhà quản lý CNTT (CIO) biết nhìn xa trông rộng. Việc không lường trước được những chi phí về năng lượng, nhân sự và phần cứng, không gian lưu trữ giới hạn của các trung tâm dữ liệu... và trên hết là mong muốn sự đơn giản đã thúc đẩy một số doanh nghiệp, chủ yếu là những đơn vị mới khởi nghiệp, chuyển cơ sở hạ tầng lưu trữ của mình sang các nhà cung cấp dịch vụ máy chủ ảo.

Theo vi.wikipedia.org

CIO của công ty Special Olympics, người đang phải chuyển nhiều dữ liệu từ trung tâm dữ liệu công ty qua các dịch vụ máy chủ truyền thống, nói: "Khái niệm công nghệ máy chủ ảo rất có ý nghĩa, nó giúp CIO giảm bớt được những sự vụ phức tạp của tổ chức và tập trung cho những công việc có mức độ giá trị cao hơn". Ông hy vọng công ty sẽ chuyển sang máy chủ ảo trong vài năm tới. Tại sao là lúc này? Những công nghệ mới như băng thông rộng có gần như khắp nơi và ảo hóa máy chủ ngày càng phổ biến, cùng các bài học kinh nghiệm rút ra từ sự phát triển mạnh mẽ của phần mềm dịch vụ (software as a service – SaaS) đang khuyến khích các CIO tư duy vượt xa khỏi giới hạn trung tâm dữ liệu.

Điện toán đám mây chắc chắn còn rất mới mẻ. Những lo ngại về an ninh và lỗi tiềm tàng của các ứng dụng là hai vấn đề chính yếu đang được đặt ra trong giới CNTT, và đây là những vấn đề có thật. Ngoài ra, các nhà cung cấp công nghệ này chưa định ra được đầy đủ mô hình kinh doanh và giá cả, đây cũng là một trong những lý do khiến một số CIO, những người chưa nhìn thấy hiệu quả đầu tư của họ từ SaaS (phần mềm dịch vụ), xem xét điện toán đám mây với cái nhìn nghi hoặc. Tất nhiên là còn có yếu tố khác: đó là sự minh bạch. Giao trách nhiệm về các ứng dụng và dữ liệu quan trọng cho đối tác thứ ba có nghĩa là khách hàng phải biết chính xác các nhà cung cấp dịch vụ điện toán máy chủ ảo xử lý thế nào về các vấn đề an ninh và kiến trúc hệ thống. Các nhà cung cấp dịch vụ sẽ minh bạch đến mức nào về những chi tiết trên vẫn còn là câu hỏi.

Tăng cường khả năng mở rộng

Không giống những phát kiến to tát khác, công nghệ ĐTĐM không chỉ là ý tưởng hình thành từ những bộ óc thông thái của Silicon Valey, mà theo như một nhà quản lý CNTT thì "đây là kết quả tất yếu của một chuỗi hiện tượng của giới công nghệ trong hơn 30 năm qua".

Thật vậy, sẽ dễ dàng hơn khi yêu cầu các nhà phân tích và những người làm CNTT nói về tính năng và mục tiêu của ĐTĐM hơn là tìm kiếm một định nghĩa chính xác. Cũng nên nhớ rằng các nhà cung cấp khác nhau tiếp cận ĐTĐM theo những cách không giống nhau. Theo cách nhìn của Salesforce.com thì ĐTĐM giống như SaaS) đối với IBM thì đây là sự hợp nhất các khối dữ liệu lớn của khách hàng được chuyển về.

Theo nhà phân tích của Research 2.0: "ĐTĐM căn bản là sự kết hợp của điện toán lưới (grid computing) và SaaS, chủ yếu là xử lý dữ liệu thô. Kết quả ĐTĐM thực chất là ảo hóa mạng". Giám đốc công nghệ (CTO) của nhóm Giải Pháp Công Nghệ Cao của IBM cho biết: "Chúng tôi đã thiết kế ĐTĐM dựa trên công nghệ ảo hóa. Bạn có một trung tâm dữ liệu với nhiều máy chủ và chúng đều trở thành các máy ảo". Ở mô hình quen thuộc hiện tại là multi-tenant SaaS, nhiều khách hàng có thể truy cập và chạy ứng dụng của nhà cung cấp dịch vụ. Với ĐTĐM, khách hàng cũng có thể chạy ứng dụng, nhưng là ứng dụng của chính họ, trên hạ tầng của nhà cung cấp.

Về phần mình, nhà cung cấp phải đảm bảo khả năng phân bổ tải (workload) một cách linh hoạt cho máy chủ khi khách hàng truy cập vào để chạy các ứng dụng. Bằng cách này, nhà cung cấp tối đa hóa khả năng tính toán của hệ thống và cho phép khách hàng yêu cầu nhiều hơn. Đây là điểm mấu chốt của ĐTĐM, cho dù Blue Cloud của IBM hay EC2 của Amazon, thì mục tiêu chính đều là khả năng mở rộng nhanh (scalability).

Theo giám đốc công nghệ của Powerset, công ty chuyên xây dựng cơ cấu tìm kiếm, thì thuật ngữ "mềm dẻo" có thể đúng hơn. Về tính mềm dẻo, ông muốn nhấn mạnh khả năng co giãn khi cần. Công ty của ông đang thiết lập bảng danh mục cho một khối lượng khổng lồ thông tin trên web, đòi hỏi việc tính toán với cường độ cao gần như liên tục. Trong quá trình thực hiện, cần dự tính đến cả những trường hợp tăng đột biến do người sử dụng, vượt quá năng lực tính toán bình thường của công ty.

Thay vì trang bị đủ các máy chủ và sẵn sàng hạ tầng để phục vụ nhu cầu lúc cao điểm, Powerset đã sử dụng dịch vụ lưu trữ của Amazon và trở thành một trong những khách hàng đầu tiên của Amazon sử dụng giải pháp EC2 và S3. Powerset chi trả cho các nguồn tài nguyên theo cách dùng bao nhiêu trả bấy nhiêu, và điều này đã tiết kiệm cho công ty một khoản lớn tiền mặt. Ngoài ra, việc sử dụng dịch vụ mềm dẻo này sẽ cho phép bộ phận CNTT tập trung nguồn lực, thời gian vào nghiệp vụ cơ bản của mình, trên cơ sở nguồn tài nguyên tối thiểu để chạy các ứng dụng kinh doanh.

Tương tự, các nhóm hay các phòng ban trong công ty thường có nhu cầu triển khai hoặc xử lý những dự án nhưng lại không đủ nguồn lực hay ngân sách cho hạ tầng cần thiết. Giải pháp cho vấn đề này, IBM sử dụng các công nghệ ảo nội bộ để cung cấp nguồn tài nguyên cần thiết cho các ứng dụng hoặc dịch vụ mới. Hiện tại trong IBM có khoảng hơn 100 dự án thực hiện theo cách này. Tờ Thời Báo New York (New York Times) cũng đã sử dụng Web Services của Amazon (EC2 và S3) để tạo các file PDF cho 11 triệu bài báo từ kho lưu trữ bằng giấy trong khoảng thời gian chưa tới 24 giờ, sử dụng 100 máy chủ ảo của EC2 thay vì mua thiết bị phần cứng cho dự án.

Nỗi lo mất kiểm soát

An ninh, độ trễ (latency), dịch vụ kèm theo và tính sẵn sàng là những vấn đề mà các nhà quản lý CNTT quan tâm khi đề cập đến ĐTĐM. Các nhà cung cấp còn có quá nhiều việc phải làm trong những năm tới để làm hài lòng các CIO. Tuy vậy, có một điều không thật cụ thể nhưng lại quan trọng đối với ĐTĐM: cần hiểu bản chất vấn đề.

Ông phó chủ tịch về quản lý sản phẩm và phát triển của Amazon nhận định: "Một vài người vẫn coi việc này như thể là sự mất kiểm soát. Họ suy nghĩ như vậy bởi quan niệm rằng họ không còn giữ dữ liệu của họ nữa, nó đang ở một nơi mà họ không có ở đó”.

Lời khuyên nào dành cho những nhà quản lý CNTT đang cân nhắc công nghệ ĐTĐM? Một nhà phân tích cho rằng: "Những nhân viên CNTT truyền thống sẽ phản đối ĐTĐM. Hãy thuyết phục những ai có kinh nghiệm phát triển web".

Mặc dù không phải là vấn đề phổ biến, một vài ứng dụng đòi hỏi phải có phần cứng đặc thù. Trong trường hợp này, theo một số chuyên gia phân tích, hãy quên việc chạy ứng dụng với ĐTĐM, và hơn nữa hiệu năng của cơ sở dữ liệu ĐTĐM có thể vẫn còn nhiều vấn đề.

Tuy nhiên, các CIO vẫn có thể tìm thấy được nhiều ích lợi từ những dịch vụ ĐTĐM, bao gồm khả năng mở rộng hơn, thời gian triển khai nhanh hơn và trung tâm dữ liệu đơn giản hơn. Không có gì phải gấp gáp, nhưng khi chuẩn bị tốt thì bạn có thể ứng dụng công nghệ ĐTĐM.

Gridbon Technologies

Từ máy Turing đến “mây điện toán”


Với bộ nhớ đủ lớn và tốc độ đủ nhanh, một máy tính đơn với chương trình phần mềm có thể đảm đương mọi việc thay cho tất cả máy tính vật lý khác trên thế giới.


Năm 1936, khi đám mây chiến tranh một lần nữa vần vũ trên bầu trời châu Âu, nhà toán học người Anh, Alan Turing, đã phát minh ra chiếc máy tính số hiện đại. Ý tưởng của Turing về máy tính số có ý nghĩa còn quan trọng hơn nhiều so với việc xây dựng một chiếc máy tính vật lý cụ thể.

Công cụ thử nghiệm của Turing, được ông gọi là "máy tính đa năng", là một chiếc máy đơn giản. Cơ bản, nó có khả năng đọc và ghi các ký hiệu 1 hay 0 trên cuộn giấy dài. Nó chỉ có thể thực hiện một hành động mỗi lúc, đọc hay ghi 1 ký hiệu, nhưng nó có thể nhớ việc đã làm, và với thời gian không giới hạn nó có thể thực hiện vô số hành động.

Turing đã tạo ra "một chiếc máy có thể tái hiện một cách chính xác hành vi của bất kỳ máy tính nào khác". Bất kỳ tính toán nào, dù phức tạp đến đâu, đều có thể phân thành một loạt các bước đơn giản riêng rẽ – thuật toán hay chương trình – và được thực hiện với máy Turing. Điều này có ý nghĩa: "về nguyên tắc tất cả máy tính số đều tương đương nhau; bất kỳ máy nào có thể đếm, ghi nhận và làm theo các câu lệnh đều có thể thực hiện bất kỳ chức năng tính toán nào". Điều này cũng có nghĩa: "phần mềm (chương trình) luôn có thể thay thế cho phần cứng".

Yêu cầu thực tế duy nhất đối với chiếc máy tính đa năng là kích thước bộ nhớ và tốc độ mà nó có thể thực hiện các phép tính và truyền kết quả. Với bộ nhớ đủ lớn và tốc độ đủ nhanh, phát minh của Turing hàm ý một máy tính đơn với chương trình phần mềm có thể đảm đương mọi việc đang được thực hiện bởi tất cả máy tính vật lý khác trên thế giới hiện nay.

Từ phần cứng đến phần mềm

Randy Mott từng được gọi là "siêu sao CIO". Mott nổi tiếng trong thập niên 1990 khi phụ trách bộ phận CNTT của tập đoàn Wal-Mart, đóng vai trò trung tâm trong việc sử dụng các hệ thống máy tính để hợp lý hóa dây chuyền cung ứng của nhà bán lẻ khổng lồ này và khai thác dữ liệu bán hàng, tạo lợi thế lớn so với K-Mart, Sears và các đối thủ khác. Mott rời Wal-Mart năm 2003 để gia nhập công ty Dell Computer, ở đây ông đã thể hiện tài nghệ trong việc mở rộng hoạt động CNTT và giúp tạo dựng vị thế hãng buôn PC hiệu quả nhất cho Dell.

Năm 2005, Mott lại nhảy việc và trở thành CIO của Hewlett Packard (HP). Nhiệm vụ của Mott tại HP không phải là thiết kế lại và tự động hoá các qui trình mà là thiết kế lại và tự động hoá chính chức năng của hệ thống CNTT.

Mott và cộng sự hiện đang thực hiện việc tinh giảm 85% trung tâm dữ liệu của HP khắp thế giới, chúng sẽ được thay thế bằng 6 hệ thống server khổng lồ đặt tại miền nam nước Mỹ – 4 ở Texas và 2 ở Georgia. Các trung tâm dữ liệu mới sẽ có tính tự động cao, có thể điều khiển từ một trung tâm điều hành và chỉ cần vài nhân viên tại chỗ. Kết hợp với nỗ lực hợp lý hóa danh mục phần mềm ứng dụng của công ty, việc hợp nhất trung tâm dữ liệu này được kỳ vọng giảm tổng nhân lực CNTT của HP từ 19.000 xuống 8.000 và cắt giảm chi phí CNTT từ 4% xuống 2%.

HP không phải là công ty duy nhất hiện đang định hình lại hệ thống CNTT. Trong 10 năm qua, IBM đã thay thế 155 trung tâm dữ liệu truyền thống của mình bằng 7 hệ thống hiện đại. Tiếp theo, IBM công bố sẽ thay thế gần 4.000 server chỉ với 30 mainframe dùng Linux.

Các kế hoạch hợp nhất trung tâm dữ liệu của HP và IBM thật ấn tượng nhưng không phải là cá biệt. Nhiều công ty lớn khác cũng đang hành động để tiết kiệm chi phí CNTT hàng tỉ USD bằng cách giảm số lượng trung tâm dữ liệu và server mà họ sử dụng.

Tất cả nên cám ơn Turing.

Phát hiện của Turing rằng "phần mềm luôn có thể thay cho phần cứng" là then chốt của "ảo hóa" - công nghệ nền tảng của làn sóng hợp nhất đang định hình lại hệ thống IT của các công ty lớn. Khi chi phí cho năng lực tính toán và dung lượng lưu trữ tiếp tục đà rơi tự do từ chục năm nay, thì ngày càng có thể biến càng nhiều phần cứng thành chương trình phần mềm – dùng một máy tính thật mạnh để chạy nhiều máy ảo.

Tất cả thiết bị phần cứng gắn vào các trung tâm dữ liệu doanh nghiệp – không chỉ server mà còn cả các ổ đĩa lưu trữ, thiết bị cân bằng tải, tường lửa, chuyển mạch và thậm chí cả cáp nối – thực chất là để thực hiện các lệnh. Ảo hóa đơn giản là biến các lệnh phần cứng thành mã lệnh chương trình (phần mềm) và loại bỏ cỗ máy vật lý. Điều này không chỉ tiết kiệm hàng đống tiền mà còn giúp hiện thực việc tự động hóa những qui trình CNTT thủ công trước đây. Một khi hạ tầng CNTT biến thành phần mềm, nó có thể được lập trình, dễ dàng và từ xa. Như thường lệ, chương trình phần mềm thay thế nhân công.

Trung tâm dữ liệu trong "mây"

Có thể bạn còn nhớ chiếc máy trả lời điện thoại đầu tiên là một thiết bị cồng kềnh. Nó ghi âm dạng analog trên cuộn băng từ và yêu cầu thường xuyên tua lại và thay thế. Sau đó nó được thay bằng chiếc máy số dễ dùng ghi âm dưới dạng chuỗi số nhị phân, cho phép tích hợp nhiều tính năng mới thông qua lập trình phần mềm. Khi thiết bị trở thành số, nó không còn là thiết bị nữa và có thể biến thành dịch vụ làm việc giống như chương trình phần mềm trên mạng của công ty điện thoại. Vậy là bạn chỉ cần đăng ký dịch vụ và có thể vứt đi chiếc máy trả lời điện thoại. Thiết bị vật lý bốc hơi thành "mây" của mạng dịch vụ.

Trung tâm dữ liệu của công ty, chung quy giống như phiên bản phức tạp hơn của chiếc máy trả lời điện thoại. Nó cũng có thể đóng gói thành phần mềm và chuyển thành một "đám mây" trên mạng. Và đó là kết quả có được nếu đi theo con đường của ảo hóa và hợp nhất. Tới lúc nào đó, việc hợp nhất các trung tâm dữ liệu, server và phần cứng khác của một công ty riêng lẻ sẽ gặp điểm giới hạn. Bạn sẽ không thể cắt giảm thêm được nữa vốn, nhân sự hay chi phí hoạt động. Bước kế tiếp yêu cầu việc hợp nhất diễn ra không chỉ trong từng công ty mà còn xuyên suốt nhiều công ty. Trung tâm dữ liệu riêng sẽ theo chân máy trả lời điện thoại cá nhân đi vào "mây". Cơ sở hạ tầng của từng công ty sẽ biến thành tiện ích dùng chung.

Khi điện toán và truyền thông trở nên đủ nhanh và đủ rẻ, mạng sẽ biến thành "máy tính toán đa năng" của Turing thực thi hiệu quả bất kỳ chương trình nào. Eric Schmidt, CEO của Google, từng nói "khi mạng trở nên nhanh như bộ xử lý, máy tính thu gọn lại và tản ra trên mạng".

Hãy chuẩn bị chào đón "World Wide Computer" (máy tính toàn cầu) thay thế cho "World Wide Web".

Sun Microsystems, hãng đã đưa ra khẩu hiệu có tính dự báo "mạng là máy tính" rất sớm từ cách đây 20 năm, đã công bố kế hoạch qua mặt chương trình hợp nhất của các đối thủ HP và IBM. Vào năm 2013, bộ phận CNTT của Sun dự định cắt giảm 50% diện tích khu trung tâm dữ liệu nội bộ. Và sau đó, theo Brian Cinque, kiến trúc sư trung tâm dữ liệu của Sun, hãng dự định giảm diện tích này xuống... zero. Đến năm 2015, Sun hy vọng chạy tất cả ứng dụng của hãng từ các lưới tiện ích dùng chung – từ "mây". Mạng sẽ trở thành không chỉ máy tính mà còn là trung tâm dữ liệu.

Hiện nay, ý tưởng về "phần mềm như dịch vụ” (SaaS – Software as a service) thường gắn với ứng dụng web. Nhưng không có lý do gì để mô hình cấp phát trên web hạn chế với các ứng dụng thông thường. Một khi ảo hóa hạ tầng tính toán, bạn có thể chạy bất kỳ ứng dụng nào trên lưới điện toán bên ngoài. Nhiều công ty nhỏ đang thực hiện việc này thông qua gói dịch vụ tính toán và lưu trữ do Amazon Web Services cung cấp. Các hãng tiên phong khác, như VMWare và 3Tera đang phát triển các công cụ mới giúp dễ dàng cấu hình ứng dụng và cơ sở hạ tầng để chạy trong "mây". Khi các công cụ này tiến triển, và khi các công ty như IBM, Google và Microsoft dồn hàng tỉ USD xây dựng lưới điện toán, việc chuyển dịch từ tính toán cục bộ sang tính toán trên "mây" sẽ mở rộng và tăng tốc.

Điểm quan trọng cần nhấn mạnh, cuộc cách mạng này không chỉ là tiết kiệm tiền bạc bằng cách chia sẻ cơ sở hạ tầng mà còn thúc đẩy sự cộng tác bằng cách chia sẻ dữ liệu và phần mềm. Cho đến nay, các hệ thống CNTT doanh nghiệp đều được xây dựng trên nguyên tắc cô lập – phần cứng riêng, phần mềm riêng, kho dữ liệu riêng. Nhưng nguyên tắc cô lập xung khắc với bản chất của chính việc kinh doanh đó là chia sẻ qui trình, thông tin và ý tưởng. Một trong những vấn đề đau đầu nhất với hệ thống CNTT đó là điều chỉnh các hệ thống cô lập hỗ trợ làm việc cộng tác.

Mô hình mới của hệ thống CNTT được xây dựng từ đầu trên nguyên tắc chia sẻ giúp giải quyết vấn đề trên. Hãy nhìn hàng triệu người đang hài lòng sử dụng những dịch vụ Web 2.0 để chia sẻ dữ liệu, làm việc với nhau và hình thành những cộng đồng trên mạng. Bạn có thể thích hay không thích Facebook, nhưng mạng xã hội cho thấy việc cộng tác trở nên dễ dàng như thế nào khi phần mềm và cơ sở dữ liệu được chia sẻ thay vì làm việc tách biệt.

Dĩ nhiên, điều đó dễ dàng cho cá nhân hay thậm chí các doanh nghiệp nhỏ, nhưng không hẳn dễ dàng cho các công ty lớn. Các đại công ty đã đầu tư hàng đống tiền cho hệ thống CNTT (thiết bị và nhân sự) và họ sẽ không vội vàng vứt bỏ khoản đầu tư này. Và dĩ nhiên, họ còn phải lo về tính tin cậy, bảo mật, dự phòng và nhiều vấn đề khác. Do vậy, việc chuyển đổi từ hệ thống CNTT riêng sang hệ thống chung sẽ không diễn ra nhanh mà sẽ dần dần. Trong tương lai, có thể các công ty sẽ sử dụng hệ thống CNTT hỗn hợp, kết hợp các hệ thống riêng với các dịch vụ dùng chung, đồng thời tái cấu trúc hạ tầng CNTT nội bộ để hoạt động giống như hệ thống tiện ích ảo hóa cho nhiều công ty khác thuê. Lưới điện toán cho phép sắp xếp máy móc và các chức năng theo bất kỳ cách thức nào đảm bảo hiệu quả và linh động nhất cho người dùng.

"Mây" và lưới điện toán

Thuật ngữ "điện toán mây" (cloud computing) khá mới và hiện đang "hot" trong lĩnh vực công nghệ. Định nghĩa từ Forester Reasearch, "điện toán mây" là "tập hợp cơ sở hạ tầng tính toán được quản lý, có khả năng mở rộng cao và được trừu tượng hóa cho phép đặt các ứng dụng của khách hàng và tính phí tuỳ theo mức sử dụng". Nói một cách đơn giản hơn, nó là tập hợp các tài nguyên – ứng dụng, năng lực tính toán và lưu trữ, và các dịch vụ (dạng như dịch vụ kiểm tra virus) – được cấp phát trên Internet.

"Điện toán mây" thường được xếp ngang với "điện toán lưới" (grid computing) hay "điện toán tiện ích" (utility computing) đã có trước đây. Cả hai đều bao hàm các trung tâm dữ liệu chứa tài nguyên điện toán có sẵn trên mạng. Vậy chúng có phải là một?

Thực sự không. "Điện toán lưới" bao hàm việc cung cấp nguồn lực tính toán như là tiện ích mà có thể bật hay tắt tùy theo yêu cầu. Có thể nói là tính toán theo nhu cầu.

"Điện toán mây" hơi khác. Nó bao hàm việc cung cấp ứng dụng đến người dùng chứ không chỉ "xung nhịp máy tính". Đây là một dạng dịch vụ CNTT được cấp phát trên Internet, có đặc trưng là quy mô - khả năng phục vụ hàng triệu người dùng. Đó chính là sự khác biệt.

Thuật ngữ "điện toán mây" có lẽ xuất phát từ biểu tượng đám mây đại diện cho Internet hay môi trường mạng rộng lớn.

Công nghệ tìm kiếm trên Web

Bài viết này sẽ đưa ra các khái niệm cơ bản nhằm định hướng ban đầu cho những người muốn tìm hiểu các công nghệ tìm kiếm trên Web

Về cơ bản có 3 loại công cụ tìm kiếm: một số được vận hành bởi các crawler (hoặc spider); một số được vận hành bởi human submissions, và một số là sự kết hợp của hai loại trên.


1/ Crawler - Based Search Engines


• Do chuơng trình máy tính tự động tạo ra.


Các công cụ dựa trên Crawler gửi các crawler, hoặc là spider ra ngoài. Các crawler này sẽ đến một trang web, đọc các thông tin thực sự của trang web đó, đọc các meta tag của trang web và nó cũng đến tận các link mà trang web đó link đến. Các crawler này sẽ gửi tất cả các thông tin về trung tâm lưu trữ để liệt kê các dư liệu ra. Crawler sẽ quay trở lại trang web đó một cách định kỳ để cập nhập sự thay đổi trên trang web đó, và chu kỳ cập nhật này là do ngưòi quản trị của công cụ tìm kiếm đó đặt cấu hình.

Web crawler, web spider hay web robot là một chương trình tự động tìm kiếm trên Internet. Nó được thiết kết để thu thập tài nguyên Internet (trang Web, hình ảnh, video, tài liệu Word, PDF hay PostScrips) , cho phép máy tìm kiếm đánh chỉ số sau đó.

Cùng phương thức, nhưng một số robots lại bị sử dụng để lượm các tài nguyên hoặc để lọc địa chỉ email.

Để đánh chỉ số các tài nguyên Web, mỗi robot sẽ đi theo các liên kết mà nó tìm thấy tại một trang trung tâm. Sau đó, mỗi trang đã duyệt sẽ được ghi nhớ lại và gán cho tần số đánh lại chỉ số dựa vào mức độ cập nhật thường xuyên hay không của trang.

Để điểu chỉnh ứng xử các robots, một tệp tin ngoại trừ (robots.txt) sẽ được đặt tại thư mục gốc của trang Web để chỉ định cho robots một danh sách những tài nguyên không được tiếp cận. Tệp tin robots.txt này còn đưa ra danh sách những bọ tìm kiếm nào được quyền đánh chỉ số trang Web. Qui tắc này cho phép giảm tải trên máy chủ và tránh đánh chỉ số những tài liệu không cần thiết hoặc nhạy cảm. Tuy nhiên có nhiều bọ tìm kiếm không tôn trọng chỉ định này, và hoàn toàn bỏ qua tệp tin ngoại trừ (robots.txt).

Một số bọ tìm kiếm phổ biến của các máy tìm kiếm :

- Googlebot của Google
- MSNBot của MSN
- Slurp của Yahoo
- Scooter của Alta Vista
- Baidu của Baidu

Image

Thuật ngữ khác của Web Crawler có thể dễ hiểu hơn là Web Spider hoặc Web Robot. Được hiểu nó là 1 chương trình hoặc các đoạn mã có khả năng tự động duyệt các trang web # theo 1 phương thức, cách thức tự động. Ngoài ra có thể dung những từ để chỉ thuật ngữ Web Crawler như ants, automatic indexers, bots, and worms.

Quá trình thực hiện được gọi là Web crawling hay spidering, rất nhiều các công cụ tìm kiếm trên thế giới sử dụng spidering để cập nhật kho dữ liệu website của mình. Chẳng hạn như google dùng nó để lấy các thông tin trên các website rồi cập nhật vào cơ sở dữ liệu của nó giúp người dùng search ra các trang theo ý muốn.

Web crawler là 1 loại của cái gọi là bot (là 1 tác tử thực hiện tự động, nghĩa giống như spider). Nó bắt đầu từ danh sách các địa chỉ URL được gọi là seeds (hạt giống). Nó sẽ vào các địa chỉ này lọc thông tin rồi tìm ra các địa chỉ URL khác thêm chúng vào danh sách các địa chỉ đã duyệt qua gọi là crawl frontier. Sau nó nó lại lặp lại quá trình đó duyệt qua những URL mới. Cứ thế, cứ thể nó lần qua rất nhiều địa chỉ website và thu thập rất nhiều nội dung khác nhau giúp ta dễ dàng tìm kiếm thông tin mình cần.

Trên thế giới những web crawler rất nhiều và áp dụng vào rất nhiều loại hình website khác nhau như: web rao vặt, web so sánh giá, web tổng hợp tin tức, web tìm kiếm,…

Ở Việt Nam cũng đã xuất hiện khá nhiều như:
- Web so sánh giá cả aha.vn
- Web tổng hợp tìm kiếm rao vặt 123g0.com
- Web tổng hợp tin tức như: baomoi.com, timnhanh.com,…
- Web tổng hợp nhạc, tìm kiếm nhạc như: baamboo.com, mp3.zing.vn, 7sac.com
- Web tổng hợp tìm kiếm như: vnnsearch.com, vnsearch.net,…

2/ Human-powered Directories

• Là dạng quản lý thư mục internet do con người quản lý.


Các công cụ tìm kiếm Human-powered thì lại tin vào các thông tin được liệt kê ra bởi người quản trị trang web, rồi sau đó các thông tin này sẽ được liệt kê và đưa vào bảng liệt kê. Chỉ những thông tin được đưa ra bởi nhà quản trị web mới được đưa vào bảng liệt kê.

Các thư mục internet hòan tòan phụ thuộc vào sự quản lý của con người. Bạn đăng ký website của bạn vào thư mục với một vài dòng mô tả ngắn gọn hoặc các biên tập viên của thư mục viết giúp phần mô tả cho bạn - chúng phù hợp với nội dung và chủ đề của từng danh mục.

Việc thay đổi những trang web không có hiệu lực trên danh mục của bạn. Những thứ hữu ích để cải thiện vị trí xếp hạng với một cỗ máy tìm kiếm không có gì để làm với việc cải thiện một vị trí trong một thư mục. Ngoại lệ duy nhất là một site tốt, với nội dung tốt, có lẽ thích hợp hơn để được xem xét so với một website nghèo nàn.


3/ Kết hợp 2 loại trên

Trong cả hai trường hợp, khi bạn yêu cầu tìm kiếm một thông tin gì thì thực tế bạn đều phải tìm trong bảng liệt kê công cụ tìm kiếm mà nó đã tạo ra. Thực tế bạn sẽ không tìm trên các web! Các bảng liệt kê này là những cơ sở dữ liệu khổng lồ được tạo ra, lưu trữ và sau đó được tìm kíêm. Điều này giải thích tại sao thỉnh thoảng khi tìm kiếm trên các công cụ tìm kiếm thương mại, ví dụ như Yahoo! Hay Google, sẽ trả về kết quả chỉ là các link. Bởi vì là các kết quả dựa trên bảng liệt kê, nên khi các công cụ tìm kiếm chưa kịp cập nhật thì nếu có một web nào đó không hoạt động nữa, kết quả vẫn ra link tới nó. Điều này chỉ được sửa lại khi công cụ tìm kiếm cập nhật lại thông tin từ web đó.

Trong thực tế, các hãng tìm kiếm khổng lồ đều kết hợp cả 2 loại trên, crawler để tự động update thông tin mới, còn bảng thư mục do nguời quản trị xử lý trong những truờng hợp website đăng ký trả tiền để đưọc lên các vị trí đầu trong quá trình search.

Vậy, tại sao cùng tìm kiếm một thông tin trên các công cụ khác nhau thì lại cho kết quả không giống nhau? Một phần là vì không phải các bảng liệt kê của các công cụ là hoàn toàn giống nhau. Nó phụ thuộc vào các spider được tìm thấy hay thông tin được nhà quản trị web trình ra. Nhưng một điều quan trọng là không phải các công cụ đều dùng chung một thuật toán để tìm trên các bảng liệt kê. Thuật toán là cách mà các công cụ tìm ra các thông tin liên quan, phù hợp với thông tin mà người dùng cần tìm.

Một trong các yếu tố của thuật toán tìm kiếm của các công cụ tìm kiếm là: tần số xuất hiện và vị trí của các từ khoá (Keyword). Tần số suất hiện càng cao thì càng thích hợp.

Một yếu tố khác cũng rất phổ biến của công cụ tìm kiếm là nó dựa vào cách trang web đó link đến các trang khác như thế nào trong trang web. Bằng cách phân tích các trang link tới nhau như thế nào, các công cụ tìm kiếm có thể xác định được nội dung trang đấy là về cái gì, biết được trang nào là phù hợp hơn. Các công cụ ngày càng trở nên tinh vi hơn và tìm kiếm cũng hiệu quả, chính xác hơn!

Trong tương lai việc lọc các tin tức trên internet sẽ là rất quan trọng giúp cho người sử dụng dễ dàng tìm được cái minh muốn bởi vì Internet ngày càng lớn mạnh cũng có nghĩa là lượng thông tin ngày càng nhiều và càng trở nên hỗn độn hơn.

4/ Các thành phần của một cỗ máy tìm kiếm tự động

Những cỗ máy tìm kiếm tự động có 3 phần tử chính:

Đầu tiên là spider, cũng được gọi là crawlers. Spider đến thăm một trang web, đọc nó, và sau đó đi theo sau những mối liên kết tới những trang khác bên trong website. Có nghĩa là, khi có ai đó tìm kiếm đến một trang, các spiders sẽ ghi nhớ điều đó. Nó sẽ quay lại trang đó và theo chu kỳ 1-2 tháng. Như vậy, nếu trang web được tìm thấy càng nhiều, thì các spiders càng năng quay trở lại hơn và như thế, kết quả tìm kiếm của bạn cũng được cải thiện theo.

Mọi thứ spider tìm thấy đi vào trong phần thứ hai của cỗ máy tìm kiếm, Chỉ mục (the index). Chỉ mục, đôi khi gọi là tài liệu, là một kho lưu trữ khổng lồ chứa đựng một sự sao chép của mọi trang web mà spider tìm thấy. Nếu một trang web thay đổi, thì danh sách này được cập nhật với thông tin mới. Đôi khi, cần phải có thời gian để các spiders lập chỉ mục cho một trang mới hay một trang được thay đổi nội dung. Như vậy, sẽ có trường hợp: một trang đã được các spiders tìm đến, nhưng lại chưa được lập chỉ mục. Và trong khỏang thời gian này, trang web sẽ hòan tòan không tồn tại trên Search engine.

Phần mềm tìm kiếm chính là phần tử thứ ba của một cỗ máy tìm kiếm. Đây là một chương trình máy tính có chức năng sàng lọc thông tin từ hàng triệu trang tương tự nhau để sắp xếp vị trí từng trang sao cho phù hợp nhất. Đây chính là nơi mà các công ty SEO khai thác để đưa một website nào đó lên vị trí Top khi được tìm kiếm với một hay nhiều từ khóa chỉ định.

Cloud computing - hạ tầng và ứng dụng

Image



Image




Tính toán và lưu trữ dạng “đám mây” chuyển các tài nguyên vật lý (như bộ vi xử lý và thiết bị lưu trữ) thành các tài nguyên mở rộng được và chia sẻ được trên Internet (tính toán và lưu trữ dưới dạng các “dịch vụ”). Mặc dù không phải là một khái niệm mới nhưng ảo hóa (virtualization) khiến cloud computing trở nên dễ mở rộng và hiệu quả hơn nhiều thông qua việc chia sẻ các hệ vật lý với sự ảo hóa server. Cloud computing cho phép người dùng tiếp cận đến các tài nguyên tính toán và lưu trữ khổng lồ mà không cần biết chúng ở đâu và được cấu hình như thế nào. Trong cloud computing Linux đóng một vai trò to lớn.

Ngày nay bạn khó có thể đọc một Website kỹ thuật nào mà lại không nhắc đến cloud computing. Cloud computing không gì khác chính là việc cung cấp các tài nguyên tính toán (máy tính và phương tiện lưu trữ) như là một dịch vụ. Cùng với đó là khả năng mở rộng các máy tính và phương tiện lưu trữ theo một cách đơn giản và “trong suốt”. Tất cả các điều này tương tự như ý tưởng của utility computing , trong đó các tài nguyên tính toán được xem như các dịch vụ “đo” được, chẳng hạn như trong các tiện ích truyền thống (điện, nước). Điều khác biệt chính là các công nghệ đã có sẽ kết hợp cùng nhau để biến cloud computing thành hiện thực.

Một trong nhưng xý tưởng quan trọng nhất của cloud computing là khả năng mở rộng và công nghệ chủ chốt là công nghệ ảo hóa. Ảo hóa cho phép sử dụng tốt hơn một server bằng cách kết hợp các hệ điều hành và các ứng dụng trên một máy tính chia sẻ đơn lẻ. Ảo hóa cũng cho phép di trú trực tuyến (online migration) để khi một server quá tải, một instance của hệ điều hành (và các ứng dụng trên đó) có thể di trú đến một server mới,ít tải hơn.

Từ góc nhìn bên ngoài, cloud computing đơn giản chỉ là việc di trú tài nguyên tính toán và lưu trữ từ doanh nghiệp vào “đám mây”. Người dùng chỉ định yêu cầu tài nguyên và cloud provider hầu như tập hợp các thành phần ảo này trong hạ tầng của nó. (xem hình 1)


H1 : Tính toán “đám mây” di trú tài nguyên trên Internet

Nhưng tại sao bạn lại sẵn sàng từ bỏ quyền kiểm soát tài nguyên của mình và cho phép chúng tồn tại ảo trong “đám mây” ? Có nhiều lý do nhưng theo tôi quan trọng nhất là tính dễ mở rộng và chi phí.

Ưu điểm mới của cloud computing là khả năng ảo hóa và chia sẻ tài nguyên giữa các ứng dụng. Hình 2 cho thấy một ví dụ.

H2 : Ảo hóa và sử dụng tài nguyên

Ở đây 3 nền tảng độc lập tồn tại cho các ứng dụng khác nhau , mỗi ứng dụng chạy trên server của nó. Trong “đám mây”, server có thể được chia sẻ (được ảo hóa) giữa các hệ điều hành và các ứng dụng để sử dụng server tốt hơn. Càng ít server thì càng cần ít không gian (giảm vùng bao phủ của các data center) và càng ít năng lượng làm mát (giảm tiêu hao nhiên liệu).

Nhưng vẫn có các trả giá và cloud computing có nhược điểm của nó (sẽ nói đến sau)


Bên trong cloud computing

Bên trong “đám mây” không chỉ có một dịch vụ mà là một tập các dịch vụ. Các tầng định nghĩa mức dịch vụ được cung cấp

H3 : Các tầng của tính toán “đám mây”

Tầng thấp nhất là Hạ tầng (Hạ tầng như một dịch vụ - IaaS). IaaS là việc cho thuê hạ tầng như một dịch vụ bao gồm các máy tính ảo hóa và băng thông dành riêng cho lưu trữ và truy cập Internet. Về cơ bản, đó là khả năng cho thuê máy tính hay data center với ràng buộc về QoS sao cho người dùng có khả năng chạy phần mềm hay hệ điều hành bào đó tùy ý.

Lên mức tiếp theo là Nền tảng (Nền tảng nưh một dịch vụ - PaaS). PaaS giống như IaaS nhưng gồm cả hệ điều hành và các dịch vụ cần thiết cho một ứng dụng chuyên biệt. Ví dụ PaaS ngoài server và lưu trữ ảo hóa cung hệ điều hành đặc biệt và tập các ứng dụng (như một máy ảo) cùng các dịch vụ cần thiết như MySQL…Nói cách khác, PaaS là IaaS với một software stack dành cho một ứng dụng.

Trên cùng của hình 3 là dịch vụ đơn giản nhất được cung cấp : ứng dụng. Tầng này được gọi là Phần mềm như một dịch vụ (SaaS) và nó là mô hình triển khai phần mềm từ một hệ tập trung sang chạy trên máy tính cục bộ. Dưới dạng dịch vụ “đo” được, SaaS cho phép bạn thuê một ứng dụng và chỉ trả tiền cho thời gian sử dụng.

Trên đây là cái nhìn sơ lược về cloud computing , bỏ qua một số khía cạnh như là Dữ liệu như một dịch vụ (DaaS ) cho phép người dùng trả tiền cho dung lượng lưu trữ và băng thông truy cập. Các dịch vụ “đám mây” cũng đang nối lên, chúng vừa có cơ chế nội để tương kết (interoperability) vừa cung cấp các API cho bên ngoài.

Saturday, November 7, 2009



Kinh tế suy thoái giúp điện toán đám mây phát triển

- Theo dự báo của Gartner, các hãng công nghệ và bản thân người dùng đang hướng tới giải pháp điện toán đám mây như một xu thế tất yếu để tiết kiệm chi phí, và kết quả là những nhà cung cấp dịch vụ này sẽ kiếm được bộn tiền.

Tuần trước Gartner vừa đưa ra một báo cáo cho biết doanh thu trong lĩnh vực điện toán đám mây năm nay có thể không vượt quá con số 56,3 tỉ USD, nhưng tới năm 2013 sẽ đạt hơn 150 tỉ USD. Các nhà phân tích cũng nói rằng các dịch vụ IT truyền thống đang chuyển hướng sang “đám mây” giúp cho lĩnh vực này ngày càng được mở rộng và phát triển ổn định.

Các quy trình kinh doanh dựa trên “đám mây” là phần lớn nhất của thị trường dịch vụ “đám mây”, bao gồm quảng cáo, thương mại điện tử, nhân lực, và xử lý thanh toán. Gartner dự báo rằng mức tăng trưởng của lĩnh vực này trong năm nay sẽ là 19,8%, tương đương với 46,6 tỉ USD.

Cũng theo Gartner, các dịch vụ hỗ trợ bằng quảng cáo như được cung cấp bởi Google, Microsoft, Yahoo, và một số hãng khác đang chiếm tới 60% thị trường dịch vụ “đám mây”, và sẽ vẫn tiếp tục nở rộ cho tới năm 2013.

Kinh tế suy giảm, chi tiêu cho IT bị bó hẹp sẽ là những yếu tố giúp cho điện toán đám mây ngày càng trở nên thông dụng hơn. Dịch vụ này giúp cung cấp những ứng dụng và dịch vụ trên nền Web với chi phí thấp, giúp các doanh nghiệp không phải đầu tư một khoản tiền lớn mà vẫn duy trì được hoạt động sản xuất kinh doanh. InfoWorld ghi nhận những chuyển đổi nhanh chóng của điện toán đám mây từ mùa thu trước, còn IDC thì dự đoán rằng sự tăng trưởng của lĩnh vực này đang hiển diện rất rõ ràng.

Tuy nhiên, cũng theo Gartner, điện toán đám mây không phải là công nghệ duy nhất tăng trưởng trong bối cảnh suy thoái kinh tế này. Phần mềm lưu trữ và IT chăm sóc y tế cũng được cho là sẽ phát triển khá mạnh.

Gridbon Technologies

Tuesday, November 3, 2009

Cloud Computing with Microsoft Technology case study in Vietnam

Cloud Computing with Microsoft Technology case study in Vietnam

Tôi ko có ý định viết 1 entry về giải pháp Cloud Computing của Microsoft vì những vấn đề mà tôi sắp đề cập ko hề liên quan gì đến Cloud Platform Azure mà chủ yếu là giải pháp ảo hóa và hosting services đang dần dần trở nên phổ biến tại Vietnam.

Gridbon là công ty chuyên cung cấp giải pháp hosting, có DataCenter khá hoành tráng ở Đức và nghe đâu dang xây dựng DC tại VietNam, tại Đức chúng tôi cung cấp dịch vụ chủ yếu trên Suse Linux và Server chạy chip AMD. Gridbon đã có các giải pháp về máy chủ ảo (VPS) từ rất sớm ra thị trường Châu Âu. Bước vào thị trường Việt Nam, nhận thấy nhu cầu với VPS Windows là rất lớn nên đã chủ động liên hệ với MS Vietnam để tìm hiểu về giải pháp ảo hóa Hyper-V trên nền tảng Wins Server 2008. Gridbon sau thời gian chạy thử nghiệm giải pháp máy chủ ảo trên nền tảng Hyper-V của Windows Server 2008 đã chính thức cung cấp dịch vụ này cho khách hàng.

1

2

Nếu mọi người để ý máy ảo Linux tại Gridbon có chi phí rẻ hơn chỉ khoảng 10$ so với máy ảo Windows, tôi có hỏi anh Bôn sao chi phí chênh nhau có vẻ hơi ít vì người ta hay nói về Open Source như Zero Cost Solution thì anh Bôn cho biết đã gọi là giải pháp cho Comercial thì đều phải bỏ tiền ra mua cả vì để triển khai giải pháp ảo hóa chuẩn trên nền tảng OpenSource thì Gridbon cũng phải bỏ tiền để mua chứ ko phải free.

Quay lại vụ máy ảo Windows Server 2008, sau thời gian triển khai gói dịch vụ ảo hóa trên nền tảng Microsoft, anh Bôn có cho biết rằng một số khách hàng mua để host các ứng dụng LOB như phần mềm kế toán được dùng chung giữa các văn phòng nằm rải rác trên cả nước. Cách thức họ sử dụng là người dùng phải Remote Desktop vào máy chủ ảo và sử dụng ứng dụng LOB từ icon trên màn hình điều khiển. Tôi mới đề xuất với anh Bôn là ứng dụng giải pháp Presentation-V có sẵn trên Windows Server 2008 tức Terminal Services RemoteApp cho phép triển khai giải pháp End-to-End cho khách hàng. Tức lúc đó người dùng sẽ ko pải remote desktop nữa mà có thể sử dụng ngay ứng dụng LOB host ở máy chủ ảo Hyper-V host tại Gridbon ngay từ icon trên desktop của họ. Sau khi thử nghiệm và đưa vào ứng dụng thì anh Bôn có cho biết là khách hàng rất phấn khích và sẽ đặt thêm máy chủ ảo để triển khai một số ứng dụng khác.

3

4

Vì vậy tôi mới nói đùa với mọi người Gridbon là Hosting Solution Provider cung cấp giải pháp Cloud Computing trên nền tảng công nghệ Microsoft tại Vietnam hiện nay với công thức: Hyper-V + Present-V+InToon= SaaS + Hosted Services = Cloud Computing with Microsoft Technology+InToon=Gridbon Technology