Nghiên cứu xây dựng kho dữ liệu dùng chung cho các dịch vụ công trực tuyến của Bộ Công Thương

Ngày nay, công nghệ thông tin đang ngày càng phát triển, trở thành mũi nhọn trong chiến lược phát triển kinh tế của mỗi nước. CNTT đã đi vào hoạt động hàng ngày của doanh nghiệp và của các tổ chức chính trị, xã hội. Tuy nhiên, các doanh nghiệp, tổ chức mà cụ thể là bộ phận CNTT còn đối mặt với vấn đề hóc búa là dữ liệu lưu trữ phân tán ở nhiều nơi; dữ liệu ở nhiều định dạng khác nhau; không thể tìm thấy dữ liệu cần thiết… Kết quả là rất nhiều các tổ chức có nhiều hệ thống thông tin, CSDL nhưng không thể có được đầy đủ thông tin liên quan và một minh chứng khoa học để đưa ra quyết định quyết định đúng đắn cho các nhà quản trị doanh nghiệp. Bộ Công Thương cũng đang đối mặt với tình trạng như vậy. Hiện nay, Bộ Công Thương có hơn 154 Dịch vụ công trực tuyến (DVCTT) ở mức độ 3 và 4. Tuy nhiên, các dịch vụ công này được xây dựng và triển khai theo từng dịch vụ riêng biệt. Do đó, dữ liệu được phân tán, trùng lặp ở nhiều nơi gây lãng phí tài nguyên. Bên cạnh đó việc quản lý thông tin của các cán bộ Bộ Công Thương cũng gặp nhiều khó khăn. Các hệ thống trùng lặp, dư thừa thông tin, tuy nhiên khi cần dữ liệu tổng hợp thì lại không tổng hợp được vì không tích hợp được các dữ liệu từ nhiều nguồn khác nhau hay định dạng khác nhau.

Với sự phát triển của các ứng dụng nghiệp vụ đòi hỏi các ứng dụng Công nghệ thông tin phải có một hạ tầng mềm dẻo và linh hoạt để có thể nhanh chóng thay đổi và đáp ứng. Một bài toán được đặt ra là làm sao có thể dễ dàng truy cập và sử dụng dữ liệu khi lượng dữ liệu của tổ chức ngày càng lớn và làm thế nào để tích hợp và sử dụng được dữ liệu trong nhiều định dạng khác nhau, tồn tại trên nhiều nền tảng khác nhau, và lưu trữ trong nhiều tập tin khác nhau, cấu trúc cơ sở dữ liệu khác nhau, được phát triển bởi các nhà cung cấp khác nhau từ đó đưa ra quyết định đúng đắn, kịp thời trong môi trường cạnh tranh hiện nay.

Kho dữ liệu (Data Warehouse) ra đời nhằm giải quyết bài toán đó. Công nghệ kho dữ liệu (Data Warehouse Technology) là tập các phương pháp, kỹ thuật và các công cụ có thể kết hợp, hỗ trợ nhau để cung cấp thông tin cho người sử dụng trên cơ sở tích hợp từ nhiều nguồn dữ liệu, nhiều môi trường khác nhau. Do vậy nhóm thực hiện đề tài do CN. Đỗ Thị Thủy, Cục Thương mại điện tử và Kinh tế số, Bộ Công Thương đã nghiên cứu và đề xuất một giải pháp đang được quan tâm là kho dữ liệu (Data Warehouse) với tên cụ thể là “Nghiên cứu xây dựng kho dữ dùng chung cho các dịch vụ công trực tuyến của Bộ Công Thương”. Việc áp dụng giải pháp này sẽ giải quyết được vấn đề tích hợp, chia sẻ dữ liệu mà không phụ thuộc vào hệ điều hành và nền tảng công nghệ. Đề tài sẽ tập trung vào nghiên cứu tình hình triển khai và áp dụng giải pháp kho dữ liệu trên thế giới và ở Việt Nam từ đó đề xuất ra giải pháp, mô hình và xây dựng kho dữ liệu dùng chung ở Bộ Công Thương.

Sau một thời gian triển khai thực hiện, nhóm đề tài đã đưa ra kết luận như sau:

Kho dữ liệu đã khá phổ biến trên thế giới, nhất là trong l nh vực tài chính, ngân hàng, hàng không, an ninh, quốc phòng. Đối với Bộ Công Thương, Bộ quản lý nhiều ngành nghề khác nhau, dữ liệu khá lớn và gồm các dữ liệu ở các lĩnh vực công nghiệp, thương mại, nên việc xây dựng kho dữ liệu để lưu trữ, chia sẻ, cung cấp và sử dụng hiệu quả các nguồn dữ liệu sẵn có là một yêu cầu cần thiết không chỉ đối với Bộ Công Thương, mà còn có ý nghĩa rất lớn đối với xã hội. Theo nghiên cứu của đề tài, đến nay đã có một số cơ quan thống kê quốc gia của một số nước đã xây dựng được kho dữ liệu như: Đan Mạch, Brazin, Bỉ... Kinh nghiệm xây dựng kho dữ liệu thống kê của các quốc gia nói trên sẽ là cơ sở tham khảo tốt cho việc xây dựng kho dữ liệu đầu vào của Bộ Công Thương.

Kết quả đề tài khoa học công nghệ này là việc nhóm tác giả đã đề xuất được giải pháp xây dựng kho dữ liệu đầu vào theo chủ đề từ đó từng bước xây dựng kho dữ liệu đầu vào tập trung. Bộ Công thương có thể sử dụng kết quả nghiên cứu để tham khảo mô hình và triển khai mô hình thống kê, trao đổi, chia sẻ thông tin trong các giai đoạn tới.

Việc triển khai kho dữ liệu sẽ là nền tảng tốt cho Bộ Công Thương triển khai hệ thống 1 cửa Bộ Công Thương và tiến tới triển khai Chính phủ điện tử tại Bộ Công Thương theo đúng kế hoạch công nghệ thông tin 2016 - 2020 của Bộ Công Thương. Triển khai kho dữ liệu giúp lãnh đạo Bộ Công Thương quản lý, điều hành các công việc của Bộ một cách hiệu quả, chính xác và kịp thời.

Bên cạnh những những kết quả đạt được, đề tài này cần được tiếp tục phát triển và hoàn thiện trong các năm tiếp sau.

Nhóm thực hiện đề tài cũng kiến nghị Bộ Công Thương cần sớm triển khai xây dựng kho dữ liệu bởi vì nguồn dữ liệu của Bộ Công Thường ngày càng lớn, đa dạng và đã bộc lộ nhiều bất cập trong việc lưu trữ, quản lý, chia sẻ , khai thác sử dụng, nếu không bắt tay ngay vào việc xây dựng kho dữ liệu, thì Bộ Công Thương không những không hạn chế được bất cập, mà còn làm bất cập tăng lên đến mức sẽ không thể kiểm soát được. Việc xây dựng Kho dữ liệu theo từng giai đoạn, trước tiên sẽ xây Kho dữ liệu đầu vào theo hướng kho dữ liệu chủ đề (data mark), sau đó sẽ tích hợp các kho dữ liệu chủ đề thành kho dữ liệu thống kê chung. Xây dựng kho dữ liệu của Bộ Công Thương sẽ dựa trên nền tảng CNTT sẵn có của Bộ Công Thương, đó là công nghệ khách/chủ. Hệ quản trị CSDL thích hợp nhất với công nghệ khách/chủ là Microsoft SQL server phiên bản 2008.Chuyển đổi dữ liệu sẽ sử dụng công cụ có sẵn là SQL Server Integration Services của Microsoft SQL server. Vần đề an ninh, an toàn mạng và bảo mật dữ liệu (không thuộc phạm vi nghiên cứu của đề tài) là vấn đề quan trọng, cần được đầu tư đồng bộ với công nghệ khách/chủ, hệ quản trị CSDL. Hơn nữa, xây dựng kho dữ liệu của Bộ Công Thương là công việc rất lớn và mới của ngành, do đó, cần có sự hỗ trợ kỹ thuật của chuyên gia có kinh nghiệm xây dựng kho dữ liệu thống kê.

Có thể tìm đọc toàn văn Báo cáo kết quả nghiên cứu của Đề tài (Mã số 16354/2019) tại Cục Thông tin Khoa học và Công nghệ Quốc gia.

P.T.T (NASATI)