Đám mây Khoa học Mở châu Âu và gợi ý cho Việt Nam

Trong giai đoạn 2018-2020, Đám mây Khoa học Mở châu Âu – EOSC (European Open Science Cloud) cùng một lúc triển khai 6 dòng hành động gồm: (1) Kiến trúc; (2) Dữ liệu; (3) Các dịch vụ; (4) Truy cập & giao diện; (5) Các quy tắc; (6) Điều hành. Bạn có thể mong chờ học được gì từ những công việc đó? Bài viết này có thể đưa ra một vài gợi ý.


Đám mây khoa học mở châu Âu với các đặc trưng: là một môi trường mở và tin cậy để trao đổi dữ liệu học thuật, cung cấp các dịch vụ mở và tức thời để phân tích và tái sử dụng dữ liệu, chương trình này không chỉ kết nối dữ liệu mà còn kết nối các nhà khoa học xuyên biên giới. Nguồn: blogs.eui.eu

Mục đích của Đám mây Khoa học Mở châu Âu – EOSC (European Open Science Cloud) là để Liên minh châu Âu dẫn đầu thế giới trong quản lý dữ liệu nghiên cứu và đảm bảo các nhà khoa học châu Âu gặt hái được đầy đủ các lợi ích của nền khoa học được thúc đẩy bởi dữ liệu’1. Các nghiên cứu từ khắp châu Âu sẽ không còn phân tán mà được lưu trữ tập trung ở cùng một nơi, có thể tìm kiếm, chia sẻ và tái sử dụng một cách dễ dàng.

Trong khuôn khổ của một bài báo sẽ không có cách gì để có thể chuyển tải hết được chi tiết các dòng hành động đó. Vì vậy, bài viết chỉ nêu lên được những điểm khái quát nhất của chúng.

Kiến trúc

Kiến trúc theo liên đoàn ngụ ý EOSC sẽ là liên đoàn các hạ tầng dữ liệu nghiên cứu hiện có nhưng được lên kế hoạch, được bổ sung thêm một lớp phủ mềm để kết nối chúng và làm cho chúng vận hành trơn tru như thể là một hạ tầng dữ liệu nghiên cứu duy nhất của châu Âu.


Hình 1 – Các dòng hành động của mô hình EOSC2.

Theo cách này, EOSC sẽ gồm lõi liên đoàn EOSC và các hạ tầng dữ liệu nghiên cứu có sẵn khác được kết nối nó theo một khung tuân thủ các quy tắc để đảm bảo sự vận hành trơn tru như được nêu ở trên.

Tất cả các hạ tầng dữ liệu nghiên cứu liên đoàn và các nhà cung cấp dịch vụ thương mại cần tuân thủ các quy tắc tham gia. Quan trọng, họ có thể đồng ý triển khai các nguyên tắc dữ liệu FAIR (ghép các ký tự đầu của các từ tiếng Anh: Findable, Accessible, Interoperable, Reusable, có nghĩa là [dữ liệu phải] tìm thấy được, truy cập được, tương hợp được và sử dụng lại được) một cách đầy đủ. Điều này có thể đóng góp cho tính bền vững lâu dài của họ, khi các nhà cấp vốn nghiên cứu của EU đang dần ràng buộc việc cấp vốn của họ với các bổn phận truy cập mở và sử dụng các kho được thừa nhận/được chứng thực FAIR. Qua thời gian, EOSC có thể với tới được các tài nguyên từ các đối tác nghiên cứu toàn cầu của EU, để tạo ra sân chơi bình đẳng về dữ liệu mở cho các nhà khoa học toàn cầu3.

Bắt đầu

Các tài nguyên được cam kết (chưa vét cạn)

Hành động

Các cột mốc

Q1, 2018

– Dự án EOSC-hub

– Dự án OpenAIRE-Advance

– Dự án FREYA

Phát triển lõi liên đoàn EOSC ban đầu gồm các tài nguyên EOSC được chia sẻ

Q4, 2019: lõi liên đoàn EOSC ban đầu sẽ có.

Q1, 2019

– Dự án EOSCPilot

– INFRASUPP-01-2018-2019 (b3)

Phát triển catalog các hạ tầng có quan tâm và hợp lệ (các Quy tắc Tham gia) sẽ được làm thành liên đoàn trong EOSC và xác định các trung tâm liên đoàn EOSC

Q4, 2019: Đăng kýcác hạ tầng dữ liệu EOSC (ban đầu)

Q4, 2018

– INFRAEOSC-04-2018

Kết nối các hạ tầng nghiên cứu được xác định theo Lộ trình của ESFRI với EOSC. Hỗ trợ hoạt động này sẽ được cung cấp qua các dự án bó.

Quý 2, 2020: Kết nối chính của hầu hết các hạ tầng và các dịch vụ với EOSC.

Bảng 1. Các hoạt động triển khai theo dòng hành động kiến trúc.

Bình diện quốc tế4

Các đơn vị dịch vụ của Ủy ban châu Âu đã làm việc trong bối cảnh của các nước G7, G20 và trong sự cộng tác với Diễn đàn Khoa học Toàn cầu của OECD5 để đảm bảo sự triển khai EOSC là phù hợp với các ưu tiên của Ủy ban trong các chương trình nghị sự quốc tế và phát triển, và hài hòa với các Mục tiêu Phát triển Bền vững của Liên Hiệp Quốc. Việc đạt được các mục tiêu đó đòi hỏi tri thức toàn cầu và việc chia sẻ dữ liệu FAIR, đặc biệt bao gồm trong các lĩnh vực khoa học và nghiên cứu. Các nhà lãnh đạo G7 và Ủy ban đã kêu gọi để ‘tất cả các nhà nghiên cứu [sẽ] có khả năng ký gửi, truy cập và phân tích dữ liệu khoa học xuyên khắp các lĩnh vực và ở phạm vi toàn cầu, và dữ liệu nghiên cứu nên gắn với các nguyên tắc FAIR’6.

Gợi ý: Điểm này có lẽ là đặc biệt quan trọng trong việc định hướng khoa học mở trong tương lai ở Việt Nam, khi mà các quốc gia của cả G7, G20, OECD và có lẽ của cả thế giới khoa học sẽ đi theo khoa học mở, khi các nhà nghiên cứu Việt Nam có khả năng ký gửi, truy cập và phân tích dữ liệu khoa học xuyên khắp các lĩnh vực và ở phạm vi toàn cầu, với dữ liệu nghiên cứu được gắn với các nguyên tắc FAIR. Các bên liên quan tới khoa học mở ở Việt Nam có thể cần đặt ra câu hỏi, liệu Việt Nam có khả năng xây dựng hạ tầng như hạ tầng lõi liên đoàn EOSC, hay Việt Nam sẽ chọn cho mình cách xây dựng hạ tầng dữ liệu nghiên cứu khoa học có khả năng kết nối được với hạ tầng lõi liên đoàn EOSC? Hơn thế, điều này có thể sẽ gợi ý cho Việt Nam để có được quyết tâm phải chuyển dịch sang khoa học mở càng sớm càng tốt, qua đó có thể hưởng lợi và cùng tồn tại được với thế giới.

Dữ liệu

Triển khai các biện pháp cần thiết để nuôi dưỡng sự phát triển các thực hành chuyên nghiệp về quản lý và quản trị dữ liệu nghiên cứu ở châu Âu7, đặc biệt:

Phát triển văn hóa quản lý dữ liệu nghiên cứu và các kỹ năng thực hành tốt hơn giữa các nhà khoa học và các nhà cải cách của EU, gồm hành động và các ưu đãi, các phần thưởng, các kỹ năng và chương trình giảng dạy có liên quan tới dữ liệu nghiên cứu và khoa học dữ liệu;

Phát triển các công cụ, đặc tả, catalog và các tiêu chuẩn dữ liệu FAIR, và các dịch vụ phía cung để hỗ trợ cho các nhà khoa học và các nhà cách tân, và

Khuyến khích nhu cầu về dữ liệu FAIR qua các chỉ thị dữ liệu FAIR nhất quán và các ưu đãi để mở dữ liệu từ các nhà cấp vốn nghiên cứu và các cơ sở khắp châu Âu.

Ngắn gọn, dòng các hành động kết hợp này có thể cung cấp một tập hợp các tài nguyên được chia sẻ của EOSC cho quản lý dữ liệu, điều có thể được các nhà nghiên cứu có hiểu biết về dữ liệu sử dụng, được tất cả các hạ tầng dữ liệu triển khai, được tất cả các nhà cấp vốn nghiên cứu mặc định và được các cơ sở địa phương ủng hộ.

Các tài nguyên được chia sẻ của EOSC có thể được phát triển để bao trùm tất cả các khía cạnh dữ liệu FAIR:

● Tìm thấy được, qua các catalog/các dịch vụ dữ liệu và siêu dữ liệu;

● Truy cập được, qua các mã nhận diện duy nhất vĩnh viễn, kế hoạch quản lý dữ liệu;

● Tương hợp được, qua các tiêu chuẩn tương hợp và các siêu dữ liệu chung;

● Sử dụng lại được, qua các quyền sở hữu trí tuệ (IPR) và các điều khoản pháp lý chung (như việc sử dụng các giấy phép Creative Commons).

Bắt đầu

Các tài nguyên được cam kết (chưa vét cạn)

Hành động

Các cột mốc

Q1, 2018

Nhóm Chuyên gia Dữ liệu FAIR (E03464), tư vấn với các bên tham gia đóng góp

Chuẩn bị Kế hoạch Hành động về dữ liệu FAIR.

Q3, 2018: Kế hoạch Hành động về dữ liệu FAIR được xuất bản

Q3, 2018

– DG RTD

– RDA Europe 4.0

– INFRAEOSC-05-2018-2019 (b)

Xác định Khung của châu Âu về dữ liệu nghiên cứu FAIR.

Q2, 2019: Khung của châu Âu về dữ liệu nghiên cứu FAIR được đồng thuận

Q1, 2019

– Dự án FREYA

– RDA Europe 4.0

Xác định chính sách Mã nhận diện Duy nhất Vĩnh viễn cho dữ liệu FAIR.

Q4, 2019: Chính sách Mã nhận diện Duy nhất Vĩnh viễn cho dữ liệu FAIR được xác định

Q1, 2019

– INFRAEOSC-05-2018-2019 (c)

Phát triển lược đồ công nhận/chứng nhận dữ liệu FAIR cho các kho.

Q4, 2019: Lược đồ chứng chỉ FAIR sẵn sàng.

Bảng 2. Các hoạt động triển khai theo dòng hành động dữ liệu

Gợi ý: Tất cả các hoạt động và lưu ý nêu trên giải thích ngắn gọn cho chúng ta thấy dữ liệu FAIR là gì, cần phải làm gì để đạt được nó và sắp tới có những tài liệu chỉ dẫn nào được viết ra về các vấn đề liên quan tới nó mà chúng ta có thể học tập để các dữ liệu được xuất bản ở Việt Nam cũng có khả năng tuân thủ FAIR nếu Việt Nam chuyển hướng sang khoa học mở, bao gồm cả việc cấp vốn nghiên cứu.

Các dịch vụ

EOSC chào 5 dạng chính các dịch vụ cho các nhà nghiên cứu, sẵn sàng theo bất kể lĩnh vực nào hoặc xuyên bất kể các đường biên giới quốc gia nào, gồm:

● Dịch vụ xác thực và nhận diện duy nhất và điểm truy cập và hệ thống định tuyến hướng tới các tài nguyên của EOSC.

● Môi trường/không gian làm việc được bảo vệ và cá nhân hóa (như, sổ lưu ký [logbook], các thiết lập, hồ sơ tuân thủ và các vấn đề còn để treo).

● Truy cập tới thông tin dịch vụ phù hợp (tình trạng của EOSC, danh sách các hạ tầng dữ liệu, thông tin có liên quan tới chính sách, mô tả khung tuân thủ) và các chỉ dẫn đặc thù (cách để tạo dữ liệu FAIR, để chứng nhận kho hoặc dịch vụ, để mua sắm các dịch vụ chung).

● Các dịch vụ để tìm kiếm, truy cập, sử dụng lại và phân tích dữ liệu nghiên cứu được những người khác tạo ra, truy cập được qua các catalog thích hợp các tập hợp dữ liệu và các dịch vụ dữ liệu (như phân tích, tổng hợp, khai phá, xử lý).

● Các dịch vụ để làm cho dữ liệu của riêng họ thành FAIR, để lưu trữ chúng và đảm bảo sự bảo tồn lâu dài.

Bắt đầu

Các tài nguyên được cam kết (chưa vét cạn)

Hành động

Các cột mốc

Q2, 2018

– Dự án EOSC-hub

– Dự án eInfraCentral

– Dự án OpenAIRE-Advance

– INFRAEOSC-01-2018

– INFRAEOSC-04-2018

– INFRAEOSC-05-2018-2019(b)

– INFRAEOSC-02-2019

– INFRAEOSC-03-2020

– INFRAEOSC-06-2019-2020(a)

– INFRAEOSC-06-2019-2020(b)

Phát triển catalog các dịch vụ ban đầu sẽ được cung cấp qua EOSC (được làm giàu định kỳ) và xác định (các) mô hình phân phối

Q4, 2018: Catalog các dịch vụ EOSC ban đầu truy cập được và mẫu EOSC Portal truy cập được

 

 

Q4, 2019: Catalog các dịch vụ EOSC và EOSC Portal được cập nhật

Q2, 2018

– Dự án EOSCpilot

– Dự án EOSC-hub

– INFRAEOSC-04-2018

– INFRAEOSC-05-2018-2019(b)

Phát triển catalog các tập hợp dữ liệu ban đầutruy cập được qua EOSC (sẽ được làm giàu định kỳ)

Q2, 2019: Catalog các tập hợp dữ liệu EOSC ban đầu truy cập được

Bảng 3. Các hoạt động triển khai theo dòng hành động dịch vụ

Về bản chất, Đám mây Khoa học Mở châu Âu (EOSC) sẽ xây dựng cả 3 thành phần8 của một hạ tầng điện toán đám mây là: (1) Hạ tầng như một dịch vụ – IaaS (Infrastructure as a Service); (2) Nền tảng như một dịch vụ – PaaS (Platform as a Service); và (3) Phần mềm như một dịch vụ – SaaS (Software as a Service). Điều khác biệt ở đây là các dịch vụ này đều có mục đích để phục vụ cho các nhà khoa học và xoay quanh dữ liệu FAIR.

Gợi ý: Là thực tế để cá nhân các nhà nghiên cứu khoa học và các cơ sở viện – trường đại học nghiên cứu của Việt Nam tập trung vào khả năng và điều kiện khai thác các dịch vụ hạ tầng EOSC vì lợi ích của chính mình thông qua các đối tác châu Âu.

Truy cập và giao diện

Đã có hai dự án được triển khai nhằm tạo ra giao diện để người sử dụng truy cập được tới các dịch vụ EOSC dễ dàng nhất có thể. Hiện có hai dự án với mục đích này đã được bắt đầu rồi theo chương trình làm việc của Horizon 2020 cho các năm 2016-2017 là: (1) EOSC-hub sẽ thí điểm nền tảng chung và sự truy cập tới các dịch vụ EOSC; và (2) dự án eInfraCentral cung cấp catalog đầu tiên và sự truy cập tới các dịch vụ hạ tầng điện tử. Trong giai đoạn 2018-2020, theo lời gọi INFRAEOSC-06-2020, EOSC còn muốn có khả năng truy cập được tới những người sử dụng qua các giao diện giữa máy – với – máy và chào sự truy cập tới các tài nguyên được chia sẻ của EOSC và đầy đủ các dịch vụ của EOSC.

Gợi ý: Đây có lẽ là công việc chỉ của các bên tham gia phát triển các ứng dụng và dịch vụ truy cập và giao diện của châu Âu và các đối tác của họ.

Các quy tắc tham gia

Các bên tham gia đóng góp của châu Âu cho EOSC đã nhìn thấy trước là phải làm sao để EOSC có thể hưởng lợi lớn từ sự phát triển các quy tắc tham gia. Hiện dự án EOSCPilot đang xây dựng các quy tắc như vậy.

Hơn nữa, các quy tắc đó có thể áp dụng khác nhau cho những người tham gia EOSC khác nhau, phụ thuộc vào thâm niên và vai trò của họ (các nhà nghiên cứu so với những người sử dụng, các nhà khoa học hoặc các nhà cách tân), vị trí (các đối tác nghiên cứu của Liên minh châu Âu so với toàn cầu), và có thể cần tôn trọng các đặc tính của các lĩnh vực khoa học khác nhau.

Bắt đầu

Các tài nguyên được cam kết (chưa vét cạn)

Hành động

Các cột mốc

Q2, 2018

– DG RTD

– Dự án EOSCpilot

– Dự án EOSC-hub

– Nhóm Chuyên gia Mức Cao EOSC

– INFRAEOSC-05-2018-2019 (a)

Phát triển các Quy tắc Tham gia, có tư vấn với các bên tham gia đóng góp

Q1, 2019: Các Quy tắc Tham gia EOSC ban đầu

 

Q4, 2019: Các Quy tắc Tham gia EOSC chính thức

Bảng 4. Các hoạt động triển khai theo dòng hành động về các quy tắc tham gia

Gợi ý: Chúng ta có lẽ sẽ chờ xem các nguyên tắc tham gia EOSC điều chỉnh sự tham gia của các đối tác nghiên cứu ngoài châu Âu sẽ như thế nào.

Điều hành

Khung điều hành EOSC rõ ràng là cần thiết và dự kiến sẽ hỗ trợ các chức năng được định nghĩa tốt, gồm chiến lược (như việc thiết lập đường hướng và các ưu tiên dài hạn và quyết định về sự tuân thủ), triển khai (như đường hướng ngân sách), giám sát (như thiết lập các chỉ số hiệu năng chính) và báo cáo, được thực thi trong phạm vi rõ ràng và có giới hạn, bao quanh các hành động cần thiết cho sự phối hợp và liên đoàn các hạ tầng dữ liệu nghiên cứu ở châu Âu như được nêu ở các phần trên. Khung điều hành dự kiến được triển khai ở 2 pha: (1) Pha đầu trong các năm 2018-2020; và (2) Pha 2 – sau năm 2020.

Bắt đầu

Các tài nguyên được cam kết (chưa vét cạn)

Hành động

Các cột mốc

Q1, 2018

EC, với sự hỗ trợ của dự án EOSCpilot, Nhóm Chuyên gia Mức Cao EOSC, OSPP và các nguồn khác

Thiết lập Khung Điều hành EOSC trong tư vấn với các quốc gia thành viên

Q4, 2018: Điều hành EOSC được thiết lập

Q1, 2019

INFRAEOSC-05-2018-2019(a)

Chuẩn bị di sản cho pha 2 triển khai (sau năm 2020)

Q3, 2020: Các khuyến cáo về đường hướng chiến lược và cấp tài chính và các thiết lập tổ chức, cho tương lai của EOSC (sau năm 2020)

Bảng 5. Các hoạt động triển khai theo dòng hành động điều hành

Gợi ý: Đây có lẽ là công việc chỉ liên quan tới các bên tham gia phát triển khung điều hành EOSC của châu Âu và các đối tác của họ.

Kết luận

Khả năng để Việt Nam có thể xây dựng cho mình các hạ tầng khoa học mở như đám mây khoa học mở châu Âu (EOSC) trong điều kiện hiện nay và trong tương lai vài chục năm tới là không tưởng, cho dù khoa học mở và các thành phần của nó, đặc biệt là dữ liệu FAIR sẽ là những gì toàn bộ thế giới khoa học từ nay trở đi sẽ hướng tới.

Trong bối cảnh như vậy, sẽ là thức thời nếu Việt Nam chọn cho mình một tiếp cận ‘ngách’ phù hợp, vừa có khả năng giúp cho khoa học của Việt Nam dịch chuyển tốt nhất và nhanh nhất theo khoa học mở, vừa có thể ‘đứng được trên vai của những người khổng lồ’ để không bị vứt sang bên lề của cuộc cách mạng sản xuất thế hệ tiếp sau – NPR9 (Next Production Revolution).

‘Muộn còn hơn không’ có lẽ là lời nhắc nhở dành cho toàn bộ cộng đồng khoa học ở Việt Nam về sự tồn tại và ngự trị của khoa học mở bây giờ và trong tương lai, đặc biệt cho những ai được giao trọng trách quản lý và tạo thuận lợi cho khoa học phát triển ở Việt Nam.

Tài liệu trích dẫn

1. Được tùy biến từ ‘Lộ trình triển khai đám mây khoa học mở châu Âu – Tài liệu làm việc của các nhân viên Ủy ban’: https://www.dropbox.com/s/z5abev46id2m0yq/swd_2018_83_f1_staff_working_paper_en_Vi-04042018.pdf?dl=0, tr 16.
2. Lộ trình triển khai đám mây khoa học mở châu Âu – Tài liệu làm việc của các nhân viên Ủy ban, trang 4, xem tại: https://www.dropbox.com/s/z5abev46id2m0yq/swd_2018_83_f1_staff_working_paper_en_Vi-04042018.pdf?dl=0
3. Tuyên bố EOSC – Đám mây Khoa học Mở châu Âu: Các cơ hội mới nghiên cứu và cách tân, trang 12, xem tại: https://www.dropbox.com/s/0txrq8row8vdq2l/eosc_declaration_Vi_23022018.pdf?dl=0
4. Lộ trình triển khai đám mây khoa học mở châu Âu – Tài liệu làm việc của các nhân viên Ủy ban, trang 21, xem tại: https://www.dropbox.com/s/z5abev46id2m0yq/swd_2018_83_f1_staff_working_paper_en_Vi-04042018.pdf?dl=0
5. Xem: https://www.innovationpolicyplatform.org/open-data-science-oecd-projectvà http://www.codata.org/working-groups/oecd-gsf-sustainable-business-models hoặc tài liệu của OECD, 2015: Making Open Science a Reality.
6. Thông cáo của các Bộ trưởng Khoa học các nước G7 ngày 28/09/2017 tại Turin, Ý. Xem các đoạn 19 và 20: https://www.dropbox.com/s/ywum8nfcgw7c6jz/G7%20Science%20Communiqu%C3%A9_Vi_25022018.pdf?dl=0
7. Lộ trình triển khai đám mây khoa học mở châu Âu – Tài liệu làm việc của các nhân viên Ủy ban, trang 22, xem tại: https://www.dropbox.com/s/z5abev46id2m0yq/swd_2018_83_f1_staff_working_paper_en_Vi-04042018.pdf?dl=0
8. Xem thêm: ‘Danh sách hành động của tuyên bố EOSC’, trang 4, phần ‘Triển khai dịch vụ’: https://www.dropbox.com/s/lipf9nrhjsm22hb/eosc_declaration-action_list_Vi_24022018.pdf?dl=0
9. OECD, 2017: Cách mạng Sản xuất Tiếp sau. Báo cáo cho G20, các trang 15 và 52 nói các chính sách cần tạo thuận lợi cho khoa học mở và dữ liệu mở: https://www.dropbox.com/s/ccxckrn1sfyetbl/the-next-production-revolution-G20-report_Vi_27042018.pdf?dl=0

Giấy phép của bài viết: CC BY 4.0 Quốc tế

Tác giả