Dữ liệu sẽ tiếp tục trao quyền cho con người, công nghệ và quy trình. Dữ liệu cho phép các tổ chức hiểu khách hàng của họ, dự đoán nhu cầu và sở thích của họ và phản hồi nhanh hơn. Dữ liệu đã trở thành xương sống trong mọi vấn đề với những cải tiến về chất lượng và khả năng của sản phẩm. Dữ liệu thậm chí còn cho phép các tổ chức hiểu hiện trạng và hoạt động hiệu quả hơn thông qua phân tích các chu kỳ kinh doanh, thói quen nhân viên và nhu cầu của khách hàng.
Có thể thấy dữ liệu đã trở thành tài sản lớn nhất và có giá trị nhất mà doanh nghiệp có. Để doanh nghiệp thành công và phát triển, doanh nghiệp phải phát triển kinh doanh định hướng bởi dữ liệu. Dữ liệu đến ở tất cả các định dạng và từ một loạt các nguồn khác nhau, bao gồm các thiết bị Internet vạn vật (IoT), các trang web truyền thông xã hội, các hệ thống bán hàng và hệ thống cộng tác nội bộ…
Với việc dữ liệu thay đổi và phát triển một cách nhanh chóng, thì nhu cầu lấy giá trị ra khỏi dữ liệu thậm chí còn cấp bách hơn. Bài viết sau giới thiệu cách thức tiếp cận hồ dữ liệu.
Hồ dữ liệu
Mặc dù có sự gia tăng về số lượng công cụ và công nghệ được thiết kế để dễ dàng thu thập, lưu trữ và đánh giá thông tin kinh doanh quan trọng, nhiều công ty vẫn không chắc chắn cách xử lý những dữ liệu này tốt nhất. Các nhà lãnh đạo doanh nghiệp và CNTT đã bị choáng ngợp bởi khối lượng và sự đa dạng của dữ liệu theo sự sắp đặt của họ, tốc độ thông tin đi qua các mạng nội bộ và mạng bên ngoài cùng với chi phí quản lý tất cả thông tin kinh doanh này. Ngoài ra, họ còn phải gánh vác thêm một nhiệm vụ thậm chí còn phức tạp hơn: khai thác những sự thấu hiểu (insight) từ tất cả các thông tin kinh doanh này.
Các giám đốc điều hành phải mở rộng cơ sở hạ tầng quản lý dữ liệu của họ một cách ồ ạt và nhanh chóng. Một lớp công nghệ quản lý dữ liệu mới nổi hứa hẹn sẽ giải quyết vấn đề này: Hồ dữ liệu (data lakes).
Hồ dữ liệu (Data lake) là một kho lưu trữ trung tâm chứa một lượng lớn dữ liệu thô được giữ để sử dụng khi cần thiết. Vì dữ liệu được giữ nguyên gốc nên doanh nghiệp không cần phải đầu tư cho việc biến đổi, phân loại và lưu trữ dữ liệu đến khi có nhu cầu sử dụng. Việc thiết lập và quản lý hồ dữ liệu hiện nay bao gồm rất nhiều tác vụ thủ công và tốn thời gian. Nhiều tổ chức CNTT đơn giản bị choáng ngợp bởi khối lượng dữ liệu khổng lồ của các bộ dữ liệu nhỏ, vừa và lớn được lưu trữ, mặc dù có liên quan, nhưng không được tích hợp. Tuy nhiên, khi được thực hiện đúng, với khung quản lý dữ liệu tích hợp, các hồ dữ liệu cho phép các tổ chức hiểu rõ hơn và khám phá mối quan hệ giữa các bộ dữ liệu.
Hồ dữ liệu là nơi các doanh nghiệp có thể thu thập, lưu trữ, phân tích và biến thành hiểu biết và hành động, bao gồm dữ liệu có cấu trúc, bán cấu trúc và không cấu trúc. Hồ dữ liệu được thiết kế để phân tích dữ liệu lớn và để giải quyết thách thức các silo dữ liệu trong dữ liệu lớn.
Khác với hồ dữ liệu, kho dữ liệu EDW biến đổi và phân loại dữ liệu từ các nguồn khác nhau của doanh nghiệp. Dữ liệu này sẵn sàng để phục vụ các báo cáo và phân tích. Còn Hồ dữ liệu lưu trữ dữ liệu chưa qua phân tích và giữ trong trạng thái thô. Những dữ liệu này cần được xử lý thêm khi có nhu cầu sử dụng.
Các nền tảng lưu trữ Hồ dữ liệu được thiết kế để giữ, xử lý và phân tích dữ liệu có cấu trúc và không cấu trúc. Chúng thường được sử dụng kết hợp với kho dữ liệu doanh nghiệp truyền thống (EDW), nhưng nói chung, chúng có chi phí khai thác thấp hơn EDW. Tiết kiệm chi phí là kết quả của việc các công ty có thể sử dụng phần cứng dễ kiếm, giá cả phải chăng và vì các bộ dữ liệu không cần phải được lập chỉ mục và đặt trước để lưu trữ tại thời điểm đưa vào. Dữ liệu được giữ ở định dạng gốc và chỉ được cấu hình lại khi cần. Cơ sở dữ liệu quan hệ cũng có thể cần phải quản lý như một phần của nền tảng hồ dữ liệu, nhưng chỉ để giảm bớt khả năng truy cập vào một số nguồn dữ liệu của người dùng cuối.
Có rất nhiều cho các công ty quan tâm đến hồ dữ liệu. Bởi vì dữ liệu được tải ở các định dạng thô thay vì được cấu hình sẵn khi đưa chúng vào hệ thống công ty, chúng có thể được sử dụng theo những cách vượt ra ngoài những phương thức cơ bản. Chẳng hạn, các nhà khoa học dữ liệu có thể không biết chính xác những gì họ đang tìm kiếm có thể tìm và truy cập dữ liệu nhanh chóng, bất kể định dạng. Thật vậy, một vùng dữ liệu thô được bảo trì và quản lý tốt, có thể là một mỏ vàng cho các nhà khoa học dữ liệu đang tìm cách thiết lập một chương trình phân tích tiên tiến. Và khi các công ty mở rộng việc sử dụng các hồ dữ liệu với các dự án thí điểm nhỏ, họ có thể thiết lập các tùy chọn tự phục vụ trực tuyến cho người dùng doanh nghiệp, trong đó họ có thể tạo các báo cáo và phân tích dữ liệu của riêng họ.
Tuy nhiên, việc tích hợp các hồ dữ liệu với các yếu tố khác của kiến trúc công nghệ, thiết lập các quy tắc phù hợp cho việc sử dụng hồ dữ liệu trên toàn công ty và xác định các sản phẩm được hỗ trợ, tài năng và khả năng cần thiết để triển khai các hồ dữ liệu và nhận ra lợi ích kinh doanh đáng kể, có thể tốn thời gian và phức tạp. Ví dụ, các công ty thường thiếu chuyên gia trong các phương pháp quản lý dữ liệu nhất định và cần tìm các nhân viên thông thạo các công nghệ lưu lượng dữ liệu mới nổi như Flume và Spark.
Trong nhiều trường hợp, các công ty đang tự làm mất cơ hội kinh doanh. Chẳng hạn, họ bị mất nhiều thời gian vào thực hiện các phương pháp thử nghiệm và kiểm đúng (falling back method) để cập nhật kiến trúc công nghệ - ví dụ, tham gia vào các cuộc thảo luận nội bộ kéo dài về thiết kế, sản phẩm và nhà cung cấp tối ưu; và tiếp tục xây dựng giải pháp hồ dữ liệu cho đến khi họ có một giải pháp đúng. Trong khi đó, cơ hội để triển khai các chương trình phân tích nâng cao để hỗ trợ bán hàng và tiếp thị kỹ thuật số và phát triển sản phẩm mới chỉ đơn giản là đã đi qua. Thay vào đó, các công ty nên áp dụng một cách tiếp cận tinh gọn để thiết kế và triển khai các hồ dữ liệu - thí điểm một loạt các công nghệ và phương pháp quản lý và thử nghiệm và tinh chỉnh chúng trước khi có được các quy trình tối ưu để lưu trữ và truy cập dữ liệu. Chẳng hạn, các công ty có thể áp dụng các tiêu chuẩn tuân thủ và quy định về dữ liệu thay đổi nhanh chóng – ví dụ, Quy định Bảo vệ dữ liệu chung của Liên minh châu Âu (GDPR) (EU) 2016/679. Có lẽ quan trọng hơn, họ có thể mang lại sự thấu hiểu dựa trên phân tích vào thị trường nhanh hơn nhiều so với đối thủ cạnh tranh của họ, trong khi giảm đáng kể chi phí và sự phức tạp của việc quản lý kiến trúc dữ liệu của họ.
Các hồ dữ liệu được quản lý và quản lý tốt sẽ giúp các tổ chức tận dụng hiệu quả hơn tất cả dữ liệu của họ để có được cái nhìn sâu sắc về kinh doanh và đưa ra quyết định tốt. Để phát huy tiềm năng của hồ dữ liệu giúp các công ty khởi chạy các chương trình phân tích một cách nhanh chóng và thiết lập văn hóa thân thiện với dữ liệu trong thời gian dài, các tổ chức cần phải tiếp cận thông minh theo phương pháp tinh gọn.
(Hình minh họa)
4 giai đoạn phát triển hồ dữ liệu
Các công ty thường trải qua bốn giai đoạn phát triển sau đây khi xây dựng và tích hợp các hồ dữ liệu trong các kiến trúc công nghệ hiện có.
Tiếp nhận dữ liệu thô
Ở cấp độ đầu tiên, hồ dữ liệu được xây dựng tách biệt với các hệ thống CNTT cốt lõi và phục vụ như một môi trường “thu giữ nguyên vẹn”, chi phí thấp, có thể mở rộng. Hồ dữ liệu đóng vai trò là lớp quản lý dữ liệu thô trong ngăn xếp (stack) công nghệ, cho phép lưu trữ dữ liệu thô không giới hạn trước khi được chuẩn bị để sử dụng trong môi trường điện toán. Các tổ chức có thể triển khai hồ dữ liệu với các tác động tối thiểu trên kiến trúc hiện có. Việc quản trị, bao gồm gắn thẻ chính xác và phân loại dữ liệu, được yêu cầu trong giai đoạn này nếu các công ty muốn tránh tạo ra một đầm lầy dữ liệu.
Môi trường khoa học dữ liệu (Data Science)
Data Science được định nghĩa là tất cả những gì về thu thập, khai thác và phân tích dữ liệu để tìm ra Insight giá trị. Sau đó trực quan hóa các Insight cho các bên liên quan, để chuyển hóa Insight thành hành động. Ở cấp độ này, các tổ chức có thể bắt đầu sử dụng hồ dữ liệu làm nền tảng thử nghiệm. Các nhà khoa học dữ liệu có quyền truy cập nhanh chóng, dễ dàng vào dữ liệu và có thể tập trung nhiều hơn vào việc chạy thử nghiệm dữ liệu và phân tích dữ liệu, thay vì chỉ tập trung vào thu thập và tiếp nhận dữ liệu. Trong các thử nghiệm sandbox này, có thể làm việc với dữ liệu chưa sửa đổi để xây dựng các nguyên mẫu cho các chương trình phân tích; Có thể triển khai một loạt các công cụ thương mại và nguồn mở dọc theo hồ dữ liệu để tạo ra các nền tảng thử nghiệm (test beds) theo yêu cầu.
Insight được viết tắt bởi (Customer insight) được hiểu nôm na là “sự thật ngầm hiểu” của khách hàng giúp doanh nghiệp hiểu được mong muốn và nhu cầu của họ đối với dịch vụ, sản phẩm của doanh nghiệp. Việc phân tích đúng hành vi của khách hàng sẽ giúp rất nhiều cho doanh nghiệp cụ thể như: liệt kê được những Insight mong muốn, điều chỉnh các chiến dịch Marketing, bán hàng phù hợp và tối ưu nhất.
Giảm tải kho dữ liệu
Ở cấp độ tiếp theo, các hồ dữ liệu bắt đầu được tích hợp với các kho dữ liệu doanh nghiệp EDW hiện có (là một cơ sở dữ liệu thống nhất chứa tất cả các thông tin kinh doanh của một tổ chức và có thể truy cập được trên toàn công ty). Tận dụng chi phí lưu trữ hồ dữ liệu thấp, các công ty có thể lưu trữ cả dữ liệu “lạnh” (dữ liệu không được truy xuất thường xuyên, nghĩa là dữ liệu hiếm khi được sử dụng, ngừng hoạt động hoặc không hoạt động). Có thể sử dụng những dữ liệu này để tạo ra thông tin chi tiết về sự thấu hiểu mà không cần đẩy dữ liệu hoặc vượt quá giới hạn lưu trữ, hoặc không cần phải tăng dung lượng của kho dữ liệu truyền thống. Khi đó, các công ty có thể tiếp tục trích xuất cường độ cao dữ liệu quan hệ trong các EDW hiện có, để có khả năng xử lý chúng. Đồng thời có thể di chuyển các tác vụ chuyển đổi và trích xuất cường độ thấp hơn sang hồ dữ liệu, được ví như với việc “tìm kim trong đống cỏ khô” – một dạng tìm kiếm mà khoa học dữ liệu cần quét cơ sở dữ liệu cho các truy vấn không có cấu trúc chỉ mục truyền thống.
Khai thác dữ liệu
Một khi các công ty bước vào giai đoạn triển khai và phát triển này, rất có thể phần lớn thông tin chảy qua công ty sẽ đi qua hồ dữ liệu. Hồ dữ liệu trở thành một phần cốt lõi của cơ sở hạ tầng dữ liệu, thay thế các dữ liệu hiện có hoặc lưu trữ dữ liệu khai thác và cho phép cung cấp dữ liệu dưới dạng dịch vụ. Các doanh nghiệp có thể tận dụng tối đa tính chất phân tán của công nghệ hồ dữ liệu, cũng như khả năng xử lý các tác vụ chuyên sâu về máy tính, chẳng hạn như các yêu cầu để tiến hành phân tích nâng cao hoặc triển khai các chương trình học máy. Một số công ty có thể quyết định xây dựng các ứng dụng sử dụng nhiều dữ liệu trên đỉnh hồ dữ liệu, như là một bảng điều khiển (dashboard) quản lý hiệu suất. Hoặc họ có thể thực hiện các giao diện lập trình ứng dụng để có thể kết hợp liền mạch sự thấu hiểu thu được từ tài nguyên hồ dữ liệu với những hiểu biết thu được từ các ứng dụng khác.
Thời gian và những yêu cầu chức năng trong từng giai đoạn phát triển hồ dữ liệu, từ vùng tiếp nhận dữ liệu cho đến các thành phần quyết định của cơ sở hạ tầng dữ liệu sẽ khác nhau tùy thuộc vào mục tiêu và điểm khởi đầu của mỗi công ty. Ở mỗi giai đoạn phát triển, các công ty cần xem xét các câu hỏi phức tạp liên quan đến quy mô và sự đa dạng của bộ dữ liệu, khả năng quản lý dữ liệu hiện có, mức độ chuyên gia về dữ liệu lớn trong các đơn vị kinh doanh và kiến thức sản phẩm trong tổ chức CNTT. Chẳng hạn, các công cụ phân tích tinh vi như thế nào trong môi trường hiện tại? Công ty sử dụng các công cụ và phương pháp phát triển truyền thống, hoặc là những công cụ và phương pháp mới? Công ty thường yêu cầu đồng thời bao nhiêu dữ liệu đồng thời? Khối lượng công việc được quản lý năng động? Làm thế nào để người dùng cuối truy cập vào dữ liệu nhanh chóng? Tại các thời điểm khác nhau trong quy trình phát triển hồ dữ liệu, các công ty có thể bị sa lầy vào những chi tiết này và mất động lực thực hiện; chắc chắn khi đó các nhà lãnh đạo trong tổ chức CNTT hoặc các đơn vị kinh doanh sẽ mong muốn giải quyết các dự án khẩn cấp khác.
Tuy nhiên, hành trình hồ dữ liệu từ một “dự án khoa học” đến tích hợp đầy đủ cơ sở hạ tầng dữ liệu có thể được đẩy nhanh, khi lãnh đạo CNTT và doanh nghiệp cùng nhau trả lời những câu hỏi này và các câu hỏi khác theo mô hình phát triển tinh gọn. Cách tiếp cận tinh gọn có thể giúp các công ty mang lại lợi thế từ các hồ dữ liệu trong vòng vài tháng thay vì nhiều năm. Bằng chứng về tác động trong ngắn hạn có thể giúp cho các nhà lãnh đạo CNTT và kinh doanh tập trung vào các vấn đề quản lý dữ liệu, qua đó hạn chế nhu cầu phải làm lại trong tương lai và không ngừng điều chỉnh các giao thức liên quan đến đưa vào, quản lý và truy cập hồ dữ liệu. Một cách tiếp cận tinh gọn có thể đặt các nhà lãnh đạo CNTT và kinh doanh trên cùng một con thuyền. Sự hợp tác này rất quan trọng, không chỉ để xác định con đường kỹ thuật thiết kế hồ dữ liệu, mà còn để thiết lập môi trường làm việc thân thiện với dữ liệu và nắm bắt các cơ hội kinh doanh mới dựa trên hiểu biết sâu sắc từ dữ liệu.
Xây dựng hồ dữ liệu: Cách tiếp cận tinh gọn
Hầu hết các tổ chức hiểu sự cần thiết của các phương pháp tinh gọn trong phát triển phần mềm, một số ít đã áp dụng linh hoạt vào quản lý dữ liệu. Thông thường, tổ chức CNTT đi đầu trong việc kiểm tra các lựa chọn công nghệ tiềm năng và phương pháp tiếp cận để xây dựng các hồ dữ liệu, với rất ít sự tham gia của các đơn vị kinh doanh. Theo cách tiếp cận tinh gọn, các nhà lãnh đạo CNTT và kinh doanh cùng nhau phác thảo và giải quyết các câu hỏi về công nghệ và thiết kế có liên quan. Chẳng hạn, hồ dữ liệu sẽ được xây dựng bằng giải pháp chìa khóa trao tay, hoặc sẽ được lưu trữ trên đám mây (sử dụng các máy chủ riêng, công cộng hoặc lưu trữ lai (hybrid off-site)). Hồ dữ liệu sẽ được lưu trữ như thế nào – nghĩa là, bộ dữ liệu nào sẽ chảy vào hồ và khi nào? Lý tưởng nhất, việc đưa dữ liệu vào hồ dữ liệu nên dựa trên các kinh doanh ưu tiên cao nhất và được thực hiện theo làn sóng, trái ngược với việc nỗ lực để kết nối tất cả các luồng dữ liệu có liên quan trong hồ dữ liệu.
Thật vậy, trong hầu hết những công ty thành công gần đây, họ đã thiết kế các hồ dữ liệu bằng cách sử dụng phương pháp tiếp cận “kinh doanh trở lại”, thay vì xem xét các yếu tố công nghệ trước tiên. Họ xác định các kịch bản trong đó các đơn vị kinh doanh có thể đạt được giá trị cao nhất từ hồ dữ liệu và sau đó đưa các kịch bản đó vào thiết kế (hoặc thiết kế lại) giải pháp lưu trữ và đưa ra quyết định triển khai. Các công ty sau đó tăng dần dữ liệu vào hồ dữ liệu theo các nhóm cụ thể hoặc các trường hợp sử dụng, khi cần thiết. Và thay vì tập trung vào một giải pháp được chỉ định, các công ty đang thử nghiệm hai hoặc ba ứng cử viên cuối cùng từ các nhà cung cấp khác nhau để đánh giá hiệu suất trong thế giới thực, dễ tích hợp và khả năng mở rộng của dịch vụ.
Cách tiếp cận tinh gọn khi triển khai có thể đảm bảo rằng các thách thức về hiệu suất hoặc triển khai sẽ sớm được bắt kịp; thông qua việc kết hợp thông tin phản hồi từ các đơn vị kinh doanh, và chừa chỗ cho các nhóm phát triển tinh gọn tìm hiểu các quy trình và giao thức quản trị dữ liệu khi lấp đầy hồ dữ liệu, công nghệ phân tích và lưu trữ thay đổi và yêu cầu kinh doanh phát triển.
Khi các hồ dữ liệu đã chuyển các dự án thí điểm thành các yếu tố cốt lõi của kiến trúc dữ liệu, các nhà lãnh đạo kinh doanh và công nghệ sẽ cần xem xét lại các chiến lược quản trị của họ. Cụ thể, họ phải học cách cân bằng giữa dữ liệu truyền thống khuôn mẫu với sự linh hoạt khi dữ liệu được thu thập nhanh chóng và sử dụng trong một thế giới kỹ thuật số. Để quản trị theo cách tiếp cận tinh gọn, các doanh nghiệp có thể áp dụng sự giám sát thích hợp khi các nguồn mới được đưa vào hồ dữ liệu, tránh các thực hành kỹ thuật khuôn mẫu trong kho dữ liệu truyền thống và sau đó tinh chỉnh các quy tắc và quy trình theo yêu cầu kinh doanh để đưa ra giải pháp tối ưu. Chẳng hạn, khoa học dữ liệu có thể được cấp quyền tự do khám phá dữ liệu, ngay cả khi các trường hợp kinh doanh đưa ra các danh mục dữ liệu vẫn còn đang được nhận dạng. Trong khi đó, người dùng tuyến đầu có thể phải đối mặt với các điều kiện chặt chẽ hơn cho đến khi các trường hợp sử dụng được thiết lập chắc chắn.
Tuy nhiên, các công ty nên chỉ định một số cá nhân là chủ sở hữu của bộ dữ liệu và quy trình, để có trách nhiệm rõ ràng để đưa ra các quyết định về nguồn dữ liệu và quyền truy cập. Do dữ liệu không được cấu trúc, các công ty cũng sẽ muốn thu thập và lưu trữ siêu dữ liệu trên tất cả các nguồn dữ liệu chảy vào hồ (trong chính hồ hoặc trong một đăng ký riêng) và duy trì một danh mục dữ liệu trung tâm cho tất cả các bên liên quan. Ngoài ra, các công ty có thể cần phải cấu hình lại quyền truy cập trên các giao thức quản lý dữ liệu - lưu ý các yêu cầu pháp lý và các vấn đề riêng tư liên quan đến việc giữ thông tin nhận dạng cá nhân. Chủ sở hữu dữ liệu phải truyền đạt các quyền truy cập này cho tất cả các bên liên quan.
Một ví dụ thực tiễn: Xây dựng hồ dữ liệu trong ngân hàng
Xem xét trường hợp một ngân hàng toàn cầu áp dụng các nguyên tắc tinh gọn để phát triển một hồ dữ liệu. Ngân hàng đã phải vật lộn với một loạt thách thức dữ liệu quan trọng: thông tin kinh doanh chất lượng thấp, thiếu chuyên gia để quản lý các bộ dữ liệu khác nhau với các định dạng khác nhau, công nghệ kho dữ liệu cũ và với hơn 1.000 nguồn dữ liệu. Đây là một hệ thống chắp vá (kludgy) - Các bộ dữ liệu vào phải được cấu trúc trước khi có thể nhập vào kho dữ liệu 4 lớp (phân phối đầu ra, khuôn dạng thông thường, lớp chủ đề và lớp ứng dụng) và trước khi có thể tạo bất kỳ báo cáo khả dụng nào.
Ngoài những thách thức kỹ thuật này, các nhà lãnh đạo kinh doanh và CNTT tại ngân hàng đã không hợp tác, điều này làm trầm trọng thêm các vấn đề dữ liệu của công ty. Dữ liệu được lưu trữ trong các hệ thống bị cô lập, vì vậy thông tin kinh doanh quan trọng thường không được chia sẻ. Những yêu cầu truy cập vào một số bộ dữ liệu nhất định nhận được sự phản hồi rất chậm, do sự phối hợp và truyền thông kém giữa các đơn vị kinh doanh và CNTT. Quản lý dữ liệu được coi là công việc của nhóm CNTT, các nhà lãnh đạo kinh doanh nắm được vấn đề và phải đấu tranh để nói rõ nhu cầu dữ liệu của họ.
Ảnh: Forbes
Các nhà lãnh đạo cao cấp tại ngân hàng lo ngại về việc mất khách hàng, một phần do công ty không có khả năng quản lý dữ liệu. Họ quyết định thử nghiệm các công nghệ hồ dữ liệu để cố gắng trích xuất dễ dàng, cấu trúc và phân phối các bộ dữ liệu; đồng thời công ty đã sử dụng mô hình phát triển tinh gọn và triển khai dự án hồ dữ liệu theo từng giai đoạn.
Các nhà lãnh đạo cấp cao đã triệu tập một nhóm dữ liệu tinh gọn, bao gồm các chuyên gia trong các đơn vị kinh doanh và trong tổ chức CNTT để xem xét tác động kinh doanh và các trường hợp sử dụng để cải thiện chất lượng dữ liệu và quyền truy cập trước khi xác định khu vực nào của công ty sẽ có quyền truy cập vào hồ dữ liệu.
Nhóm dữ liệu tinh gọn đã thực hiện các cuộc phỏng vấn chi tiết với người dùng kinh doanh để xác định các điểm tồn đọng và cơ hội trong thực tiễn quản lý dữ liệu hiện có. Kế hoạch của nhóm là phát hành các làn sóng dịch vụ và ứng dụng dữ liệu mới trong 4 tháng, thực hiện các công cụ quản lý dữ liệu mới, phát triển dịch vụ cung cấp dữ liệu với các đơn vị kinh doanh và tinh chỉnh các quy trình dựa trên phản hồi của khách hàng. Trong vài tháng kể từ khi khởi động dự án dữ liệu tinh gọn, ngân hàng đã có thể tải dữ liệu liên quan đến các trường hợp sử dụng kinh doanh cụ thể vào một môi trường chung và xác định các yếu tố dữ liệu quan trọng cần thiết để cung cấp dịch vụ cho các đơn vị kinh doanh.
Thành công trong các lĩnh vực kinh doanh cho phép ngân hàng mở rộng việc sử dụng hồ dữ liệu sang các khu vực khác trong những tháng tiếp theo. Sự chuyển dịch từ cấu trúc toàn bộ dữ liệu chuyển sang ghi lại quá trình hệ thống (back-end) chỉ cho dữ liệu được sử dụng là rất quan trọng. Ngân hàng đã có thể phá vỡ các silo dữ liệu; thông tin từ các hệ thống có thể được tìm thấy ở một nơi và nhân viên có thể truy cập nhiều dạng dữ liệu (nhân khẩu học, địa lý, phương tiện truyền thông xã hội, v.v..) để có được cái nhìn toàn diện (360 độ) về khách hàng. Sự hợp tác giữa các đơn vị kinh doanh và nhóm CNTT, cũng như điểm số hài lòng của nhân viên và khách hàng cũng tăng lên.
Kết luận
Ngày càng có nhiều công ty đang thử nghiệm các hồ dữ liệu, với hy vọng sẽ nắm bắt được những lợi thế vốn có trong các luồng thông tin có thể truy cập dễ dàng bất kể nền tảng và trường hợp kinh doanh và chi phí lưu trữ dữ liệu thấp hơn so với lưu trữ trong kho dữ liệu truyền thống. Tuy nhiên, như bất kỳ triển khai công nghệ mới nào, các công ty sẽ cần phải xây dựng lại các hệ thống, quy trình và mô hình quản trị. Sẽ có những câu hỏi không thể tránh khỏi về các giao thức bảo mật, nhóm tài năng và việc xây dựng kiến trúc doanh nghiệp đảm bảo tính linh hoạt không chỉ trong các ngăn xếp công nghệ mà còn trong khả năng kinh doanh. Kinh nghiệm cho thấy rằng một cách tiếp cận tinh gọn để thực hiện các hồ dữ liệu có thể giúp các công ty vượt qua một cách nhanh chóng và hiệu quả để tối đa các khả năng mà dữ liệu có thể mang lại./.
Tài liệu tham khảo:
1. https://www.mckinsey.com/
2. https://helpex.vn/article/
3. https://smartfactoryvn.com/technology/
4. http://hbr.org
(Bài viết đăng ấn phẩm in Tạp chí TT&TT số 9 tháng 9/2021)