Một trong những xu hướng phát triển cùng với thời đại đó chính là việc áp dụng phân tích dữ liệu Big data trong doanh nghiệp. Dưới đây là một số ứng dụng của Big data được nhiều doanh nghiệp lớn áp dụng. Từ đó rút ra bài học kinh nghiệm cho các doanh nghiệp Việt Nam, khi có thể còn đang chật vật với việc phân tích dữ liệu.

Xem thêm: Ứng dụng của Big Data và bài học cho những doanh nghiệp Việt Nam hiện nay
Bạn có biết là những vị trí liên quan tới lĩnh vực khoa học dữ liệu (data science) và phân tích dữ liệu (data analysis) là khó tuyển nhất với một công ty không? Sự bùng nổ nhu cầu tìm kiếm các chuyên gia trong những lĩnh vực này mở ra hàng loạt nhu cầu và đồng thời, đẩy thị trường tuyển dụng vào tình trạng cung không đủ đáp ứng cầu.

Xem thêm: Data Analysis là gì? Cần học những gì?
Khoa học dữ liệu đang dần khẳng định vai trò của mình trong việc cải thiện sức khỏe ngày nay. Big Data không chỉ được ứng dụng để xác định phương hướng điều trị mà giúp cải thiện quá trình chăm sóc sức khỏe. Từ khi Big Data được ứng dụng vào lĩnh vực chăm sóc sức khỏe, nó đã tạo nên nhiều tác động lớn trong việc giảm lãng phí tiền bạc và thời gian.

Xem thêm: Giải pháp Big data cho lĩnh vực y tế
Ứng dụng Big Data trong quản lý doanh thu
Ngành công nghiệp du lịch và lữ hành đang đối mặt với thách thức bán đúng sản phẩm đến đúng đối tượng khách hàng vào thời điểm chính xác và giữ đúng giá ở đúng kênh. Tất cả điều này đòi hỏi dữ liệu nội bộ lẫn bên ngoài. Dữ liệu nội bộ như kỳ vọng của khách hàng trong quá khứ, tỷ lệ hết vé, doanh thu phòng và tình trạng đặt vé hiện tại. Dữ liệu bên ngoài gồm sự kiện, thời tiết, những chuyến bay và những kỳ nghỉ.

Xem thêm: Ứng dụng Big Data trong ngành du lịch
Nếu các bạn đã theo dõi các bài viết của Big Data Uni thì chắc cũng đã nắm được tổng quan về Big Data bao gồm khái niệm, lợi ích và ứng dụng của nó trong nhiều lĩnh vực khác nhau. Trong chủ đề bài viết lần này và sắp tới, chúng tôi sẽ không đề cập về những giá trị mà Big Data đem lại mà đi vào trọng tâm một trong những công cụ, quá trình quan trọng nhất đối với mỗi dự án Big Data đó chính là Data mining (hay còn gọi là khai phá dữ liệu).

Xem thêm: TỔNG QUAN VỀ DATA MINING (P1): KHAI PHÁ DỮ LIỆU LÀ GÌ?
TTCT - College Board, tổ chức phi lợi nhuận đang phụ trách kỳ thi SAT, đã bán mỗi cái tên thí sinh kèm theo các thông tin liên quan với giá 47 cent (khoảng 11.000 đồng), gây ra những tranh cãi dữ dội về tuyển sinh đại học ở Mỹ.
Big Data ngày càng được sử dụng để tối ưu hóa các quy trình kinh doanh. Các nhà bán lẻ có thể tối ưu hóa cổ phiếu của họ dựa trên dự đoán. Từ dữ liệu truyền thông xã hội, xu hướng tìm kiếm trên web và dự báo thời tiết.

Xem thêm: Giải Pháp Big Data Tối ưu hóa quy trình kinh doanh
Nếu các bạn có theo dõi những bài viết của chúng tôi về Data management (quản lý dữ liệu) và Data quality (chất lượng dữ liệu), thì chắc cũng biết tầm quan trọng của quá trình Data security; sự ra đời của những bộ luật, điều luật về bảo mật thông tin, dữ liệu như GDPR tại châu Âu, luật An ninh Mạng ở nước ta; đặc biệt là xu hướng khách hàng đang ngày càng quan tâm hơn về tính minh bạch trong việc sử dụng, và khả năng bảo vệ nguồn dữ liệu, thông tin cá nhân của họ tại các công ty.

Xem thêm: THỰC TRẠNG DATA SECURITY TRÊN TOÀN CẦU
Hàng ngày, chúng ta thường xuyên kết nối thông qua điện thoại, máy tính bảng, bảng điều khiển trò chơi và hầu hết các ứng dụng, các kênh kết nối đều được thực hiện qua các thiết bị này.Khi di chuyển giữa các thiết bị và kênh, họ đang tạo ra nhiều điểm tiếp xúc, kết nối giữa các thiết bị khác nhau mà không hề hay biết.

Xem thêm: BIG DATA Là Chìa Khóa Thành Công Của Marketing Thời Đại Số
Big Data được ứng dụng trong rất nhiều lĩnh vực khác nhau như đã giới thiệu ở bài viết “Big Data – Tên gọi gợi lên khái niệm”. Bài viết tiếp theo dưới đây sẽ nói chi tiết hơn về các ứng dụng của Big data trong từng trường hợp cụ thể, và trong từng lĩnh vực đặc thù. Qua đó chúng ta sẽ thấy được tầm quan trọng trong việc thu thập và phân tích dữ liệu Big data.

Xem thêm: ỨNG DỤNG CỦA BIG DATA TRONG MỌI LĨNH VỰC
Giới thiệu về K – nearest neighbor (KNN)
Ở các bài viết trước đã giới thiệu đến các bạn một cách tổng quan những chủ đề về Data mining (Khai phá dữ liệu), Predictive analytics (Phân tích dự báo), Statistics (Thống kê) bao gồm các khái niệm quan trọng, kỹ thuật phân tích và ứng dụng, lợi ích trong các lĩnh vực khác nhau.

Xem thêm: THUẬT TOÁN KNN VÀ VÍ DỤ ĐƠN GIẢN TRONG NGÀNH NGÂN HÀNG
Dữ liệu khách hàng hay Customer data được coi là tài sản, nguồn thông tin vô giá đối với mọi công ty thuộc nhiều lĩnh vực kinh doanh khác nhau. Việc triển khai các quy trình khai thác, dự án nghiên cứu, phân tích Customer data với mục đích tìm hiểu, nắm bắt mong muốn, nhu cầu thầm kín của khách hàng, và chuyển nó thành những giá trị cụ thể thông qua từng chiến lược, kế hoạch hoạt động chính là chìa khóa cạnh tranh của mỗi tổ chức ngày nay.

Xem thêm: TỔNG QUAN VỀ CUSTOMER DATA (P.1) – DỮ LIỆU KHÁCH HÀNG LÀ GÌ?
Murray Webb, 33 tuổi, tốt nghiệp thạc sĩ về thống kê ứng dụng (applied statistics) tại Trường Đại học Kennesaw (Atlanta, Mỹ), hiện kiếm được 160.000 đô la một năm với công việc chủ yếu là theo dõi phần thông tin về dữ liệu chăm sóc sức khỏe khách hàng cho các bệnh viện. Webb cho biết hằng tuần đều có người đại diện của các công ty cũng như các công ty chuyên cung cấp nguồn nhân lực tìm đến anh và đưa ra các lời mời làm việc như một nhà khoa học dữ liệu (data scientist).

Xem thêm: Khoa học dữ liệu – nghề đang hái ra tiền ở Mỹ
Ở bài viết trước, đã giới thiệu đến các bạn thuật toán đầu tiên của mô hình Classification – mô hình phân loại – là thuật toán K nearest neighbor (KNN) với công thức cơ bản, và ví dụ đơn giản về ứng dụng của KNN trong ngành ngân hàng để hiểu hơn cách vận hành thuật toán.

Xem thêm: PHƯƠNG PHÁP ĐÁNH GIÁ MÔ HÌNH PHÂN LOẠI (CLASSIFICATION MODEL EVALUTATION)
Business Intelligenc (BI) hay Data Analytics – phân tích dữ liệu từ lâu đã trở thành các công cụ hữu ích hỗ trợ các tổ chức, công ty trong quá trình hoạt động và phát triển. Ở bài viết lần này, sẽ giới thiệu đến các bạn các lợi ích của phân tích dữ liệu trong kinh doanh, nhưng trước tiên ta cùng phân biệt rõ 2 khái niệm được nêu ở trên mà nhiều người thường nhầm lẫn.

Xem thêm: LỢI ÍCH PHÂN TÍCH DỮ LIỆU TRONG KINH DOANH
Một câu nói nổi tiếng của William Glasser, chuyên gia tâm thân học Mỹ:
Chúng ta học….
10% của những gì ta đọc được
20% của những gì ta nghe thấy
30% của những gì ta nhìn thấy
50% của những gì ta nghe và nhìn thấy
70% của những gì ta thảo luận
80% của những gì ta trải nghiệm
95% của những điều ta dạy người khác

Xem thêm: Phần mềm hiện thị dữ liệu, phân tích dữ liệu
Ở các phần trước trong chủ đề về Statistics (thống kê) đã giới thiệu đến các bạn các khái niệm, lợi ích, ứng dụng của thống kê, đặc biệt Descriptive statistics (thống kê mô tả), một trong 2 dạng cơ bản của Statistics. Trở lại với bài viết lần này chúng tôi sẽ trình bày tóm tắt về dạng còn lại, chính là một số kiến thức của Inferential Statistics hay còn gọi là thống kê suy luận.

Xem thêm: TỔNG QUAN VỀ STATISTICS: INFERENTIAL STATISTICS (THỐNG KÊ SUY LUẬN)
Bộ dữ liệu này sẽ có ích cho các bạn xây dựng app và website tra cứu bài hát karaoke, tra cứu tác giả, tra cứu theo đầu hoặc đĩa karaoke...
* Mã số Karaoke Việt Nam Arirang 5 số, California 6 số, MusicCore, Sơn Ca Media và Việt KTV bao gồm cả tiếng Việt và tiếng Anh.
* Đầu karaoke Arirang cập nhật đến vol 64 mới nhất.
* Đầu karaoke MusicCore cập nhật đến vol 93 mới nhất.
* Đầu karaoke Sơn Ca Media (ACNOS) cập nhật đến vol 58 mới nhất.
* Đầu karaoke Việt KTV cập nhật đến vol 95 mới nhất.
* Đầu karaoke California cập nhật đến vol 20 mới nhất.
* Tra cứu theo Album Volume...
* Đặc biệt hỗ trợ đầy đủ lời bài hát.

Xem thêm: Tặng dữ liệu karaoke
Tìm hiểu về mối quan hệ giữa Big Data và Cloud
Việc tận dụng và khai thác Big Data để phục vụ cho mục đích cải thiện hiệu quả hoạt động kinh doanh ở mỗi công ty ngày càng trở nên quan trọng và đem lại lợi ích cực kỳ to lớn. Big Data được xem là tài sản cực kỳ chủ lực không thuộc tài chính và nhân lực, nên tài nguyên này cũng cần được quản lý và sử dụng đúng cách.

Xem thêm: BIG DATA VÀ CLOUD – SỰ KẾT HỢP HOÀN HẢO
Thương mại điện tử không chỉ tận hưởng những lợi ích của việc điều hành trực tuyến mà còn phải đối mặt với nhiều thách thức để đạt được các mục tiêu kinh doanh. Lý do là bởi các doanh nghiệp dù là nhỏ hay lớn, khi đã tham gia vào thị trường này đều cần đầu tư mạnh để cải tiến công nghệ.

Xem thêm: Giải pháp Big data cho Thương Mại Điện Tử
Như vậy chúng ta đã cùng nhau đi qua 4 phần của series bài viết về thuật toán Decision trees hay còn gọi là thuật toán cây quyết định. Chúng ta đã làm quen với định nghĩa tổng quát, các dạng cây quyết định bao gồm phân 2 nhánh – CART, và nhiều nhánh C4.5 sử dụng các công thức Goodness of Split, Gini Index, Entropy kết hợp với Information Gain, hay Gain Ratio để xây dựng mô hình áp dụng cho biến mục tiêu là biến định tính, và chúng ta cũng tiếp cận qua một số cách thức để tăng độ hiệu quả của mô hình, tránh trường hợp Overfitting hay Underfitting như Stopping rule và Pruning method, và nhìn lại những ưu điểm, khuyết điểm một cách tổng thể về Decision Trees.

Xem thêm: THUẬT TOÁN CÂY QUYẾT ĐỊNH (P.5) REGRESSION TREE VÀ DECISION RULES
Ở bài viết trước, chúng tôi đã giới thiệu sơ lược về Chatbot về khái niệm cũng như cách thức vận hành đơn giản nhất của Chatbot. Lần này, chúng tôi sẽ cung cấp cho các bạn về các phương pháp, thuật toán là cơ sở hoạt động của Chatbot hay nói cách khác Chatbot hoạt động ra sao?

Xem thêm: TỔNG QUAN VỀ CHATBOT (PHẦN 2): CHATBOT HOẠT ĐỘNG NHƯ THẾ NÀO?
Big data trong ngành du lịch đang bùng nổ trong những năm gần đây. Nhiều người cho rằng Big Data sẽ lấy đi sự cá nhân hóa của các doanh nghiệp du lịch, nhưng điều này không hề đúng bởi công nghệ du lịch đã phát triển và Big Data đang được sử dụng để đưa thêm nhiều sự liên hệ cá nhân vào trải nghiệm khách hàng. Vậy Big Data là gì và nó được sử dụng như thế nào trong ngành du lịch? Hãy cùng tìm hiểu trong bài viết dưới đây.

Xem thêm: Từ BIG DATA đến cá nhân hóa trong lĩnh vực du lịch
Trở lại với chủ đề về Data mining, ở phần 1 đã giới thiệu đến các bạn về khái niệm, tầm quan trọng, lợi ích chính và thách thức của Data mining, tiếp tục với phần 2, sẽ đi vào phân tích các ứng dụng của Data mining trong các lĩnh vực một cách chi tiết hơn. Nhưng trước tiên chúng ta cùng điểm qua các loại thông tin và loại dữ liệu được thu thập và phân tích bằng các công cụ Data mining.

Xem thêm: TỔNG QUAN VỀ DATA MINING (P2): ỨNG DỤNG TRONG CÁC LĨNH VỰC
Trở lại với chủ đề Data security, bảo mật dữ liệu, ở phần 1 bài viết trước chúng ta đã cùng nhau tìm hiểu về thực trạng Data security trên toàn cầu thông qua bàn luận những số liệu từ các báo cáo, nghiên cứu của Verizon và IBM về Data breach (xâm phạm, đánh cắp, rò rỉ dữ liệu) tại những công ty, tổ chức đến từ nhiều quốc gia khác nhau; cũng như tìm hiểu tổng quan về Data security như khái niệm, lợi ích, thách thức.

Xem thêm: GIẢI PHÁP CẢI THIỆN BẢO MẬT DỮ LIỆU – DATA SECURITY
Chắc bạn đã một lần từng nghe, hoặc biết đến Chatbot khi đã vô tình bắt gặp nó được thể hiện ở các trang mạng xã hội (social media platform) hay trên các ứng dụng mua sắm trực tuyến (online shopping application). Chatbot hiện đang là công cụ hỗ trợ đắc lực dành cho các công ty, tổ chức trong việc phát triển, duy trì và cải thiện mối quan hệ với khách hàng (customer relationship management).

Xem thêm: TỔNG QUAN VỀ CHATBOT (PHẦN 1) CHATBOT LÀ GÌ?
với khát vọng là công ty đi đầu trong lĩnh vực khai phá dữ liệu Big Data, và tư vấn chiến lược trong tương lai, sẵn sàng hỗ trợ, đồng hành cùng bạn – dù bạn là ai – trên con đường khai phá Big Data. Nhưng trước hết công ty giới thiệu các bước khai thác Big Data. Theo SAS, các bước khai phá Big Data bao gồm:

Xem thêm: THÁCH THỨC TRONG QUÁ TRÌNH KHAI THÁC DỮ LIỆU BIG DATA
Hacker tối qua đã tung thông tin nghi là của hai triệu khách hàng từ một ngân hàng Việt Nam lên Raidforums, một website chuyên mua bán dữ liệu.
Các thông tin bị rò rỉ bao gồm tên đầy đủ, số chứng minh thư, số điện thoại, địa chỉ nhà, ngày tháng năm sinh, giới tính, email và nghề nghiệp.

Xem thêm: Hacker tung dữ liệu hai triệu người dùng ngân hàng lên mạng, kiểm tra nhanh xem có trong danh sách...
Data visualization tạm được dịch là trực quan hóa dữ liệu, đây là phương pháp không chỉ là bước quan trọng của bất kỳ quy trình phân tích, hay khai phá dữ liệu mà nó còn là công cụ được sử dụng phổ biến và rộng rãi ở mọi tổ chức thuộc mọi lĩnh vực, hay bởi mỗi một ai trong chúng ta, với mục đích đơn giản là truyền đạt, trình bày một cách hiệu quả, đơn giản, thu hút những thông tin, dữ liệu đến người đọc, người xem.

Xem thêm: TỔNG QUAN VỀ DATA VISUALIZATION (TRỰC QUAN HÓA DỮ LIỆU)
Trở lại với chủ đề bài viết về Data mining, ở 2 phần trước đã giới thiệu dến các bạn khái niệm, tầm quan trọng, lợi ích, thách thức và đặc biệt là ứng dụng của Data mining trong nhiều lĩnh vực khác nhau. Phần cuối của chủ đề Data mining lần này, sẽ phân tích về các quy trình, kỹ thuật và thuật toán của Data mining, hay tìm hiểu làm cách Data mining khai thác giá trị, những thông tin hữu ích từ dữ liệu?

Xem thêm: TỔNG QUAN VỀ DATA MINING (P3): QUÁ TRÌNH VÀ PHƯƠNG PHÁP
Các công ty truyền thông và người hoạt động trong lĩnh vực giải trí cần thúc đẩy chuyển đổi kỹ thuật số để phân phối sản phẩm và nội dung của họ nhanh nhất có thể tại thị trường hiện tại.

Xem thêm: Giải pháp Big data cho lĩnh vực Truyền Thông và Giải Trí
Để thu thập các thông tin bệnh nhân các nhà nghiên cứu phải sử dụng đến đơn vị petabyte. Mỗi petabyte dữ liệu tương đương với 1 triệu gigabyte. Công ty Express Scripts, có trụ sở tại St Louis, Missouri, Mỹ, đã thu thập được 22 petabyte dữ liệu y tế từ 83 triệu bệnh nhân, với số lượng dữ liệu này được chuyển đổi thành định dạng MP3, sẽ mất khoảng 44.000 năm để lắng nghe hết số lượng tệp nhạc này.

Xem thêm: Sự ảnh hưởng của “Big data” tới ngành Dược trong tương lai
Tầm quan trọng của Big Data (Dữ liệu lớn) và sự nhận thức về giá trị của nó giảm dần, nhiều công ty đầu tư vào lĩnh vực này nhưng không đem lại kỳ vọng, và kết quả tốt lợi. Nguyên nhân do nhu cầu và tính chất phức tạp của hệ thống công nghệ kỹ thuật phải xây dựng, bảo trì, chi phí lại cao, thiếu nguồn nhân lực có chuyên môn sâu, và kỹ năng về lĩnh vực Data Science hay Data Analytics,…

Xem thêm: TỔNG QUAN VỀ BIG DATA TRÊN TOÀN CẦU
Sự xuất hiện ngày càng nhiều các sản phẩm công nghệ, kỹ thuật số thông minh tiên tiến gia tăng tối đa trải nghiệm khách hàng cho thấy mức độ phổ biến và ứng dụng rộng rãi của Machine Learning để phát triển các sản phẩm AI (Artificial Intelligence – trí tuệ nhân tạo). Cũng chính các thay đổi cực kỳ lớn và thịnh hành của môi trường công nghệ đã tạo cơ hội, mở ra cánh cửa để Big Data thúc đẩy kinh tế, hỗ trợ các công ty cải thiện hiệu quả kinh doanh của mình thông qua khai thác giá trị tiềm ẩn, thông tin hữu ích từ dữ liệu.

Xem thêm: TOP CÁC XU HƯỚNG BIG DATA SẼ ĐI ĐẦU TRONG NĂM 2019 (PHẦN 1)