Trong hệ thống ngân hàng, Big Data đã và đang được ứng dụng hiệu quả từ cách đây khá lâu. Big Data thể hiện vai trò không thể thay thế của mình trong mọi hoạt động của ngân hàng: từ thu tiền mặt đến quản lý tài chính. Các ứng dụng Big Data đã giúp giảm bớt rắc rối của khách hàng và tạo doanh thu cho các ngân hàng.

Xem thêm: Giải pháp Big data cho lĩnh vực Ngân hàng
Không có gì phải nghi ngờ, khi tất cả các doanh nghiệp hiện tại đều bị thôi thúc bởi lợi ích của việc khai thác dữ liệu (data) – thu thập, quản lý, xử lý, phân tích và diễn giải. Điều đó đòi hỏi mỗi tổ chức cần có một cơ sở dữ liệu (database) mới, tiên tiến để đáp ứng với môi trường kinh doanh hiện đại do các database cũ không thể bắt kịp tốc độ thay đổi về hình thức và khối lượng dữ liệu.

Xem thêm: QUẢN LÝ DỮ LIỆU LÀ CƠ HỘI TẠO GIÁ TRỊ KINH DOANH
Bài chia sẻ của Ths.Bs Nguyễn Thành Danh (Danh Nguyen) - chuyên gia trong lĩnh vực quản lý y tế sau khi tham dự Hội thảo “Big Data trong cải tiến chất lượng y tế” được tổ chức tại Bệnh viện Việt Đức:

Xem thêm: Bùng nỗ digital healthcare, big data trong lĩnh vực y tế đang đến rất gần
Nguồn tài nguyên giá trị nhất của thế giới hiện nay không còn là dầu mỏ, mà là kho dữ liệu số đang tăng lên với cấp độ lũy thừa mỗi ngày. Trong cuộc cách mạng công nghiệp 4.0, Big Data là một yếu tố đóng vai trò then chốt. Vậy Big Data thực chất là gì, và nó đang được ứng dụng như thế nào? Đối với nhiều người, đó là một thuật ngữ mơ hồ về hình ảnh của những hệ thống máy chủ khổng lồ, hoặc sẽ liên hệ đến việc nhận được các loại quảng cáo từ một nhà bán lẻ.

Xem thêm: Công nghệ Big Data và xu hướng ứng dụng
Trở lại với chủ đề bài viết về phân tích dự báo – Predictive analytics, ở phần 1, đã giới thiệu đến các bạn thế nào là phân tích dự báo, phân biệt nó với Data analytics, Descriptive analytics (phân tích mô tả) và Prescriptive analytics (phân tích đề xuất), còn phần 2 lần này chúng tôi sẽ đi vào trình bày một cách tổng quan về bản chất, cách thức vận hành, quy trình, và các thuật toán hay kỹ thuật phân tích được sử dụng trong Predictive analytics.

Xem thêm: TỔNG QUAN VỀ PREDICTIVE ANALYTICS (PHÂN TÍCH DỰ BÁO) (PHẦN 2)
Hacker tối qua đã tung thông tin nghi là của hai triệu khách hàng từ một ngân hàng Việt Nam lên Raidforums, một website chuyên mua bán dữ liệu.
Các thông tin bị rò rỉ bao gồm tên đầy đủ, số chứng minh thư, số điện thoại, địa chỉ nhà, ngày tháng năm sinh, giới tính, email và nghề nghiệp.

Xem thêm: Hacker tung dữ liệu hai triệu người dùng ngân hàng lên mạng, kiểm tra nhanh xem có trong danh sách...
Marketing là chìa khóa để cánh cửa thành công cho bất kỳ doanh nghiệp nào. Giờ đây, không chỉ các công ty lớn có thể điều hành các hoạt động quảng cáo tiếp thị mà cả các doanh nhân nhỏ cũng có thể chạy các chiến dịch quảng cáo thành công trên các nền tảng truyền thông xã hội và quảng bá sản phẩm của họ.

Xem thêm: Giải pháp Big data cho lĩnh vực Marketing
Hàng ngày, chúng ta thường xuyên kết nối thông qua điện thoại, máy tính bảng, bảng điều khiển trò chơi và hầu hết các ứng dụng, các kênh kết nối đều được thực hiện qua các thiết bị này.Khi di chuyển giữa các thiết bị và kênh, họ đang tạo ra nhiều điểm tiếp xúc, kết nối giữa các thiết bị khác nhau mà không hề hay biết.

Xem thêm: BIG DATA Là Chìa Khóa Thành Công Của Marketing Thời Đại Số
Nếu các bạn có theo dõi những bài viết của chúng tôi về Data management (quản lý dữ liệu) và Data quality (chất lượng dữ liệu), thì chắc cũng biết tầm quan trọng của quá trình Data security; sự ra đời của những bộ luật, điều luật về bảo mật thông tin, dữ liệu như GDPR tại châu Âu, luật An ninh Mạng ở nước ta; đặc biệt là xu hướng khách hàng đang ngày càng quan tâm hơn về tính minh bạch trong việc sử dụng, và khả năng bảo vệ nguồn dữ liệu, thông tin cá nhân của họ tại các công ty.

Xem thêm: THỰC TRẠNG DATA SECURITY TRÊN TOÀN CẦU
Giới thiệu về K – nearest neighbor (KNN)
Ở các bài viết trước đã giới thiệu đến các bạn một cách tổng quan những chủ đề về Data mining (Khai phá dữ liệu), Predictive analytics (Phân tích dự báo), Statistics (Thống kê) bao gồm các khái niệm quan trọng, kỹ thuật phân tích và ứng dụng, lợi ích trong các lĩnh vực khác nhau.

Xem thêm: THUẬT TOÁN KNN VÀ VÍ DỤ ĐƠN GIẢN TRONG NGÀNH NGÂN HÀNG
Big data là gì? Công nghệ dữ liệu lớn là gì? Phân tích dữ liệu lớn là gì? Mang lại lợi ích như thế nào? Ứng dụng của Big Data trong thời đại công nghệ 4.0 là gì?
Các công ty công nghệ lớn hiện nay tại sao lại cần và ứng dụng Big Data nhiều đến vậy? Những cơ hội và thách thức khi ứng dụng Big Data là gì?
Hẳn là bạn đã từng giật mình khi bạn tìm kiếm thông tin nào đó trên Google. Mua sắm ở các trang thương mại trực tuyến và nhận thấy các trang này.

Xem thêm: Big Data công nghệ biến “sắt” thành mỏ “vàng”, Cơ hội và thách thức
Big Data mang lại cơ hội cho lĩnh vực bán lẻ bằng cách phân tích thị trường cạnh tranh và sự quan tâm của khách hàng. Nó giúp xác định hành trình trải nghiệm, xu hướng mua sắm và sự hài lòng của khách hàng bằng cách thu thập dữ liệu đa dạng.

Xem thêm: Giải pháp Big data cho lĩnh vực Bán Lẻ
Chủ đề về Big Data tác động đến social media marketing (tiếp thị qua mạng xã hội), mà cung cấp đến các bạn sẽ được chia thành 2 phần
- Phần 1: Sự “bùng nổ” của social media và xu hướng marketing mới
- Phần 2: Tác động của Big data đến xu hướng social media marketing

Xem thêm: SỰ “BÙNG NỔ” CỦA SOCIAL MEDIA VÀ XU HƯỚNG MARKETING MỚI
Nếu các bạn đã theo dõi các bài viết của Big Data Uni thì chắc cũng đã nắm được tổng quan về Big Data bao gồm khái niệm, lợi ích và ứng dụng của nó trong nhiều lĩnh vực khác nhau. Trong chủ đề bài viết lần này và sắp tới, chúng tôi sẽ không đề cập về những giá trị mà Big Data đem lại mà đi vào trọng tâm một trong những công cụ, quá trình quan trọng nhất đối với mỗi dự án Big Data đó chính là Data mining (hay còn gọi là khai phá dữ liệu).

Xem thêm: TỔNG QUAN VỀ DATA MINING (P1): KHAI PHÁ DỮ LIỆU LÀ GÌ?
Ở bài viết trước, đã giới thiệu đến các bạn khái niệm về Data management – quản lý dữ liệu – lịch sử ra đời, cũng như các thành phần, quy trình, chức năng có trong Data management. Trở lại với phần 2 “Tầm quan trọng của quản lý dữ liệu” , sẽ đi vào phân tích chi tiết các lợi ích chính, các thách thức mỗi tổ chức phải đối mặt khi triển khai, và liệt kê một số giải pháp thực tiễn sẽ hỗ trợ hiệu quả.

Xem thêm: TẦM QUAN TRỌNG CỦA QUẢN LÝ DỮ LIỆU (DATA MANAGEMENT) (P2)
Ngày nay, tiềm năng phát triển các chiến lược kinh doanh dựa trên dữ liệu và thông tin là lớn hơn bao giờ hết. Đối với một số tổ chức, dữ liệu và phân tích dữ liệu đã trở thành động lực chính trong việc đề xuất các chiến lược kinh doanh của họ.

Xem thêm: CÔNG TY ĐỊNH HƯỚNG DỮ LIỆU (DATA – DRIVEN ENTERPRISE) (PHẦN 2)
Ở bài viết trước, chúng tôi đã giới thiệu sơ lược về Chatbot về khái niệm cũng như cách thức vận hành đơn giản nhất của Chatbot. Lần này, chúng tôi sẽ cung cấp cho các bạn về các phương pháp, thuật toán là cơ sở hoạt động của Chatbot hay nói cách khác Chatbot hoạt động ra sao?

Xem thêm: TỔNG QUAN VỀ CHATBOT (PHẦN 2): CHATBOT HOẠT ĐỘNG NHƯ THẾ NÀO?
Một dự án lớn đang được tiến hành ở cả Anh và Mỹ nhằm thu thập thông tin thông qua một khối lượng lớn dữ liệu bệnh nhân. Đây là một dự án đầy hứa hẹn nhằm tối ưu hóa giá trị sử dụng thuốc, từ việc xác định sự kém tuân thủ trong điều trị để nâng cao chất lượng kê đơn.

Xem thêm: Dữ liệu lớn Big data và Tương lai của ngành Dược?
Sự phát triển của ngành ngân hàng (Banking) đi đôi với sự ra đời của Big Data
Ngành ngân hàng đã phát triển theo bước nhảy vọt trong thập kỷ qua từ hoạt động vận hành kinh doanh đến cung cấp dịch vụ. Điều đáng ngạc nhiên chính là, hầu hết các ngân hàng đều gặp khó khăn hay thất bại trong việc sử dụng, khai thác thông tin, dữ liệu từ cơ sở dữ liệu (database) mà họ có được từ khách hàng và từ các chi nhánh, bộ phận của tổ chức.

Xem thêm: ỨNG DỤNG CỦA BIG DATA TRONG LĨNH VỰC NGÂN HÀNG (PHẦN 1)
Những doanh nghiệp đầu ngành có khả năng tiếp cận nhiều dữ liệu hơn bao giờ hết.
Nhưng dữ liệu tự thân không tạo ra hiểu biết sâu sắc về doanh nghiệp, khách hàng hay hoạt động kinh doanh.

Xem thêm: Hướng dẫn tổng quan về Kinh Doanh Thông Minh – Business Intelligence – BI
Các công ty truyền thông và người hoạt động trong lĩnh vực giải trí cần thúc đẩy chuyển đổi kỹ thuật số để phân phối sản phẩm và nội dung của họ nhanh nhất có thể tại thị trường hiện tại.

Xem thêm: Giải pháp Big data cho lĩnh vực Truyền Thông và Giải Trí
Ở thời điểm nay, không phải tài sản vật chất, thiết bị máy móc hay cơ sở hạ tầng sản phẩm là tài sản lớn nhất của một doanh nghiệp, mà chính là khách hàng. Nếu bạn không thể làm hài lòng khách hàng và hiểu nhu cầu của họ, thì bạn sẽ không bao giờ trở thành chủ sở hữu của một doanh nghiệp thành công.

Xem thêm: Giải pháp Big data cho lĩnh vực Dịch Vụ Khách Hàng
Data visualization tạm được dịch là trực quan hóa dữ liệu, đây là phương pháp không chỉ là bước quan trọng của bất kỳ quy trình phân tích, hay khai phá dữ liệu mà nó còn là công cụ được sử dụng phổ biến và rộng rãi ở mọi tổ chức thuộc mọi lĩnh vực, hay bởi mỗi một ai trong chúng ta, với mục đích đơn giản là truyền đạt, trình bày một cách hiệu quả, đơn giản, thu hút những thông tin, dữ liệu đến người đọc, người xem.

Xem thêm: TỔNG QUAN VỀ DATA VISUALIZATION (TRỰC QUAN HÓA DỮ LIỆU)
Để thu thập các thông tin bệnh nhân các nhà nghiên cứu phải sử dụng đến đơn vị petabyte. Mỗi petabyte dữ liệu tương đương với 1 triệu gigabyte. Công ty Express Scripts, có trụ sở tại St Louis, Missouri, Mỹ, đã thu thập được 22 petabyte dữ liệu y tế từ 83 triệu bệnh nhân, với số lượng dữ liệu này được chuyển đổi thành định dạng MP3, sẽ mất khoảng 44.000 năm để lắng nghe hết số lượng tệp nhạc này.

Xem thêm: Sự ảnh hưởng của “Big data” tới ngành Dược trong tương lai
Quay trở lại với chủ đề về Decision trees, thì ở 2 bài viết trước đã giới thiệu đến các bạn khái quát thế nào là thuật toán cây quyết định, bao gồm các thành phần, và một số công thức tính toán để lựa chọn các biến phân nhánh hay cách phân nhánh tối ưu, mục đích dự báo, phân loại, phân nhóm các đối tượng dữ liệu vào các nhóm, các lớp của biến mục tiêu sao cho chính xác nhất.

Xem thêm: THUẬT TOÁN CÂY QUYẾT ĐỊNH (P.3): C4.5 (ENTROPY)
Trở lại với chủ đề về Data mining, ở phần 1 đã giới thiệu đến các bạn về khái niệm, tầm quan trọng, lợi ích chính và thách thức của Data mining, tiếp tục với phần 2, sẽ đi vào phân tích các ứng dụng của Data mining trong các lĩnh vực một cách chi tiết hơn. Nhưng trước tiên chúng ta cùng điểm qua các loại thông tin và loại dữ liệu được thu thập và phân tích bằng các công cụ Data mining.

Xem thêm: TỔNG QUAN VỀ DATA MINING (P2): ỨNG DỤNG TRONG CÁC LĨNH VỰC
1. Xu hướng nghề nghiệp trong tương lai
Hiện tại, chúng ta đang sống trong giai đoạn đầu của thời kỳ cách mạng công nghiệp lần thứ 4. Triết lý của cuộc cách mạng công nghiệp 4.0 là chúng ta phải sử dụng công nghệ thông tin để tăng được năng suất lao động, từ đó tiết kiệm được chi phí, mang lại lợi ích cho người tiêu dùng.

Xem thêm: CHUYÊN GIA PHÂN TÍCH DỮ LIỆU – SỰ THÀNH CÔNG TRONG TƯƠNG LAI
Hiện nay dữ liệu lớn (big data) và khoa học dữ liệu là một lĩnh vực rất sôi nỗi và phát triễn nhanh trong thời gian gần đây. Như đánh giá của Trường Đại Học Harvard, Hoa Kỳ thì nhà khoa học dữ liệu (data scientist) sẽ là công việc hấp dẫn nhất thế kỹ 21.

Xem thêm: Lời khuyên để trở thành nhà khoa học dữ liệu tốt!
Trở lại với chủ đề về các xu hướng Big Data sẽ đi đầu trong năm 2019, ở phần 1, Big Data Uni đã đề cập về sự phát triển và thay đổi của Internet of Things (IOT), trí tuệ nhân tạo (Artificial Intelligence – AI), Machine Learning (ML) tác động như thế nào đến lĩnh vực Big Data, và một số dự báo về thị trường Big Data. Phần 2 bài viết, chúng tôi sẽ đề cập chi tiết về các xu hướng của những công cụ, cách thức hỗ trợ cho việc khai thác, tiếp cận Big Data, cùng với các vấn đề, thách thức mới trong lĩnh vực Big Data.

Xem thêm: TOP CÁC XU HƯỚNG BIG DATA SẼ ĐI ĐẦU TRONG NĂM 2019 (PHẦN 2)
KHI MỘT CHUYÊN GIA PHÂN TÍCH DỮ LIỆU NHẬN ĐƯỢC YÊU CẦU TỪ CÁC PHÒNG BAN, BỘ PHẬN HAY LÃNH ĐẠO CÔNG TY, CHUYÊN GIA ẤY CÓ THỂ NHẢY VÀO PHÂN TÍCH NGHIÊN CỨU NGAY VẤN ĐỀ. NGƯỜI LÀM PHÂN TÍCH DỮ LIỆU SẼ MONG MUỐN TỪ YÊU CẦU ĐƠN GIẢN BAN ĐẦU SẼ TÌM RA PHÁT HIỆN TUYỆT VỜI, ĐƯA RA ĐƯỢC CÁC ĐỀ XUẤT HAY NHẤT ĐỂ ÁP DỤNG CHO CÔNG TY. NHƯNG THỰC TẾ THƯỜNG KHÔNG THUẬN LỢI NHƯ VẬY.

Xem thêm: Các bước chuẩn bị cho một dự án phân tích dữ liệu thành công!
Để thành công và phát triển, một công ty cần phải có khả năng đạt được, giữ chân, thỏa mãn và thu hút càng nhiều khách hàng càng tốt. Hiểu rõ hơn về khách hàng thông qua phân tích dữ liệu khách hàng vừa là công việc, nhiệm vụ rất quan trọng vừa là cơ sở để đánh giá công ty hoạt động hiệu quả như thế nào.

Xem thêm: TỔNG QUAN VỀ CUSTOMER DATA (P.2) LỢI ÍCH CỦA DỮ LIỆU KHÁCH HÀNG
Tại Việt Nam, kho dữ liệu còn rất hạn chế, muốn nghiên cứu phải đòi hỏi nền tảng công nghệ rất lớn. Tuy nhiên, để phục vụ người dân tốt hơn thì việc xây dựng dữ liệu lớn (big data) là việc cần thiết, phải đẩy mạnh triển khai trong thời gian tới.

Nhiều doanh nghiệp Việt Nam chưa xây dựng big data trong hoạt động sản xuất, kinh doanh và quản trị doanh nghiệp
Xem thêm: Việt Nam còn thiếu big data?
Bối cảnh, nguyên nhân tại sao các công ty ngày nay cần định hướng dữ liệu (Data – driven)
Nếu các bạn có theo dõi những các bài viết trước đây của thì chúng tôi đã đề cập nhiều về tầm quan trọng của dữ liệu – được coi là nguồn sống của mọi tổ chức trong thời đại 4.0 – cũng như các xu hướng của Big Data, Data Analytics, và nhu cầu khai thác dữ liệu để đạt được giá trị, lợi ích trong kinh doanh ngày càng được quan tâm hơn.

Xem thêm: CÔNG TY ĐỊNH HƯỚNG DỮ LIỆU (DATA – DRIVEN ENTERPRISE) (PHẦN 1)
Big Data có thể tạo ra các phương pháp tiếp cận dựa trên dữ liệu sáng tạo để dạy học sinh. Ở nhiều nước, việc ứng dụng Big Data trong trường học và cao đẳng đã dần trở nên phổ biến. Nhưng các nước đang phát triển cũng bắt đầu nghiên cứu để ứng dụng trong các hoạt động giảng dạy.

Xem thêm: Giải pháp Big data cho lĩnh vực Giáo Dục
Từ khi có ứng dụng data science, ngành y tế và chăm sóc sức khỏe cũng có những bước nhảy vọt quan trọng. 5 nhóm lĩnh vực data science đã áp dụng thành công những ứng dụng của data science có thể kể đến như Phân tích hình ảnh y khoa, gien và bộ gien, Điều chế thuốc, phân tích và chẩn đoán, ứng dụng phần mềm sức khỏe hay trợ lý sức khỏe tâm lý.

Xem thêm: Ứng dụng Data Science vào lĩnh vực Y tế mang tính đột phá
Ở bài viết trước, phần 1 về ứng dụng Big Data trong lĩnh vực E-commerce, đã giới thiệu đến các bạn tổng quan về thị trường E-commerce, các định nghĩa, khái niệm về kinh doanh trực tuyến, đồng thời mô tả nguồn dữ liệu E-commerce có những đặc tính được coi là Big Data và nói lên nhu cầu khai thác.

Xem thêm: ỨNG DỤNG BIG DATA TRONG LĨNH VỰC E-COMMERCE (PHẦN 2)
Tìm hiểu về mối quan hệ giữa Big Data và Cloud
Việc tận dụng và khai thác Big Data để phục vụ cho mục đích cải thiện hiệu quả hoạt động kinh doanh ở mỗi công ty ngày càng trở nên quan trọng và đem lại lợi ích cực kỳ to lớn. Big Data được xem là tài sản cực kỳ chủ lực không thuộc tài chính và nhân lực, nên tài nguyên này cũng cần được quản lý và sử dụng đúng cách.

Xem thêm: BIG DATA VÀ CLOUD – SỰ KẾT HỢP HOÀN HẢO
Sự xuất hiện ngày càng nhiều các sản phẩm công nghệ, kỹ thuật số thông minh tiên tiến gia tăng tối đa trải nghiệm khách hàng cho thấy mức độ phổ biến và ứng dụng rộng rãi của Machine Learning để phát triển các sản phẩm AI (Artificial Intelligence – trí tuệ nhân tạo). Cũng chính các thay đổi cực kỳ lớn và thịnh hành của môi trường công nghệ đã tạo cơ hội, mở ra cánh cửa để Big Data thúc đẩy kinh tế, hỗ trợ các công ty cải thiện hiệu quả kinh doanh của mình thông qua khai thác giá trị tiềm ẩn, thông tin hữu ích từ dữ liệu.

Xem thêm: TOP CÁC XU HƯỚNG BIG DATA SẼ ĐI ĐẦU TRONG NĂM 2019 (PHẦN 1)
Tầm quan trọng của Big Data (Dữ liệu lớn) và sự nhận thức về giá trị của nó giảm dần, nhiều công ty đầu tư vào lĩnh vực này nhưng không đem lại kỳ vọng, và kết quả tốt lợi. Nguyên nhân do nhu cầu và tính chất phức tạp của hệ thống công nghệ kỹ thuật phải xây dựng, bảo trì, chi phí lại cao, thiếu nguồn nhân lực có chuyên môn sâu, và kỹ năng về lĩnh vực Data Science hay Data Analytics,…

Xem thêm: TỔNG QUAN VỀ BIG DATA TRÊN TOÀN CẦU
Ở 2 bài viết trước đã giới thiệu đến các bạn thuật toán Classification đầu tiên là KNN (K – nearest neighbor) và một số phương pháp đánh giá mô hình phân loại như Hold out, Cross validation, hay Confusion matrix, Lift, Gain chart, ROC/ AUC. Trở lại với chủ đề về những thuật toán phân loại trong Data mining, lần này chúng tôi và các bạn sẽ tìm hiểu về Decision Tree, thuật toán có thể nói là “nổi tiếng”, “phổ biến” mà bất kỳ ai hoạt động và làm việc trong lĩnh vực khoa học dữ liệu, hoặc phân tích dữ liệu đều phải biết đến.

Xem thêm: THUẬT TOÁN CÂY QUYẾT ĐỊNH (P.1) : CLASSIFICATION & REGRESSION TREE (CART)
Bạn có biết là những vị trí liên quan tới lĩnh vực khoa học dữ liệu (data science) và phân tích dữ liệu (data analysis) là khó tuyển nhất với một công ty không? Sự bùng nổ nhu cầu tìm kiếm các chuyên gia trong những lĩnh vực này mở ra hàng loạt nhu cầu và đồng thời, đẩy thị trường tuyển dụng vào tình trạng cung không đủ đáp ứng cầu.

Xem thêm: Data Analysis là gì? Cần học những gì?
Phân tích dữ liệu là một công việc rất quan trọng giúp chúng ta có thể lập báo cáo tốt hơn, tránh được những sai sót, đảm bảo được tính chính xác của báo cáo. Vậy phân tích dữ liệu là phải làm những công việc gì? Sau đây chúng ta sẽ tìm hiểu về kỹ năng phân tích dữ liệu trước khi lập báo cáo trên Excel thông qua 1 bài tập sau:
Giả sử rằng bạn làm ở vị trí trưởng bộ phận bán hàng. Cuối tháng bạn nhận được 1 bảng dữ liệu về bán hàng trong tháng của cửa hàng mình như sau:
