Các sản phẩm thực phẩm cũng như đồ uống là một trong những sản phẩm được lưu hành nhiều nhất trong thương mại quốc tế. Đó cũng là một trong những thị trường được điều tiết và giám sát nghiêm ngặt nhất, cả ở cấp quốc gia và quốc tế. Do những thiệt hại tiềm tàng mà các sản phẩm thực phẩm không phù hợp có thể gây ra những ảnh hưởng trong nền kinh tế, và sức khỏe cộng đồng hoặc môi trường tự nhiên của bất kỳ quốc gia nào , nên thực phẩm sẽ được kiểm soát rất gắt gao khi lưu hành trên quốc tế.

Xem thêm: Truy xuất nguồn gốc thực phẩm bằng hợp đồng thông minh của Blockchain Ethereum
Mong muốn ứng dụng Blockchain và AI, Data Science của doanh nghiệp khiến nhu cầu kỹ sư IT rành những chuyên môn này tiếp tục tăng cao.
Mức lương, số lượng tuyển dụng đến số người ứng tuyển, nhân sự IT giỏi về các công nghệ như chuỗi khối (Blockchain), trí tuệ nhân tạo (AI) và khoa học dữ liệu (Data Science) chính là tâm điểm tuyển dụng trong ngành công nghệ thông tin nửa đầu năm 2019.

Xem thêm: Nhu cầu tuyển dụng nhân sự Blockchain, AI tăng mạnh
Xác minh nhận dạng số
OneName và BitID là những ví dụ về các dịch vụ nhận dạng số dựa trên Blockchain. Chúng xác nhận danh tính của một cá nhân trên một trang web. Các dịch vụ xác minh kỹ thuật số phân quyền tận dụng lợi thế của một thực tế rằng tất cả người dùng Bitcoin đều có một ví cá nhân, và do đó cũng có một địa chỉ ví.

Xem thêm: Blockchain – Khởi nguồn của một nền kinh tế mới: Chương 3 – Blockchain 3.0 (Phần 3)
Nguồn tài nguyên giá trị nhất của thế giới hiện nay không còn là dầu mỏ, mà là kho dữ liệu số đang tăng lên với cấp độ lũy thừa mỗi ngày. Trong cuộc cách mạng công nghiệp 4.0, Big Data là một yếu tố đóng vai trò then chốt. Vậy Big Data thực chất là gì, và nó đang được ứng dụng như thế nào? Đối với nhiều người, đó là một thuật ngữ mơ hồ về hình ảnh của những hệ thống máy chủ khổng lồ, hoặc sẽ liên hệ đến việc nhận được các loại quảng cáo từ một nhà bán lẻ.

Xem thêm: Công nghệ Big Data và xu hướng ứng dụng
Từ khi có ứng dụng data science, ngành y tế và chăm sóc sức khỏe cũng có những bước nhảy vọt quan trọng. 5 nhóm lĩnh vực data science đã áp dụng thành công những ứng dụng của data science có thể kể đến như Phân tích hình ảnh y khoa, gien và bộ gien, Điều chế thuốc, phân tích và chẩn đoán, ứng dụng phần mềm sức khỏe hay trợ lý sức khỏe tâm lý.

Xem thêm: Ứng dụng Data Science vào lĩnh vực Y tế mang tính đột phá
Sự phát triển của ngành ngân hàng (Banking) đi đôi với sự ra đời của Big Data
Ngành ngân hàng đã phát triển theo bước nhảy vọt trong thập kỷ qua từ hoạt động vận hành kinh doanh đến cung cấp dịch vụ. Điều đáng ngạc nhiên chính là, hầu hết các ngân hàng đều gặp khó khăn hay thất bại trong việc sử dụng, khai thác thông tin, dữ liệu từ cơ sở dữ liệu (database) mà họ có được từ khách hàng và từ các chi nhánh, bộ phận của tổ chức.

Xem thêm: ỨNG DỤNG CỦA BIG DATA TRONG LĨNH VỰC NGÂN HÀNG (PHẦN 1)
Thương mại điện tử không chỉ tận hưởng những lợi ích của việc điều hành trực tuyến mà còn phải đối mặt với nhiều thách thức để đạt được các mục tiêu kinh doanh. Lý do là bởi các doanh nghiệp dù là nhỏ hay lớn, khi đã tham gia vào thị trường này đều cần đầu tư mạnh để cải tiến công nghệ.

Xem thêm: Giải pháp Big data cho Thương Mại Điện Tử
Ở 2 bài viết trước đã giới thiệu đến các bạn thuật toán Classification đầu tiên là KNN (K – nearest neighbor) và một số phương pháp đánh giá mô hình phân loại như Hold out, Cross validation, hay Confusion matrix, Lift, Gain chart, ROC/ AUC. Trở lại với chủ đề về những thuật toán phân loại trong Data mining, lần này chúng tôi và các bạn sẽ tìm hiểu về Decision Tree, thuật toán có thể nói là “nổi tiếng”, “phổ biến” mà bất kỳ ai hoạt động và làm việc trong lĩnh vực khoa học dữ liệu, hoặc phân tích dữ liệu đều phải biết đến.

Xem thêm: THUẬT TOÁN CÂY QUYẾT ĐỊNH (P.1) : CLASSIFICATION & REGRESSION TREE (CART)
Quyển sách mới ra “hiểu số để tăng số – Sexy little number” của Dimitrix Maex & Paul B.Brown đưa ra một góc nhìn tổng hợp trong việc sử dụng số liệu để thực hiện tiếp thị marketing trong thời đại công nghiệp số hoá, dữ liệu lớn. Trong bài này chúng tôi sẽ tóm tắt 1 số ý chính từ quyển sách cho bạn không có thời gian đọc hết quyển sách này.

Xem thêm: Sử dụng số liệu trong kinh doanh thời đại số
Tại Việt Nam, kho dữ liệu còn rất hạn chế, muốn nghiên cứu phải đòi hỏi nền tảng công nghệ rất lớn. Tuy nhiên, để phục vụ người dân tốt hơn thì việc xây dựng dữ liệu lớn (big data) là việc cần thiết, phải đẩy mạnh triển khai trong thời gian tới.

Nhiều doanh nghiệp Việt Nam chưa xây dựng big data trong hoạt động sản xuất, kinh doanh và quản trị doanh nghiệp
Xem thêm: Việt Nam còn thiếu big data?
Ở thời điểm nay, không phải tài sản vật chất, thiết bị máy móc hay cơ sở hạ tầng sản phẩm là tài sản lớn nhất của một doanh nghiệp, mà chính là khách hàng. Nếu bạn không thể làm hài lòng khách hàng và hiểu nhu cầu của họ, thì bạn sẽ không bao giờ trở thành chủ sở hữu của một doanh nghiệp thành công.

Xem thêm: Giải pháp Big data cho lĩnh vực Dịch Vụ Khách Hàng
Khoa học phân tích dữ liệu là một nhánh rẽ quan trọng trong lĩnh vực công nghệ thông tin. Nó sớm bộc lộ những tiềm lực quan trọng thúc đẩy sự phát triển của thế giới. Với sự phát triển nhanh chóng và lan rộng của mình, ngành Khoa học Dữ liệu đặc biệt thu hút sự quan tâm của các chuyên gia Việt Nam và cả trên khắp thế giới.

Xem thêm: Khoa học phân tích dữ liệu – Góc nhìn từ Việt Nam và Thế Giới
Quay trở lại với chủ đề về Decision trees, thì ở 2 bài viết trước đã giới thiệu đến các bạn khái quát thế nào là thuật toán cây quyết định, bao gồm các thành phần, và một số công thức tính toán để lựa chọn các biến phân nhánh hay cách phân nhánh tối ưu, mục đích dự báo, phân loại, phân nhóm các đối tượng dữ liệu vào các nhóm, các lớp của biến mục tiêu sao cho chính xác nhất.

Xem thêm: THUẬT TOÁN CÂY QUYẾT ĐỊNH (P.3): C4.5 (ENTROPY)
Hiện nay dữ liệu lớn (big data) và khoa học dữ liệu là một lĩnh vực rất sôi nỗi và phát triễn nhanh trong thời gian gần đây. Như đánh giá của Trường Đại Học Harvard, Hoa Kỳ thì nhà khoa học dữ liệu (data scientist) sẽ là công việc hấp dẫn nhất thế kỹ 21.

Xem thêm: Lời khuyên để trở thành nhà khoa học dữ liệu tốt!
Trở lại với chủ đề Data security, bảo mật dữ liệu, ở phần 1 bài viết trước chúng ta đã cùng nhau tìm hiểu về thực trạng Data security trên toàn cầu thông qua bàn luận những số liệu từ các báo cáo, nghiên cứu của Verizon và IBM về Data breach (xâm phạm, đánh cắp, rò rỉ dữ liệu) tại những công ty, tổ chức đến từ nhiều quốc gia khác nhau; cũng như tìm hiểu tổng quan về Data security như khái niệm, lợi ích, thách thức.

Xem thêm: GIẢI PHÁP CẢI THIỆN BẢO MẬT DỮ LIỆU – DATA SECURITY
Big Data ngày càng được sử dụng để tối ưu hóa các quy trình kinh doanh. Các nhà bán lẻ có thể tối ưu hóa cổ phiếu của họ dựa trên dự đoán. Từ dữ liệu truyền thông xã hội, xu hướng tìm kiếm trên web và dự báo thời tiết.

Xem thêm: Giải Pháp Big Data Tối ưu hóa quy trình kinh doanh
Trở lại với chủ đề về các xu hướng Big Data sẽ đi đầu trong năm 2019, ở phần 1, Big Data Uni đã đề cập về sự phát triển và thay đổi của Internet of Things (IOT), trí tuệ nhân tạo (Artificial Intelligence – AI), Machine Learning (ML) tác động như thế nào đến lĩnh vực Big Data, và một số dự báo về thị trường Big Data. Phần 2 bài viết, chúng tôi sẽ đề cập chi tiết về các xu hướng của những công cụ, cách thức hỗ trợ cho việc khai thác, tiếp cận Big Data, cùng với các vấn đề, thách thức mới trong lĩnh vực Big Data.

Xem thêm: TOP CÁC XU HƯỚNG BIG DATA SẼ ĐI ĐẦU TRONG NĂM 2019 (PHẦN 2)
Ngày nay, khi nhiều tổ chức đẩy mạnh tiếp cận dữ liệu, và cho rằng dữ liệu là nguồn lực quan trọng để phát triển, thì Data quality – chất lượng dữ liệu – càng được quan tâm và chú ý hơn. Theo Gartner (công ty hàng đầu thế giới chuyên về tư vấn và nghiên cứu), dữ liệu có chất lượng thấp sẽ ảnh hưởng tiêu cực đến năng suất, lợi nhuận của mỗi tổ chức đặc biệt khi mọi hành động, quyết định, chiến lược đều dựa vào dữ liệu.

Xem thêm: TỔNG QUAN VỀ DATA QUALITY – CHẤT LƯỢNG DỮ LIỆU (P1)
Bạn có biết là những vị trí liên quan tới lĩnh vực khoa học dữ liệu (data science) và phân tích dữ liệu (data analysis) là khó tuyển nhất với một công ty không? Sự bùng nổ nhu cầu tìm kiếm các chuyên gia trong những lĩnh vực này mở ra hàng loạt nhu cầu và đồng thời, đẩy thị trường tuyển dụng vào tình trạng cung không đủ đáp ứng cầu.

Xem thêm: Data Analysis là gì? Cần học những gì?
Như vậy chúng ta đã cùng nhau đi qua 4 phần của series bài viết về thuật toán Decision trees hay còn gọi là thuật toán cây quyết định. Chúng ta đã làm quen với định nghĩa tổng quát, các dạng cây quyết định bao gồm phân 2 nhánh – CART, và nhiều nhánh C4.5 sử dụng các công thức Goodness of Split, Gini Index, Entropy kết hợp với Information Gain, hay Gain Ratio để xây dựng mô hình áp dụng cho biến mục tiêu là biến định tính, và chúng ta cũng tiếp cận qua một số cách thức để tăng độ hiệu quả của mô hình, tránh trường hợp Overfitting hay Underfitting như Stopping rule và Pruning method, và nhìn lại những ưu điểm, khuyết điểm một cách tổng thể về Decision Trees.

Xem thêm: THUẬT TOÁN CÂY QUYẾT ĐỊNH (P.5) REGRESSION TREE VÀ DECISION RULES
Ngày nay, tiềm năng phát triển các chiến lược kinh doanh dựa trên dữ liệu và thông tin là lớn hơn bao giờ hết. Đối với một số tổ chức, dữ liệu và phân tích dữ liệu đã trở thành động lực chính trong việc đề xuất các chiến lược kinh doanh của họ.

Xem thêm: CÔNG TY ĐỊNH HƯỚNG DỮ LIỆU (DATA – DRIVEN ENTERPRISE) (PHẦN 2)
KHI MỘT CHUYÊN GIA PHÂN TÍCH DỮ LIỆU NHẬN ĐƯỢC YÊU CẦU TỪ CÁC PHÒNG BAN, BỘ PHẬN HAY LÃNH ĐẠO CÔNG TY, CHUYÊN GIA ẤY CÓ THỂ NHẢY VÀO PHÂN TÍCH NGHIÊN CỨU NGAY VẤN ĐỀ. NGƯỜI LÀM PHÂN TÍCH DỮ LIỆU SẼ MONG MUỐN TỪ YÊU CẦU ĐƠN GIẢN BAN ĐẦU SẼ TÌM RA PHÁT HIỆN TUYỆT VỜI, ĐƯA RA ĐƯỢC CÁC ĐỀ XUẤT HAY NHẤT ĐỂ ÁP DỤNG CHO CÔNG TY. NHƯNG THỰC TẾ THƯỜNG KHÔNG THUẬN LỢI NHƯ VẬY.

Xem thêm: Các bước chuẩn bị cho một dự án phân tích dữ liệu thành công!
Business Intelligenc (BI) hay Data Analytics – phân tích dữ liệu từ lâu đã trở thành các công cụ hữu ích hỗ trợ các tổ chức, công ty trong quá trình hoạt động và phát triển. Ở bài viết lần này, sẽ giới thiệu đến các bạn các lợi ích của phân tích dữ liệu trong kinh doanh, nhưng trước tiên ta cùng phân biệt rõ 2 khái niệm được nêu ở trên mà nhiều người thường nhầm lẫn.

Xem thêm: LỢI ÍCH PHÂN TÍCH DỮ LIỆU TRONG KINH DOANH
Hàng ngày, chúng ta thường xuyên kết nối thông qua điện thoại, máy tính bảng, bảng điều khiển trò chơi và hầu hết các ứng dụng, các kênh kết nối đều được thực hiện qua các thiết bị này.Khi di chuyển giữa các thiết bị và kênh, họ đang tạo ra nhiều điểm tiếp xúc, kết nối giữa các thiết bị khác nhau mà không hề hay biết.

Xem thêm: BIG DATA Là Chìa Khóa Thành Công Của Marketing Thời Đại Số
với khát vọng là công ty đi đầu trong lĩnh vực khai phá dữ liệu Big Data, và tư vấn chiến lược trong tương lai, sẵn sàng hỗ trợ, đồng hành cùng bạn – dù bạn là ai – trên con đường khai phá Big Data. Nhưng trước hết công ty giới thiệu các bước khai thác Big Data. Theo SAS, các bước khai phá Big Data bao gồm:

Xem thêm: THÁCH THỨC TRONG QUÁ TRÌNH KHAI THÁC DỮ LIỆU BIG DATA
Hội thảo Quốc tế về Thống kê Du lịch do Liên Hợp Quốc (UN) tổ chức vào cuối tháng 6, 2017 tại Manilla, Phillippines đã nhấn mạnh tới cách các thành phố sử dụng công nghệ Dữ liệu lớn (Big Data) để quản lý du lịch tốt hơn.

Xem thêm: Câu chuyện Dữ liệu lớn và ngành du lịch
Trở lại với chủ đề về các thuật toán cây quyết định Decision trees, như vậy qua các bài viết trước chúng ta đã tìm hiểu về tổng quan thuật toán cây quyết định là gì, làm quen với các dạng thuật toán CART (phân 2 nhánh) sử dụng công thức Goodness of Split, Gini Index và C4.5 (phân nhiều hơn 2 nhánh) sử dụng công thức Entropy kết hợp với Information gain.

Xem thêm: THUẬT TOÁN CÂY QUYẾT ĐỊNH (P.4): ƯU & KHUYẾT ĐIỂM, STOPPING & PRUNING METHOD
Tìm hiểu về mối quan hệ giữa Big Data và Cloud
Việc tận dụng và khai thác Big Data để phục vụ cho mục đích cải thiện hiệu quả hoạt động kinh doanh ở mỗi công ty ngày càng trở nên quan trọng và đem lại lợi ích cực kỳ to lớn. Big Data được xem là tài sản cực kỳ chủ lực không thuộc tài chính và nhân lực, nên tài nguyên này cũng cần được quản lý và sử dụng đúng cách.

Xem thêm: BIG DATA VÀ CLOUD – SỰ KẾT HỢP HOÀN HẢO
Chắc bạn đã một lần từng nghe, hoặc biết đến Chatbot khi đã vô tình bắt gặp nó được thể hiện ở các trang mạng xã hội (social media platform) hay trên các ứng dụng mua sắm trực tuyến (online shopping application). Chatbot hiện đang là công cụ hỗ trợ đắc lực dành cho các công ty, tổ chức trong việc phát triển, duy trì và cải thiện mối quan hệ với khách hàng (customer relationship management).

Xem thêm: TỔNG QUAN VỀ CHATBOT (PHẦN 1) CHATBOT LÀ GÌ?
Khoa học dữ liệu đang dần khẳng định vai trò của mình trong việc cải thiện sức khỏe ngày nay. Big Data không chỉ được ứng dụng để xác định phương hướng điều trị mà giúp cải thiện quá trình chăm sóc sức khỏe. Từ khi Big Data được ứng dụng vào lĩnh vực chăm sóc sức khỏe, nó đã tạo nên nhiều tác động lớn trong việc giảm lãng phí tiền bạc và thời gian.

Xem thêm: Giải pháp Big data cho lĩnh vực y tế
Các công ty truyền thông và người hoạt động trong lĩnh vực giải trí cần thúc đẩy chuyển đổi kỹ thuật số để phân phối sản phẩm và nội dung của họ nhanh nhất có thể tại thị trường hiện tại.

Xem thêm: Giải pháp Big data cho lĩnh vực Truyền Thông và Giải Trí
Trở lại với chủ đề bài viết về thuật toán cây quyết định, ở bài viết trước đã giới thiệu đến các bạn tổng quan thế nào là Decision Tree, các công thức quan trọng để xác định cách phân nhánh tối ưu hay nói cách khác là đem lại kết quả phân loại (classification) chính xác dựa trên các thuộc tính dữ liệu và đặc biệt là thuật toán CART (classification and regression tree) sử dụng công thức “Goodness of Split”.

Xem thêm: THUẬT TOÁN CÂY QUYẾT ĐỊNH (P.2): CART (GINI INDEX)