
Phân nhóm, rời rạc hóa dữ liệu.
Để đơn giản hóa dữ liệu tuổi, nhà khoa học dữ liệu đã sử dụng phân nhóm dữ liệu, gom tất cả khách hàng từ 20 đến 30 tuổi vào một nhóm duy nhất và thay thế bằng giá trị đại diện là 25 (điểm giữa).


Để đơn giản hóa dữ liệu tuổi, nhà khoa học dữ liệu đã sử dụng phân nhóm dữ liệu, gom tất cả khách hàng từ 20 đến 30 tuổi vào một nhóm duy nhất và thay thế bằng giá trị đại diện là 25 (điểm giữa).

Sau khi giải trình tự DNA môi trường, nhà nghiên cứu đã sử dụng phương pháp phân nhóm để gộp các đoạn đọc tương tự vào các nhóm phân loại như vi khuẩn, nấm và cổ khuẩn.












