Để đơn giản hóa dữ liệu tuổi, nhà khoa học dữ liệu đã sử dụng phân nhóm dữ liệu, gom tất cả khách hàng từ 20 đến 30 tuổi vào một nhóm duy nhất và thay thế bằng giá trị đại diện là 25 (điểm giữa).
Sau khi giải trình tự DNA môi trường, nhà nghiên cứu đã sử dụng phương pháp phân nhóm để gộp các đoạn đọc tương tự vào các nhóm phân loại như vi khuẩn, nấm và cổ khuẩn.
Hình ảnh mờ nhạt đã được cải thiện đáng kể nhờ sử dụng kỹ thuật gộp bin trong quá trình đọc dữ liệu, giúp kết hợp điện tích từ các điểm ảnh lân cận một cách hiệu quả.