Ứng dụng mô hình hồi quy Logistic dự báo ống bể trên hệ thống phân phối nước
Hiện tượng bể ống cấp nước thường xuyên xảy ra trên các hệ thống phân phối không
những gây nên những tổn thất về mặt kinh tế cho các công ty cấp nước mà còn là nguy cơ để các
chất ô nhiễm xâm nhập vào đường ống cấp nước. Một số mô hình đã được phát triển để xác định
khả năng xảy ra ống hỏng từ số liệu thống kê hoặc thực nghiệm, tuy nhiên đa số các mô hình đều
giới hạn cho vật liệu ống kim loại, trong khi số lượng ống nhựa như uPVC, HDPE được sử dụng
rất nhiều trên mạng lưới lại bị bỏ qua. Trong bài báo này sẽ đề xuất mô hình hồi quy logistics để
xác định mối liên quan giữa hiện tượng ống bể và các đặc điểm của đường ống trên mạng lưới
phân phối, từ đó đưa ra dự báo về xác suất bể ống cho tất cả các loại vật liệu ống dẫn trên mạng
lưới cấp nước. Kết quả của mô hình được kiểm chứng cho mạng lưới phân phối nước quận Hải
Châu thành phố Đà Nẵng.
Tóm tắt nội dung tài liệu: Ứng dụng mô hình hồi quy Logistic dự báo ống bể trên hệ thống phân phối nước
KHOA HỌC CÔNG NGHỆ TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ THỦY LỢI SỐ 39 - 2017 1 ỨNG DỤNG MÔ HÌNH HỒI QUY LOGISTIC DỰ BÁO ỐNG BỂ TRÊN HỆ THỐNG PHÂN PHỐI NƯỚC Phạm Thị Minh Lành ĐH Bách Khoa Tp. Hồ Chí Minh Phạm Hà Hải ĐH Kiến Trúc Tp. Hồ Chí Minh Vũ Thị Vân Anh ĐH Tài nguyên và Môi trường TPHCM Trương Thị Thu Hằng ĐH Thủy Lợi, số 2 Trường Sa Nguyễn Quang Trưởng và Lê Đình Hồng ĐH Bách Khoa Tp. Hồ Chí Minh Tóm tắt: Hiện tượng bể ống cấp nước thường xuyên xảy ra trên các hệ thống phân phối không những gây nên những tổn thất về mặt kinh tế cho các công ty cấp nước mà còn là nguy cơ để các chất ô nhiễm xâm nhập vào đường ống cấp nước. Một số mô hình đã được phát triển để xác định khả năng xảy ra ống hỏng từ số liệu thống kê hoặc thực nghiệm, tuy nhiên đa số các mô hình đều giới hạn cho vật liệu ống kim loại, trong khi số lượng ống nhựa như uPVC, HDPE được sử dụng rất nhiều trên mạng lưới lại bị bỏ qua. Trong bài báo này sẽ đề xuất mô hình hồi quy logistics để xác định mối liên quan giữa hiện tượng ống bể và các đặc điểm của đường ống trên mạng lưới phân phối, từ đó đưa ra dự báo về xác suất bể ống cho tất cả các loại vật liệu ống dẫn trên mạng lưới cấp nước. Kết quả của mô hình được kiểm chứng cho mạng lưới phân phối nước quận Hải Châu thành phố Đà Nẵng. Từ khóa: ống cấp nước; mô hình hồi quy logistic; hệ thống phân phối nước; phần mềm R. Abstract: Pipe failure phenomenon often have on water distribution systems, it is not only causes economic losses to water supply companies, but also the risk of pathogen contaminant intrusion into the pipe. Some models were applied to define probability of pipe failure by statistic data or experimental data, but most models are limited to metal materials, however the number of plastic as UPVC, HDPE is used popular on the network again ignored. In this paper, we propose a logistic regression model to determine the relationship between the likelihood of pipe failure and pipe characteristics on the water distribution systems for all pipe materials. Results of model will be apply for water distribution system in Hai Chau district, Da Nang city. Keywords: water supply pipe; Logistic Regression Model; water distribution systems; R software. 1. GIỚI THIỆU * Mỗi ngày, các công ty cấp nước đều ghi nhận các sự cố bể vỡ trên tuyến ống đặc biệt là các tuyến ống dịch vụ và vẫn tốn thêm chi phí để tìm rò bể trên các tuyến ống cấp I, II [1]. Đôi khi chi phí để sửa chữa đoạn ống nhiều lần sẽ cao hơn so với việc lắp đặt ống mới [2]. Bên Ngày nhận bài: 27/6/2017 Ngày thông qua phản biện: 22/7/2017 Ngày duyệt đăng: 28/7/2017 cạnh đó hoạt động sửa chữa cũng làm ảnh hưởng đáng kể đến chất lượng phục vụ của hệ thống, chưa kể đến khả năng làm gián đoạn giao thông của khu vực đặt ống. Để giảm thiểu chi phí quản lí đồng thời ngăn chặn nguy cơ lan truyền bệnh qua hệ thống phân phối nước, cần phải có một kế hoạch bảo dưỡng hợp lí và thay thế kịp thời các đường ống có nguy cơ giảm hiệu suất làm việc hay không còn khả năng phục vụ. Một trong những cơ sở quan trọng để xây dựng quy trình này là dự báo khả KHOA HỌC CÔNG NGHỆ TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ THỦY LỢI SỐ 39 - 2017 2 năng ống bể trên hệ thống phân phối nước. Vậy nên, nghiên cứu được thực hiện với các mục tiêu sau: - Đánh giá các yếu tố liên quan tới khả năng hỏng của ống dẫn nước cấp. - Đề xuất mô hình dự báo ống bể trên hệ thống phân phối. Nghiên cứu được giới hạn trong các nội dung sau: - Bỏ qua đặc điểm hình học của điểm bể (bể do vết nứt dọc, vết nứt vòng hay vết nứt ngang). - Ống dẫn làm việc trong điều kiện bình thường, không xét tới sự cố bất thường gây nên bể ống và các trường hợp bể tại phụ tùng đấu nối. - Khu vực áp dụng là dự báo khả năng ống hỏng trên mạng lưới cấp nước quận Hải Châu, thành phố Đà Nẵng. 2. TỔNG QUAN CÁC NGHIÊN CỨU Ống cấp nước bị bể là tập hợp của các yếu tố đã phân tích ở trên, để đánh giá mức độ ảnh hưởng của các yếu tố này bằng phương pháp thống kê tác giả thường sử dụng các mô hình số mũ, hồi quy tuyến tính, mô hình Bayesian, Poisson. Mỗi mô hình có một ưu điểm riêng và phù hợp với số liệu khảo sát. Nhận định ban đầu cho rằng khả năng ống hỏng phụ thuộc vào thời gian làm việc, tác giả [3] đã đưa ra mô hình số mũ để mô tả hiện tượng này và mô hình này tiếp tục được phát triển bởi Ossman năm 2011 [4], từ lịch sử bể ống để dự báo xác suất hỏng trong tương lai tuy nhiên dữ liệu khảo sát chưa đề cấp tới các yếu tố liên quan tới môi trường làm việc của ống như điều kiện áp suất, môi trường trong và ngoài ống. Một số nghiên cứu tiếp cận theo phương pháp mạng ANN để xác định hiệu suất làm việc của hệ thống cũng như tỉ lệ hỏng ống trong thời gian làm việc [5], ngoài ra còn đề xuất đưa phân tích phân tầng vào mô hình ANN để tăng hiệu suất mô hình [6], kết quả cho thấy tuổi ống ảnh hưởng đến điều kiện đánh giá là 20,95%, vật liệu là 17,49 % và tỉ lệ bể ống 13,13%, mục đích cung cấp nước của từng đoạn ống cũng được cho là ảnh hưởng tới khả năng bể ống là 2,85%. Một trong những nhược điểm của mô hình ANN là thời gian chạy mô hình lớn và chi phí cho khảo sát số liệu đầu vào khá cao, vậy nên mô hình mới chỉ đáp ứng cho nghiên cứu học thuật. Các mô hình hồi quy tuyến tính được áp dụng phổ biến cho dự báo khả năng làm việc của ống do nội dung phương pháp đơn giản và được Andreou,1987 đánh giá đạt kết quả chính xác đến 70% [7], đồng thời tác giả cũng nhận định ống hỏng phụ thuộc vào đường kính, vị trí đặt ống, nguyên nhân gây bể và không phụ thuộc vào độ tuổi. Những kết luận đánh giá về tỉ lệ bể bị ảnh hưởng bởi lần vỡ thứ hai cũng được đưa ra từ mô hình tuyến tinh, những ống bể sớm sau giai đoạn cài đặt sẽ có tỉ lệ nguy cơ cao hơn những ổng bể ở giai đoạn sau này [8]. So sánh hiệu quả các mô hình hồi quy tuyến tính, Poisson, số mũ tác giả [9] đề xuất mô hình số mũ thời gian và Poisson là mô hình dự báo chính xác nguy cơ bể, đặc biệt là đếm được số lần không bể. Đường kính ống , vật liệu, khu vực bao phủ là rừng, đất nông nghiêp, giao thông, và biến đo đếm được như nhiệt độ, lượng mưa, độ ẩm của đất là một trong nhưng nguyên nhân gây nên bể vỡ trong hệ thống. Nghiên cứu này lại đưa ra kết luận khác với tác giả [8]: tỉ lệ bể vỡ tăng theo thời gian tính từ lần bể cuối cùng. Hồi quy Bayesian là mô hình mới được áp dùng trong các nghiên cứu gần đây, với những ưu điểm của mô hình đã giúp bài toán có kết quả chính xác hơn các phương pháp trước. Đánh giá các yếu ảnh hưởng là các biến không chắc chắn [10] chạy mô hình tính được hệ số ảnh hưởng của điều kiện ống và môi trường xung quanh cho từng loại vật liệu. Kết quả cho thấy ảnh hưởng của các tính chất vật lí ống KHOA HỌC CÔNG NGHỆ TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ THỦY LỢI SỐ 39 - 2017 3 dẫn quan trọng hơn tác động của môi trường đặt ống, đặc biệt các vật liệu CI và DI có khả năng bể cao hơn do tác động của nhiệt độ và lượng mưa. Phân tích các nghiên cứu trước đây, đề tài đưa ra một số kết luận sau: - Để xác định được tỉ lệ ăn mòn trên các ống thực tế rất khó thực hiện nên các nghiên cứu hiện nay mới dừng ở hai vật liệu là ống gang và ống thép. Bên cạnh đó, đa số các đường ống cấp nước được chôn dưới mặt đất nên chi phí lấy mẫu sẽ rất tốn kém, các mẫu ống thường chỉ khảo sát trên một tuyến đường như vậy tính chất đại diện của mẫu nghiên cứu chưa cao. Vậy nên các kết luận về bể vỡ ống do ăn mòn hay không phải do ăn mòn cần phải được nghiên cứu nhiều hơn trong tương lai. - Thông số đại diện cho ăn mòn là độ tuổi ống dẫn và đã được chứng minh là có mối tương quan giữa tuổi bể vỡ và khả năng xuất hiện bể ống, không những thế những ống bể sớm thì tuổi thọ ống dẫn sẽ ngắn hơn những ống bể muộn hơn. Yếu tố vật liệu ống, môi trường làm việc và vị trí đặt quan trọng hơn là độ tuổi khi xem xét khả năng bể vỡ. - Đường kính ống dẫn là một trong những thông tin đáng tin cậy để dự báo khả năng bể vỡ, các tác giả cho thấy tỉ lệ ống hỏng tăng theo đường kính với những ống có đường kính nhỏ 300mm, tuy nhiên kết quả này được lưu ý là còn phụ thuộc vào diện tích thành phố khảo sát. Áp suất làm việc trong ống cũng cần xem xét cụ thể hơn về mức độ ảnh hưởng tới khả năng ống bể. Cải thiện kết quả của các nghiên cứu trước đây và phát triển mô hình dự báo ống bể trong điều kiện Việt Nam, tác giả đặt ra nội dung chính cần nghiên cứu như sau: Nội dung 1: mức độ ảnh hưởng của các yếu tố tới sự kiện ống hỏng trên hệ thống cấp nước và trong các yếu tố đó thì yếu tố nào ảnh hưởng nhiều nhất tới sự kiện ống hỏng. Nội dung 2: Dự báo xác suất hỏng của ống (P) làm việc trong môi trường thực tế. Nghiên cứu được thực hiện qua các bước như hình 1. Nội dung nghiên cứu sẽ tập trung nhiều hơn tới đặc điểm hình học của mạng lưới ống dẫn cũng như vị trí tuyến đường đặt ống, tổng chiều dài trong một DMA của mạng. Hình 1. Nội dung nghiên cứu dự báo ống hỏng trên HTPPN Hệ thống cấp nước của Việt Nam bắt đầu số hóa khoảng từ năm 2013 và vẫn đang trong giai đoạn hoàn chỉnh, đồng bộ hóa thông tin, vậy nên trong quá trình thu thập dữ liệu có những số liệu không có khả năng thu thập cũng như thời gian thực hiện không cho phép nên giới hạn đề tài đặt ra là phân tích trên những số liệu thu thập được từ hệ thống thông tin GIS của hệ thống cấp nước. Vì vậy kết quả của đề tài có thể không đánh giá chi tiết được các điều kiện liên quan như chỉ số dẫn điện, độ ẩm của môi trường đất bên ngoài hay chỉ số oxy hóa tan của nước trong đường ống, giá trị lực tác dụng từ nền đường cho từng đoạn ống. Tuy nhiên mô hình đề xuất trong nghiên cứu lại có tính áp dụng thực tế tốt hơn, từ những dữ liệu GIS của công ty cấp nước hoàn toàn có thể ước lượng khả năng ống bể mà không phải Phân tích điều kiện ống cấp nước Kiểm chứng mô hình Mô hình dự báo ống bể Kết luận Các yếu tố liên quan tới xác suất bể ống cấp nước Kiểm định mô hình Mô tả số liệu Áp dụng mô hình Mô hình hồi quy logistic KHOA HỌC CÔNG NGHỆ TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ THỦY LỢI SỐ 39 - 2017 4 thu thập hay khảo sát cụ thể từng vị trí đặt ống trên mạng lưới. Các yếu tố ảnh hưởng tới ống hỏng được xem xét trong đề tài bao gồm các đặc trưng vật lí của hệ thống (D, L, Mat), chỉ số độ tuổi (A) đại diện cho tỉ lệ ăn mòn và giá trị áp suất trung bình làm việc của ống (P). Ngoài ra các đại lượng đặc trưng cho đặc điểm hình học của mạng lưới bao gồm vị trí tuyến đường đặt ống (R), số đoạn ống kết nối trên một tuyến ống (N0), tổng chiều dài ống trong một DMA và số lần bể vỡ trước đây (Prior) cũng được khảo sát để đưa vào mô hình thống kê. Độ tuổi ống dẫn (A) Tuổi ống không phải là yếu tố ảnh hưởng trực tiếp tới nguy cơ ống bể nhưng là giá trị hiển thị dễ nhất để nhận biết khả năng làm việc của ống. Với cùng một độ tuổi nhưng điều kiện vật lí khác nhau và môi trường làm việc khác nhau thì xác suất xẩy ra ống hỏng cũng không giống nhau. Nhưng nếu dùng độ tuổi để xem xét thời điểm xảy ra bể vỡ nhiều đột ngột trong một giai đoạn nhất định thì cũng có thể phát hiện ra những yếu tố ảnh hưởng đặc biệt hoặc dự báo một sự kiện bất thường trong tương lai. Vậy nên cần thiết phải đưa biến độ tuổi vào trong dữ liệu khảo sát. Số lượng nút đấu nối t rên một t uyến ống dẫn (N0) Tổn thất cục bộ xuất hiện tại các vị trí chuyển hướng nước chảy và tổn thất này thường được bỏ qua trên mạng lưới đường ống dẫn nước và trong tính toán cũng cho thấy giá trị này không làm ảnh hưởng nhiều tới áp lực làm việc trên đường ống. Tuy nhiên nếu xét về mặt xáo trộn dòng chảy trong ống thì qua mỗi nút dòng chảy có sự xáo trộn nhất định. Nếu đánh giá tỉ lệ ăn mòn bề mặt trong của ống dẫn ngoài tác động của nồng độ hóa học và tính chất vật lý của nước thì xáo trộn dòng chảy giúp hóa chất được trộn đều hơn trên đường ống và giảm hiện tượng lắng cặn. Vậy nên số lượng điểm đấu nối trên một tuyến ống cũng ảnh hưởng tới sự kiện ống hỏng. Vật liệu ống dẫn (Mat) Tính chất cơ học của vật liệu là khác nhau, vật liệu kim loại được cho là dễ ăn mòn hơn trong môi trường ẩm ướt trong khi vật liệu nhựa lại dễ bị lão hóa và khả năng chịu tải được cho là kém hơn [20]. Trong mạng lưới phân phối nước đô thị, những ống truyền tải thường sử dụng vật liệu kim loại như SS, ST đặc biệt là vật liệu gang xám (CI) trong thời gian trước đây được sử dụng phổ biến, nên đa số các nghiên cứu bể ống hiện nay cũng tập trung xem xét vật liệu này. Tuy nhiên, nghiên cứu ống hỏng cần có dự báo rộng hơn trong tương lai nên hướng tiếp cận cần đa dạng hơn cho tất cả các loại vật liệu. Trong nghiên cứu này, các vật liệu trong số liệu thống kê đều được xem xét, bao gồm SS, ST, DI, CI, uPVC, HDPE và cả những ống AC (xi măng amiăng). Đường kính ống dẫn D(mm) Là đại lượng đặc trưng cho cho khả năng vận chuyển nước của đường ống, với nhận định ban đầu cho thấy xác suất ống hỏng sẽ giảm khi đường kính ống tăng. Theo yêu cầu sản xuất, chiều dày thành ống cũng tăng theo độ lớn của đường kính. Áp lực làm việc trung bình trong DMA (m) Áp lực làm việc thay đổi theo cấp ống phân phối và thời gian làm việc, không những thế áp lực ống dẫn cũng có thể thay đổi khi xảy ra áp va hoặc khu vực lắp đặt sửa chữa ống thường xuyên. Ngoài lực tác động lên thành ống, giá trị áp lực nước trong ống dẫn còn làm ảnh hưởng tới mức độ xáo trộn hóa chất và lắng cặn. Áp lực yếu hoặc bằng 0 sẽ tạo điều kiện cho cặn bám dính vào thành ống làm giảm khả năng làm việc, khi áp lực dao động lại gây nên hiện tượng bào mòn vật liệu ống [17]. Quá trình lặp lại nhiều lần theo thời gian làm bề mặt ống dẫn không còn trơn nhẵn như lúc mới lắp đặt, một số vị trí bị lồi do lắng cặn, một số vị trị khác lại bị bào mòn. Bề mặt vật liệu KHOA HỌC CÔNG NGHỆ TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ THỦY LỢI SỐ 39 - 2017 5 ngày càng khả năng chịu tải khả năng bể ống Chiều dài ống dẫn L(km) Có nhiều quan điểm khác nhau khi dự báo xác suất hỏng theo chiều dài ống, nghiên cứu gần đây nhất cho rằng ống hỏng tăng khi chiều dài giảm nhưng có nghiên cứu lại cho rằng ống hỏng không tăng theo chiều dài mà tăng theo chiều dài bình phương. Trên phương diện thủy lực cho thấy, dọc theo chiều dài đường ống áp lực dòng chảy trong ống giảm dần như vậy nguy cơ hỏng ống do tải trọng nước bên trong ống cũng giảm. Tuy nhiên nếu xét tới các tác động từ bên ngoài thì đoạn ống càng ngắn, ngoại lực tác dụng lên thành ống càng nhỏ khi đó nguy cơ ống hỏng lại tỉ lệ thuận với chiều dài. Tuyến đường đặt ống R Mỗi tuyến đường đặt ống là một đại lượng đặc trưng cho môi trường đất xung quanh ống cũng như tải trọng tác dụng bên ngoài ống dẫn nước. Tổng chiều dài đường ống trong một DMA Mỗi DMA đặc trưng cho số lượng đối tượng phục vụ và khoanh vùng khu vực thủy lực, từ đó được sử dụng để kiểm soát rò rỉ trên hệ thống phân phối. Quy mô của mỗi DMA sẽ quyết định công suất phục vụ của từng đường ống, với cùng một loại đường kính và chiều dài ống nhưng số lượng đối tượng đấu nối nhiều thì chế độ thủy lực trên đường ống sẽ t ... ến đường được đặt ống lấy từ dữ liệu GIS của công ty. - Mat là vật liệu ống dẫn, bao gồm AC, CI, DI, HDPE, SS, ST và uPVC - D là đường kính ống dẫn. Đề tài tập trung nghiên cứu các đường ống có đường kính D≥100mm vì số liệu bể vỡ ghi nhận trên các ống có đường kính nhỏ hơn đa số là do khách hàng hoặc các công trình thi công gần tuyến ống. - P là giá trị áp lực trung bình làm việc của đoạn ống được nội suy từ dữ liệu cảm biến áp lực trên mạng lưới. - Cột Prior ghi nhận nếu ống hỏng lần thứ nhất là No, nếu ống hỏng lần thứ 2 thì lịch sử bể vỡ Prior=1st tương tự cho ống hỏng lần thứ 3 thì Prior=2nd. Số liệu khảo sát ống hỏng được ghi nhận trong 7 năm từ cuối năm 2010 đến tháng 4 năm 2016 cho thấy tỉ lệ ống bể trung bình của các loại vật liệu có sự khác nhau như Hình 3. Qua biểu đồ thống kê tỉ lệ bể vỡ qua các năm cho thấy giá trị này có xu thế giảm theo từng loại vật liệu ống, trong đó ống AC có tỉ lệ bể vỡ lớn nhất còn ống CI lại có số lượng bể vỡ trên mạng lưới nhỏ nhất. Số lần hỏng ống ghi nhận được trên mạng lưới lớn nhất là ống uPVC (79 lần bể trong 6 năm) tuy nhiên do tổng chiều dài vật liệu uPVC là lớn nhất trên mạng lưới nên tỉ lệ bể đối với vật liệu này chỉ đứng thứ 3, số liệu bể không được ghi nhận trên ống sắt SS. Các nghiên cứu trước đây cho thấy ống có vật liệu DI có khả năng bể cao hơn các vật liệu khác và kết luận này cũng đúng cho dữ liệu quận Hải Châu, Đà Nẵng. KHOA HỌC CÔNG NGHỆ TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ THỦY LỢI SỐ 39 - 2017 8 Hình 3.Thống kê số lần bể vỡ theo chiều dài ống trên mạng lưới Từ số liệu thống kê, so sánh độ tuổi ống dẫn trong nhóm hỏng và không hỏng Hình 4 cho thấy tuổi ống trong nhóm hỏng (F=1) nhỏ hơn nhóm không hỏng (F=0), số liệu F=1 có phần diện tích 25% phía dưới trung vị lớn hơn, điều này chứng tỏ xu hướng ống hỏng ở độ tuổi trẻ nhiều hơn độ tuổi già, còn trong tập F=0 thì trung vị chia hai phần tương đối đồng đều. Số liệu ống không hỏng của quận HC xuất hiện hai giá giới hạn hộp không nằm trong giới hạn hộp, để xem xét hai giá trị này có phải giá trị ngoại vi (Outlier) hay không cần kiểm định số liệu để biết rõ hơn. Hình 4. Biểu đồ so sánh độ tuổi (A) ống hỏng và không hỏng Hình 5. Biểu đồ quan hệ giữa A~Mat quận HC Những ống có thời gian làm việc lâu nhất so với các ống khác trên mạng lưới là vật liệu uPVC (HC:17,42. Được cho là vật liệu có độ bền cao và linh hoạt trong quá trình thi công lắp đặt, HDPE mới được đưa vào sử dụng phổ biến trong những năm gần đây, nhưng số liệu khảo sát lại cho thấy tuổi ống nhỏ nhất (0,36 tuổi) lại xuất hiện trên vật liệu này, bên cạnh đó xét tổng quát thì thời gian làm việc thực tế của ống cũng nhỏ hơn các vật liệu khác. Một phần nguyên nhân là do kĩ thuật thi công mối hàn không đúng kết hợp với tải trọng khu vực đặt ống và môi trường đất gây nên bể ống. Số liệu bể cũng không tuyến tính với chiều dài mạng lưới, năm 2012 tỉ lệ bể vỡ ống tăng đột biến, nhưng đến năm 2015 lại giảm xuống mức thấp nhất trong các năm. Lượng ống bể giảm do mạng lưới được cải thiện về công nghệ cũng như phương pháp quản lí. Tuổi ống khảo sát lớn nhất tại quận HC là 36,5 tuổi và nhỏ nhất là 0,36 tuổi trong đó tuổi hỏng ống trung bình khoảng 10 tuổi. Biểu đồ phân bố mật độ dùng để đo tần số xuất hiện của một biến số từ đó thấy rõ sự thay đổi hay biến động của dữ liệu, qua đó có thể phát hiện sai sót trong số liệu đầu vào. Hình 6 cho thấy số lượng ống bể giảm từ đường kính 100- KHOA HỌC CÔNG NGHỆ TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ THỦY LỢI SỐ 39 - 2017 9 200 mm nhưng lại tăng ở D300mm. Kiểm chứng mô hình hồi quy logistic Sử dụng hàm glm trong phần mềm R để phân tích số liệu ống hỏng và không hỏng. Nghiên cứu tiến hành phân tích hai biến đại diện cho biến liên tục là độ tuổi (A) của ống dẫn và biến chữ (Mat) là vật liệu ống để phân tích ý nghĩa kết quả của mô hình đề xuất, sau đó ứng dụng mô hình hồi quy logistic cho tổ hợp các yếu tố ảnh hưởng và dự báo xác suất hỏng cho từng ống trong tập số liệu. Hình 6. Biểu đồ phân bố các yếu tố của hệ thống cấp nước Hải Châu Phân tích mức độ ảnh hưởng của biến tuổi thọ đến nguy cơ hỏng ống Với F=0 thì độ tuổi ống dẫn được tính đến thời điểm khảo sát, số liệu ống hỏng F=1 thì độ tuổi A được ghi nhận tại thời điểm ống hỏng. Xem xét tương quan giữa biến F và A trong mô hình hồi quy logistic có kết quả như Bảng 2. Như vậy, khi độ tuổi tăng một độ lệch chuẩn thì khả năng ống bể ống giảm 37%. Qua mô hình có thể biểu diễn mối tương quan giữa tuổi ống và nguy cơ ống hỏng theo phương trình sau: Logit(p) =-1,47 - 0,16.(A) Vậy -1,47-0,16( )1,47-0,16( )1 Ae p Ae Theo đó, khi A=5 thì p=0,094 và A= 5 - sd(A)= 0,48 (giảm 1 độ lệch chuẩn) thì p=0,18 vậy xác suất hỏng ống tăng 0,48/0,094 = 5,13%. Bảng 2. Kết quả mô hình logistic F~A Deviance Residuals: Min 1Q Median 3Q Max -0.6242 -0.3768 -0.2872 -0.2271 2.9428 Coefficients: Estimate Std. Error z value Pr(>|z| ) (Intercept) -1.47323 0.21103 -6.981 2.93e-12 *** KHOA HỌC CÔNG NGHỆ TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ THỦY LỢI SỐ 39 - 2017 10 A -0.16324 0.02471 -6.605 3.97e-11 *** --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 (Dispersion parameter for binomial family taken to be 1) Null deviance: 809.40 on 1978 degrees of freedom Residual deviance: 762.47 on 1977 degrees of freedom AIC: 766.47 Number of Fisher Scoring iterations: 6 Phân tích mức độ ảnh hưởng của biến vật liệu đến nguy cơ hỏng ống Xem xét ảnh hưởng của vật liệu tới khả năng bể ống cấp nước được thực hiện và cho kết quả như Bảng 3. Bảng 3. Kết quả mô hình logistic F~Mat Deviance Residuals: Min 1Q Median 3Q Max -0.6039 -0.3686 -0.3686 -0.2126 3.0214 Coefficients: Estimate Std. Error z value Pr(>|z| ) (Intercept) -1.6094 0.7746 -2.078 0.0377 MatCI -0.6371 0.8370 -0.761 0.4466 MatDI -2.1691 0.8531 -2.542 0.0110 MatHDPE -1.3381 0.8136 -1.645 0.1000 MatSS -12.9566 624.1943 -0.021 0.9834 MatST -2.9444 1.0513 -2.801 0.0051 MatuPVC -1.0454 0.7855 -1.331 0.1832 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 (Dispersion parameter for binomial family taken to be 1) Null deviance: 809.40 on 1978 degrees of freedom Residual deviance: 782.16 on 1972 degrees of freedom AIC: 796.16 Number of Fisher Scoring iterations: 13 Chỉ số Pr >0.05 chỉ ra rằng sự khác biệt về nguy cơ bể vỡ ống của vật liệu CI, HDPE, SS và uPVC so với vật liệu AC. Tương tự như biến độ tuổi thì biến vật liệu cũng có quan hệ nghịch biến với khả năng bể vỡ ống. Mô hình so sánh khả năng hỏng của các loại vật liệu thấp hơn (∆P) so với vật liệu AC bao nhiêu phần trăm, có thể tóm tắt kết quả trong bảng 4. Bảng 4. Mô hình hồi quy logistic quận Hải Châu Mat Ước lượng hồi quy (β$) µ 1 -P e CI -0.6371 47.12% DI -2.1691 88.57% HDPE -1.3381 73.77% SS -12.9566 100% ST -2.9444 94.74% uPVC -1.0454 64.84% Phân tích tổng hợp ảnh hưởng của các biến đến nguy cơ hỏng ống Ống hỏng là tổng hợp của nhiều yếu tố tác động nên không chỉ đánh giá tác động riêng lẻ của từng yếu tố mà cần một đánh giá tổng hợp để xem xét vấn đề toàn diện hơn. Kết quả chạy mô hình hồi quy logistic cho biến phụ thuộc F và các biến độc lập được thể hiện trong Hình 7. Kết quả cho thấy độ lệch ước số hồi quy của biến Prior và N0 nhiều nhất và chỉ số ống hỏng tuyến tính với P, La là khác nhau. Tuy nhiên để đưa ra mức độ ảnh hưởng cụ thể của các biến số này tương đối phức tạp, cần có một phương pháp tốt hơn để đánh giá khả năng ống hỏng do yếu tố nào là chính, yếu tố nào là phụ. Phương trình hồi quy cho quận Hải Châu được viết như sau: F=18,13 + 0,0002.R + 0,002.D + 0,018.N0 + 0,34P + 1,37L - 0,22A - 0,08.La - 20,55.Prior(No/1st) - 1,28.Prior(2nd/1st) - 0,95.Prior(3rd/1st) - 0,76.Prior(4th/1st) - 0,72.Prior(5th/1st) - 0,39.Prior(6th/1st) - 16,30.Mat(SS/AC)- 2,15.Mat(ST/AC) - 2,072,15.Mat(DI/AC) - 2,15.Mat(HDPE/AC) - 0,712,15.Mat(uPVC/AC) - 0,522,15.Mat(CI/AC) Áp dụng phương trình hồi quy cho các số liệu khảo sát để dự báo khả năng xảy ra ống hỏng KHOA HỌC CÔNG NGHỆ TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ THỦY LỢI SỐ 39 - 2017 11 trên mạng lưới cấp nước, từ đó so sánh với số liệu hỏng thực tế để kiểm chứng hiệu quả của mô hình đề xuất. Dùng lệnh predict trong R cho mô hình hồi quy, kết quả dự báo hỏng cho từng đoạn ống như Hình 8. Xác suất dự báo ống hỏng được tính cho từng số liệu trong dữ liệu khảo sát và dao động từ 0%-100%, kết quả được thể hiện trong Hình 8, khả năng ống hỏng sẽ giảm trên các tuyến dài có số lượng điểm đấu nối ít. Xác suất xuất hiện hỏng ống tập trung tại các ống có đường kính nhỏ hơn hoặc bằng 400mm, cũng có một vài giá trị xuất hiện ở cỡ đường kính lớn nhưng đa số nguy cơ ống hỏng <50% (tính đến thời điểm khảo sát). Ước số hồi quy µ 0 Ước số hồi quy µ 0 Hình 7. Biểu đồ so sánh ước số hồi quy của các yếu tố Hình 8. Xác suất dự báo ống hỏng theo NO và D KHOA HỌC CÔNG NGHỆ TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ THỦY LỢI SỐ 39 - 2017 12 Kiểm tra sự phù hợp giữa kết quả mô hình và số liệu thực tế Bảng 5. Kết quả kiểm tra hỗn hợp xác suất ống hỏng dự báo và thực tế Quận Hải Châu Dữ liệu thực tế Ống không hỏng (0) Ống hỏng(1) Mô hình dự báo Ống không hỏng (0) 1871 73 Ống hỏng (1) 5 30 Trong số ống hỏng dự báo bằng mô hình hồi quy logistic thì bao nhiêu ống hỏng thật ở ngoài thực tế và bao nhiêu ống không hỏng lại được mô hình dự báo là hỏng, vấn đề này cần phải được kiểm tra để đánh giá hiệu suất của mô hình dự báo. Giới hạn được cho là mô hình dự báo chính xác là Pf = 50%, kết quả được thể hình trong Bảng 5. Mô hình dựa báo cho quận Hải Châu có 1871 ống không hỏng và dữ liệu thực tế cũng cho thấy các ống này không hỏng, có 5 ống không hỏng nhưng mô hình lại dự báo ống hỏng, dự báo sai 0,27%. Các số liệu dự báo sai này của mô hình có được chấp nhận hay không sẽ được xác định theo hai tiêu chí là đường cong ROC (Receiver Operating Characteristic Curve) và chỉ số AUC. Đường cong ROC là đường cong thể hiện độ nhạy (sensitivity) và độ đặc hiệu (specificity) của kết quả dự báo, một dự báo tốt khi diện tích dưới đường cong là lớn nhất. Chỉ số AUC (Area Under the Curve) là một giá trị biểu diễn diện tích dưới đường cong ROC được sử dụng để đánh giá phân định giữa giá trị ống hỏng và không hỏng. Giá trị này được đánh giá theo giới hạn từ 0,5-1 như Bảng 6. AUC được tính toán bằng hàm auc trong phần mềm R cho thấy kết quả dự báo ống hỏng cho quận Hải Châu được chấp nhận ở mức độ tốt. Qua đó cho thấy mô hình hồi quy logistics áp dụng cho dự báo ống hỏng trên hệ thống phân phối là phù hợp. Hình 8. Đường cong ROC cho HTTPN Hải Châu Bảng 6. Diện tích dưới đường cong(AUC) để đánh giá hiệu suất của mô hình AUC Ý nghĩa diễn giải AUC. HC >0,9 Rất tốt 0,8-0,9 Tốt 0.8843 0,7-0,8 Trung bình 0,6-0,7 Không tốt 0,5-0,6 Kết quả không sử dụng được KHOA HỌC CÔNG NGHỆ TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ THỦY LỢI SỐ 39 - 2017 13 KẾT LUẬN Mô hình dự báo sử dụng cho tập số liệu quận Hải Châu cho thấy các biến liên quan tới bể ống bao gồm độ tuổi (A), vật liệu (Mat), đường kính (D), chiều dài ống trong một DMA (La), lịch sử bể vỡ (Prior), chiều dài ống dẫn (L), áp lực làm việc trung bình của từng đoạn ống (P) và số điểm đấu nối trên một tuyến (N0). Mô hình hồi quy logistic áp dụng cho biến F với hai giá trị 1(hỏng) và 0(không hỏng) đã đưa ra mối quan hệ tuyến tính của biến này với các biến còn lại. Quan hệ này đồng biến với thông số chiều dài, áp lực làm việc, đường kính, vị trí đặt ống, số điểm đấu nối trên tuyến ống, tổng chiều dài ống trong một DMA và nghịch biến với các giá trị còn lại. Từ đó xác định xác suất xảy ra hỏng ống trên mô hình, các giá trị dự báo được so sánh với số liệu thực tế cho thấy dự báo đúng 70%-84%. Đề tài đã đưa ra kết quả dự báo ống hỏng theo dữ liệu khảo sát thực và kiểm chứng độ chính xác bằng đường cong ROC và tiêu chuẩn AUC, mô hình logistic cho kết quả nằm trong giới hạn tốt Để giảm khả năng ống bể cần tác động tới yếu tố độ tuổi, chiều dài ống, tổng chiều dài trong mộ DMA và áp lực làm việc. Với những ống đã bể vỡ trong lịch sử thì cần thiết phải xem xét phương án thay thế mới trong các lần hỏng sau vì giá trị này có ảnh hưởng lớn nhất đến khả năng xảy ra bể ống. Sử dụng số liệu thống kê thu thập được từ GIS của mạng lưới cấp nước quận Hải Châu, áp dụng mô hình dự báo nghiên cứu đã đề xuất được mối quan hệ giữa các thông số trong điều kiện làm việc của ống và sự cố ống hỏng. Tuy nhiên, do hạn chế trong quá trình thu thập thông tin nên các biến độc lập chưa mô tả hết được các yếu tố liên quan đến biến phụ thuộc như các tải trọng xe chạy trên đường là bao nhiêu thì ảnh hưởng tới xác suất ống hỏng hay chỉ số về điều kiện địa chất thủy văn tại từng vị trí đặt ống. Bên cạnh đó mô hình cũng không đánh giá cụ thể chiều dày còn lại hay tỉ lệ ăn mòn của từng đoạn ống theo độ tuổi vì giá trị này không có số liệu khảo sát thực tế. TÀI LIỆU THAM KHẢO [1] A. Wood and B. J. Lence, “Using Water Main Break Data to Improve Asset Management for Small and Medium Utilities: District of Maple Ridge, B.C.,” J. Infrastruct. Syst., vol. 15, no. 2, pp. 111–119, 2009. [2] T. M. W. A. Pelliccia, “Water main repair/replacement for Binghamton,N. Y.,” Vicksburg,Miss.39180, 1981. [3] N. S. Bubbis, “Maintenance and Operating Problems of Winnipeg,” J. Am. Water Work. Assoc., vol. 41, no. 5, pp. 429–436, 1948. [4] H. O. and K. Bainbridge, “Comparison of Statistical Deterioration Models for Water Distribution Networks,” J. Perform. Constr. Facil., vol. 25, no. May, pp. 259–266, 2011. [5] H. Al-barqawi and T. Zayed, “Infrastructure Management : Integrated AHP / ANN Model to Evaluate Municipal Water Mains ’ Performance,” no. December, pp. 305–318, 2008. [6] D.Achim;F. Ghotb; and K. J. McManus, “Prediction of water pipe asset life using neural networks,” J. Infrastruct. Syst., vol. 13, no. 1, pp. 26–30, 2007. KHOA HỌC CÔNG NGHỆ TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ THỦY LỢI SỐ 39 - 2017 14 [7] T. Wengström, “Comparative analysis of Pipe Break Rates A Literature review,” Chalmers Univ. Technol., 1993. [8] B. I. C. Goulter, “Analysis of water distribution pipe failure type in Winnipeg, Cananda,” J. Transp. Eng., vol. 115, no. 2, pp. 95–111, 1989. [9] S. Yamijala, “Statisticcal estimation of water distribution system pipe break risk,” Texas A&M University, 2007. [10] G. Kabir, S. Tesfamariam, and R. Sadiq, “Bayesian Model Averaging for the Prediction of Water Main Failure for Small to Large Candian Municialities,” Can. J. Civ. Eng., vol. 43, no. 3, pp. 233–240, 2016. [11] R. I. Gentleman, “R-paper.pdf,” J. Comput. Graph. Statastics, vol. 5, no. 3, pp. 299– 314, 1996. [12] G. Kabir, S. Tesfamariam, J. Loeppky, and R. Sadiq, “Integrating Bayesian Linear Regression with Ordered Weighted Averaging: Uncertainty Analysis for Predicting Water Main Failures,” ASCE-ASME J. Risk Uncertain. Eng. Syst. Part A Civ. Eng., vol. 1, no. 3, p. 4015007, 2015.
File đính kèm:
- ung_dung_mo_hinh_hoi_quy_logistic_du_bao_ong_be_tren_he_thon.pdf