5.2. Estonia
Estonia đã thực hiện dự án “nghiên cứu sử dụng dữ liệu di động trong lĩnh vực thống kê di cư”[1], nhằm mục đích cung cấp hiểu biết sâu sắc về mô hình di chuyển hiện tại của người dân tại các khu vực trong cả nước.
Nguồn dữ liệu
Nguồn dữ liệu phổ biến nhất cho các nghiên cứu liên quan đến di cư ở Estonia là dữ liệu từ các cuộc Tổng điều tra dân số. Tuy nhiên, trong bối cảnh tình hình xã hội thay đổi nhanh thì mô hình di cư với khoảng cách 10 năm giữa các cuộc Tổng điều điều tra là không phù hợp. Do đó, nguồn dữ liệu điện thoại di động đại diện cho một trong những nguồn dữ liệu mới thay thế cho dữ liệu Tổng điều tra đang được quan tâm tại Estonia.
Dự án sử dụng dữ liệu điện thoại di động được lưu trữ trong dữ liệu thanh toán của các nhà mạng (được gọi là dữ liệu vị trí điện thoại di động thụ động). Dữ liệu vị trí điện thoại thụ động bao gồm dữ liệu vị trí của mọi hoạt động cuộc gọi (cuộc gọi, SMS, data) trong mạng lưới của BTS. Dữ liệu được cung cấp bởi nhà điều hành điện thoại di động lớn nhất ở Estonia (EMT) và được thu thập bởi công ty Positium LBS trong khoảng thời gian từ tháng 1 năm 2007 đến tháng 12 năm 2009.
Dữ liệu thu thập bao gồm khoảng một phần ba dân số Estonia sử dụng điện thoại di động. Được thực hiện theo đúng quy trình thu thập dữ liệu di động
Ẩn danh dữ liệu được đảm bảo bởi:
(1) Dữ liệu thô được lưu trữ với định danh ẩn danh;
(2) Độ phân bố không gian không chính xác (khoảng sai số hàng trăm mét);
(3) Kết quả một phần được tính lại bởi các hệ số đặc biệt để đại diện cho toàn bộ dân số;
Phương pháp
Trong dự án, nhiệm vụ chính là việc xác định nơi ở và nơi làm việc trong quá trình xử lý dữ liệu vị trí điện thoại di động thụ động (tương ứng với các vị trí quan trọng vào ban đêm và ban ngày). Estonia sử dụng phương pháp thuật toán điểm neo dựa trên việc xác định các địa điểm thường xuyên truy cập vào thời gian ngày/đêm cụ thể. Sau khi xác định được các điểm neo là nhà và chỗ làm việc thì sẽ tạo ma trận OD (điểm đến gốc).

Hình 5.2.1. Mô hình nguyên lý thuật toán điểm neo (Nguồn:_https://www.tandfonline.com/doi/suppl/10.1080/17445647.2012.762331/suppl_file/tjom_a_762331_sm4552.pdf)
Mặt khác, sự phân bố dân cư ở Estonia không đồng đều giữa các khu vực. Do đó, kết quả tính toán được hiệu chỉnh với các hệ số đặc biệt cho mỗi khu vực để làm đại diện dữ liệu cho toàn bộ dân số.
Có hai quan điểm đo lường các mức độ chính xác không gian khác nhau: Trong mức độ thứ nhất ma trận OD, bản đồ được tính toán theo cấp độ đô thị (227 đô thị ở Estonia). Trong mức độ thứ hai ma trận OD được tính toán chi tiết không gian mạng lưới của BTS cụ thể được sử dụng (918 trạm BTS ở Estonia). Với mức độ một phù hợp với tính toán di cư theo ranh giới hành chính và thống kê chính thức. Với mức độ thứ hai cho phép phân tích mô hình di cư theo không gian thực tế rất chi tiết.
Kết quả dự án
Kết quả dự án đã lập được bản đồ di chuyển hàng ngày ở các đô thị tại Estonia. Bản đồ (1.2, 1.3a 1.3b) mô tả trực quan hóa thông tin được khai thác từ dữ liệu vị trí của điện thoại di động và bổ sung cho việc di chuyển dữ liệu từ điều tra dân số (Bản đồ 1.1)
Hình 5.2.2. Bản đồ thông tin các khu vực thành phố tại Estonia (Nguồn:_https://www.tandfonline.com/doi/suppl/10.1080/17445647.2012.762331/suppl_file/tjom_a_762331_sm4552.pdf)

Hình 5.2.3. Bản đồ dòng người di cư hàng ngày tại Estonia (Nguồn:_https://www.tandfonline.com/doi/suppl/10.1080/17445647.2012.762331/suppl_file/tjom_a_762331_sm4552.pdf)
Bản đồ 1.2 (Hình 5.2.3) thể hiện các dòng người di cư chính đại diện cho 50 người sử dụng điện thoại di động trở lên và có hơn 30% tổng dân số đi từ thành phố gốc (màu vàng cam). Trên bản đồ các thành phố trung tâm được xác định dựa trên mối quan hệ của các luồng di chuyển chính. Dựa vào tỷ lệ dân số cân bằng giữa ban ngày và ban đêm giúp xác định các thành phố đóng vai trò (điểm đến) định hướng di chuyển hàng ngày để đến làm việc hay đi du lịch. (Nếu Số dân ban ngày lớn hơn số dân ban đêm có màu xanh đậm và ngược lại có màu đỏ).
Hình 5.2.4. Bản đồ di cư tại các thành phố (dựa trên tỷ lệ cân bằng tương đối ) (Nguồn:_https://www.tandfonline.com/doi/suppl/10.1080/17445647.2012.762331/suppl_file/tjom_a_762331_sm4552.pdf)

Hình 5.2.5. Bản đồ di cư tại các thành phố (dựa trên tỷ lệ cân bằng tuyệt đối ) (Nguồn:_https://www.tandfonline.com/doi/suppl/10.1080/17445647.2012.762331/suppl_file/tjom_a_762331_sm4552.pdf)

Hình 5.2.6. Bản đồ di cư tại các thành phố giáp biên giới (https://www.tandfonline.com/doi/suppl/10.1080/17445647.2012.762331/suppl_file/tjom_a_762331_sm4552.pdf)
Bản đồ 1.3c (Hình 5.2.6) Mô tả di cư hàng ngày của người dân được thể hiện bằng tỷ lệ người đi lại qua biên giới của đô thị so với dân số ban đêm của đô thị.

Hình 5.2.7. Bản đồ chức năng di cư tại các thành phố ở Estonia (Nguồn:_https://www.tandfonline.com/doi/suppl/10.1080/17445647.2012.762331/suppl_file/tjom_a_762331_sm4552.pdf)
Bản đồ 1.4 (Hình 5.2.7) Bản đồ tổng hợp các bản đồ mô tả (1.2, 1.3a, 1.3b,1.3c).
Phương pháp để xác định thành phố trung tâm và phân loại đô thị được sử dụng.
- Bước 1: Xác định loại thành phố trung tâm.
Thành phố trung tâm là một thành phố đóng vai trò là điểm đến của luồng di chuyển chính cho ít nhất ba đô thị khác. Luồng di chuyển chính là luồng di chuyển lớn nhất từ thành phố cụ thể đến.
- Bước2: Xác định khu vực trung tâm có luồng di chuyển 30% (15%) được phân định cho mỗi đô thị.
Khu vực trung tâm của mỗi đô thị được xác định là luồng di chuyển có hơn 30% (15%) tỷ lệ người đi làm đến một đô thị cụ thể.
- Bước 3: Khu vực trung tâm được chia thành ba cấp độ (khu vực trung tâm của thành phố trung tâm, khu vực trung tâm của đô thị, khu vực trung tâm của quận) phụ thuộc theo số lượng đô thị trực thuộc và quy mô của khu vực trung tâm của quận.
Bản đồ 1.4 (Hình 5.2.7) có thể được so sánh trực tiếp với bản đồ được thực hiện bởi Tammaru (2001, 2005 ) dựa trên khảo sát với hơn 44000 người trả lời
Ngoài ra, để thực hiện được mô hình hoá dữ liệu thành bản đồ, thì số liệu để thực hiện được bổ sung bởi các bảng thể hiện dân số cơ bản và đặc điểm đi lại của các thành phố như bảng 1.1, bảng 1.2 và bảng 1.3
Hình 5.2.8. Bảng số liệu di cư hàng ngày ở các đô thị tại Estonia (Nguồn:_https://www.tandfonline.com/doi/suppl/10.1080/17445647.2012.762331/suppl_file/tjom_a_762331_sm4552.pdf)
Hình 5.2.9. Bảng số liệu di cư hàng ngày ở các thành phố trung tâm tại Estonia (Nguồn:_https://www.tandfonline.com/doi/suppl/10.1080/17445647.2012.762331/suppl_file/tjom_a_762331_sm4552.pdf)
Hình 5.2.10. Bảng số liệu di cư hàng ngày giữa các thành phố trung tâm tại Estonia
(Nguồn: https://www.tandfonline.com/doi/suppl/10.1080/17445647.2012.762331/suppl_file/tjom_a_762331_sm4552.pdf)
Từ bảng 1.3 (Hình 5.2.10) số liệu các luồng di chuyển hàng ngày lớn nhất, cũng như điểm xuất phát và điểm đến được trình bày trực quan hóa như trong (Hình 5.2.11)

Hình 5.2.11. Bản đồ trực quan hoá dòng người di cư tại các thành phố trung tâm ở Estonia
(Nguồn: https://www.tandfonline.com/doi/suppl/10.1080/17445647.2012.762331/suppl_file/tjom_a_762331_sm4552.pdf)
Bản đồ 2.1 (Hình 5.2.11) mô tả các vùng chức năng trong các bước tổng hợp khác nhau bằng phương pháp intramax dựa trên việc phân nhóm liên tục các khu vực và giảm thiểu di chuyển qua biên giới và tối đa hóa các di chuyển giữa các khu vực. Dữ liệu được xử lý bằng phần mềm tính toán Flowmap 7.4 (Breukelman, Brink, Jong, & Floor, 2009).

Hình 5.2.12. Bản đồ mạng lưới các trạm BTS tại Estonia
(Nguồn: https://www.tandfonline.com/doi/suppl/10.1080/17445647.2012.762331/suppl_file/tjom_a_762331_sm4552.pdf)
Nguồn dữ liệu CDR được thu thập từ (918 trạm BTS) của nhà mạng. Việc sử dụng các đơn vị không gian cho phép nắm bắt các mối liên kết tự nhiên giữa các khu vực cụ thể dựa trên di chuyển hàng ngày của người dân. Sau đó mô tả các khu vực di cư hàng ngày của người dân được thể hiện ở mức độ chi tiết.
Các luồng di chuyển ở cấp độ khu vực của trạm BTS cụ thể đã được kết nối vào mạng lưới đường giao thông để có bức tranh tổng thể chính xác hơn về mô hình quy mô di cư hàng ngày ở Estonia được thể hiện qua bản đồ (Bản đồ 2.2).

Hình 5.2.13. Bản đồ di cư hàng ngày tại các khu vực thành phố trung tâm ở Estonia
(Nguồn: https://www.tandfonline.com/doi/suppl/10.1080/17445647.2012.762331/suppl_file/tjom_a_762331_sm4552.pdf)
Các mức độ di cư trên đường bộ được mô hình hóa dựa trên dữ liệu dòng người di cư xuất phát từ vị trí trạm BTS của điện thoại di động. Điều này cho thấy tiềm năng rất lớn của dữ liệu di động nhằm dự báo quy mô di cư hàng ngày tại các thành phố ở Estonia.
Phần mềm
- Lưu trữ dữ liệu: được cung cấp bởi kết nối với nhà mạng MNO.
- Xử lý dữ liệu: MS Access và MS Excel
- Phân tích dữ liệu: phân định các vùng chức năng bằng phương pháp intramax và mô hình hóa các luồng di chuyển trong mạng lưới đường được thực hiện vơi phần mềm Flowmap 7.4
- Trực quan hóa dữ liệu: sử dụng ESRI ArcGIS 9.3 và Corel Draw 12.
Kết luận dự án:
Ưu điểm:
- Thông qua dự án nhận thấy rằng, Dữ liệu vị trí điện thoại di động là nguồn dữ liệu bổ sung đầy tiềm năng cho điều tra dân số. Tuy nhiên, không thể thay thế được điều tra dân số vì dữ liệu vị trí không có các thông tin biến nhân khẩu học.
- Dữ liệu vị trí của điện thoại di động có thể cung cấp thông tin đi lại cho phần lớn dân số theo thời gian và tần suất lặp lại gần như tự do quyết định.
- Khoảng cách thời gian giữa thời điểm khảo sát và thời điểm có sẵn của dữ liệu có thể được rút ngắn xuống chế độ gần như thời gian thực.
Hạn chế:
Các yếu tố chính hạn chế việc sử dụng dữ liệu vị trí điện thoại di động hiện nay là:
- Tính mới tuyệt đối và đặc tính rất cụ thể của dữ liệu
- Không có thông tin nhân khẩu học của người trả lời (ngoại trừ tuổi tác, giới tính và ngôn ngữ giao tiếp ưa thích nếu có của người dùng điện thoại di động)
- Vi phạm quyền riêng tư bảo mật thông tin người dùng từ các nhà mạng
- Khai thác dữ liệu phụ thuộc hoàn toàn vào các nhà mạng dịch vụ viễn thông.