Xây dựng hệ thống thông minh hiểu biết môi trường xung quanh ứng dụng cho xe tự hành ngoài trời

Nhóm nghiên cứu do Cơ quan chủ trì Đại học Quảng Bình cùng phối hợp với Chủ nhiệm đề tài Hoàng Văn Dũng thực hiện Đề tài “Xây dựng hệ thống thông minh hiểu biết môi trường xung quanh ứng dụng cho xe tự hành ngoài trời”, với mục tiêu nghiên cứu các kỹ thuật phân tích hình ảnh và các dữ liệu liên quan, các kỹ thuật trí tuệ nhân tạo nhằm đề xuất giải pháp xử lý ước lượng chuyển động, nhận dạng hiểu biết môi trường xung quanh hỗ trợ trong hệ thống giao thông thông minh, đặc biệt là các hệ thống xe tự hành ngoài trời.

Một số mục tiêu cụ thể của đề tài nghiên cứu như sau: Nghiên cứu giải pháp kết hợp dữ liệu thu nhận từ camera truyền thống, camera đa hướng, GPS và Laser LRF để ước lượng chuyển động của xe; nhận dạng phân loại một số đối tượng quan tâm liên quan đến các vấn đề giao thông (như người tham gia giao thông, xe lưu hành trên đường) để hỗ trợ trong các hệ thống lái xe, tránh va chạm; Các kỹ thuật nhận dạng địa điểm, lập lịch điều hướng... trên cơ sở thu nhận tín hiệu để sử dụng các kỹ thuật phân tích dữ liệu, huấn luyện các mô hình học máy nhằm nhận dạng, hiểu biết về môi trường giao thông ứng dụng trong các hệ thống điều khiển xe một cách tự động.

Phương pháp tiếp cận của đề tài là Nghiên cứu tài liệu, các công trình khoa học đăng trên các tạp chí hội thảo có chất lượng cao; tìm hiểu dự án liên quan đến các hệ thống giao thông thông minh và xe tự động. Nghiên cứu lý thuyết, đề xuất các giải pháp, phân tích đánh giá các phương pháp liên quan đến giải pháp đề xuất. Tìm hiểu, phân tích dữ liệu từ các nguồn dữ liệu của các nhóm nghiên cứu liên quan để có thể đánh giá so sánh; tự tạo lập dữ liệu thực nghiệm. Tiến hành thực nghiệm đánh giá giải pháp đề xuất và so sánh với các giải pháp khác (nếu có). Điều chỉnh các giải pháp hoặc nghiên cứu đề xuất lại giải pháp nếu như thực nghiệm không đúng giả thiết và kỳ vọng của giải pháp được đề xuất.

Sau thời gian nghiên cứu, đề tài đã thu được những kết quả như sau:

Chức năng ước lượng vị trí của xe khi chuyển động có vai trò hết sức quan trọng trong hệ thống xe tự hành. Về vấn đề này, chúng tôi đã nghiên cứu và đề xuất giải pháp ước lượng chuyển động của xe bằng cách phân tích mối quan hệ giữa sự thay đổi tương đối giữa xe và các vật thể cố định, môi trường xung quanh xe dựa vào các hình ảnh tuần tự được thu nhận trong quá trình xe di chuyển. Thông thường, chuyển động của một vật thể trong không gian 3D được tính toán theo 6 bậc tự do (6DOF) của chuyển động quay (Yaw, Pitch, Roll), chuyển động tịnh tiến (Forward-Back, Left-Right, Up-Down). Tuy nhiên, đối với xe 4 bánh có sự ràng buộc giữa các thành phần chuyển động. Trong nghiên cứu này, chúng tôi đề xuất giải pháp ước lượng chuyển động của xe với 5 bậc tự do (5DOF). Luận cứ lý thuyết quan trọng cho việc đề xuất giải pháp là nguyên lý trong ràng buộc cấu trúc chuyển động phẳng (2D) của xe 4 bánh (Ackermann steering geometry) được mở rộng để có thể áp dụng cho bài toán ước lượng chuyển động trong địa hình không phẳng (3D motion). Thay vì ước lượng chuyển động tự do của vật thể với 6DOF, chúng tôi đã phân tích mối quan hệ giữa chuyển động tịnh tiến và chuyển động quay của xe để thiết lập mối quan hệ ràng buộc giữa chúng. Thiết lập giả thiết ràng buộc giúp hạn chế các bậc tự do nhằm giảm bớt các tham số cần thiết được sử dụng cho ước lượng chuyển động. Thông thường, để tính các thành phần chuyển động tự do của vật thể trong 3D cần tới 8 điểm tương ứng giữa các ảnh tuần tự, nhưng với các giả thiết về ràng buộc giữa các thành phần chuyển động ta chỉ cần 2 điểm tương ứng. Việc giảm bớt các tham số tính toán giúp tăng tốc độ xử lý của hệ thống. Bên cạnh đó, chúng tôi cũng nghiên cứu đề xuất phương pháp tính trực tiếp các tham số chuyển động bằng 2 điểm tương ứng theo mô hình chuyển động đề xuất ở bước 1. Nhằm loại bỏ những ngoại lai, sai số ước lượng điểm tương ứng không chính xác do lỗi so khớp ảnh, chúng tôi cũng đề xuất cách tiếp cận tối ưu hóa lỗi dựa vào góc sai số giữa tia chiếu các điểm trong không gian thực tế lên ảnh và tia ước lượng chiếu ngược từ ảnh ra không gian thực tế. Giải pháp đề xuất được thực hiện với sự hợp tác với Phòng thí nghiệm các hệ thống thông minh - Trường ĐH Ulsan- Hàn Quốc. Kết quả nghiên cứu có ý nghĩa quan trọng trong ước lượng chuyển động, xác định vị trí của xe một cách chính xác hỗ trợ quyết định điều hướng phù hợp. Giải pháp đề xuất có thể được ứng dụng thực tế như là một module trong hệ thống xe tự hành - không người lái.

Kết quả nghiên cứu được công bố trong bài báo "Motion estimation based on two corresponding points and angular deviation optimization" đăng trên tạp chí ISI IEEE Transactions on Industrial Electronics (ISSN 0278-0046), thuộc danh mục SCOPUS và SCI (Q1, IF 7.05).

Nhận dạng và dự đoán hành động của người tham gia giao thông và xác định vị trí tương ứng một cách chính xác nhằm điều hướng xe phù hợp về tốc độ và hướng chuyển động, tránh các va chạm, tai nạn giao thông là yêu cầu hết sức quan trọng, có ý nghĩa quyết định thành công của hệ thống lái xe tự động. Liên quan đến nội dung này, nhóm nghiên cứu đã tập trung nghiên cứu và đề xuất các giải pháp để nhận dạng, dự đoán hành động con người dựa trên các phương pháp trích xuất đặc trưng từ hình ảnh, video và các kỹ thuật học máy nhằm tổ chức huấn luyện mô hình để sử dụng phân loại, nhận dạng hành động. Trong các nghiên cứu này, chúng tôi đã có 3 đóng góp chính:

+ Nghiên cứu giải pháp trích xuất và biểu diễn đặc trưng cục bộ trích xuất từ video như các loại đặc trưng ảnh dựa vào lược đồ (histogram) của thay đổi gradient cường độ xám trong ảnh (HOG), các biến đổi luồng quang học (optical flow) thể hiện quỹ đạo chuyển động của vật thể trong video bằng phân tích lược đồ luồng quang học ((HOF) và lược đồ biên chuyển động (MBH). Các kiểu đặc trưng này được trích xuất từ video làm đầu vào cho các hệ thống trí tuệ nhân tạo để nhận dạng hành động. Nhóm nghiên cứu đã đề xuất giải pháp kết hợp hai kỹ thuật học máy gồm SVM và boosting để tạo ra máy phân loại, nhận dạng đủ mạnh với chính xác cao. Trong kiến trúc hệ thống nhận dạng này, kỹ thuật SVM được sử dụng như là các phân loại yếu, chúng được kết hợp với nhau theo kỹ thuật tăng cường thích nghi (Adaboost) nhằm tạo ra máy phân loại đủ mạnh đáp ứng được độ chính xác yêu cầu. Giải pháp đề xuất được thực nghiệm trên các tập dữ liệu chuẩn đã được các nhóm nghiên cứu uy tín trên thế giới sử dụng như KTH, UCF50, HMDB51. Kết quả nghiên cứu này có ý nghĩa quan trọng trong việc nâng cao độ chính xác của hệ thống nhận dạng. Giải pháp đề xuất có thể ứng dụng trong thực tế để nhận dạng, dự đoán các hành động phổ biến như đi, chạy băng qua đường của người đi bộ và các đối tượng tham gia giao thông nhằm hỗ trợ ra quyết định điều khiển phương một cách phù hợp.

Kết quả nghiên cứu được công bố trong bài báo "Boosting discriminative models for activity detection using local feature descriptors", trình bày tại hội thảo quốc tế Intelligent Information and Database Systems năm 2017 và xuất bản trong tài liệu Lecture Notes in Computer Science, thuộc danh mục SCOPUS và ISI Proceeding.

Có thể tìm đọc báo cáo kết quả nghiên cứu (mã số 16313/2019) tại Cục Thông tin KHCNQG.

Đ.T.V (NASATI)