Điều hướng tự động bằng Công nghệ Intel® RealSense ™

(Cập nhật: 11/19/2020 2:09:12 PM)

Hầu hết chúng ta đều quen thuộc với khái niệm ô tô tự lái, nhưng có lẽ ít quen thuộc hơn với các loại công nghệ tự hành khác ngoài khoa học viễn tưởng. Vào năm 2019, thị trường robot được định giá gần 40 tỷ đô la, dự báo sẽ tăng 25% vào năm 2020. Thị trường máy bay không người lái thương mại được định giá khoảng 6 tỷ đô la. Trong khi một phần đáng kể của cả hai thị trường đều bao gồm các robot hoặc máy bay không người lái do người điều khiển hoặc robot thực hiện các nhiệm vụ lặp đi lặp lại, nhu cầu ngày càng tăng đối với các phiên bản tự động của cả hai.

SỰ KHÁC BIỆT GIỮA TỰ ĐỘNG VÀ TỰ ĐỘNG HÓA
Các thiết bị tự động không yêu cầu con người phải lập trình hoặc dự đoán mọi hành động mà họ sẽ thực hiện để phản ứng với môi trường thay đổi. Một robot tự động có thể được điều hướng đến một vị trí nhưng phản ứng với các chướng ngại vật trên đường đi một cách thông minh. Ví dụ: video này cho thấy một rô-bốt nguyên mẫu sử dụng Intel® RealSense ™ D435 và T265 để lập kế hoạch đường đi từ A đến B, nhưng cũng để phản ứng với các vật thể ném theo đường dự định của nó.
Thật dễ dàng để liên tưởng đến robot theo nghĩa khoa học viễn tưởng về một robot hình người, có thể phản ứng với chúng ta trong mọi tình huống và hành động theo cách tương tự như con người nhân tạo. Sự thật là loại robot này còn rất xa trong tương lai. Robot ngày nay không được thiết kế để thay thế con người, mà là để tăng cường và mở rộng khả năng của chúng ta bằng cách đảm nhận các nhiệm vụ nguy hiểm hoặc lặp đi lặp lại như giao thức ăn cho bệnh viện hoặc vệ sinh công nghiệp. Trong bất kỳ mục đích sử dụng nào trong số này, có một số khả năng phổ biến mà rô bốt tự hành cần để có thể điều hướng an ỆNEMột khả năng rất cơ bản - robot và máy bay không người lái cần phải có khả năng phát hiện các đối tượng để phản ứng thích hợp với chúng. Một máy ảnh độ sâu như máy ảnh độ sâu Intel RealSense D455, D435i hoặc D415 có thể được sử dụng để phát hiện nhiều đối tượng khác nhau một cách dễ dàng, nhưng có một số vật liệu khó có thể tự động nhận ra. Trong bài báo này từ Đại học Công nghệ Hóa học Bắc Kinh, nhóm nghiên cứu khám phá việc sử dụng máy ảnh độ sâu Intel RealSense cùng với một số thuật toán nhận dạng vật thể bổ sung để xác định các vật thể trong suốt. Bằng cách di chuyển máy ảnh xung quanh vật thể và chụp một vài hình ảnh khác nhau, họ đã tạo thành công bản quét các vật thể trong suốt mà họ có thể tái tạo và chuẩn bị cho việc cầm nắm của robot.

Phát hiện đối tượng và nhận dạng đối tượng là hai khả năng khác nhau. Máy ảnh độ sâu Intel RealSense có thể phát hiện các đối tượng và đo các đối tượng trong trường nhìn của chúng một cách khá đơn giản, vì đo kích thước và khoảng cách là khả năng cố hữu của máy ảnh. Tuy nhiên, việc nhận biết một đối tượng là gì đòi hỏi nỗ lực bổ sung, sử dụng khung học máy. Sử dụng camera độ sâu để đào tạo hệ thống nhận dạng đối tượng mang lại một số lợi thế như khả năng dễ dàng phân đoạn một đối tượng khỏi các đối tượng nền, vì vậy có thể cần ít dữ liệu đào tạo hơn so với cách tiếp cận dựa trên hình ảnh 2d.

TRÁNH VA CHẠM

Yếu tố quan trọng để đảm bảo an toàn, tránh va chạm là khả năng của robot có thể điều hướng xung quanh hoặc tránh bất kỳ chướng ngại vật nào. Điều này bao gồm cả chướng ngại vật tĩnh như tường hoặc bề mặt không bằng phẳng, nhưng cũng có thể là chướng ngại vật tạm thời hoặc di chuyển như người hoặc vật nuôi. Mặc dù một số rô-bốt đủ mạnh để xử lý các va chạm theo nghĩa đen trên đường, nhưng xe lăn rô-bốt tự động cần có khả năng phân đoạn khu vực 'có thể lái được' khỏi các chướng ngại vật và khu vực không thể di chuyển để chở người một cách an toàn mà không bị thương. Các nhà nghiên cứu tại Đại học Khoa học và Công nghệ Hồng Kông đã giải quyết vấn đề này trong bài báo này. Họ sử dụng một máy ảnh độ sâu Intel RealSense D415 để đo sự chênh lệch độ sâu giữa các bề mặt có thể lái được và các điểm bất thường của đường có chiều cao lớn hơn 5cm tính từ bề mặt đó.

Sử dụng camera đo độ sâu cho phép họ sử dụng Trình tạo nhãn tự giám sát (SSLG) để tự động gắn nhãn các điểm bất thường của đường và các khu vực có thể lái được. Cách tiếp cận này cho kết quả tốt hơn so với các phương pháp truyền thống vì nó có thể tự động thích ứng tại thời điểm chạy với những trở ngại mới mà hệ thống có thể chưa thấy trước đây. Họ đã đào tạo hệ thống trên khoảng 4000 hình ảnh độ sâu được dán nhãn bằng tay được thu thập tại các khu vực thường gặp đối với xe lăn, chẳng hạn như vỉa hè. Hệ thống không yêu cầu sự thật cơ bản được dán nhãn bàn tay này, điều này chỉ đơn giản được sử dụng để đánh giá hiệu quả của phương pháp tự trị. Các khu vực nằm ngoài phạm vi của máy ảnh được tự động gắn nhãn là 'không xác định', nơi mọi thứ khác trong cảnh được phân thành các khu vực có thể lái được và không thể lái được hoặc đường bất thường.

Mặc dù mục tiêu chính của bài báo này là tạo ra một hệ thống hoạt động cho xe lăn tự động, không có lý do gì mà cách tiếp cận như vậy cũng không hoạt động tốt đối với robot giao hàng hoặc bất kỳ robot tự lái nào khác.
LẬP KẾ HOẠCH DI CHUYỂN
Sau khi các khu vực có thể lái được đã được xác định, giai đoạn tiếp theo của điều hướng tự động là lập kế hoạch cho một con đường chuyển động tránh chướng ngại vật. Bài báo này sử dụng một thuật toán mà họ đã phát triển để lấy dữ liệu từ máy ảnh độ sâu D435 để lập kế hoạch đường đi qua các nhà kính nông nghiệp. Trong nghiên cứu trước đó, họ đã sử dụng công cụ tìm phạm vi laser 2D để cảm nhận các khu vực có thể lái được trước khi lập kế hoạch đường đi của chúng, nhưng công cụ tìm phạm vi laser gặp vấn đề khi xác định các nhà máy là chướng ngại vật. Sử dụng camera chiều sâu cho phép họ tinh chỉnh thuật toán để cho phép robot di chuyển qua các hàng mà không bị va chạm.

 BẢN ĐỊA HÓA ĐỒNG THỜI LẬP BẢN ĐỒ

Các thuật toán tránh va chạm, lập kế hoạch đường đi và phát hiện đối tượng vốn dĩ không có dữ liệu lịch sử về vị trí của rô bốt. Họ đang hành động trong thời gian thực hoặc lập kế hoạch cho các hành động trong tương lai, nhưng một khi những hành động đó đã diễn ra hoặc đang diễn ra trong thời gian thực, họ không có bất kỳ nhận thức hoặc ký ức nào về nơi họ đã ở. Đây có thể là một thách thức - trong bài báo cuối cùng, các nhà nghiên cứu đã phát hiện ra vấn đề là một khi cây cối bị khuất tầm nhìn của máy ảnh, va chạm có thể xảy ra ngay cả khi chúng đã được phát hiện và tránh trước đó.

Để nhận biết về một không gian và vị trí bên trong nó, Bản địa hóa và Lập bản đồ Đồng thời hoặc SLAM là cần thiết. Các thuật toán SLAM giống như các thuật toán được nhúng trong Máy ảnh theo dõi Intel RealSense T265 được thiết kế để giúp một đối tượng không chỉ biết nó đang ở đâu mà còn biết nó đã ở đâu trong một không gian. Nó thực hiện điều này bằng cách lấy nguồn cấp dữ liệu trực quan từ một cặp hoặc nhiều máy ảnh, kết hợp với các cảm biến khác như máy đo độ bánh xe hoặc đơn vị đo lường quán tính (IMU) và so sánh cách các tính năng hình ảnh và dữ liệu cho các cảm biến đó di chuyển theo thời gian. Điều này xảy ra cực kỳ nhanh chóng và với dữ liệu thay đổi này, các thuật toán tạo ra 'bản đồ' về khu vực mà rô bốt hoặc máy bay không người lái đã đi qua. Sau đó, bản đồ này có thể được chia sẻ với các robot khác, vì vậy, ví dụ: bạn có thể có một nhóm robot được thiết kế để di chuyển qua cùng một không gian cứ sau mười phút. Công cụ đầu tiên sẽ tạo bản đồ và đường dẫn sau đó có thể được chia sẻ với các rô bốt sau.

Nguồn: Intel

Quý khách vui lòng liên hệ với BrandPC để chúng tôi được phục vụ:

🖥 BrandPC - Cung cấp giải pháp - công nghệ dành cho doanh nghiệp

🏢 Số 76 ngõ 120 Yên Lãng, Đống Đa, Hà Nội

☎ Hotline: 0888 627 888

🌎Website: http://www.brandpc.vn/

Tin tức khác

Bài viết nhiều người xem nhất

Bài viết mới nhất

Review công nghệ

Công Ty TNHH BRANDPC Việt Nam
Gọi mua hàng
Facebook Chat