Blog Forum News Resources

📚 Research Papers Collection

Browse the latest scientific publications with multilingual abstracts available in English, Russian and Azerbaijani.

I Move Therefore I Learn: Experience-Based Traversability in Outdoor Robotics

Authors: Miguel Ángel de Miguel,Jorge Beltrán,Juan S. Cely,Francisco Martín,Juan Carlos Manzanares,Alberto García
Published: July 2, 2025
Accurate traversability estimation is essential for safe and effective navigation of outdoor robots operating in complex environments. This paper introduces a novel experience-based method that allows robots to autonomously learn which terrains are traversable based on prior navigation experience, without relying on extensive pre-labeled datasets. The approach integrates elevation and texture data into multi-layered grid maps, which are processed using a variational autoencoder (VAE) trained on a generic texture dataset. During an initial teleoperated phase, the robot collects sensory data while moving around the environment. These experiences are encoded into compact feature vectors and clustered using the BIRCH algorithm to represent traversable terrain areas efficiently. In deployment, the robot compares new terrain patches to its learned feature clusters to assess traversability in real time. The proposed method does not require training with data from the targeted scenarios, generalizes across diverse surfaces and platforms, and dynamically adapts as new terrains are encountered. Extensive evaluations on both synthetic benchmarks and real-world scenarios with wheeled and legged robots demonstrate its effectiveness, robustness, and superior adaptability compared to state-of-the-art approaches.
Точная оценка обходов необходима для безопасной и эффективной навигации роботов на открытом воздухе, работающих в сложных условиях. В этом документе представлен новый метод, основанный на опыте, который позволяет роботам автономно изучать, какие территории можно пройти на основе предварительного навигационного опыта, не полагаясь на обширные предварительно меченные наборы данных. Подход интегрирует данные о повышении и текстуре в многослойные карты сетки, которые обрабатываются с использованием вариационного автоподора (VAE), обученного наборе общей текстуры. Во время начальной телеоперационной фазы робот собирает сенсорные данные при перемещении по окружающей среде. Эти переживания кодируются в компактных векторах признаков и кластеризируются с использованием алгоритма березы, чтобы эффективно представлять обезжириваемые области местности. В развертывании робот сравнивает новые патчи с местностью с его обученными кластерами для оценки обходов в режиме реального времени. Предлагаемый метод не требует обучения с данными из целевых сценариев, обобщается по разным поверхностям и платформам и динамически адаптируется по мере того, как встречаются новые территории. Обширные оценки как синтетических критериев, так и сценариев реального мира с колесными и ногами-роботами демонстрируют его эффективность, надежность и превосходную адаптивность по сравнению с самыми современными подходами.
Mürəkkəb mühitlərdə fəaliyyət göstərən açıq robotların təhlükəsiz və effektiv naviqasiyası üçün dəqiq yol keçidliyi qiymətləndirməsi vacibdir. Bu sənəd robotların əvvəlcədən hazırlanmış məlumat bazalarına güvənmədən, robotların əvvəlcədən naviqasiya təcrübəsinə əsaslanaraq hansı ərazilərin yüklənməsini öyrənməsinə imkan verən yeni bir təcrübə əsaslı bir metod təqdim edir. Yanaşma yüksəklik və toxuma məlumatlarını ümumi bir toxuma məlumat bazasında öyrədilmiş bir variasiya Autoencoder (VAE) istifadə edərək işlənmiş çox qatlı şəbəkə xəritələrinə birləşdirir. İlkin teleoperated mərhələ zamanı robot ətraf mühitin ətrafında hərəkət edərkən sensasiya məlumatlarını toplayır. Bu təcrübələr kompakt xüsusiyyət vektorlarına kodlanır və xarab bir alqoritmindən istifadə edilə bilən ərazi sahələrini səmərəli şəkildə təmsil etmək üçün istifadə olunur. Yerləşdirmədə, robot real vaxt rejimində yollılığı qiymətləndirmək üçün yeni ərazi yamalarının öyrənilmiş xüsusiyyətləri ilə yeni ərazi yamalarını müqayisə edir. Təklif olunan metod hədəf ssenarilərdən məlumatlarla təlim tələb etmir, müxtəlif səthlər və platformalarda ümumiləşdirir və yeni ərazilərlə qarşılaşdıqca dinamik uyğunlaşır. Həm sintetik meyarlarda, həm də əlil və ayaqlı robotlar olan real dünya ssenarilərində geniş qiymətləndirmələr, ən müasir yanaşmalara nisbətən effektivliyini, möhkəmliyini və üstün uyğunlaşmanı nümayiş etdirir.
Download Full PDF

RaGNNarok: A Light-Weight Graph Neural Network for Enhancing Radar Point Clouds on Unmanned Ground Vehicles

Authors: David Hunt,Shaocheng Luo,Spencer Hallyburton,Shafii Nillongo,Yi Li,Tingjun Chen,Miroslav Pajic
Published: July 2, 2025
Low-cost indoor mobile robots have gained popularity with the increasing adoption of automation in homes and commercial spaces. However, existing lidar and camera-based solutions have limitations such as poor performance in visually obscured environments, high computational overhead for data processing, and high costs for lidars. In contrast, mmWave radar sensors offer a cost-effective and lightweight alternative, providing accurate ranging regardless of visibility. However, existing radar-based localization suffers from sparse point cloud generation, noise, and false detections. Thus, in this work, we introduce RaGNNarok, a real-time, lightweight, and generalizable graph neural network (GNN)-based framework to enhance radar point clouds, even in complex and dynamic environments. With an inference time of just 7.3 ms on the low-cost Raspberry Pi 5, RaGNNarok runs efficiently even on such resource-constrained devices, requiring no additional computational resources. We evaluate its performance across key tasks, including localization, SLAM, and autonomous navigation, in three different environments. Our results demonstrate strong reliability and generalizability, making RaGNNarok a robust solution for low-cost indoor mobile robots.
Недооцененные мобильные роботы в помещении приобрели популярность благодаря растущему внедрению автоматизации в домах и коммерческих помещениях. Тем не менее, существующие решения для лидара и камеры имеют такие ограничения, как плохая производительность в визуально скрытых средах, высокие вычислительные накладные расходы для обработки данных и высокие затраты на лидары. В отличие от этого, датчики радиолокации MMWAVE предлагают экономически эффективную и легкую альтернативу, обеспечивая точную эпоху независимо от видимости. Однако существующая локализация на основе радара страдает от генерации, шума и ложных облаков, шума и ложных обнаружений. Таким образом, в этой работе мы вводим рагннарок, в режиме реального времени, легкий и обобщаемый графический графический нейронная сеть (GNN) для улучшения облаков радарных точек, даже в сложных и динамических средах. С временем вывода всего 7,3 мс на недорогих Raspberry Pi 5, Ragnnarok работает эффективно даже на таких устройствах с ограниченными ресурсами, не требуя дополнительных вычислительных ресурсов. Мы оцениваем его производительность по ключевым задачам, включая локализацию, удар и автономную навигацию, в трех разных средах. Наши результаты демонстрируют сильную надежность и обобщение, что делает Ragnnarok надежным решением для недорогих внутренних мобильных роботов.
Aşağı qiymətli qapalı mobil robotlar evlərdə və ticarət məkanlarında avtomatlaşdırmanın artırılması ilə populyarlıq qazandı. Bununla birlikdə, mövcud lidar və kamera əsaslı həllər, vizual olaraq gizli mühitlərdə, məlumatların işlənməsi üçün yüksək hesablama və lidarlar üçün yüksək xərclər kimi zəif performans kimi məhdudiyyətlərə malikdir. Bunun əksinə olaraq, mmwave radar sensorları, görünmədən asılı olmayaraq dəqiq bir şəkildə dəqiqləşdirilən səmərəli və yüngül alternativ təklif edir. Bununla birlikdə, mövcud olan radar əsaslı lokalizasiya seyrək nöqtə bulud nəsli, səs-küy və saxta aşkar edilmişdən əziyyət çəkir. Beləliklə, bu işdə Ragnnarok, real vaxt rejimində, yüngül və ümumiləşdirilə bilən bir qrafik şəbəkəsi (GNN) -ə - radar nöqtəsi buludlarını, hətta mürəkkəb və dinamik mühitlərdə də inkişaf etdirmək üçün təqdim edirik. Aşağı qiymətli moruq pi 5-də cəmi 7.3 ms-in nəticəsi olan Ragnnarok belə resurs məhdud cihazlarda da səmərəli işləyir, əlavə hesablama mənbələri tələb olunmur. Üç fərqli mühitdə, lokalizasiya, slam və muxtar naviqasiya daxil olmaqla əsas vəzifələr arasında onun performansını qiymətləndiririk. Nəticələrimiz, Ragnnarok'u aşağı qiymətli qapalı mobil robotlar üçün möhkəm bir həll edən güclü etibarlılıq və ümumiləşdirmə qabiliyyətini nümayiş etdirir.
Download Full PDF

Box Pose and Shape Estimation and Domain Adaptation for Large-Scale Warehouse Automation

Authors: Xihang Yu,Rajat Talak,Jingnan Shi,Ulrich Viereck,Igor Gilitschenski,Luca Carlone
Published: July 2, 2025
Modern warehouse automation systems rely on fleets of intelligent robots that generate vast amounts of data -- most of which remains unannotated. This paper develops a self-supervised domain adaptation pipeline that leverages real-world, unlabeled data to improve perception models without requiring manual annotations. Our work focuses specifically on estimating the pose and shape of boxes and presents a correct-and-certify pipeline for self-supervised box pose and shape estimation. We extensively evaluate our approach across a range of simulated and real industrial settings, including adaptation to a large-scale real-world dataset of 50,000 images. The self-supervised model significantly outperforms models trained solely in simulation and shows substantial improvements over a zero-shot 3D bounding box estimation baseline.
Современные системы автоматизации складов полагаются на флоты интеллектуальных роботов, которые генерируют огромные объемы данных, большинство из которых остаются безнотированными. В этой статье разрабатывается самоотверженный трубопровод адаптации доменов, который использует реальные, нематборенные данные для улучшения моделей восприятия, не требуя ручных аннотаций. Наша работа сосредоточена специально на оценке позы и формы ящиков и представляет собой правильный и сертифицированный трубопровод для самоподобной позы и оценки формы. Мы широко оцениваем наш подход в целом ряд смоделированных и реальных промышленных условий, включая адаптацию к крупномасштабному набору данных реального мира из 50 000 изображений. Самоподобная модель значительно превосходит модели, обученные исключительно моделированию, и демонстрирует существенные улучшения по сравнению с базовой базовой оценки 3D-оценки с нулевым выстрелом.
Müasir anbar avtomatlaşdırma sistemləri, çox sayda məlumat yaradan ağıllı robotların donanmasına güvənir - əksəriyyəti görünməmiş qalır. Bu sənəd, əlverişsizliyini tələb etmədən qavrayış modellərini yaxşılaşdırmaq üçün real dünyanın, əlbələm olmayan məlumatların, öz-özünə idarə olunan bir domen uyğunlaşma boru kəmərini inkişaf etdirir. İşlərimiz xüsusi olaraq qutuların pozasını və formasını qiymətləndirməyə yönəlmiş və özünü idarə edən qutu pozası və forma qiymətləndirməsi üçün düzgün və təsdiq edilmiş boru kəmərini təqdim edir. Bir sıra simulyasiya edilmiş və həqiqi sənaye parametrləri arasında, o cümlədən 50.000 görüntünün geniş miqyaslı bir real dünya vertəsmətinə uyğunlaşma ilə yanaşmağımızı geniş qiymətləndiririk. Öz-özünə nəzarət olunan model, yalnız simulyasiyada hazırlanmış və sıfır vuruşlu 3D məhdudlaşdıran bir qutu qiymətləndirmə başlığı üzərində əhəmiyyətli dərəcədə yaxşılaşmalar göstərir.
Download Full PDF

DexWrist: A Robotic Wrist for Constrained and Dynamic Manipulation

Authors: Martin Peticco,Gabriella Ulloa,John Marangola,Pulkit Agrawal
Published: July 2, 2025
We present the DexWrist, a compliant robotic wrist designed to advance robotic manipulation in highly-constrained environments, enable dynamic tasks, and speed up data collection. DexWrist is designed to be close to the functional capabilities of the human wrist and achieves mechanical compliance and a greater workspace as compared to existing robotic wrist designs. The DexWrist can supercharge policy learning by (i) enabling faster teleoperation and therefore making data collection more scalable; (ii) completing tasks in fewer steps which reduces trajectory lengths and therefore can ease policy learning; (iii) DexWrist is designed to be torque transparent with easily simulatable kinematics for simulated data collection; and (iv) most importantly expands the workspace of manipulation for approaching highly cluttered scenes and tasks. More details about the wrist can be found at:this http URL.
Мы представляем Dexwrist, соответствующее роботизированное запястье, предназначенное для продвижения роботизированных манипуляций в условиях с ограниченными трудами, обеспечения динамических задач и ускорения сбора данных. Dexwrist разработан, чтобы быть близким к функциональным возможностям человеческого запястья и достигает механического соблюдения и большего рабочего пространства по сравнению с существующими роботизированными запястьями. Dexwrist может перегружать политическое обучение за счет (i) обеспечивая более быстрое телеоперацию и, следовательно, делает сбор данных более масштабируемым; (ii) выполнение задач в меньшем количестве шагов, что уменьшает длину траектории и, следовательно, может облегчить политическое обучение; (iii) DexWrist разработан так, чтобы быть прозрачным крутящим моментом с легко моделируемой кинематикой для моделируемого сбора данных; и (iv) наиболее важно, расширяет рабочее пространство манипуляций для приближения к очень загроможденным сценам и задачам. Более подробную информацию о запястье можно найти по адресу: http url.
Biz yüksək məhdud mühitlərdə robot manipulyasiyasını inkişaf etdirmək, dinamik tapşırıqları aktivləşdirmək və məlumat toplamaq üçün hazırlanmışdır. DexWrist, insan biləyinin funksional imkanlarına yaxın olmaq və mexaniki uyğunluq və mövcud robot bilək dizaynları ilə müqayisədə daha çox iş sahəsi əldə etmək üçün hazırlanmışdır. DexWrist, daha sürətli teleoperation və məlumat toplusunu daha genişlənməyə imkan verən (i) tərəfindən super yükləmə siyasətini öyrənə bilər; (ii) traektoriya uzunluğunu azaldır və buna görə də siyasət öyrənmələrini yüngülləşdirə biləcək vəzifələri azaltmaq; (iii) Dexwrist, simulyasiya edilmiş məlumat toplamaq üçün asanlıqla simulatlı kinematiklərlə şəffaf olmaq üçün hazırlanmışdır; və (iv) ən əsası, yüksək dağılmış səhnələrə və vəzifələrə yaxınlaşma üçün manipulyasiya iş sahəsini genişləndirir. Bilək haqqında daha çox məlumat tapa bilərsiniz: bu http URL.
Download Full PDF

VQ-VLA: Improving Vision-Language-Action Models via Scaling Vector-Quantized Action Tokenizers

Authors: Yating Wang,Haoyi Zhu,Mingyu Liu,Jiange Yang,Hao-Shu Fang,Tong He
Published: July 2, 2025
In this paper, we introduce an innovative vector quantization based action tokenizer built upon the largest-scale action trajectory dataset to date, leveraging over 100 times more data than previous approaches. This extensive dataset enables our tokenizer to capture rich spatiotemporal dynamics, resulting in a model that not only accelerates inference but also generates smoother and more coherent action outputs. Once trained, the tokenizer can be seamlessly adapted to a wide range of downstream tasks in a zero-shot manner, from short-horizon reactive behaviors to long-horizon planning. A key finding of our work is that the domain gap between synthetic and real action trajectories is marginal, allowing us to effectively utilize a vast amount of synthetic data during training without compromising real-world performance. To validate our approach, we conducted extensive experiments in both simulated environments and on real robotic platforms. The results demonstrate that as the volume of synthetic trajectory data increases, the performance of our tokenizer on downstream tasks improves significantly-most notably, achieving up to a 30% higher success rate on two real-world tasks in long-horizon scenarios. These findings highlight the potential of our action tokenizer as a robust and scalable solution for real-time embodied intelligence systems, paving the way for more efficient and reliable robotic control in diverse applicationthis http URLwebsite:this https URL
В этой статье мы вводим инновационный токенизатор действий на основе векторов, основанный на самом крупном наборе данных о траектории действий, используя более 100 раз больше данных, чем предыдущие подходы. Этот обширный набор данных позволяет нашему токенизатору захватывать богатую пространственно -временную динамику, что приводит к модели, которая не только ускоряет вывод, но также генерирует более плавные и более когерентные результаты. После обучения токенизатор может быть легко адаптирован к широкому диапазону нижестоящих задач с нулевым выстрелом, от реактивного поведения короткого хоризона до планирования длинного хоризона. Ключевым выводом нашей работы является то, что разрыв домена между синтетическими и реальными траекториями действия является маргинальным, что позволяет нам эффективно использовать огромное количество синтетических данных во время обучения без ущерба для реальной работы. Чтобы подтвердить наш подход, мы провели обширные эксперименты как в моделируемых средах, так и на реальных роботизированных платформах. Результаты демонстрируют, что по мере увеличения объема данных синтетической траектории производительность нашего токенизатора по нижестоящим задачам значительно значительно улучшается, достигая до 30% более высокого уровня успеха в двух реальных задачах в сценариях с длинными горе. Эти результаты подчеркивают потенциал нашего токенизатора действий как надежного и масштабируемого решения для систем воплощенных в реальном времени, прокладывая путь к более эффективному и надежному роботизированному контролю в различных применениях.
Bu sənəddə, əvvəlki yanaşmalardan 100 qat çox məlumatdan istifadə edərək, ən böyük miqyaslı fəaliyyət traektoriyası məlumat bazasında innovativ bir vektor kəmiyyətin toqqizliyi məlumat bazası təqdim edirik. Bu geniş məlumat bazası, tokenizerimizin zəngin spatiotemporal dinamikasını ələ keçirməyə imkan verir, nəticədə təkcə nəticəni sürətləndirməyən, eyni zamanda daha hamar və daha uyğun bir hərəkət nəticələrini yaradan bir modellə nəticələnir. Təcrübə edildikdən sonra, tokenizer, uzunmüddətli reaktiv davranışlardan qısa bir şəkildə sıfır vuruşlu davranışlardan geniş bir şəkildə endirilə bilər. Əsərimizin əsas tapılması, sintetik və həqiqi fəaliyyət traektoriyaları arasındakı domen boşluğunun, real-dünya performansından istifadə etmədən təlim zamanı çox miqdarda sintetik məlumatlardan səmərəli istifadə etməyə imkan verir. Yanaşmanızı təsdiqləmək üçün həm simulyasiya edilmiş mühitdə, həm də real robot platformalarında geniş təcrübələr apardıq. Nəticələr, sintetik traektoriya məlumatlarının həcminin artdıqca, aşağı axındakı tokenizatorumuzun performansı, ən əsası, uzunmüddətli işləyən iki dünyagörüşündə 30% daha yüksək müvəffəqiyyət nisbətində yüksək səviyyədə yaxşılaşır. Bu tapıntılar, Fəaliyyət Tokenizerimizin potensialının potensialını vurğulayır
Download Full PDF

Welcome to our Blog — a platform for sharing insights, tutorials, community stories, and discussions about technology, innovation, and more. Join the conversation and stay connected with our vibrant tech community.