摩登7机器人
CHUANGZE ROBOT
当前位置:首页 > 新闻资讯 > 机器人开发 > 常见的人工智能大模型:NLP,CV和多模态大模型

常见的人工智能大模型:NLP,CV和多模态大模型

来源:高工机器人     编辑:摩登7   时间:2024/10/17   主题:其他 [加盟]

人形机器人的“大脑”是指基于人工智能大模型的机器人控制系统,用于实现机器人的 感知、决策、学习和控制等功能。2023 年,随着人工智能大模型技术的快速迭代,为人形机 器人的产业落地提供了重要的技术支撑。在人-机-环境交互方面,大模型可以接受视觉、语言、触觉等多种信息输入,提升交互能力。人工智能大模型是实现高度智能化人形机器人的 关键技术之一。

目前常见的人工智能大模型有 NLP(Natural Language Processing,自然语言处理) 大模型、CV(Computer Vision,计算机视觉)大模型和多模态大模型等。

1、NLP(Natural Language Processing,自然语言处理)大模型

NLP 大模型是人工智能领域的重要研究方向,融合了语言学、计算机科学、机器学习、 数学、认知心理学等多个学科领域的知识。自然语言处理包含自然语言理解和自然语言生成 两个方面,常见任务包括文本分类、结构分析、语义分析、知识图谱、信息提取、情感计算、 文本生成、自动文摘、机器翻译、对话系统、信息检索和自动问答等。研究内容覆盖的粒度 包括字、词、短语、句子、段落和篇章等多种层次。由于语言的复杂性,高精度、高鲁棒、 可解释的通用自然语言处理系统目前还没有成熟解决方案,仍需进行长期研究。

2、CV(Computer Vision,计算机视觉)大模型

CV(Computer Vision,计算机视觉)大模型是指基于深度学习的计算机视觉模型,通 常用于图像识别、目标检测、人脸识别、图像分割等计算机视觉任务。计算机视觉作为人工 智能和深度学习的子领域,目前主要以深度卷积神经网络(CNN)和 Transformer 为支撑, 针对各个应用场景开发优化类人视觉功能,例如厂商利用图像识别、图像和视频搜索、视频 合成等技术应用于汽车交通、媒体标签等常用场景。

3、多模态大模型

多模态大模型是指将文本、图像、视频、音频等多模态信息联合起来进行训练的模型。 这种模型可以处理和分析多种类型的数据,例如文本、图像、视频和音频,从而更全面地理 解和利用各种信息。多模态大模型的训练通常采用深度学习技术,通过对大量多模态数据进 行学习,模型能够从数据中提取出更丰富、更复杂的信息。多模态大模型在许多领域都有应 用,例如自然语言处理、计算机视觉、音频处理等。






机器人各部位关键技术分析

机器人大脑提高人形机器人的人-机-环境共融交互能力,支撑全场景落地应用;机器人小脑提升人形机器人非 结构化环境下全身协调鲁棒移动、灵巧操作及人机交互能力

大模型在机器人领域研究与应用案例汇总

英伟达 GR00T让人形机器人理解自然语言文本,语音,视频,以模仿人类运动;阿里云机器人大模型可赋予机器人知识库问答,工艺流程代码生成,机械臂轨迹规划,3D目标检测和动态环境理解等全方位能力

智能机器人纯视觉与激光雷达方案比较

纯视觉方案:成本低,技术成熟度高,产业链成熟度高,符合人眼逻辑;易受天气影响,易受光照影响,算力需求较高,需要大量图像训练集;激光雷达方案:识别率高,环境适应力强,产业链成熟度高

人形机器人四种环境感知传感器各项性能比较

摄像头可实现测距,但精度较低,通过 AI 算法识别,但难 以识别非标准障碍物;毫米波雷达纵向精度高,横 精度低;激光雷达是高精度,3D 建模,易识别;

全球主要人形机器人的控制解决方案汇总

本田 ASIMO由四个运行着 VxWorks 实时操作系统的处理器构成;欧洲 ICUB使用名为 ARCHER 的学习型算法体系;特斯拉 Optimus用Optimus 的神经网络

人形机器人丝杠行业深度报告: 核心传动精密部件,国产化未来可期,市场规模249.5亿元

人形机器人将实现从0到1量产,根据摩登7测算,2025年和2030年全球人形机器人市场规模 分别有望达到1.4亿元和249.5亿元,2025-2030年全球人形机器人CAGR有望达到182%

人形机器人执行系统之灵巧手-空心杯电机

人形机器人灵巧手进行抓取动作,空心杯电机为核心部件;信号解析 汇总执行 输出转速 (高速、低扭矩) 降速增扭 直线传动转 换为旋转传 动 驱动传导 感知及力 反馈

人形机器人执行系统之旋转执行器-减速器

旋转执行器分布于肩部、手部等多自由度关节,作用是将某物旋转到一定角度完成旋转运动;驱动关节完成旋转动作,减速器为核心部件

人形机器人执行系统之线性执行器-行星滚柱丝杠

线性执行器位于膝肘等单自由度及腕踝等双自由度关节,将电机旋转运动转为直线运动;变旋转运动为直线运动,行星滚柱丝杠为核心部件

人形机器人整体构造及成本拆解:执行系统较为关键

人形机器人感知系统成本占比7.3%,执行系统成本占比53.2%;线性执行器成本占比31.0%;旋转执行器成本占比17.9%;其他成本占比39.5%

人形机器人BOM拆解分析-三大核心部分

执行系统BOM占比最高,约53.2%(其中直线、旋转、手部分别 占31.0%、17.9%、4.3%);感知系统占7.3%,其他芯片、电池等部件合计占比39.5%

中国人形机器人研发团队-24支机器人团队介绍

国防科技大学Blackman;哈尔滨工业大学HIT Humanoid; 理工汇童;浙江大学悟空;优必选WalkerX、优悠;小鹏汽车PX5;达闼科技XR-4;上海钢铁侠
资料获取
机器人开发
== 最新资讯 ==
常见的人工智能大模型:NLP,CV和多模
机器人各部位关键技术分析
上海市机器人产业发展现状:“3+X”空间
大模型在机器人领域研究与应用案例汇总
智能机器人纯视觉与激光雷达方案比较
人形机器人四种环境感知传感器各项性能比较
全球主要人形机器人的控制解决方案汇总
中国未来五十年人工智能行业生态全景—AI
中国未来五十年人工智能行业生态全景—关键
中国近几年人工智能相关政策汇总
中国人工智能竞争与发展潜力—技术优势
2024智能算力产业发展白皮书-算力规模
大模型安全实践白皮书2024-安全性、可
中国未来50年产业发展趋势白皮书-人工智
青岛市人工智能产业-打造具有全球竞争力的
== 机器人推荐 ==
迎宾讲解服务机器人

服务机器人(迎宾、讲解、导诊...)


            智能服务机器人                   
版权所有 摩登7智能机器人集团股份有限公司 中国运营中心:上海 科技园8号楼5层 中国生产中心:山东日照解放路71号
销售1:4006-935-088 销售2:4006-937-088 客服电话: 4008-128-728