钉钉AI助理升级：上线图片理解、文档速读等功能

2024-04-21 互联网170

3月29日消息，钉钉AI助理近日宣布完成升级，上线图片理解、文档速读、工作流等产品能力，率先探索多模态、长文本与RPA技术在AI应用的落地。基于阿里通义千问大模型，升级后的钉钉AI助理拥有更强的视觉推理能力和长文本速读能力。

目前，用户在钉钉IM消息框或点击魔法棒按钮进入AI助理对话框，发送长文件、在线文档、网页链接、视频内容，即可根据内容识人、识地点、分析、答题、翻译、摘要、提取文字，甚至可以通过多轮交互进一步做智能问答。

图源：钉钉黑板报公众号

据了解，基于通义千问Qwen-VL-Max视觉理解模型，钉钉AI助理能够准确描述和识别图片信息，并根据图片进行信息推理、扩展创作、文字提取、翻译等，相当于一个全能的“图片小百科”。

不管图片展示的是某件物体、某个人物、风景，还是菜谱、社交梗图、数学题和衣服标签，AI助理都能一秒识别图片内容，并在此基础上进行多轮对话问答。比如，旅游时看到一个很美的建筑，拍照发给钉钉AI助理，就能迅速了解它的历史背景和相关故事。

图源：钉钉黑板报公众号

利用这一能力，用户还可以实现识图翻译或提取图片中的文字，让信息获取更加便捷。比如，不知道某件衣服的洗涤方式，把衣服标签拍个照发给钉钉AI助理，就可以翻译上面的英文。

通义千问Qwen-VL-Max拥有更强的视觉推理和中文理解能力，整体性能堪比GPT-4V和Gemini Ultra。在MMMU、MathVista等测评中远超业界所有开源模型，在文档分析（DocVQA）、中文图像相关（MM-Bench-CN）等任务上超越GPT-4V，达到世界最佳水平。

此外，AI助理也支持视频内容的速读。发送给AI助理的短视频、直播切片或培训视频可以被快速“观看”，AI助理会根据视频内容生成字幕，提取关键词，并生成一份智能摘要，对于最高2GB的视频内容，仅需3分钟即可完成智能解读。

点赞 0举报收藏 0打赏 0评论 0

更多>同类新闻资讯

推荐图文

OFO员工撤离北京门内	全球最大钢格板集团落
由山东卫视主办的山东	2009年度服装网购行业

推荐新闻资讯

点击排行

免责申明：本站所有信息均由网友自由发布,本站不承担由于内容的合法性及真实性所引起的一切争议和法律责任。

• 国产SiC模块替代英飞凌赛米控三菱FUJI富士IGBT	• 珠海基本半导体SiC碳化硅IPM功率模块一级代理
• 怡亚通旗下小怡家与玛氏箭牌签署品牌直供合作协	• 1688无锡产业带培育计划正式启动
• 阿里云将在五个国家投资新建数据中心	• 九州通获评金羚奖“2024年度ESG典范企业”
• 京东五金城品质工具节开场10分钟成交金额破百万	• 国联股份2023年度暨2024年Q1业绩说明会问题汇总
• 京东工业与杭叉集团签署战略合作协议	• 焦点科技与连云港市商务局签订战略合作协议