【财通计算机】CV领域再迎技术突破，通用视觉GPT曙光乍现

#Meta发布图像分割基础模型SAM。Meta于4月5日发布的Segment Anything Model (SAM) ，是目前第一个专攻计算机视觉领域（CV）的图像分割任务的基础模型，由大约1100万张许可和隐私保护图像上收集的超过11亿个分割masks的数据集上训练而成（比现有数据集大400倍），它能很好地完成自动分割图像中的所有内容、根据提示词进行图像分割、能用交互式点和框的方式进行提示等任务。此外，Meta还开源了SA-1B，这是迄今为止最大的图像分割数据集，为学术界和工业界日后的研究打下地基。

#智源研究院推出通用分割模型SegGPT。智源研究院联手浙江大学、清华大学于4月6日发布可利用视觉提示（prompt）完成任意分割任务的通用视觉模型SegGPT。与SAM类似，SegGPT具备通用能力、灵活推理能力、以及自动视频分割和追踪能力。SegGPT 的训练被定义为一个上下文着色问题，训练后，SegGPT 可以通过上下文推理在图像或视频中执行任意分割任务，例如实例、类别、零部件、轮廓、文本等。

#CV领域迎来GPT-3时刻。SAM、SegGPT等模型的出现是对CV技术泛化能力的进一步突破，其通用性将显著拓宽图像识别的应用边界，并大幅降低相关技术的应用门槛。我们认为在CV领域具备技术沉淀和客户渠道壁垒的公司将直接受益，此类公司有望率先利用最前沿的技术工具赋能下游行业，以供给创造需求&持续降本增效的方式巩固其先发优势。

相关标的：遥感地理（航天宏图，中科星图，超图软件）、机器视觉（奥普特，柏楚电子、金橙子，天准科技）、超高清及视觉（当虹科技，虹软科技，万兴科技）、智能车（四维图新、中科创达、德赛西威、均胜电子、光庭信息、经纬恒润）、AI综合领军（科大讯飞、海康威视、大华股份、云从科技、罗普特、云天励飞、格灵深瞳）

作者:乌龟流 | 分类:调研纪要 | 浏览:181 | 评论:0

上一篇 »【华泰金属李斌团队】求真周产业笔记14– 230409：美服务业走弱，金价或仍有上行空间下一篇 »【长江电新】光伏花语第6期：招标加速价格良好，N型渐露头角

发表评论:

◎欢迎参与讨论，请在这里发表您的看法、交流您的观点。

乌龟流

低风险投资-FIRE运动

10

2023
04

【财通计算机】CV领域再迎技术突破，通用视觉GPT曙光乍现

发表评论:

两融余额持续新高

看一家破产企业的三张表

2024年9月27日上交所宕机

10点魔咒

白酒渠道商的困境

银行坏账率及其调节手段

3A转债希望转2的近期观点

华尔街的老投资家们

截断亏损，让利润奔跑

这游戏玩来玩去能降维打新来的吗

数字经济的小观点

上市公司价值的多重视角

低风险投资-FIRE运动

10

202304

【财通计算机】CV领域再迎技术突破，通用视觉GPT曙光乍现

发表评论:

2023
04