【财通计算机】CV领域再迎技术突破,通用视觉GPT曙光乍现
#Meta发布图像分割基础模型SAM。Meta于4月5日发布的Segment Anything Model (SAM) ,是目前第一个专攻计算机视觉领域(CV)的图像分割任务的基础模型,由大约1100万张许可和隐私保护图像上收集的超过11亿个分割masks的数据集上训练而成(比现有数据集大400倍),它能很好地完成自动分割图像中的所有内容、根据提示词进行图像分割、能用交互式点和框的方式进行提示等任务。此外,Meta还开源了SA-1B,这是迄今为止最大的图像分割数据集,为学术界和工业界日后的研究打下地基。
#智源研究院推出通用分割模型SegGPT。智源研究院联手浙江大学、清华大学于4月6日发布可利用视觉提示(prompt)完成任意分割任务的通用视觉模型SegGPT。与SAM类似,SegGPT具备通用能力、灵活推理能力、以及自动视频分割和追踪能力。SegGPT 的训练被定义为一个上下文着色问题,训练后,SegGPT 可以通过上下文推理在图像或视频中执行任意分割任务,例如实例、类别、零部件、轮廓、文本等。
#CV领域迎来GPT-3时刻。SAM、SegGPT等模型的出现是对CV技术泛化能力的进一步突破,其通用性将显著拓宽图像识别的应用边界,并大幅降低相关技术的应用门槛。我们认为在CV领域具备技术沉淀和客户渠道壁垒的公司将直接受益,此类公司有望率先利用最前沿的技术工具赋能下游行业,以供给创造需求&持续降本增效的方式巩固其先发优势。
相关标的:遥感地理(航天宏图,中科星图,超图软件)、机器视觉(奥普特,柏楚电子、金橙子,天准科技)、超高清及视觉(当虹科技,虹软科技,万兴科技)、智能车(四维图新、中科创达、德赛西威、均胜电子、光庭信息、经纬恒润)、AI综合领军(科大讯飞、海康威视、大华股份、云从科技、罗普特、云天励飞、格灵深瞳)