字节跳动 AI Lab 提出多模态模型
产品详细介绍:
字节跳动 AI Lab Research 团队提出X-VLM,初次提出学习多粒度的视觉和言语对齐。试验证明,这种预练习方法非常高效,模型规划无需很大,预练习数据无需许多, 仅216M参数量的X-VLM就能在广泛的多模态使命上获得了非常优异的体现,例如:图画文本检索、根据图片的问答或推理、视觉定位、图片描绘生成。
更多热门资讯、洞悉剖析、研究报告、直播讲座……敬请重视【硬科技】欢迎在各大渠道查找【硬科技】,认准蓝色logo的账号!在这里看见、读懂和衔接硬科技!咱们聚集光电芯片、人工智能、航空航天、新能源、智能轿车、生物医药、科创金融等职业,并依托于科学技能立异情报SaaS服务商才智芽所具有的共同科技情报数据优势,与读者一同看见技能趋势,读懂硬科技产业,衔接立异未来。“硬科技”由才智芽立异研究中心出品。