您现在的位置是:主页 > 财金 >
豆包视觉理解模型由字节跳动推出,1 元能处理约 300 张高清图
发布时间:2024年12月18日 15时21分48秒 财金 人已围观
简介12 月 18 日,字节跳动在火山引擎 Force 大会发布豆包视觉理解模型,为企业提供高性价比多模态大模型能力,其千 tokens 输入价格为 3 厘,一元钱即可使用。...
据快科技 12 月 18 日报道,今日举行的火山引擎 Force 大会上,字节跳动重磅推出豆包视觉理解模型,为企业提供高性价比的多模态大模型服务。
该模型每千 tokens 输入价格仅为 3 厘,1 元钱可处理 284 张 720P 图片,比行业价格低 85%,能以更低成本推动 AI 技术普及和应用发展。
火山引擎总裁谭待表示,豆包视觉理解模型不仅能精确识别视觉内容,还拥有出色的理解和推理能力,可根据图像信息进行复杂逻辑计算,完成分析图表、处理代码、解答学科问题等任务。
在此之前,豆包视觉理解模型已接入豆包 App 和 PC 端产品。
值得一提的是,字节跳动计划于 2025 年春季推出具有更长视频生成能力的豆包视频生成模型 1.5 版,豆包端到端实时语音模型也将很快上线。
目前,豆包大模型已与八成主流汽车品牌合作,并接入多家手机、PC 等智能终端,覆盖终端设备约 3 亿台,智能终端对豆包大模型的调用量在半年内增长了 100 倍。