小红书hilab开源dots模型家族中首个视觉语言模型dots.vlm1,该模型构建于12亿参数的视觉编码器和DeepSeek V3 LLM之上,通过大规模预训练和精调,在视觉感知与推理上达到准SOTA水平。
小红书开源多模态大模型
2025-08-11 09:30 来源:星元科技
小红书hilab开源dots模型家族中首个视觉语言模型dots.vlm1,该模型构建于12亿参数的视觉编码器和DeepSeek V3 LLM之上,通过大规模预训练和精调,在视觉感知与推理上达到准SOTA水平。