DeepSeek来了,他开源了一款统一的多模态理解和生成的模型:Janus 1.3B
Janus核心是可以同时理解和生成文字、图像,它可以看懂图片和文字,还能根据描述画出图片来
它将视觉编码分为两个独立路径,一个用于理解图像,另一个用于生成图像,这种设计可以缓解理解和生成任务对视觉编码器的不同需求所带来的冲突
github:https://t.co/SDJ1xxzOpq
模型:https://t.co/jAZEAB4Hx4
#DeepSeek #DeepSeekJanus #LLM
点击图片查看原图
点击图片查看原图