小红书发布并开源端到端文档识别模型:FireRed-OCR

AI 资讯快报  • 2026-03-04 09:372次浏览
小红书团队发布并开源端到端文档识别模型,基于Qwen3-VL架构,首创”三阶段渐进优化”策略与”几何+语义”数据工厂,解决通用VLM处理复杂文档时的”结构性幻觉”问题。模型在权威评测OmniDocBench v1.5中取得端到端方案SOTA,综合评分92.9%领先Gemini-3.0 Pro等模型。 更多详情...