好像UniVG-R1仅支持单bbox的输出,在很多推理分割数据集(LISA LLMSeg等)均需要输出多个实例 mask。并且,在表2 Zero-shot评测中,发现LISA、LLMSeg等标注都仅有一个框,如果标注mask中有多个实例,是如何得到一个框的标注呢? 希望您能解答我的疑惑,谢谢!