在 `EvaluationExample.md` 文件中, `R={i_1,u_1,u_2,i_2,u_3}`。按我的理解,response 应该是一段文字回复和0-n个图片组成的,也就是 `R={u, i_1, i_2}` ,其中 `u` 是用户的文字回复,`i_1`, `i_2` 是图片。 请问能给出`R={i_1,u_1,u_2,i_2,u_3}`这种示例吗,或者麻烦指出我理解中存在的问题。