Skip to content

1Wata/mllmTracker

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

19 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Step1. 数据集下载和环境配置:

我已经将 lasot,TNL2L,OTB_lang 已经全部上传到 modelscope 上了,下载可以如下下载:

#验证SDK token
from modelscope.hub.api import HubApi
api = HubApi()
api.login('470dc5bd-b4d9-4ed2-997b-a3684903260e')

#数据集下载
from modelscope.msdatasets import MsDataset
ds =  MsDataset.load('FineTuneWata/tracking_data')
#您可按需配置 subset_name、split,参照“快速使用”示例代码

下载之后目录结构是这样的,需要进入每一个数据集内部将当前路径下的 zip 文件全部解压,最终路径示例如下:

 -- data
     -- lasot
         |-- airplane
         |-- basketball
         |-- bear
         ...
     -- TNL2K
         |-- TNL2K_test_subset
         |-- TNL2K_train_subset
         ...
     -- otb_lang
         |-- OTB_query_test
         |-- OTB_query_train
         |-- OTB_videos

环境配置:

代码仓库已经上传到 1Wata/mllmTracker 中了,环境配置如下:

git clone https://github.com/1Wata/mllmTracker.git
cd mllmTracker

conda create -n track python=3.10 -y
conda activate track
conda install cudatoolkit=12.4 -c nvidia
pip install -r requirements.txt

克隆代码仓库之后还需要配置一下数据集的路径,就在 dataset_interface/dataset_config.yaml 路径下,修改三个数据集路径就行(因为目前只用了三个数据集);除此之外还要把 workspace_dir 改为整个仓库的路径(mllmTracker 代码仓库的路径)

env:
  workspace_dir: '/data1/lihaobo/tracking/'
  lasot_dir: '/data1/lihaobo/tracking/data/lasot'
  tnl2k_dir: '/data1/lihaobo/tracking/data/TNL2K_CVPR2021'
  otb_lang_dir: '/data1/lihaobo/tracking/data/OTB_lang'

Step2. 数据集制作:

cd dataset_interface
python make_rft_dataset.py --samples_per_epoch 40000 --output_dir path/to/save/dataset

Step3. 训练

开始训练,首先要下载 Qwen2.5VL-3B 模型在 ./rft/share_models路径下。再启动训练脚本,训练脚本在 rft/src/scripts/3B_tracking.sh 下,在开始训练之前需要修改 3B_tracking.sh 中的几个参数,包括上面制作数据集的路径,gpu 数量设置等,运行命令:

cd rft
./src/scripts/3B_tracking.sh

就可以开始训练了

Step4. Inference & evalutation

​ 在推理之前,需要设置一下推理脚本的路径,先只用 OTB_lang 数据集测试,修改 dataset_interface/evaluation/local.py 文件夹下 OTB_lang 数据集路径

​ 推理脚本在 dataset_interface 文件夹下,采用了多进程推理,默认使用全部的显卡推理(几张显卡几个进程)(这个由于没有资源跑,我不能完全保证代码没有问题)

cd dataset_interface
python rft_inference_wo_crop.py \
    --model_path "/path/to/your/Qwen2_5_VLForConditionalGeneration_model_directory" \
    --dataset_name "OTB_lang" \
    --output_dir "path/to/otb_tracking_results" \
    --save_vis False \
    --gap_list 1 10 \
    --smart_resize_min_pixels 3136 \
    --smart_resize_max_pixels 102400 \

进行 metrics 的计算:

python analysis_results.py \
	--results_path "path/to/otb_tracking_results" \
	--dataset_name "otb_lang"

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published